Bluesky zmaga się z poważnym problemem związanym z prywatnością po milionie publicznych postów zostały zeskrobane ze swojej platformy do szkolenia AI, zgodnie z A 404Media raport. Zbiór danych, opracowany przez bibliotekarz zajmujący się uczeniem maszynowym Daniel van Strien z firmy AI Hugging Face, miał zostać wykorzystany w badaniach związanych z przetwarzaniem języka naturalnego i analizą mediów społecznościowych. Choć przedstawiciele Bluesky zapewniają, że platforma nigdy nie będzie uczyć generatywnej sztucznej inteligencji na danych użytkowników, otwarty charakter jej API sprawia, że jest ona podatna na zewnętrzne skrobaki.
Bluesky boryka się z obawami dotyczącymi prywatności w związku ze skradzionymi postami użytkowników
Zbiór danych, o którym mowa, pochodzi ze strony Bluesky’s API Firehose’aktóry zapewnia zagregowany strumień aktualizacji danych publicznych, w tym postów, polubień i obserwujących. Van Strien zamierzał wykorzystać ten zbiór danych do popchnięcia badań nad uczeniem maszynowym. Jednak obejmował nie tylko tekst postów, ale także zdecentralizowane identyfikatory użytkowników (DID) i metadane. Po tym, jak doniesienia medialne nagłośniły ten problem, zbiór danych został szybko usunięty z Hugging Face ze względu na wywołaną przez niego reakcję dotyczącą prywatności użytkowników i braku zgody.
Użytkownicy Bluesky nie wyrazili wyraźnej zgody na wykorzystanie ich postów w ten sposób, chociaż zasady Bluesky nie zabraniają kategorycznie takich działań. Sednem kontrowersji jest otwarta struktura API Bluesky, która umożliwia zewnętrznym programistom swobodny dostęp do publicznych danych. Zgodnie z oświadczeniem przedstawiciela Bluesky „chcielibyśmy znaleźć sposób, aby użytkownicy Bluesky mogli komunikować się z zewnętrznymi organizacjami/programistami, czy wyrażają na to zgodę”, co wskazuje na wysiłki mające na celu zwiększenie kontroli użytkowników nad udostępnianiem danych w przyszłości.
Bluesky zyskuje 1,25 miliona użytkowników po wyborach
Po usunięciu zbioru danych van Strien przyznał, że w swoim podejściu do gromadzenia danych naruszył przejrzystość i zgodę. „Przepraszam za ten błąd” – stwierdził w kolejnym poście na Bluesky. To wydarzenie stanowi dla użytkowników zachętę do lepszego zrozumienia, że wszelkie treści udostępniane publicznie na platformie są dostępne dla podmiotów zewnętrznych. W miarę ciągłego rozwoju platformy — przekraczającej ostatnio 20 milionów użytkowników — firma Bluesky będzie prawdopodobnie poddawana coraz większej kontroli pod kątem stosowanych przez nią środków ochrony danych i prywatności użytkowników.
Bluesky prowadzi obecnie dyskusje na temat mechanizmów, które umożliwiłyby użytkownikom wyrażanie preferencji dotyczących zgody osobom trzecim. Jednakże egzekwowanie prawa pozostaje wyzwaniem; jak zauważyła platforma, ostatecznie to od zewnętrznych programistów będzie zależeć, czy zastosują się do tych preferencji. Przedstawiciele Bluesky dodatkowo przekazali, że choć dążą do rozmów z inżynierami i zespołami prawnymi, nie ma dostępnych natychmiastowych rozwiązań.
Autor wyróżnionego obrazu: Błękitny