Prawnicy „The New York Times” i „Daily News” twierdzą, że OpenAI nieumyślnie usunął kluczowe dane w związku z pozwem przeciwko firmie dotyczącym praw autorskich w związku z nieuprawnionym wykorzystaniem ich treści, zgodnie z TechCrunch raport. Do incydentu doszło po tym, jak OpenAI zgodziło się zapewnić dostęp do swoich zbiorów danych szkoleniowych, aby pomóc powodom w weryfikacji wykorzystania ich materiałów chronionych prawem autorskim.
W pozwie zarzuca się, że OpenAI pobrało artykuły z „The New York Times” i „Daily News” bez uzyskania pozwolenia na szkolenie swoich modeli. W odpowiedzi na pozew OpenAI udostępniło prawnikom wydawcy dwie maszyny wirtualne w celu przeszukiwania danych szkoleniowych pod kątem treści chronionych prawem autorskim. Od 1 listopada zespoły prawne poświęciły na poszukiwania ponad 150 godzin. Jednak 14 listopada inżynierowie OpenAI omyłkowo usunęli wszystkie dane wyszukiwania przechowywane na jednej z maszyn wirtualnych, jak zauważono w pozwie złożonym w Sądzie Okręgowym Stanów Zjednoczonych dla Południowego Okręgu Nowego Jorku.
Próby odzyskania usuniętych danych przez OpenAI były w większości skuteczne, ale utrata struktury folderów i nazw plików sprawiła, że odzyskane dane stały się bezużyteczne do śledzenia, gdzie artykuły powodów zostały uwzględnione w szkoleniu AI. W piśmie złożonym przez pełnomocnika powodów podkreślano, że musieli oni zrekonstruować swoją pracę, co pochłaniało ogromne zasoby i czas.
Pomimo usunięcia danych adwokat wyjaśnił, że nic nie wskazuje na to, aby incydent był zamierzony. Wyrazili obawę, że OpenAI jest idealnie przygotowana do przeszukiwania własnych zbiorów danych, wskazując na obowiązek pomocy w dochodzeniu w sprawie potencjalnego naruszenia praw autorskich.
OpenAI właśnie uczyniło macOS inteligentniejszym dzięki obsłudze aplikacji ChatGPT
OpenAI twierdzi, że wykorzystywanie publicznie dostępnych danych do szkolenia swoich modeli mieści się w ramach „dozwolonego użytku”. Firma utrzymuje, że nie musi udzielać licencji ani rekompensować tych treści, nawet jeśli czerpie zyski ze swoich produktów AI. Niemniej jednak OpenAI zawarło umowy licencyjne z kilkoma wydawcami, w tym z tak znanymi nazwiskami, jak Associated Press i Financial Times. Choć szczegółowe warunki tych transakcji nie są ujawnione, według doniesień Dotdash, jeden z partnerów, otrzymuje co najmniej 16 milionów dolarów rocznie.
OpenAI nie wydało jeszcze oświadczenia w sprawie incydentu ani jego konsekwencji dla relacji z powodami.
Autor wyróżnionego obrazu: Jonathana Kempera/Unsplash