Internet Archive przegrało znaczącą batalię prawną po tym, jak Sąd Apelacyjny Stanów Zjednoczonych podtrzymał orzeczenie rządzący w Hachette v. Internet Archive, stwierdzając, że praktyki digitalizacji i wypożyczania książek naruszały prawo autorskie. Sprawa wynikała z inicjatywy National Emergency Library Archiwum w czasie pandemii, która umożliwiła nieograniczone wypożyczanie książek w wersji cyfrowej, wywołując sprzeciw wydawców i autorów. Sąd odrzucił obronę Archiwum opartą na dozwolonym użytku, chociaż uznał jego status organizacji non-profit. To orzeczenie wzmacnia kontrolę autorów i wydawców nad ich dziełami. Ale natychmiast przypomina mi, w jaki sposób narzędzia AI szkolą i wykorzystują dane w Internecie, w tym książki i nie tylko. Jeśli działalność non-profitowej organizacji Internet Archive nie mieści się w ramach dozwolonego użytku, w jaki sposób płatne narzędzia oparte na sztucznej inteligencji wykorzystują te dane?
Pomimo licznych Pozwy o prawa autorskie do sztucznej inteligencjidane tekstowe z punkty informacyjne zwykle nie skutkuje surowymi orzeczeniami przeciwko narzędziom AI, często kończąc się partnerstwa z główni gracze.
Możesz uważać, że jest inaczej i twierdzić, że Internet Archive bezpośrednio korzysta z książek, ale chociaż narzędzia AI opierają się na wszystkich danych, którymi dysponują, aby wygenerować Twoje eseje, nadal możesz uzyskać z nich konkretne fragmenty lub bardziej szczegółowe odpowiedzi, jeśli użyjesz dobrze opracowanego polecenia.
Sprawa Hachette v. Internet Archive uwypukla istotne obawy dotyczące sposobu, w jaki modele AI pozyskują dane treningowe, zwłaszcza gdy dotyczą one materiałów chronionych prawem autorskim, takich jak książki. Systemy AI często opierają się na dużych zestawach danych, w tym tekstach chronionych prawem autorskim, co powoduje podobne wyzwania prawne dotyczące nielicencjonowanego użytkowania. Jeśli sądy ograniczą digitalizację i korzystanie z utworów chronionych prawem autorskim bez zezwolenia, firmy AI mogą musieć zabezpieczyć licencje na teksty używane w szkoleniu, co zwiększy złożoność i potencjalne koszty. Może to ograniczyć dostęp do zróżnicowanych, wysokiej jakości zestawów danych, co ostatecznie wpłynie na rozwój i innowacje w zakresie AI.
Ponadto sprawa ta podkreśla ograniczenia dozwolony użytek obrona w kontekście transformacyjnego wykorzystania, które często jest kluczowe dla uzasadnienia AI dla korzystania z danych tekstowych na dużą skalę. Jeśli sądy będą wąsko postrzegać to, co stanowi dozwolony użytek, twórcy AI mogą napotkać więcej ograniczeń dotyczących sposobu uzyskiwania dostępu do książek chronionych prawem autorskim i korzystania z nich. To napięcie między ochroną praw autorów a utrzymaniem otwartego dostępu do wiedzy może mieć daleko idące konsekwencje dla przyszłości praktyk szkoleniowych AI i etycznego wykorzystania danych.
Potrzebujesz głębszego wglądu w sprawę? Oto wszystko, co musisz o niej wiedzieć.
Hachette kontra Internet Archive – wyjaśnienie
Hachette v. Internet Archive to ważna sprawa sądowa, która koncentruje się wokół prawa autorskiego i ograniczeń doktryny „dozwolonego użytku” w kontekście bibliotek cyfrowych. Sprawa rozpoczęła się w 2020 r., kiedy kilka dużych firm wydawniczych — Hachette, HarperCollins, Penguin Random House i Wiley — pozwało Internet Archive, organizację non-profit poświęconą zachowaniu cyfrowych kopii stron internetowych, książek i innych mediów.
Sprawa dotyczyła praktyki Archiwum polegającej na skanowaniu książek i wypożyczaniu ich online.
Historia pozwu przeciwko Internet Archive
Ten Otwarta Biblioteka projekt, prowadzony przez Internet Archive, został stworzony, aby umożliwić ludziom wypożyczanie książek cyfrowo. Oto jak to działało:
- Internet Archive kupiło fizyczne kopie książek.
- Zeskanowali te książki i przenieśli je do wersji cyfrowej.
- Ludzie mogli wypożyczać wersje cyfrowe, ale książkę mogła wypożyczyć tylko jedna osoba na raz, tak jak wypożycza się książkę papierową ze zwykłej biblioteki.
Internet Archive uważało, że jest to zgodne z prawem, ponieważ pozwalali wypożyczyć książkę tylko jednej osobie na raz. Nazwali ten system Kontrolowane pożyczki cyfrowe (CDL)Pomysł polegał na tym, aby wypożyczanie cyfrowe działało tak samo jak wypożyczanie w bibliotekach fizycznych.
Gdy na początku 2020 r. wybuchła pandemia COVID-19, wiele bibliotek musiało zostać zamkniętych, co utrudniło ludziom dostęp do książek. Aby pomóc, Internet Archive uruchomiło Narodowa Biblioteka Awaryjna (NEL) w marcu 2020 r. Ten program zmienił wiele rzeczy:
- NEL pozwalał wielu osobom wypożyczać tę samą cyfrową kopię książki w tym samym czasie. To usunęło zasadę „jedna osoba na raz”.
- Celem było zapewnienie większej liczbie osób dostępu do książek w czasie pandemii, zwłaszcza studentom i naukowcom, którzy utknęli w domach.
Chociaż NEL miał być tymczasowy, rozgniewał autorów i wydawców. Twierdzili, że umożliwienie wielu osobom pożyczenia tej samej kopii cyfrowej bez pozwolenia było jak kradzież ich pracy.
Zamieszki wydawców
W czerwcu 2020 roku duzi wydawcy pozwali Internet Archive. Twierdzili:
- Internet Archive nie miało pozwolenia na skanowanie książek ani wypożyczanie ich w formie cyfrowej.
- Postępując w ten sposób, Internet Archive naruszyło swoje prawa autorskie, które dają im wyłączne prawo do kontrolowania sposobu kopiowania i udostępniania swoich książek.
- Podejście NEL, polegające na umożliwieniu wielu osobom jednoczesnego wypożyczania kopii cyfrowych, było szczególnie szkodliwe dla ich działalności i w istocie stanowiło piractwo.
Wydawcy argumentowali, że działania Internet Archive szkodzą rynkowi ich książek. Powiedzieli, że ludzie otrzymują darmowe wersje cyfrowe zamiast kupować e-booki lub wypożyczać je z licencjonowanych bibliotek.
Obrona Internet Archive
Internet Archive broniło się, twierdząc, że jego praca jest chroniona przez dozwolony użytek. Dozwolony użytek pozwala na ograniczone wykorzystanie materiałów chronionych prawem autorskim bez zezwolenia w celach edukacyjnych, badawczych i komentarzowych. Archiwum przedstawiło następujące punkty:
- Oni zapewniali transformacyjny usługę zapewniającą czytelnikom dostęp do książek fizycznych w nowej, cyfrowej formie.
- Nie czerpali z tego zysku, gdyż byli organizacją non-profit, której misją było gromadzenie wiedzy i udostępnianie jej.
- NEL było tymczasową odpowiedzią na pandemię i miało na celu pomoc osobom, które w czasie kryzysu nie miały dostępu do książek.
Wskazywali również na swoje Kontrolowane pożyczki cyfrowe system jako sposób na przestrzeganie praw autorskich. Zgodnie z CDL, tylko jedna osoba mogła wypożyczyć książkę na raz, tak jak w bibliotece fizycznej.
Decyzje sądu
Orzeczenie Sądu Rejonowego (marzec 2023 r.)
W marcu 2023 r. sąd federalny stanął po stronie wydawców. Sędzia John G. Koeltl orzekł, że działania Internet Archive nie są chronione przez dozwolony użytek. Powiedział:
- Wypożyczanie cyfrowe w Internet Archive nie było transformacyjny ponieważ nie dodawali niczego nowego do książek. Po prostu kopiowali je w formie cyfrowej, co nie kwalifikowało się do dozwolonego użytku.
- Sąd stwierdził również, że wypożyczanie przez Archiwum szkodziło rynkowi zarówno drukowanych, jak i cyfrowych wersji książek. Oferując bezpłatne kopie cyfrowe, Internet Archive było postrzegane jako konkurujące ze sprzedażą e-booków przez wydawców.
- Sąd Zakończono że Archiwum utworzyło prace pochodneco oznacza, że stworzyli nowe wersje książek (kopie cyfrowe) bez pozwolenia.
Orzeczenie Sądu Apelacyjnego (sierpień 2023 r.)
Internet Archive odwołał się od tej decyzji do wyższej instancji, US Court of Appeals for the Second Circuit, mając nadzieję na uchylenie orzeczenia. Jednak sąd apelacyjny również orzekł na korzyść wydawców, ale złożył jedno ważne wyjaśnienie:
- Sąd uznał, że Internet Archive jest niedochodowy organizacji, a nie komercyjnej. To rozróżnienie było ważne, ponieważ komercyjne wykorzystanie często może osłabić obronę dozwolonego użytku, ale w tym przypadku sąd uznał, że Archiwum nie było motywowane zyskiem.
- Mimo to sąd uznał, że działania Archiwum nie podlegają ochronie na podstawie zasady dozwolonego użytku, mimo iż jest ono organizacją non-profit.
Podsumowanie
Sprawa Hachette v. Internet Archive pokazała, że nawet organizacje non-profit, takie jak Internet Archive, nie mogą swobodnie digitalizować i wypożyczać książek bez naruszania praw autorskich. To orzeczenie może również wpłynąć na sposób, w jaki firmy AI wykorzystują materiały chronione prawem autorskim do trenowania swoich systemów. Jeśli organizacje non-profit napotkają takie ograniczenia, narzędzia AI mogą potrzebować licencji na wykorzystywane przez siebie dane. Nawet jeśli już je mają zaczęto zawierać pewne umowyZastanawiam się, co z pierwsze wpisy?
Źródło wyróżnionego obrazu: Eray Eliaçık/Bing