Sztuczna inteligencja w pirackich książkach: oto jak MetaAI sama się wyszkoliła

Najważniejsza kradzież dzieł sztuki w historii ludzkości: jak Meta wykorzystała pirackie książki do wyszkolenia swojej sztucznej inteligencji. Legalne ścieżki zostały opisane jako „nadmiernie kosztowne” i „niezwykle długa” procedura

Sztuczna inteligencja w pirackich książkach: oto jak MetaAI sama się wyszkoliła

zdjęcie: Dado Ruvic / / FORUM

Dyskusja na temat sztucznej inteligencji trwa od lat. Jednak dopiero niedawno zaczęliśmy z nią coraz częściej wchodzić w interakcje. Istotnym wyzwaniem dla szkolenia sztucznej inteligencji jest zapotrzebowanie na ogromne ilości wysokiej jakości tekstu.

Warto zauważyć, że książki są jednym z najłatwiej dostępnych źródeł tekstu. W przeciwieństwie do stron internetowych zaprojektowanych pod kątem optymalizacji pod kątem wyszukiwarek (SEO), oferują one materiały o wyższej jakości. To rozróżnienie jest kluczowe, ponieważ sztuczna inteligencja, która czerpie z AI, obniża swoją własną jakość , a znaczna część treści online została już wygenerowana przez AI. Dlatego książki opublikowane przed 2020 rokiem zapewniają, że nie zawierają treści tworzonych za pomocą AI.

Jak ujawnił The Atlantic, Mark Zuckerberg, CEO Meta, zatwierdził wykorzystanie LibGen (skrót od „Library Genesis”), nielegalnego repozytorium plików, które dostarczało treści do szkolenia modelu AI Meta. Założony około 2008 roku w Rosji, LibGen to system, który przechowuje ponad 7,5 miliona plików książek i 81 milionów plików prac badawczych. Jest to jedna z największych pirackich bibliotek online na świecie, służąca jako zasób dla wielu studentów (i najwyraźniej również dla innych).

Według The Atlantic pracownicy Meta nawiązali współpracę z różnymi firmami w sprawie licencjonowania książek do rozwoju AI, ale wyniki były niezadowalające. „Wydaje mi się to nadmiernie kosztowne” — powiedział jeden z pracowników na wewnętrznym czacie firmy. Starszy menedżer z zespołu Llama 3 zauważył, że byłoby to również „niezwykle powolne” przedsięwzięcie.

Gdy sytuacja stała się publiczna, społeczności autorów na całym świecie wyraziły zamiar podjęcia kroków prawnych przeciwko Meta. W marcu 2025 r. francuscy wydawcy i autorzy ogłosili swoje plany. Vincent Montagne, prezes Krajowego Stowarzyszenia Wydawców, oskarżył Meta o „lekceważenie praw autorskich i angażowanie się w pasożytnictwo” podczas konferencji prasowej. W Polsce Związek Literatów (organizacja broniąca praw autorów)
zachęca również autorów do zapoznania się z bazą danych The Atlantic.

– Jesteśmy świadkami największej kradzieży dzieł twórczych w historii ludzkości.

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *