У Meta знову скандал: Llama майже повністю запам’ятав книгу про Гаррі Поттера

19 Червня 2025, 13:04

3 хв читання

Аудіо версія новини

Лідія Неплях

Керую стрічкою, працюю з SEO-оптимізацією, вичитую тексти та верстаю.

Дослідники з кількох американських університетів з’ясували: модель штучного інтелекту Llama 3.1 від Meta запам’ятала значну частину книги «Гаррі Поттер і філософський камінь» — настільки добре, що здатна відтворювати її дослівно. Про це пише Mashable.

Що сталося

Нові дослідження показують, що модель штучного інтелекту Llama 3.1 від Meta здатна запам’ятовувати захищені авторським правом книги майже дослівно. Модель може відтворити дослівно уривки з 42% книги «Гаррі Поттер і філософський камінь», а загалом — фрагменти з 91% тексту.

Llama навчався, зокрема, на піратській книжковій базі Books3 — колекції піратських книг, яка використовувалася для навчання мовних моделей. Саме ця база є предметом судового позову Kadrey v. Meta Platforms, поданого низкою авторів, зокрема Річардом Кадрі, чиї твори без дозволу опинилися в тренувальних даних Meta.

Примітно, що модель майже не запам’ятала книгу самого Кадрі — лише 0,13% «Пісочної людини Слім». Утім, це не рятує Meta від потенційних юридичних проблем, адже загальний рівень запам’ятовування виявився набагато вищим, ніж припускали раніше.

Чому це цікаво

Юридичні експерти звертають увагу: така вибірковість свідчить, що компанії можуть контролювати процес навчання моделей і зменшувати рівень «запам’ятовування». Тобто це не технічна випадковість, а наслідок рішень щодо джерел даних.

Meta та інші гравці ринку ШІ посилаються на «добросовісне використання» (fair use) — але чим більше модель відтворює текст дослівно, тим слабше цей аргумент.

«Це змінює правила гри», — каже професор права Роберт Браунейс з Університету Джорджа Вашингтона. Якщо такі докази будуть прийняті в суді, вони можуть серйозно вплинути на подальшу юридичну практику навколо навчання ШІ.

Meta поки не прокоментувала результати дослідження.

Нагадаємо, Meta не вперше опиняється у скандалі через свою модель ШІ. У квітні 2025-го компанія обдурила тести ШІ, які проводила для своїх нових моделей ШІ Llama 4. Виявилося, що модель Maveric, яка, за результатами тесту LMArena, стояла вище GPT-4o і трохи нижче Gemini 2.5 Pro, відрізняється від тої версії, до якої мають доступ користувачі.

Більше про це

01 НОВИНИ

Meta запускає підтримку паролів для Facebook і Messenger — як затестити

#Llama #Штучний інтелект