НОВИНИ

У Meta знову скандал: Llama майже повністю запам’ятав книгу про Гаррі Поттера

Аудіо версія новини

Слухати

Дослідники з кількох американських університетів з’ясували: модель штучного інтелекту Llama 3.1 від Meta запам’ятала значну частину книги «Гаррі Поттер і філософський камінь» — настільки добре, що здатна відтворювати її дослівно. Про це пише Mashable.

Що сталося

Нові дослідження показують, що модель штучного інтелекту Llama 3.1 від Meta здатна запам’ятовувати захищені авторським правом книги майже дослівно. Модель може відтворити дослівно уривки з 42% книги «Гаррі Поттер і філософський камінь», а загалом — фрагменти з 91% тексту.

Llama навчався, зокрема, на піратській книжковій базі Books3 — колекції піратських книг, яка використовувалася для навчання мовних моделей. Саме ця база є предметом судового позову Kadrey v. Meta Platforms, поданого низкою авторів, зокрема Річардом Кадрі, чиї твори без дозволу опинилися в тренувальних даних Meta.

Примітно, що модель майже не запам’ятала книгу самого Кадрі — лише 0,13% «Пісочної людини Слім». Утім, це не рятує Meta від потенційних юридичних проблем, адже загальний рівень запам’ятовування виявився набагато вищим, ніж припускали раніше.

Чому це цікаво

Юридичні експерти звертають увагу: така вибірковість свідчить, що компанії можуть контролювати процес навчання моделей і зменшувати рівень «запам’ятовування». Тобто це не технічна випадковість, а наслідок рішень щодо джерел даних.

Meta та інші гравці ринку ШІ посилаються на «добросовісне використання» (fair use) — але чим більше модель відтворює текст дослівно, тим слабше цей аргумент.

«Це змінює правила гри», — каже професор права Роберт Браунейс з Університету Джорджа Вашингтона. Якщо такі докази будуть прийняті в суді, вони можуть серйозно вплинути на подальшу юридичну практику навколо навчання ШІ.

Meta поки не прокоментувала результати дослідження.

Нагадаємо, Meta не вперше опиняється у скандалі через свою модель ШІ. У квітні 2025-го компанія обдурила тести ШІ, які проводила для своїх нових моделей ШІ Llama 4. Виявилося, що модель Maveric, яка, за результатами тесту LMArena, стояла вище GPT-4o і трохи нижче Gemini 2.5 Pro, відрізняється від тої версії, до якої мають доступ користувачі.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
Чому ваші поради не допомагають — дослідження Гарварду

21 Грудня 2025, 18:00

Досвід і думки
HOLYWATER та Starlight Production почали співпрацю з виробництва вертикальних серіалів: скільки коштує створити продукт

21 Грудня 2025, 13:43

НОВИНИ
8 найбагатших сімей у світі — рейтинг

21 Грудня 2025, 09:00

НОВИНИ
Без цього експерименту Джобс і Возняк не створили б Apple

20 Грудня 2025, 19:00

Досвід і думки
Як операційне мислення змінює бізнес і роль COO — конспект від Fractional COO

20 Грудня 2025, 13:16

НОВИНИ
56 найвідоміших цитат Воррена Баффета, які варто прочитати кожному

20 Грудня 2025, 09:00

НОВИНИ
Український Careeotech отримав $25 000

19 Грудня 2025, 20:23

НОВИНИ
Google Chrome почав автоматично блокувати нав’язливі сповіщення — що зміниться для користувачів

19 Грудня 2025, 18:05

НОВИНИ
The Economist обрав країну 2025 року — хто це

19 Грудня 2025, 17:28

НОВИНИ
Київ став лідером рейтингу міст України за розвитком електронних сервісів — дослідження

19 Грудня 2025, 16:40