НОВИНИ

У Meta знову скандал: Llama майже повністю запам’ятав книгу про Гаррі Поттера

Аудіо версія новини

Слухати

Дослідники з кількох американських університетів з’ясували: модель штучного інтелекту Llama 3.1 від Meta запам’ятала значну частину книги «Гаррі Поттер і філософський камінь» — настільки добре, що здатна відтворювати її дослівно. Про це пише Mashable.

Що сталося

Нові дослідження показують, що модель штучного інтелекту Llama 3.1 від Meta здатна запам’ятовувати захищені авторським правом книги майже дослівно. Модель може відтворити дослівно уривки з 42% книги «Гаррі Поттер і філософський камінь», а загалом — фрагменти з 91% тексту.

Llama навчався, зокрема, на піратській книжковій базі Books3 — колекції піратських книг, яка використовувалася для навчання мовних моделей. Саме ця база є предметом судового позову Kadrey v. Meta Platforms, поданого низкою авторів, зокрема Річардом Кадрі, чиї твори без дозволу опинилися в тренувальних даних Meta.

Примітно, що модель майже не запам’ятала книгу самого Кадрі — лише 0,13% «Пісочної людини Слім». Утім, це не рятує Meta від потенційних юридичних проблем, адже загальний рівень запам’ятовування виявився набагато вищим, ніж припускали раніше.

Чому це цікаво

Юридичні експерти звертають увагу: така вибірковість свідчить, що компанії можуть контролювати процес навчання моделей і зменшувати рівень «запам’ятовування». Тобто це не технічна випадковість, а наслідок рішень щодо джерел даних.

Meta та інші гравці ринку ШІ посилаються на «добросовісне використання» (fair use) — але чим більше модель відтворює текст дослівно, тим слабше цей аргумент.

«Це змінює правила гри», — каже професор права Роберт Браунейс з Університету Джорджа Вашингтона. Якщо такі докази будуть прийняті в суді, вони можуть серйозно вплинути на подальшу юридичну практику навколо навчання ШІ.

Meta поки не прокоментувала результати дослідження.

Нагадаємо, Meta не вперше опиняється у скандалі через свою модель ШІ. У квітні 2025-го компанія обдурила тести ШІ, які проводила для своїх нових моделей ШІ Llama 4. Виявилося, що модель Maveric, яка, за результатами тесту LMArena, стояла вище GPT-4o і трохи нижче Gemini 2.5 Pro, відрізняється від тої версії, до якої мають доступ користувачі.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
Techosystem запускає MarTech & Media Cluster для розвитку маркетингових технологій і медіа в Україні

26 Лютого 2026, 18:26

БІЗНЕС
Data Analytics VS Data Science: у чому різниця та що обрати новачку

26 Лютого 2026, 17:00

НОВИНИ
Тепер ви можете створювати відео зі своїх зображень за допомогою Nano Banana

26 Лютого 2026, 16:34

НОВИНИ
«ШІ-моделі можуть більше, ніж їм дозволяють»: що виявило нове дослідження Anthropic

26 Лютого 2026, 14:47

СПЕЦПРОЄКТИ
Інтернeт був 128 кілобіт,а нас — восьмеро. 20 років SPD Technology очима тих, хто розвиває компанію зсередини

26 Лютого 2026, 14:00

НОВИНИ
У «Бабеля» новий мажоритарний власник — що зміниться для редакції

26 Лютого 2026, 13:12

НОВИНИ
Збитки The Washington Post у 2025 році перевищили $100 млн — деталі

26 Лютого 2026, 12:20

БІЗНЕС
Рейтинг 1,6 в Google Maps. Як Glovo, Bolt Food та Uklon Delivery конкурують за одного кур’єра та клієнта

26 Лютого 2026, 12:00

НОВИНИ
Описав задачу — і пішов: Perplexity презентувала автономний «ШІ-комп’ютер»

26 Лютого 2026, 11:30

БІЗНЕС
«Так англійську в Україні ще не викладали»: Джошуа Пратт про те, як поєднувати вивчення мови та бізнес-коучинг

26 Лютого 2026, 11:00