НОВИНИ

«ШІ-моделі можуть більше, ніж їм дозволяють»: що виявило нове дослідження Anthropic

Аудіо версія новини

Слухати

Anthropic представила дослідження, яке показує реальне використання агентів штучного інтелекту. Розповідаємо деталі.

Що сталося

Компанія Anthropic опублікувала дослідження реального використання агентів штучного інтелекту. Воно показало, шо майже половина всіх інструментів через API-агентів припадає на програмну інженерію. Решта активності розподілена між 16 різними галузями, жодна з яких не перевищує 9% частки.

Окремий висновок дослідження стосується автономності. Дослідники зазначають, що Claude може самостійно виконувати завдання, які зазвичай займають у людини до п’яти годин. Проте на практиці майже всі робочі сеанси (999 із 1000) тривають не більше ніж 42 хвилини. Це свідчить про те, що потенціал моделі значно більший, ніж те, як люди використовують її зараз.

Як змінюється поведінка користувачів

Новачки рідко дозволяють агенту працювати повністю самостійно — лише приблизно у 20% випадків. Коли ж людина набирається досвіду (після сотень сесій), вона вже у понад 40% випадків дає агенту більше свободи.

Але цікаво інше: досвідчені користувачі навіть частіше зупиняють агента під час роботи — 9% дій проти 5% у новачків. Це не означає меншу довіру. Просто змінюється стиль контролю:

  • новачки перевіряють кожен крок наперед;
  • досвідчені дозволяють працювати самостійно, але втручаються, якщо помічають проблему.

Ще один важливий момент: у складних завданнях агент частіше сам просить уточнення, ніж його зупиняє людина. Загалом більшість дій (73%) усе одно відбувається з участю людини. І лише 0,8% операцій є незворотними.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
CFO дедалі частіше працюють у чатах з ШІ. Fuelfinance хоче принести туди фінанси

13 Травня 2026, 18:40

НОВИНИ
Samsung запускає бета-версію One UI 9 для Galaxy S26 — що зміниться

13 Травня 2026, 17:56

НОВИНИ
9 українських стартапів отримають 300 000 євро у першій когорті Startup EDGE

13 Травня 2026, 16:01

НОВИНИ
Google хоче перетворити курсор на ШІ-інтерфейс для Chrome і Gemini

13 Травня 2026, 15:21

НОВИНИ
SpaceX масштабує Starship перед IPO: компанія думає про мережу космопортів

13 Травня 2026, 14:24

НОВИНИ
DrugCards поглинула латвійську компанію

13 Травня 2026, 13:01

Як це працює
Скоротили цикл запуску з 3 років до 9 місяців. Ярослав Морозов про те, як і навіщо Universe відсіює 499 ідей із 500

13 Травня 2026, 12:05

НОВИНИ
У Китаї випустили робота-трансформера, яким керує людина — відео

13 Травня 2026, 11:02

НОВИНИ
Android вчиться ловити шпигунів: Google запускає Intrusion Logging

13 Травня 2026, 10:03

Як це працює
38 000 поїздок без планів на самоокупність: чому «Інклюзивний» клас Uklon працює не за правилами стандартного райдхейлінгу

13 Травня 2026, 08:34