Anthropic представила дослідження, яке показує реальне використання агентів штучного інтелекту. Розповідаємо деталі.
Що сталося
Компанія Anthropic опублікувала дослідження реального використання агентів штучного інтелекту. Воно показало, шо майже половина всіх інструментів через API-агентів припадає на програмну інженерію. Решта активності розподілена між 16 різними галузями, жодна з яких не перевищує 9% частки.
Окремий висновок дослідження стосується автономності. Дослідники зазначають, що Claude може самостійно виконувати завдання, які зазвичай займають у людини до п’яти годин. Проте на практиці майже всі робочі сеанси (999 із 1000) тривають не більше ніж 42 хвилини. Це свідчить про те, що потенціал моделі значно більший, ніж те, як люди використовують її зараз.
Як змінюється поведінка користувачів
Новачки рідко дозволяють агенту працювати повністю самостійно — лише приблизно у 20% випадків. Коли ж людина набирається досвіду (після сотень сесій), вона вже у понад 40% випадків дає агенту більше свободи.
Але цікаво інше: досвідчені користувачі навіть частіше зупиняють агента під час роботи — 9% дій проти 5% у новачків. Це не означає меншу довіру. Просто змінюється стиль контролю:
- новачки перевіряють кожен крок наперед;
- досвідчені дозволяють працювати самостійно, але втручаються, якщо помічають проблему.
Ще один важливий момент: у складних завданнях агент частіше сам просить уточнення, ніж його зупиняє людина. Загалом більшість дій (73%) усе одно відбувається з участю людини. І лише 0,8% операцій є незворотними.