За даними OpenAI, сучасні моделі ШІ вже здатні виконувати частину робіт так само добре, як і люди, але вони не зможуть повністю замінити людей. Про це пише Gizmodo.
Що сталося
Компанія OpenAI опублікувала звіт із результатами тестування провідних моделей у 44 різних професіях. Оцінювання називається GDPval, і OpenAI стверджує, що воно має на меті обґрунтувати дебати щодо ШІ та відстежити, як моделі вдосконалюються з часом.
Завдання у ньому створювали фахівці з 14-річним досвідом у ключових галузях США, що формують найбільшу частку ВВП: від фінансів і нерухомості до виробництва та державного управління. Дослідження показало такий результат:
- Claude Opus 4.1 — 47,6%.
- GPT-5 high — 38,8%.
- GPT-4o — із 12,4%.
Моделі впевнено виконують завдання касирів, менеджерів із продажів і розробників ПЗ, але гірше справляються у сферах інженерії, фармації та монтажу відео.
За підрахунками OpenAI, моделі виконують завдання GDPval у 100 разів швидше і дешевше, ніж люди. При цьому більшість професій охоплює не лише рутинні кроки, які можна формалізувати у вигляді тесту. Тому ШІ бере на себе повторювані функції, звільняючи людям час для складних і творчих завдань.
Також компанія наголошує, що попри прогрес, повної заміни людей штучним інтелектом чекати не варто. Нагадуємо, нещодавно ми писали, що Мінцифра та Google розпочали новий етап співпраці у сфері штучного інтелекту. Першим результатом став запуск «Дія.AI» — національного AI-асистента на базі моделі Gemini.