НОВИНИ

Штучний інтелект не вміє грати в «Маріо» (поки що) — яка модель впоралась краще

Аудіо версія новини

Слухати

TechChrunch пише, що дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Розповідаємо про результати дослідження.

Що сталося

Дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Вони виявили, що ця гра є складнішим випробуванням для ШІ, ніж Pokеmon, в який штучний інтелект грав доволі повільно.

Для експерименту залучали різні моделі ШІ:

  • Claude 3.7;
  • Gemini 1.5 Pro;
  • GPT-4o;

Claude 3.7 показав найкращі результати, тоді як інші моделі мали труднощі.

Для тестування використовувалася модифікована версія гри, запущена в емуляторі та інтегрована з фреймворком GamingAgent. Цей фреймворк надавав ШІ базові інструкції та знімки екрана, а ШІ, своєю чергою, генерував код Python для керування Маріо.

У чому різниця між іграми

Дослідження показало, що моделі ШІ, які використовують покрокове міркування, показали гірші результати в цій грі, оскільки їм потрібен час для прийняття рішень, що є критичним фактором у Super Mario Bros. порівняно з Pokеmon.

Хоча ігри вже давно використовуються для тестування ШІ, досі немає чіткого зв’язку між ігровими навичками ШІ та реальним прогресом. Нібито ігри є абстрактними та спрощеними в порівнянні з реальним світом. Проте, експеримент з Super Mario Bros. дозволяє спостерігати за тим, як ШІ справляється зі складними завданнями в реальному часі.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
Ілюзія work-life balance: СЕО топкомпаній сумніваються, що ШІ полегшить роботу у 2026 році

27 Грудня 2025, 18:00

БІЗНЕС
Як не потрапити в акселератор: 5 типових помилок засновників

27 Грудня 2025, 13:26

НОВИНИ
4 фільми з найвищим рейтингом Rotten Tomatoes у 2025 році

27 Грудня 2025, 09:00

НОВИНИ
Астрономи зафіксували активне зореутворення за 2 700 світлових років — фото

26 Грудня 2025, 18:01

НОВИНИ
Ютубер, на якого Apple подала у суд за витоки, показав ранній дизайн складного iPhone

26 Грудня 2025, 17:38

СТАРТАПИ
6 ветеранських стартапів отримали $44 000: SKELAR Veteran Venture Program представили фіналістів акселераційної програми

26 Грудня 2025, 17:30

НОВИНИ
1,2 млрд користувачів LinkedIn під загрозою: хакери атакують через фейкові вакансії

26 Грудня 2025, 17:16

НОВИНИ
Як говорити так, щоб вас чули: правило комунікації Джобса і Безоса

26 Грудня 2025, 16:06

НОВИНИ
Маск, Хуанг і Пейдж: як ШІ приніс техномільярдерам США $550 млрд

26 Грудня 2025, 14:09

КРЕАТИВ
Як українських акторів готують до міжнародного ринку: підсумки 2025-го року в AMO Actors Agency

26 Грудня 2025, 14:00