НОВИНИ

Штучний інтелект не вміє грати в «Маріо» (поки що) — яка модель впоралась краще

Аудіо версія новини

Слухати

TechChrunch пише, що дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Розповідаємо про результати дослідження.

Що сталося

Дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Вони виявили, що ця гра є складнішим випробуванням для ШІ, ніж Pokеmon, в який штучний інтелект грав доволі повільно.

Для експерименту залучали різні моделі ШІ:

  • Claude 3.7;
  • Gemini 1.5 Pro;
  • GPT-4o;

Claude 3.7 показав найкращі результати, тоді як інші моделі мали труднощі.

Для тестування використовувалася модифікована версія гри, запущена в емуляторі та інтегрована з фреймворком GamingAgent. Цей фреймворк надавав ШІ базові інструкції та знімки екрана, а ШІ, своєю чергою, генерував код Python для керування Маріо.

У чому різниця між іграми

Дослідження показало, що моделі ШІ, які використовують покрокове міркування, показали гірші результати в цій грі, оскільки їм потрібен час для прийняття рішень, що є критичним фактором у Super Mario Bros. порівняно з Pokеmon.

Хоча ігри вже давно використовуються для тестування ШІ, досі немає чіткого зв’язку між ігровими навичками ШІ та реальним прогресом. Нібито ігри є абстрактними та спрощеними в порівнянні з реальним світом. Проте, експеримент з Super Mario Bros. дозволяє спостерігати за тим, як ШІ справляється зі складними завданнями в реальному часі.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
Google дозволить кандидатам користуватися Gemini на технічних співбесідах

08 Травня 2026, 11:09

НОВИНИ
70 мов на вході й 13 на виході: OpenAI оновив голосовий стек для розробників

08 Травня 2026, 10:03

БІЗНЕС
Профайл Гаррі Селфріджа. Людина, яка 100 років тому перетворила ТРЦ на шоу-бізнес, а потім померла у боргах

08 Травня 2026, 08:34

НОВИНИ
Boosta запустила SEO-спринт для джунів із оплатою та шансом на офер

07 Травня 2026, 19:04

Борщ
Пиво до книжки, квадратна паска і 1,5 млн грн на регіональну журналістику. Що робили українські бренди разом у квітні

07 Травня 2026, 19:00

НОВИНИ
HIMERA запустила виробництво нових ретрансляторів R1 — фото

07 Травня 2026, 18:02

НОВИНИ
Ціни на хліб та паливо зростають: що подорожчало в Україні у квітні 2026-го

07 Травня 2026, 17:17

НОВИНИ
McDonald’s показав зростання прибутку: виторг і продажі перевищили прогнози

07 Травня 2026, 15:15

НОВИНИ
Уряд оновив «Власну Справу»: скільки грошей дадуть бізнесам у 2026-му

07 Травня 2026, 13:46

НОВИНИ
Спаму стане менше? Google загрожує штраф ЄС

07 Травня 2026, 12:31