НОВИНИ

Штучний інтелект не вміє грати в «Маріо» (поки що) — яка модель впоралась краще

Аудіо версія новини

Слухати

TechChrunch пише, що дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Розповідаємо про результати дослідження.

Що сталося

Дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Вони виявили, що ця гра є складнішим випробуванням для ШІ, ніж Pokеmon, в який штучний інтелект грав доволі повільно.

Для експерименту залучали різні моделі ШІ:

  • Claude 3.7;
  • Gemini 1.5 Pro;
  • GPT-4o;

Claude 3.7 показав найкращі результати, тоді як інші моделі мали труднощі.

Для тестування використовувалася модифікована версія гри, запущена в емуляторі та інтегрована з фреймворком GamingAgent. Цей фреймворк надавав ШІ базові інструкції та знімки екрана, а ШІ, своєю чергою, генерував код Python для керування Маріо.

У чому різниця між іграми

Дослідження показало, що моделі ШІ, які використовують покрокове міркування, показали гірші результати в цій грі, оскільки їм потрібен час для прийняття рішень, що є критичним фактором у Super Mario Bros. порівняно з Pokеmon.

Хоча ігри вже давно використовуються для тестування ШІ, досі немає чіткого зв’язку між ігровими навичками ШІ та реальним прогресом. Нібито ігри є абстрактними та спрощеними в порівнянні з реальним світом. Проте, експеримент з Super Mario Bros. дозволяє спостерігати за тим, як ШІ справляється зі складними завданнями в реальному часі.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
Яким був Стів Джобс на початку карʼєри — архівне відео

16 Січня 2026, 18:36

Що за шум
Чи справді Novus, «Сільпо», «Аврора» зачиняють магазини: що насправді відбувається з супермаркетами в блекаути

16 Січня 2026, 18:00

НОВИНИ
Тепер ви зможете дивитись «Форсаж» і «Людина-павук» на Netflix — що відомо про угоду на $7 млрд

16 Січня 2026, 16:59

НОВИНИ
MacPaw закриває свій магазин-конкурент AppStore — чому

16 Січня 2026, 16:15

НОВИНИ
Смерті, політики та попкультура: 25 найпопулярніших статей «Вікіпедії» всіх часів

16 Січня 2026, 14:39

НОВИНИ
OpenAI запускає конкурента Google Translate — які переваги

16 Січня 2026, 12:52

НОВИНИ
В Україні стало на 13 000 менше ІТ-ФОПів — де найбільше закриттів

16 Січня 2026, 11:04

БІЗНЕС
Де твоя вершина? Поп-ап ZYN у Буковелі відкрився біля підніжжя гори 

16 Січня 2026, 11:00

НОВИНИ
Схоже, Альтман хоче вдосконалити наші мізки. Засновник OpenAI залучив гроші на свій новий стартап

16 Січня 2026, 10:00

БІЗНЕС
Остання закрита економіка світу: як багатий нафтою Іран застряг між санкціями та протестами

16 Січня 2026, 08:34