НОВИНИ

Штучний інтелект не вміє грати в «Маріо» (поки що) — яка модель впоралась краще

Аудіо версія новини

Слухати

TechChrunch пише, що дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Розповідаємо про результати дослідження.

Що сталося

Дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Вони виявили, що ця гра є складнішим випробуванням для ШІ, ніж Pokеmon, в який штучний інтелект грав доволі повільно.

Для експерименту залучали різні моделі ШІ:

  • Claude 3.7;
  • Gemini 1.5 Pro;
  • GPT-4o;

Claude 3.7 показав найкращі результати, тоді як інші моделі мали труднощі.

Для тестування використовувалася модифікована версія гри, запущена в емуляторі та інтегрована з фреймворком GamingAgent. Цей фреймворк надавав ШІ базові інструкції та знімки екрана, а ШІ, своєю чергою, генерував код Python для керування Маріо.

У чому різниця між іграми

Дослідження показало, що моделі ШІ, які використовують покрокове міркування, показали гірші результати в цій грі, оскільки їм потрібен час для прийняття рішень, що є критичним фактором у Super Mario Bros. порівняно з Pokеmon.

Хоча ігри вже давно використовуються для тестування ШІ, досі немає чіткого зв’язку між ігровими навичками ШІ та реальним прогресом. Нібито ігри є абстрактними та спрощеними в порівнянні з реальним світом. Проте, експеримент з Super Mario Bros. дозволяє спостерігати за тим, як ШІ справляється зі складними завданнями в реальному часі.

ЧИТАЙТЕ ТАКОЖ

FOMO OFF
Феномен Cowboys: як коштувати $13 мільярдів без жодної перемоги за 30 років

30 Травня 2026, 13:34

НОВИНИ
6 фільмів про Київ — добірка до Дня міста

30 Травня 2026, 09:00

НОВИНИ
СЕО OpenAI назвав сфери, де людський контакт поки сильніший за ШІ

29 Травня 2026, 19:20

Борщ
Бігові кросівки, які не можна купити, дармовис із 3D-друку дронів і адаптивний одяг для ветеранів. Що робили українські бренди разом у травні

29 Травня 2026, 19:00

НОВИНИ
Роналду, Мессі, Джеймс: хто увійшов до рейтингу Forbes із доходом понад $100 млн

29 Травня 2026, 18:34

НОВИНИ
Google пом’якшила ліміти Gemini: складні запити більше не з’їдатимуть увесь ліміт

29 Травня 2026, 16:28

НОВИНИ
YouTube зробила подкасти зручнішими для прослуховування в русі

29 Травня 2026, 14:59

БІЗНЕС
Що реально утримує людей в ІT-компаніях: досвід SharksCode

29 Травня 2026, 14:00

НОВИНИ
Dell різко підвищила прогноз через AI-сервери Nvidia — акції стрибнули на 40%

29 Травня 2026, 13:08

НОВИНИ
В Європі під час рейду вилучили 800 серверів для російських кібератак

29 Травня 2026, 12:14