НОВИНИ

Штучний інтелект не вміє грати в «Маріо» (поки що) — яка модель впоралась краще

Аудіо версія новини

Слухати

TechChrunch пише, що дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Розповідаємо про результати дослідження.

Що сталося

Дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Вони виявили, що ця гра є складнішим випробуванням для ШІ, ніж Pokеmon, в який штучний інтелект грав доволі повільно.

Для експерименту залучали різні моделі ШІ:

  • Claude 3.7;
  • Gemini 1.5 Pro;
  • GPT-4o;

Claude 3.7 показав найкращі результати, тоді як інші моделі мали труднощі.

Для тестування використовувалася модифікована версія гри, запущена в емуляторі та інтегрована з фреймворком GamingAgent. Цей фреймворк надавав ШІ базові інструкції та знімки екрана, а ШІ, своєю чергою, генерував код Python для керування Маріо.

У чому різниця між іграми

Дослідження показало, що моделі ШІ, які використовують покрокове міркування, показали гірші результати в цій грі, оскільки їм потрібен час для прийняття рішень, що є критичним фактором у Super Mario Bros. порівняно з Pokеmon.

Хоча ігри вже давно використовуються для тестування ШІ, досі немає чіткого зв’язку між ігровими навичками ШІ та реальним прогресом. Нібито ігри є абстрактними та спрощеними в порівнянні з реальним світом. Проте, експеримент з Super Mario Bros. дозволяє спостерігати за тим, як ШІ справляється зі складними завданнями в реальному часі.

Больше об этом

01 НОВИНИ

Microsoft Dragon Copilot — що відомо про персональний ШІ-асистент у світі медицини

Добавить в закладки

Любую статью можно сохранить в закладки на сайте, чтобы прочесть ее позже.

МАТЕРИАЛЫ ПО ТЕМЕ

НОВИНИ
Телескоп «Джеймса Вебба» зафіксував народження зірок — відео

05 сентября 2025, 19:01

НОВИНИ
12 цитат Джорджіо Армані, який помер у віці 91 року

05 сентября 2025, 18:04

НОВИНИ
Чому Tesla запропонувала Ілону Маску $1 трлн — найбільший пакет в історії

05 сентября 2025, 17:20

НОВИНИ
Ось які професії залишуться під контролем людей, а які замінить ШІ — дослідження Microsoft

05 сентября 2025, 16:03

НОВИНИ
Warner Bros. Discovery подала до суду на ШІ-сервіс Midjourney — чому

05 сентября 2025, 14:45

НОВИНИ
OpenAI виготовлятиме власні AI-чипи для ChatGPT — новий конкурент Nvidia

05 сентября 2025, 12:32

НОВИНИ
OpenAI створює платформу для наймання з ШІ, яка конкуруватиме з LinkedIn

05 сентября 2025, 11:18

БІЗНЕС
Favbet Tech увійшов у «Топ-50 IT-компаній України» за версією DOU та показав найбільший приріст команди

05 сентября 2025, 11:00

НОВИНИ
100 млн грн для military-tech-стартапів: Brave1 відкрив грантову програму

05 сентября 2025, 10:00

БІЗНЕС
Перший заробіток у 14 євро і фінансові факапи. Історія Project Manager-ки, яка перейшла з ІТ у подорожі

05 сентября 2025, 08:34