НОВИНИ

Штучний інтелект не вміє грати в «Маріо» (поки що) — яка модель впоралась краще

Аудіо версія новини

Слухати

TechChrunch пише, що дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Розповідаємо про результати дослідження.

Що сталося

Дослідники з Каліфорнійського університету в Сан-Дієго використовують гру Super Mario Bros. для тестування штучного інтелекту. Вони виявили, що ця гра є складнішим випробуванням для ШІ, ніж Pokеmon, в який штучний інтелект грав доволі повільно.

Для експерименту залучали різні моделі ШІ:

  • Claude 3.7;
  • Gemini 1.5 Pro;
  • GPT-4o;

Claude 3.7 показав найкращі результати, тоді як інші моделі мали труднощі.

Для тестування використовувалася модифікована версія гри, запущена в емуляторі та інтегрована з фреймворком GamingAgent. Цей фреймворк надавав ШІ базові інструкції та знімки екрана, а ШІ, своєю чергою, генерував код Python для керування Маріо.

У чому різниця між іграми

Дослідження показало, що моделі ШІ, які використовують покрокове міркування, показали гірші результати в цій грі, оскільки їм потрібен час для прийняття рішень, що є критичним фактором у Super Mario Bros. порівняно з Pokеmon.

Хоча ігри вже давно використовуються для тестування ШІ, досі немає чіткого зв’язку між ігровими навичками ШІ та реальним прогресом. Нібито ігри є абстрактними та спрощеними в порівнянні з реальним світом. Проте, експеримент з Super Mario Bros. дозволяє спостерігати за тим, як ШІ справляється зі складними завданнями в реальному часі.

ЧИТАЙТЕ ТАКОЖ

НОВИНИ
Як перетворити жарт на 8,8 млн проданих банок — monobank і «Живчик» розповіли історію своєї колаборації

04 Жовтня 2025, 18:45

НОВИНИ
У monobank нова CMO — як планує тримати бренд у топі та планку трендсетера: ексклюзив

04 Жовтня 2025, 17:49

НОВИНИ
Довгостроковий проєкт на 100 млн грн: «Хартія» розповіла про найвдаліші колаборації

04 Жовтня 2025, 15:18

НОВИНИ
Вкладав власні 40 000 грн: Клопотенко розповів деталі про колаборацію із «Укрзалізницею»

04 Жовтня 2025, 14:22

Досвід і думки
Від пошукових систем до ШІ-чатів: яку роль відіграє LLMs.txt у новій SEO-реальності

04 Жовтня 2025, 13:25

НОВИНИ
Мозаїка за понад 1,6 млн грн та 1,2 млн донатів: znamy та Alterra показали результати співпраці

04 Жовтня 2025, 13:15

НОВИНИ
6 мрлд тонн щосекунди: вчені зафіксували найшвидше зростання планети у Всесвіті

03 Жовтня 2025, 19:21

НОВИНИ
Ось чому лише 30% працівників хочуть бути керівниками — дослідження

03 Жовтня 2025, 18:15

НОВИНИ
Користувачі скаржаться на зайві запитання від ChatGPT — що сталося

03 Жовтня 2025, 17:28

НОВИНИ
65 000 грн на людину: як змінилися корпоративні бенефіти в Україні у 2025 — дослідження

03 Жовтня 2025, 16:24