НОВИНИ

GPT-o3 зіграв в шахи з Grok — ось хто виграв

Аудіо версія новини

Слухати

Розробники штучного інтелекту вперше провели триденний шаховий турнір між великими мовними моделями, де OpenAI GPT o3 здобув перемогу над xAI Grok 4 із рахунком 4:0. Про це пише Сybernews.

Що сталося

Розробники систем штучного інтелекту влаштували перше в історії триденне шахове змагання між великими мовними моделями, в якому взяли участь вісім представників від Anthropic, DeepSeek, Google, Moonshot AI, OpenAI та xAI.

  • DeepSeek і Moonshot AI вибули перші.
  • Google Gemini посів третє місце, він переміг GPT o4-mini з рахунком 3.5:0.5.
  • GPT o3 у фіналі переміг Grok 4 з рахунком 4:0.

Спочатку фаворитом вважався xAI Grok 4. Однак у фіналі він припустився низки помилок, кілька разів втративши ферзя, тоді як GPT o3 демонстрував стабільну гру. За підсумками 12 зіграних партій, середній показник «правильних ходів» для GPT o3 становив 90,8%, у Grok 4 — 80,2%. Результат цікавий тим, що показує різницю в практичній стійкості моделей у завданнях, що вимагають логіки, планування й адаптації до ходів опонента.

Ілон Маск ще до фіналу писав у X:

Що далі

Організатори та розробники використовують турніри для тестування алгоритмів у задачах із жорсткими правилами та довготривалою стратегією. Подібні змагання допомагають оцінити логіку та здатність моделей до корекції помилок. Нагадуємо, раніше ми писали, що уперше з моменту випуску GPT-2 понад п’ять років тому, OpenAI представиі дві нові моделі з відкритою вагою — gpt-oss-120b і gpt-oss-20b. Їх можна безплатно завантажити на платформі Hugging Face.

ЧИТАЙТЕ ТАКОЖ

БІЗНЕС
Не сім’я, а баскетбольна команда: як побудувати корпоративну культуру через спортивну модель — кейс Boosters

20 Лютого 2026, 17:00

НОВИНИ
Банкноти 1,2,5,10 гривень зникають з обігу: що зміниться з березня 2026

20 Лютого 2026, 16:50

НОВИНИ
Від продуктового до АЗС: в Україні запрацював державний сервіс «єЧек» — що це означає для бізнесу

20 Лютого 2026, 16:06

НОВИНИ
Tesla запускає найдешевший Cybertruck за $59 990 — деталі

20 Лютого 2026, 15:08

НОВИНИ
Експорт українських ІТ-послуг зріс до $6,66 млрд у 2025 році — дослідження 

20 Лютого 2026, 14:13

НОВИНИ
Google терміново оновлює Chrome — що цього разу

20 Лютого 2026, 12:33

НОВИНИ
Meta скорочує премії своїм співробітникам — куди спрямують зекономлені кошти

20 Лютого 2026, 11:20

БІЗНЕС
Як виділятися в інфошумі, будувати стале ком’юніті та чому AI не замінить ваших талантів. Про що говорили на UPConf’25 

20 Лютого 2026, 11:00

НОВИНИ
Стартап співзасновника українського Reface залучив $10 млн інвестицій

20 Лютого 2026, 10:12

БІЗНЕС
Від баночки святої води зі Львова до угоди з Fox Entertainment. Як працює Holywater Tech — стартап, який будує Netflix для вертикального відео

20 Лютого 2026, 08:34