НОВИНИ

GPT-o3 зіграв в шахи з Grok — ось хто виграв

Аудіо версія новини

Слухати

Розробники штучного інтелекту вперше провели триденний шаховий турнір між великими мовними моделями, де OpenAI GPT o3 здобув перемогу над xAI Grok 4 із рахунком 4:0. Про це пише Сybernews.

Що сталося

Розробники систем штучного інтелекту влаштували перше в історії триденне шахове змагання між великими мовними моделями, в якому взяли участь вісім представників від Anthropic, DeepSeek, Google, Moonshot AI, OpenAI та xAI.

  • DeepSeek і Moonshot AI вибули перші.
  • Google Gemini посів третє місце, він переміг GPT o4-mini з рахунком 3.5:0.5.
  • GPT o3 у фіналі переміг Grok 4 з рахунком 4:0.

Спочатку фаворитом вважався xAI Grok 4. Однак у фіналі він припустився низки помилок, кілька разів втративши ферзя, тоді як GPT o3 демонстрував стабільну гру. За підсумками 12 зіграних партій, середній показник «правильних ходів» для GPT o3 становив 90,8%, у Grok 4 — 80,2%. Результат цікавий тим, що показує різницю в практичній стійкості моделей у завданнях, що вимагають логіки, планування й адаптації до ходів опонента.

Ілон Маск ще до фіналу писав у X:

Що далі

Організатори та розробники використовують турніри для тестування алгоритмів у задачах із жорсткими правилами та довготривалою стратегією. Подібні змагання допомагають оцінити логіку та здатність моделей до корекції помилок. Нагадуємо, раніше ми писали, що уперше з моменту випуску GPT-2 понад п’ять років тому, OpenAI представиі дві нові моделі з відкритою вагою — gpt-oss-120b і gpt-oss-20b. Їх можна безплатно завантажити на платформі Hugging Face.

Больше об этом

01 НОВИНИ

ChatGPT прославляв Сатану й радив завдавати собі шкоди — що сталося

Добавить в закладки

Любую статью можно сохранить в закладки на сайте, чтобы прочесть ее позже.

МАТЕРИАЛЫ ПО ТЕМЕ

НОВИНИ
Ці 4 запити для ChatGPT допоможуть масштабувати бізнес у 2025 році

02 сентября 2025, 18:19

НОВИНИ
19% українців їдуть понад годину, щоб дістатися до роботи — дослідження

02 сентября 2025, 17:21

НОВИНИ
Китайські науковці створили перший у світі мультичастотний чип 6G зі швидкістю понад 100 Гбіт/с

02 сентября 2025, 16:22

НОВИНИ
УКУ відмовився поселити студентку в гуртожиток через ЛГБТ-емодзі в її соцмережах (Оновлено)

02 сентября 2025, 15:23

БІЗНЕС
Цукерка, що пережила Другу світову: як M&M’s стали культовим брендом завдяки армії США

02 сентября 2025, 15:00

НОВИНИ
6 млн грн для розвитку жіночого бізнесу — стартує третій сезон акселератора «Відважна»

02 сентября 2025, 12:43

НОВИНИ
У Німеччині подали позов проти Milka: вага шоколадки зменшилась на 10 грам

02 сентября 2025, 12:04

НОВИНИ
Що ШІ думає про Україну —дослідження 

02 сентября 2025, 11:14

БІЗНЕС
25 років інновацій: як robota.ua зробила пошук роботи безпечнішим

02 сентября 2025, 11:00

НОВИНИ
Ось, що вміє новий дрон-бомбер JET MAX від українських розробників — фото

02 сентября 2025, 10:00