© depositphotos/anusorn_nakdee Модель o3 перемогла Grok 4, який припустився серії помилок, зокрема втратив ферзя.
Модель штучного інтелекту o3 від OpenAI перемогла Grok 4, розроблений компанією Ілона Маска xAI, у фіналі турніру з шахів між великими мовними моделями. Турнір проводився на платформі Kaggle, що належить Google, і тривав три дні, повідомляє BBC.
На відміну від спеціалізованих шахових програм, участь у змаганні брали універсальні моделі штучного інтелекту, створені для повсякденного використання. Серед учасників моделі від Anthropic, Google, OpenAI, xAI, а також китайських розробників DeepSeek і Moonshot AI.
У фіналі Grok 4 допустив низку помилок, включно з повторною втратою ферзя, що дозволило моделі o3 здобути впевнену перемогу. Гросмейстер Хікару Накамура, який коментував турнір, зазначив: “Ґрок зробив так багато помилок у цих іграх, а OpenAI – ні”.
Третє місце посіла модель Gemini від Google, яка перемогла іншу модель OpenAI у матчі за бронзу. Всього у турнірі брали участь вісім моделей, що змагалися у серії партій між собою з використанням єдиних стандартних правил.
Журналіст Chess.com Педро Піньята у своєму огляді зазначив, що до півфіналу Grok 4 виглядав фаворитом і лідирував без особливих труднощів. “Попри кілька моментів слабкості, ШІ Ілона Маска здавався найсильнішим шахістом… Але ілюзія розвіялася в останній день турніру”, – написав він.
Ілон Маск перед фіналом прокоментував виступ Grok 4, зазначивши, що попередній успіх був “побічним ефектом”, адже компанія “майже не витрачала зусиль на шахи”. Водночас OpenAI вже не вперше демонструє перевагу у застосуванні своїх моделей до нестандартних завдань.
This is a side effect btw. @xAI spent almost no effort on chess. https://t.co/p18DFFn35A
— Elon Musk (@elonmusk) August 5, 2025
Турнір на Kaggle є одним із прикладів використання шахів як тесту для оцінки когнітивних можливостей моделей штучного інтелекту. Розробники активно використовують подібні змагання як тести для перевірки навичок своїх систем у логічному мисленні, стратегічному плануванні та адаптивному навчанні.
Настільна гра Go, як і шахи, традиційно використовується у сфері ШІ для оцінки здатності моделей до складної оптимізації. У 2016-2019 роках система AlphaGo від DeepMind перемогла кількох чемпіонів світу з Go, а південнокорейський гросмейстер Лі Се-дол після серії поразок у 2019 році завершив кар’єру.
Співзасновники OpenAI Сем Альтман і Ілон Маск раніше працювали разом у компанії, але нині є конкурентами. Обидві сторони стверджують, що саме їхні останні моделі є найрозвинутішими у світі. Турнір лише посилив технологічне суперництво між OpenAI та xAI.
Підсумки змагання на Kaggle підтвердили, що хоча універсальні ШІ-моделі ще не досягли рівня спеціалізованих шахових програм, вони вже демонструють здатність до складного стратегічного аналізу. Розробники вбачають у цьому потенціал для використання ШІ в інших сферах, що вимагають високого рівня абстрактного мислення.
Нещодавно OpenAI презентувала свою нову флагманську модель GPT-5, яку вважає проривом на шляху до створення штучного загального інтелекту (AGI). Попри помітні покращення у точності, програмуванні та безпеці, компанія визнала, що GPT-5 не здатна до безперервного навчання – ключової ознаки справжнього AGI.