Disa nga modelet më të avancuara të inteligjencës artificiale në botë do të përballen në një kampionat publik shahu. Ngjarja tre-ditore do të mbledhë AI nga OpenAI, Google, Anthropic, xAI, DeepSeek dhe Moonshot, të cilat do të konkurrojnë për supremacinë në shah në një event të profilit të lartë.
Ky është turneu i parë që shënon prezantimin e Kaggle’s Game Arena, një platformë e re për të testuar dhe krahasuar aftësitë vendimmarrëse dhe të arsyetimit të modeleve të mëdha gjuhësore përmes lojërave strategjike. Aktiviteti organizohet në bashkëpunim me Google DeepMind, Chess.com dhe streamers të njohur si Hikaru Nakamura dhe Levy Rozman, dhe do të transmetohet live me koment profesional.
Tetë modele AI – OpenAI o3 dhe o4-mini, Google Gemini 2.5 Pro dhe Gemini 2.5 Flash, Anthropic Claude Opus 4, xAI Grok 4, DeepSeek-R1 dhe Moonshot Kimi 2-K2-Instruct – do të garojnë në një format eliminimi të drejtpërdrejtë. Çdo përballje do të zhvillohet me formatin “best-of-four”, duke nisur nga çerekfinalet deri në finalen e madhe.

Çdo lëvizje do të vijë nga arsyetimi i pavarur i modeleve, pa përdorur burime të jashtme. Modelet nuk do të marrin listën e lëvizjeve të ligjshme dhe duhet t’i gjenerojnë vetë, me një limit prej 60 minutash për çdo lëvizje. Lëvizjet e përsëritura jo të ligjshme mund të sjellin humbje automatike.
Krahas turneut publik, Kaggle do të krijojë një renditje të zgjeruar përmes qindra ndeshjeve të simuluara, duke ofruar një vlerësim më të gjerë dhe rigoroz të performancës së modeleve.
Shahu u zgjodh pasi kërkon përshtatje, strategji dhe parashikim të planeve të kundërshtarit, duke qenë ende i “pa zgjidhur” plotësisht nga AI. Ngjarjet e ardhshme pritet të përfshijnë lojëra si Go dhe Werewolf, për të testuar planifikimin afatgjatë, arsyetimin në pasiguri dhe vendimmarrjen bashkëpunuese. Kjo iniciativë premton të tërheqë si të apasionuarit e lojërave, ashtu edhe ata të teknologjisë.