Gyakorlatilag nem maradt már olyan médium, amivel ne került volna összefüggésbe a mesterséges intelligencia, hiszen hiába beszélünk egy viszonylag fiatal technológiáról, szinte egymás lábát tapossák a szolgáltatók a különböző szöveg- és képgenerátorokkal, miközben a zenék és videók készítésére alkalmas gépi modellek is elkezdtek színre lépni.
A következő állomásként a Google nemrég bemutatott egy új algoritmust, ami puszta képekből játékokat is létre tud hozni, most pedig itt egy újabb AI technológia, amely a kontrollert is kiveszi a kezünkből.
A Google DeepMind által leleplezett SIMA (Scalable Instructable Multiworld Agent) az első olyan generatív mesterséges intelligencia, amely természetes nyelven elhangzott utasításokat követ 3D-s virtuális környezetek és videojátékok széles skáláján. A gyakorlatban ez azt jelenti, hogy a SIMA hangutasítások alapján képes műveleteket végezni egy sor játékban.
Introducing SIMA: the first generalist AI agent to follow natural-language instructions in a broad range of 3D virtual environments and video games. 🕹️
— Google DeepMind (@GoogleDeepMind) March 13, 2024
It can complete tasks similar to a human, and outperforms an agent trained in just one setting. 🧵 https://t.co/qz3IxzUpto pic.twitter.com/02Q6AkW4uq
A Google csapata nem az első, amely játszani tanít egy AI programot, elég csak az OpenAI és az Nvidia Minecraftozó algoritmusaira gondolni, a SIMA különlegessége viszont az, hogy nemcsak egy specifikus címre szól, hanem bármilyen játékban bevethető. Ez pedig még nem minden, a DeepMind állítása szerint ugyanis a technológia még jobban is teljesít egy általa sosem látott címben, mint egy olyan hagyományos algoritmus, amit kimondottan arra a programra tanítottak be.
Ennek érdekében a Google 8 stúdióval dolgozott együtt, hogy a játékaikkal segítsék a mesterséges intelligencia kiképzését. A programban olyan fejlesztők vettek részt, mint a Hello Games (No Man's Sky) és a Tuxedo Labs (Teardown), a kiterjedt tréningnek köszönhetően pedig a SIMA több mint 600 játékbeli műveletet képes elvégezni, például elfordulni egy bizonyos irányba, tárgyakkal interakcióba lépni vagy a menükben navigálni.
Az összetettebb parancsokkal ugyan még nem tud mit kezdeni a modell, de a DeepMind folytatja a megoldás tökéletesítését, a végcél ugyanis az, hogy az AI teljesen magától is képes legyen játszani. Hogy ennek milyen gyakorlati értelme van, arról lehetne vitatkozni, de a mozgáskorlátozott játékosoknak például hasznos lehetne egy fejlett, hangparancsokkal terelgethető mesterséges intelligenciás ügynök.