A tavalyi évben végignézhettük, ahogy a gépi tanuláson alapuló szöveg- és képgenerátorok meghódították a világot, 2024 pedig újabb ugrást hozott, hiszen az AI-piac egyik úttörője, az OpenAI nemrég egy vadonatúj modellt prezentált, ami már a videós műfajjal is megbirkózik, méghozzá nem akármilyen minőségben.
Ugyan már az eddig színre lépett technológiák kapcsán is rengeteg a megválaszolatlan biztonsági és etikai kérdés, de a mesterséges intelligenciában szintén nyakig gázoló Google nem lassít, és máris egy újabb médiumot hódítana meg videojátékok képében.
A keresőóriáshoz tartozó kutatók egy csoportja ugyanis nemrég leleplezte a Genie (generative interactive environments - generatív interaktív környezetek) néven futó mesterséges intelligenciás modellt, ami már egyetlen fotóból képes egy szimpla platformjátékot faragni. A technológia mögött dolgozó algoritmust 200 ezer órányi webes videó segítségével tanították be.
Ami igazán figyelemre méltó, hogy a Genie betanításához nem volt szükség szöveges utasításokra vagy egyéb jelölésekre, a feldolgozott videókból okulva az algoritmus egyetlen kép alapján el tudja dönteni, mely elemek tartoznak a létrehozandó játékbeli környezethez és melyik lesz az irányítható karakter. A generatív modell kézi rajzokból, valódi fotókból és mesterséges intelligenciával készült illusztrációkból is képes kihozni a játékokat, szorosan alkalmazkodva azok vizuális stílusához.
A technológiának mindazonáltal vannak még jelentős megkötései: a Genie platformerei egyelőre csupán 16 képkockát tartalmaznak, és azokat is mindössze 1 fps képkockasebesség mellett adják vissza. A Google generatív modellje tehát még messze van attól, hogy elvegye a játékfejlesztők munkáját, de egész látványosan kezdett, a készítői szerint pedig a könnyű taníthatósága miatt más területeken, például a robotok programozásához szükséges szimulációk létrehozásában is nagy szolgálatot tehet.