A Google-nek eddig nincs valami nagy szerencséje a mesterséges intelligenciával. Habár a keresőóriás évek óta végez kutatásokat a generatív modelleken, az OpenAI és a Microsoft jelentősen beelőzték őket az arra épülő szolgáltatások elérhetővé tételével, amikor pedig ennek hatására sietve prezentálták a házon belüli fejlesztésű Bard chatbotot, az egy látványos bakival égette be őket a színpadon.
Ezt az emléket lett volna hivatott eltörölni a nemrég leleplezett új AI-modell, a multimodális alapokra építkező Gemini, ám most ismét magyarázkodásra kényszerül a Google, miután kiderült, hogy nem volt teljesen őszinte a technológiát illetően.
A Gemini előnye, hogy a multimodális felépítésnek köszönhetően változatos tartalmakat képes kezelni a szövegektől a képeken át a videókig, melynek kapcsán a Google egy videót játszott le, ahol az AI látszólag valós időben reagált ezekre az inputokra.
A Bloomberg beszámolója szerint viszont az algoritmus válaszai eleve fel voltak gyorsítva, amire ugyan még egy diszkréten elhelyezett megjegyzés is felhívta a figyelmet a feltöltés leírásában, arra azonban már semmi sem utalt, hogy a Gemini valójában nem a videó, hanem abból kivágott állóképek alapján dolgozott, amiket szöveges parancsokkal is megtámogattak a fejlesztők. A Google ezt csak utólag, egy szóvivő útján közölte a hírügynökséggel.
Könnyű belátni, hogy ez teljesen más megvilágításba helyezi a keresőóriás új mesterséges intelligenciáját, ami a vállalat saját benchmarkjai szerint állítólag magasan felülmúlja a rivális megoldásokat. A Bloomberg cikke után a Google megpróbálkozott a tűzoltással, és a projekt egyik felelőse, Oriol Vinalys az X-felületén magyarázta a bizonyítványt. Az új AI-t kifejlesztő DeepMind-részleg alelnöke szerint a videó csak a "fejlesztők inspirálását" célozta, de utólag már belátják, hogy a Gemini pontossága önmagában is elég lett volna a közönség lenyűgözéséhez.
A vállalatnál tehát azt állítják, hogy az új generatív technológia valóban szállítja a leleplezésen megvillantott képességeket, de azt nem vitatják, hogy nem abban a formában, nem olyan gördülékenyen működik a rendszer, ahogy azt a videó sugallta.