A ChatGPT megjelenése és az azt kifejlesztő OpenAI összefogása a Microsofttal derült égből villámcsapásként érte a Google-t, amely így erőltetett tempóban volt kénytelen kiadni a saját, Bard néven futó chatbotját, több kellemetlen pillanatot is okozva magának. Egy évvel a mesterséges intelligenciás láz kirobbanása után viszont a keresőóriás kezdi összekapni magát, és most egy teljesen új AI-modellt jelentett be, amely az elmondása alapján képes lepipálni a konkurens megoldásokat.
A Gemini néven futó újdonság három formában támad: a Nano a Pixel-mobilokra kerül, a Prót a Bard chatbotba integrálják, az Ultrát pedig nagyobb partnereknek, például adatközpontokba szánják. A modell ereje abban rejlik, hogy ún. multimodális megközelítést alkalmaz, így egyaránt működik szövegekkel, képekkel, hanganyagokkal, videókkal és programkódokkal.
A Google szerint a Gemini ezzel magasan felülmúlja az eddig látott mesterséges intelligenciákat, melynek bizonyítékául benchmarkokat is mutatott a vállalat. Ezek azt állítják, hogy a szöveges feladatok esetén a Gemini 8-ből 7 tesztben jobban teljesít az OpenAI legújabb, GPT-4 modelljénél, a multimodális (kép, videó, hang) méréseken pedig 10-ből 10 kategóriában végez az élen.
A vállalat hozzátette, hogy a fejlesztés során a biztonságot helyezték a középpontba, több technológiát is bevetetve a visszaélések kivédésére és a tényszerűség garantálására. A Gemini Nano már most elérhető a Pixel 8 mobilokon a decemberi Feature Drop részeként, ahol különböző appok (pl. Summarize, Recorder, Gboard) funkcióit segíti, a Bardba integrált Pro pedig szintén megjelent, ám ez csak az angol nyelvet támogatja. A vállalati partnereknek szánt Gemini Ultra egyelőre tesztüzemmódban fut, de valamikor 2024 elején ez is elrajtolhat.