Amikor mesterséges intelligenciáról, vagy AI-ról van szó, akkor többség jelenleg a ChatGPT-hez hasonló alkalmazásokra gondol. A technológia ennél jóval több lehetőséget rejt, ezt pedig a Google is sikerrel demonstrálta egy újságíróknak tartott videós bemutatóval. A résztvevők láthatták ahogy a Gemini vezérelte robot képes volt megkülönböztetni az asztalon lévő, különböző színű és felületű edényeket, és a műanyag gyümölcsöket rakosgatni beléjük a megadott paraméterek szerint.
Ami itt történt, az az volt, hogy a Google megfogta a Gemini 2.0-s nyelvi modelljét, és beültette azt egy robotba. A modell persze több átalakításon is keresztül ment, hogy értelmezhesse a kameráival látott információkat, és a számításainak eredményeit ne csak szavakká, de tettekké is formálhassa.
Ennek a Gemini verziónak Gemini Robotics VLA (vision-language-action vagyis látás-nyelv-cselekvés) a teljes neve, és a célja, hogy afféle agyként funkcionáljon majd a jövőbeli robotok számára.
A Google jelenleg több megoldással is igyekszik garantálni, hogy a VLA-vel felvértezett gépek mindig biztonságosak maradhassanak az emberek számára. Ehhez több szakemberrel is együttműködnek, de hogy mindez pontosan mit is jelent valójában, még nem tudjuk. Az egész program relatíve fiatal, így egy darabig még nem érdemes Gemini robotok megvásárlásán gondolkodnunk.