Minden az AI-ról szól: ezeket jelentette be a Google az I/O 2024-en

Szabó Dániel

| 2024 május 14. 22:25

A Google minden területen ráfekszik a mesterséges intelligenciára, mi pedig összeszedtünk az összes fontos információt a vállalat terveiről, projektjeiről.

Hirdetés

Ma tartotta meg a nagy éves konferenciáját a Google, melynek keretében számos termékéről szót ejtett, kézzel foghatóakról és virtuálisakról egyaránt. A tavalyihoz hasonlóan újfent kétórás előadásban darálták le az előadók azokat az innovációkat és fejlesztéseket, amiken jelenleg dolgoznak, és természetesen a Google I/O-n is hatalmas hangsúlyt kapott a mesterséges intelligencia és az arra épülő funkciók.

Az alábbiakban egy rövid összefoglalót olvashattok a rendezvényen elhangzott legfontosabb részletekről, a cikk végén beágyazott videót elindítva pedig végignézhetitek az előadást, ha a teljes élményre vágytok.

Hirdetés

Íme a 2024-es Google I/O bejelentései tőmondatokban:

A Gemma a Google nyílt forráskódú, nagyméretű nyelvi modellje, amellyel kapcsolatban bejelentette a cég, hogy egy új, 27 milliárd paraméteres modellt ad hozzá a Gemma 2-höz, a modellcsalád következő generációja júniusban jelenik meg.
Kap egy kis gondoskodást a Google Play, többek között az alkalmazások új felfedezési funkciójával, a felhasználók becsábításának új módjaival, a Play Pontok frissítéseivel és a fejlesztők számára elérhető eszközök (mint a Google Play SDK Console és a Play Integrity API) egyéb fejlesztéseivel, az appkészítők lehetőségeit kibővítő Engage SDK kiadásával.
A Google bemutatott egy olyan funkciót, amely hívás közben figyelmeztetni fogja a felhasználókat a lehetséges csalásokra. Ez az Android egy jövőbeli verziójával kerül beépítésre, és a Gemini Nanót, a Google generatív AI-kínálatának legkisebb változatát használja. A rendszer hatékonyan, valós időben fogja figyelni a csalásokkal összefüggésbe hozható beszélgetési mintákat (például ha valaki banki képviselőnek adja ki magát).
A Google Fotókat is a mesterséges intelligencia segítségével turbózzák fel: ezt a Gemini AI-modellje által működtetett kísérleti funkció, az Ask Photos elindításával teszik meg. A nyár folyamán bevezetésre kerülő újdonság intuitívabbá teszi a megfelelő tartalom (személyek, helyek, dolgok) megtalálását a fotókon, kevésbé lesz manuális a keresési folyamat.
A Gemini modellcsaládot több más területen is bevetik:
- A Gmail esetében az AI közreműködésével kereshetnek, összegezhetnek és szerkeszthetnek majd leveleket a felhasználók, és akár összetettebb feladatok esetén is intézkedni tud, például segíthet egy űrlap kitöltésével.
- A Gemini 1.5 Pro nagy előrelépés lesz: a vállalat modellcsaládjának zászlóshajója az új verzióval hosszabb dokumentumokat, kódbázisokat, videókat és hangfelvételeket is képes elemezni, akár 2 millió tokent is képes befogadni (ez a korábbi mennyiség duplája).
- A Gemini Live-val "mélyreható" beszélgetéseket folytathatunk majd a Geminivel: megszakíthatjuk a chatbotot, miközben beszél és különféle kérdéseket tehetünk fel az egyes részletek tisztázására, Gemini pedig valós időben alkalmazkodik majd, képes lesz látni és reagálni a felhasználó környezetére, akár az okostelefon kamerája által rögzített fényképek, videók segítségével is.
- A már említett Gemini Nanót, a legkisebb AI-modelljét a Chrome böngészőbe is eépíti a Chrome 126-tal kezdődően. A vállalat szerint a fejlesztők így igénybe vehetik a modellt a saját AI-funkcióik működtetésére.
- A Gemini on Android a Google Asszistens AI-jal meghajtott helyettesítője lesz, amely kihasználja majd az Android rendszerbe és a Google alkalmazásaiba való mély integrációját. Így például a felhasználók képesek lesznek a mesterséges intelligencia által generált képeket közvetlenül a Gmail, a Google Messages és más alkalmazásokba húzni. A YouTube-tábor pedig konkrét információkat találhatnak majd a videókon belül egy koppintással.
- A Google Maps esetében is elérhetővé válnka a Gemini-modell képességei, kezdve a Places API-val. A fejlesztők saját alkalmazásaikban és weboldalaikon megjeleníthetik a helyek és területek generatív AI-összefoglalóit. Ezek a Gemini által, a Google Maps több mint 300 millió közreműködőből álló közösségének meglátásai alapján készülnek.
A TPU (Tensor Processing Unit) teljesítményét megnövelik azáltal, hogy bemutatták az AI-chipek következő, hatodik generációját. Trillium néven még idén piacra kerülnek, és az elődhöz képest 4,7-szeres teljesítménynövekedést tudnak felmutatni.
A Google keresésben is egyre inkább hasznát vehetjük majd a mesterséges intelligenciának, az AI-alapú áttekintéseket az Egyesült Államokban vezetik be először, emellett a Gemini ügynökként való használatát is tervezik, például olyan dolgokban, mint az utazásszervezés. Eleinte még csak egy rövid összefoglalót kapunk a keresett témával kapcsolatban, de a vállalat azt tervezi, hogy a teljes találati oldal rendezésében, kiaknázásában generatív AI-t használ majd.
A Google bejelentette az Imagen 3-at, az Imagen generatív AI-modellcsalád legújabb tagját. Az új változat az Imagen 2-vel szemben pontosabban érti meg a szöveges utasításokat, amelyeket képekre fordít, és "kreatívabb, részletesebb", illetve kevesebb "zavaró alkotást, hibát" produkál. Állításuk szerint ez az eddigi legjobb modelljük a szöveg megjelenítésére.
A Project IDX, a vállalat következő generációs, AI-központú, böngészőalapú fejlesztőkörnyezete mostantól átlépett a nyílt bétaverzióba: a frissítéssel együtt érkezik a Google Maps Platform integrációja az IDE-be, amely segít hozzáadni a geolokációs funkciókat az alkalmazásokhoz, valamint Chrome Dev Tools és Lighthouse integrációkat az appok hibakeresése érdekében.
A Google az OpenAI Sorájának riválisát hozza el a Veo nevű AI-modellel, amellyel körülbelül egyperces, 1080p-s videoklipeket generáltathatunk. A Veo képes különböző vizuális és filmes stílusok rögzítésére, valamint a már elkészült felvételek szerkesztésére, módosítására.

A Circle to Search funkció (amivel bekarikázva kereshetünk) képes lesz összetettebb problémák megoldására is a pszichológia és a matematikai szóproblémák terén. A cél az, hogy még természetesebbé tegyék a Google keresővel való kapcsolatot valamilyen művelet elvégzésével.
A Firebase platform új kiegészítője, a Firebase Genkit célja, hogy megkönnyítse a fejlesztők számára az AI-alapú alkalmazások JavaScript/TypeScript nyelven történő létrehozását, és hamarosan a Go támogatás is megjelenik hozzá (ez egy nyílt forráskódú, Apache 2.0 licencet használó keretrendszer, amivel a fejlesztők gyorsan beépíthetik az AI-t az új és meglévő alkalmazásaikba).
Jön a Pixel 8a, amely 499 dollárról indul a tengerentúlon, és az egyik legfontosabb újdonsága a Tensor G3 chip, de komoly fegyvertény lehet a Gemini "fejlesztői funkcióként" való hozzáadása is. A 6,1 hüvelykes, 1080x2400-as felbontású kijelzőt, a kettős hátlapi kamerarendszert (64 megapixeles főszenzor, 13 megapixeles ultraszéles kamera), a 8GB RAM-ot és a 123/245 GB-os tárhelyet egy 4492 mAh-es akkumulátor szolgál ki. A Google Pixel Tablet, a Slate pedig már kapható.

MSI Vector 16 HX AI teszt – így szép csak igazán a gamerlét Bivalyerős Intel CPU és GeForce RTX 50-es GPU dübörög az új Vector 16-ban, ami nem titkolja el, hogy PC-gamernek lenni milyen jó dolog is.

Hirdetés

Minden az AI-ról szól: ezeket jelentette be a Google az I/O 2024-en

Íme a 2024-es Google I/O bejelentései tőmondatokban:

Hirdetés

Verhetetlen áron zsákolhatod be a Windows 11 Prót

Kövess Facebookon!

A Seagate szerint többet ártanak a környezetnek az SSD-k, mint a merevlemezek

Hivatalos: itt a megfizethető Nvidia GeForce RTX 5060-as széria

Ha új tévét veszel, ezeket a funkciókat mindenképp tudnia kell!

Mark Zuckerberg törölni akarta az összes barátunkat a Facebookon

Így védekezz az új adathalász-trükk ellen

Ingyen adja a Google a Gemini AI prémium csomagját a diákoknak, de nem örökre