Hirdetés

Minden az AI-ról szól: ezeket jelentette be a Google az I/O 2024-en



|

A Google minden területen ráfekszik a mesterséges intelligenciára, mi pedig összeszedtünk az összes fontos információt a vállalat terveiről, projektjeiről.

Hirdetés

Ma tartotta meg a nagy éves konferenciáját a Google, melynek keretében számos termékéről szót ejtett, kézzel foghatóakról és virtuálisakról egyaránt. A tavalyihoz hasonlóan újfent kétórás előadásban darálták le az előadók azokat az innovációkat és fejlesztéseket, amiken jelenleg dolgoznak, és természetesen a Google I/O-n is hatalmas hangsúlyt kapott a mesterséges intelligencia és az arra épülő funkciók.

Az alábbiakban egy rövid összefoglalót olvashattok a rendezvényen elhangzott legfontosabb részletekről, a cikk végén beágyazott videót elindítva pedig végignézhetitek az előadást, ha a teljes élményre vágytok. 

Hirdetés

Íme a 2024-es Google I/O bejelentései tőmondatokban: 

  • A Gemma a Google nyílt forráskódú, nagyméretű nyelvi modellje, amellyel kapcsolatban bejelentette a cég, hogy egy új, 27 milliárd paraméteres modellt ad hozzá a Gemma 2-höz, a modellcsalád következő generációja júniusban jelenik meg. 
  • Kap egy kis gondoskodást a Google Play, többek között az alkalmazások új felfedezési funkciójával, a felhasználók becsábításának új módjaival, a Play Pontok frissítéseivel és a fejlesztők számára elérhető eszközök (mint a Google Play SDK Console és a Play Integrity API) egyéb fejlesztéseivel, az appkészítők lehetőségeit kibővítő Engage SDK kiadásával.
  • A Google bemutatott egy olyan funkciót, amely hívás közben figyelmeztetni fogja a felhasználókat a lehetséges csalásokra. Ez az Android egy jövőbeli verziójával kerül beépítésre, és a Gemini Nanót, a Google generatív AI-kínálatának legkisebb változatát használja. A rendszer hatékonyan, valós időben fogja figyelni a csalásokkal összefüggésbe hozható beszélgetési mintákat (például ha valaki banki képviselőnek adja ki magát). 
  • A Google Fotókat is a mesterséges intelligencia segítségével turbózzák fel: ezt a Gemini AI-modellje által működtetett kísérleti funkció, az Ask Photos elindításával teszik meg. A nyár folyamán bevezetésre kerülő újdonság intuitívabbá teszi a megfelelő tartalom (személyek, helyek, dolgok) megtalálását a fotókon, kevésbé lesz manuális a keresési folyamat. 
  • A Gemini modellcsaládot több más területen is bevetik:
    • A Gmail esetében az AI közreműködésével kereshetnek, összegezhetnek és szerkeszthetnek majd leveleket a felhasználók, és akár összetettebb feladatok esetén is intézkedni tud, például segíthet egy űrlap kitöltésével. 
    • A Gemini 1.5 Pro nagy előrelépés lesz: a vállalat modellcsaládjának zászlóshajója az új verzióval hosszabb dokumentumokat, kódbázisokat, videókat és hangfelvételeket is képes elemezni, akár 2 millió tokent is képes befogadni (ez a korábbi mennyiség duplája).
    • A Gemini Live-val "mélyreható" beszélgetéseket folytathatunk majd a Geminivel: megszakíthatjuk a chatbotot, miközben beszél és különféle kérdéseket tehetünk fel az egyes részletek tisztázására, Gemini pedig valós időben alkalmazkodik majd, képes lesz látni és reagálni a felhasználó környezetére, akár az okostelefon kamerája által rögzített fényképek, videók segítségével is. 
    • A már említett Gemini Nanót, a legkisebb AI-modelljét a Chrome böngészőbe is eépíti a Chrome 126-tal kezdődően. A vállalat szerint a fejlesztők így igénybe vehetik a modellt a saját AI-funkcióik működtetésére. 
    • A Gemini on Android a Google Asszistens AI-jal meghajtott helyettesítője lesz, amely kihasználja majd az Android rendszerbe és a Google alkalmazásaiba való mély integrációját. Így például a felhasználók képesek lesznek a mesterséges intelligencia által generált képeket közvetlenül a Gmail, a Google Messages és más alkalmazásokba húzni. A YouTube-tábor pedig konkrét információkat találhatnak majd a videókon belül egy koppintással. 
    • A Google Maps esetében is elérhetővé válnka a Gemini-modell képességei, kezdve a Places API-val. A fejlesztők saját alkalmazásaikban és weboldalaikon megjeleníthetik a helyek és területek generatív AI-összefoglalóit. Ezek a Gemini által, a Google Maps több mint 300 millió közreműködőből álló közösségének meglátásai alapján készülnek. 
  • A TPU (Tensor Processing Unit) teljesítményét megnövelik azáltal, hogy bemutatták az AI-chipek következő, hatodik generációját. Trillium néven még idén piacra kerülnek, és az elődhöz képest 4,7-szeres teljesítménynövekedést tudnak felmutatni.
  • A Google keresésben is egyre inkább hasznát vehetjük majd a mesterséges intelligenciának, az AI-alapú áttekintéseket az Egyesült Államokban vezetik be először, emellett a Gemini ügynökként való használatát is tervezik, például olyan dolgokban, mint az utazásszervezés. Eleinte még csak egy rövid összefoglalót kapunk a keresett témával kapcsolatban, de a vállalat azt tervezi, hogy a teljes találati oldal rendezésében, kiaknázásában generatív AI-t használ majd.
  • A Google bejelentette az Imagen 3-at, az Imagen generatív AI-modellcsalád legújabb tagját. Az új változat az Imagen 2-vel szemben pontosabban érti meg a szöveges utasításokat, amelyeket képekre fordít, és "kreatívabb, részletesebb", illetve kevesebb "zavaró alkotást, hibát" produkál. Állításuk szerint ez az eddigi legjobb modelljük a szöveg megjelenítésére. 
  • A Project IDX, a vállalat következő generációs, AI-központú, böngészőalapú fejlesztőkörnyezete mostantól átlépett a nyílt bétaverzióba: a frissítéssel együtt érkezik a Google Maps Platform integrációja az IDE-be, amely segít hozzáadni a geolokációs funkciókat az alkalmazásokhoz, valamint Chrome Dev Tools és Lighthouse integrációkat az appok hibakeresése érdekében.
  • A Google az OpenAI Sorájának riválisát hozza el a Veo nevű AI-modellel, amellyel körülbelül egyperces, 1080p-s videoklipeket generáltathatunk. A Veo képes különböző vizuális és filmes stílusok rögzítésére, valamint a már elkészült felvételek szerkesztésére, módosítására.
  • A Circle to Search funkció (amivel bekarikázva kereshetünk) képes lesz összetettebb problémák megoldására is a pszichológia és a matematikai szóproblémák terén. A cél az, hogy még természetesebbé tegyék a Google keresővel való kapcsolatot valamilyen művelet elvégzésével. 
  • A Firebase platform új kiegészítője, a Firebase Genkit célja, hogy megkönnyítse a fejlesztők számára az AI-alapú alkalmazások JavaScript/TypeScript nyelven történő létrehozását, és hamarosan a Go támogatás is megjelenik hozzá (ez egy nyílt forráskódú, Apache 2.0 licencet használó keretrendszer, amivel a fejlesztők gyorsan beépíthetik az AI-t az új és meglévő alkalmazásaikba).
  • Jön a Pixel 8a, amely 499 dollárról indul a tengerentúlon, és az egyik legfontosabb újdonsága a Tensor G3 chip, de komoly fegyvertény lehet a Gemini "fejlesztői funkcióként" való hozzáadása is. A 6,1 hüvelykes, 1080x2400-as felbontású kijelzőt, a kettős hátlapi kamerarendszert (64 megapixeles főszenzor, 13 megapixeles ultraszéles kamera), a 8GB RAM-ot és a 123/245 GB-os tárhelyet egy 4492 mAh-es akkumulátor szolgál ki. A Google Pixel Tablet, a Slate pedig már kapható. 
Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.