Olvasóink többség minden bizonnyal követi a mesterséges intelligencia használatára vonatkozó technológiai szintlépéseket, fejlődéseket, a nagy nyelvi modellek feldolgozása, a mindennapjainkra ható alkalmazások felgyorsítása és a hardveres képességek szinte napról-napra változnak. Az Nvidia ebben kitüntetett figyelmet kap, hiszen a vállalat elképesztő erőforrásokat delegált az AI-gyorsítók fejlesztésére és az értékesíthető portfólió kialakítására, a verseny első szakaszát pedig csak azért nyerte meg, mert elsőként lépett ebbe, a jövőt alakító irányba.
Miközben Jensen Huang és csapat épp megszámolatlanul nyomtatja a pénzt és tőzsdei rekordokat dönt meg, addig természetesen a versenytársak sem alszanak. Lehet, hogy picit kevesebb a felhajtás, de a háttérben az AMD, az Intel, a Microsoft, az Amazon és még sokan mások tervezik, fejlesztik saját gyártású vezérlőiket. Most csupán egyikükről érkezett hír, és nagyon úgy fest, hogy az Intel CEO-ja által évekkel ezelőtt felvázolt gyártási ütemváltás itt-ott meghozza a gyümölcsét.
Korai lenne kikiáltani a király bukását, mindenesetre a Stability AI legfrissebb teszteredményei alapján a Gaudi2 képes elérni azokat, az Intel által még 2023 nyarán ígért számokat, amik jelentősen túllépik az Nvidia A100 és H100 gyorsítók teljesítményét. Az Ampere architektúrára épülő Tensor-GPU esetében nincs szó meglepetésről, hiszen maga az architektúra nincs a mai lapkák szintjén, a H100 megjelenésekor maga az Nvidia jelzett minimum 4-szeres gyorsulási értékeket.
Érdekesebb az összevetés a Hopperrel szemben, és ha hihetünk a Stable Diffusion AI-alapú képgenerátor fejlesztőcsapatának, akkor az Intel megoldása 55%-kal magasabb képalkotásra képes másodpercenként. Nincs ugyan részletezve, de elméletileg a nyers hardverteljesítményt vizsgálták, vagyis semmilyen egyéb optimalizáció nem futott; nincs pl. Tensor Core specifikált kód.
Több területen végeztek összehasonlításokat, és a tesztfutásokból egyértelműen kiolvasható, hogy bár a nyers hardverteljesítmény fontos, és nagyon nem mindegy, mekkora és milyen sebességű HBM memória dolgozik a lapka mellett, az optimalizált futás jelentősen befolyásolhatja a gyorsítók sebességét. A nagyvállalatok közti harc pedig ezen a fronton dőlhet vagy épp mélyülhet el, hiszen a HPC-rendszerek piacán nem pusztán hardvervásárlás történik, hanem teljes ökoszisztémák mellett döntenek a vevők. Legalábbis a gyártók ebbe az irányba igyekeznek terelni mindenkit, a teljesítményre vonatkozó hatékonysági mutatók kizárólag akkor lesznek optimálisak, ha minimum platformszinten terveznek az AI-számításokkal.
Piaci részesedést tekintve a dominancia még érvényes, de izgalmas lesz megfigyelni a 2025-ös év kezdetét; erősnek ígérkezik az Nvidia Blackwell, de az Intel Gaudi 2 mellett az AMD Instinct MI300X is nagyon erős alternatíva az aktuális generáció ellenében.