Számítógép vásárlásakor, azon belül is a processzor kiválasztásakor hatalmas dilemma előtt állunk: általában csak a két legnagyobb CPU-gyártó neveit halljuk megjelenni a kész konfigurációk kínálatában, ám a döntés az Intel és az AMD között még így sem könnyű. Hogy kicsit segítsünk a legmegfelelőbb erőművet kiválasztani későbbi konfigurációnk alapjához, összegyűjtöttük a legfontosabb információkat a két cég legújabb architektúráiról.
Napjaink feldolgozóegységei
A modern processzorok napjainkra magas szinten integrált chipekké váltak, melyek egy közös félvezető eszközön helyezik el a különböző, működéshez szükséges egységeket, kiegészítve a perifériák vezérlőivel. Éppen ezért a gyártók már – teljesen jogosan – egyetlen chip működésén alapuló komplex rendszernek tekintik elkészített processzoraikat.
Természetesen a költséghatékonyság mellett egyéb okok is ahhoz vezettek, hogy a gyártók az ilyen nagymértékű összevonások és az egyetlen központi vezérlő kialakítása mellett döntöttek. Egyrészt a kevesebb modulból álló chipben a számítási egységek közelebb helyezkednek el a kontrollerekhez, aminek köszönhetően sokkal közvetlenebbé (és ezáltal lényegesen gyorsabbá) válik a kapcsolat közöttük. Ezen kívül természetesen az egyetlen lapka sokkal kompaktabb gépházak kialakítását teszi lehetővé, hisz nem kell külön-külön gondoskodnunk az egyes részek hűtéseiről, mivel minden integrált. Az AMD az x86-os processzoraiban gyorsított feldolgozóegységeket alkalmaz (APU), amely alapvetően a 2, 4 vagy 8 magos főprocesszort, egy viszonylag nagy gyorsítótárat, illetve egy – rendszerint – nagy teljesítményű grafikus memóriát tartalmaz. Ezzel szemben az Intel központi feldolgozóegységeket (CPU) használ processzorai építésekor, melyek a jelenlegi PC-s változatok esetében 2, 4 vagy 6 CPU-magot, valamint a memória, illetve a megjelenítő csatolóit, egy grafikus chipet és egy nagy, közös puffert foglal magában.
A processzorok előállítása során a CPU-architektúra kialakításakor a tranzisztorok mérete és száma fontos szerepet játszik. Minél kisebb ugyanis az áramkör úgynevezett szerkezeti szélessége, annál nagyobb wattonkénti számítási teljesítményt képes elméletben kisajtolni magából a processzor, és – ideális esetben – a nagyobb a tranzisztorszám komolyabb számítási teljesítménnyel is párosul.
Domináns szerepkörben
Nem véletlen, hogy az Intel rengeteg tapasztalatával, amit első, 4004-es CPU-jának 1971-ben történt piacra dobása óta szerzett, szinte monopóliumot alakított ki a processzorpiacon, az eladások 80 százalékánál a cég logója szerepel a specifikációs listán. Ha össze kívánjuk hasonlítani a két vállalat erőviszonyát, elég csupán arra az adatra tekintenünk, amely szerint az Intel éves kutatási és fejlesztési költségvetése sokkal magasabb, mint az AMD 12 hónap alatt szerzett bevétele.
Az AMD, remélve, hogy lecsippenthet valamelyest a konkurens gyártó eladásaiból, úgy döntött, hogy jelenlegi generációs – Kaveri névre hallgató – chipjében kicsit felülígéri az Intelt a processzorok számában, és a tajvani TSMC céggel karöltve rendkívüli teljesítményű, 28 nanométeres lapkák gyártásába kezdett. A 32 nanométeres elődökhöz (Richland és Trinity) képest az áramkörök száma a vadonatúj kialakításban 1,3 milliárdról 2,4 milliárdra nőtt. Az Intel 2013 közepén bemutatott Haswell-generációjában a házon belül már jól ismert 22 nanométeres gyártási technológiát használva készültek a CPU-k. Az előd Ivy Bridge-hez képest a Haswell-chipek mérete 160 négyzetmilliméterről 177-re nőtt, ám ez az apró növekedés 1,4 milliárdos áramkör-gyarapodáshoz vezetett.
Kaveri vs. Haswell
A Kaveri különlegessége, hogy egy heterogén rendszerarchitektúra (HSA), melyben az AMD processzor, illetve a grafikus magok közötti szoros kölcsönhatás jelentősen növeli az APU számítási hatékonyságát. A heterogén rendszerekben kiemelkedően fontos szerepe van az osztott memória-hozzáférésnek és -kezelésnek, hiszen a rendszerben a grafikus egység és a processzor egyetlen közös – Heterogeneous Uniform Memory Access (hUMA) nevű – címtárral rendelkezik, melynek köszönhetően az architektúra bármely magja hozzáférhet a többi mag által kiszámított eredményekhez, illetve a gyorsítótárazott adatokhoz is. E módszer megvalósításának érdekében az AMD szakított egy régóta fennálló hagyománnyal: eddig kizárólag a processzor felelt a programsorozatok zavartalan futásáért. A HSA-ban már a számítások elvégzésére is programozható a CPU, C++ és Open CL C programnyelvek használatával.
Az AMD a hQ (Heterogeneous Queuing) nevű technológia beépítésével kívánja minimálisra csökkenteni a türelmetlen várakozással töltött perceket, illetve az adatok feldolgozására szánt időt. Az ilyen kialakítás előnyei meglehetősen kézenfekvőek, hisz lehetővé teszi, hogy minden feladat végrehajtásához az aktuálisan legoptimálisabb számolási módot használjuk, ily módon a soros számításokat tökéletes sebességgel hajtja végre a CPU, míg a grafikus magok a rengeteg lebegőpontos egységgel (FPU) a párhuzamos számításokat képesek hibátlanul – és természetesen villámgyorsan – elvégezni. Az osztott címtárú kialakításnak köszönhetően pedig minden, számítást végző egység látja a többi eredményét, sőt akár még a feladat elvégzése közben kapott részeredményeket is felhasználhatják saját műveleteikhez.
Aztán 2011-ben bevezették a Streamroller névre keresztelt mikroarchitektúrát, amely az AMD korábbi Bulldozer kernelének második optimalizálásaként látott napvilágot. Kialakítása moduláris felépítésű, egy-egy eleme pedig két logikai magból áll, melyek két 128 bites FPU-ból, két integeregységből, két ALU-ból, valamint két címszállításért felelős egységből (AGU) alkotnak rendszert, az elvégzett műveleteik számítási eredményei pedig egy közös, L2-es gyorsítótárban tárolódnak.
A jelenleg már a negyedik generációját taposó Intel chipek legújabb tagja, a Haswell 2013 közepén ünnepelte premierjét. A processzor tulajdonképpen a 2011-ben bemutatott Sandy Bridge kódnevű mikroarchitektúra alaposan átdolgozott és továbbfejlesztett változata, ami azonban alacsonyabb csíkszélesség mellett komolyabb teljesítményt kínál. Kialakítását gyűrűs felépítés jellemzi: a CPU-mag, a grafikus memória, illetve a folyamatokért felelős System Agent egy közös Last-Level-Cache-en (LLC) keresztül cserélnek adatot, a különféle alegységeket pedig egy körkörösen elhelyezett busz köti össze. Az ősökkel összevetve a jelenlegi generáció 50 százalékkal több tranzisztort tartalmaz, melyek nagyrészt a grafikus memóriát bővítik.
A Haswell mikroarchitektúra bevezetésével egy időben az Intel kiterjesztette x86-os utasításkészletét is. A bővítőcsomag keretein belül debütált újdonságként a kibővített utasításkészlettel felszerelt AVX2 (Advanced Vector Extension 2) is, ami már képes a 256 bites regiszterek kezelésére, illetve akár 60 százalékkal felgyorsíthatja a számítási folyamatokat annak köszönhetően, hogy több memóriacímből képes egyszerre olvasni (például multimédiás alkalmazások vagy titkosítás során lehet hasznos). Ezen felül a hálózati feszültség szabályozására egy külön kontrollert integráltak a CPU-ba, ami sokkal nagyobb energiahatékonyságot garantál akár extrém ingadozások esetén is (például mikor a rendszer készenléti módból próbál felállni).
Egyre fontosabb az integrált GPU
A Kaveriben használt hatalmas mennyiségű áramkörök közel 50 százalékát az integrált grafikusmagban találhatjuk meg, míg az Intel esetében ez a szám csupán 30 százalék. Hiányossága orvoslásaként az Intel hét különböző grafikus feldolgozóegységgel kínálja eladásra eszközeit, melyek közül a legkomolyabb képességekkel rendelkező termék, az Iris Pro Graphics 5200 akár 128 MB-os extra memóriával is feldobhatja életünket. A Kaveri megjelenésével természetesen az AMD is bevezetett egy új grafikus processzort, melyben a korábban használt VLIW (Very Long Instruction Word) technológiát felváltotta a sokkal modernebb GCN (Graphic Core Next), amit az AMD már alaposan letesztelt a Radeon HD 7000-es grafikuskártya-család elkészítésekor. A GCN architektúra a párhuzamos számítások végrehajtására szakosodott, ami négy SIMD-t és 16 ALU-t fog össze egyetlen Shader-halmazban, és a négy TMU-val kiegészülve adják a GPU magját.
A grafikus feladatok ellátására a Kaveri nyolc magot használ, ami típustól függően akár 512 Shader-processzort is tartalmazhat, melyek egy 128 bites memóriainterfészhez csatlakoznak. A felületet a 2133-as DDR3 típusú RAM-okhoz alakították ki, azonban az ezeknél gyorsabb és nagyobb teljesítményű memóriák beépítése sem jelent problémát a jövőben. A jelenlegi generációs videokártyákhoz hasonlóan a Kaveri grafikus memóriája is támogatja a DirectX 11.2-t, az Open CL-t, az Open GL 4.3-at, a PCI Express 3.0-t, valamint a házon belül használt Mantle-t, illetve a Dual Graphics technológiát is. Ezen felül a grafikus feldolgozóegységgel érkezik még egy erőteljes videokódoló, illetve dekódoló is, a kimenő kép jele pedig DisplayPort 1.2-n, DVI-n, HDMI-n és VGA-kimeneteken keresztül küldhető a megjelenítőre.
Processzorának jelenlegi, negyedik generációs változatában az Intel a nagy teljesítményű grafikus memória kialakítására helyezte a hangsúlyt. A hétféle változatú, különféle képességekkel megáldott Haswell alapok közös pontjait a képernyő-csatolófelületek (DVI, Displayport 1.2, HDM11.4a, VGA és Wireless Display 4.1), valamint az alkalmazható programozási technológiák (DirectX 11.1, Open CL 1.2 és Open GL4.0) jelentik. Természetesen a különféle kialakítások gépspecifikus jelleget is mutatnak, asztali számítógépeinkbe kizárólag a HD Graphics jelzéssel ellátott chipek kerülnek, míg a legnagyobb teljesítménnyel rendelkező Iris Graphics-ot meglepő módon a noteszgépek számára tartják fenn.
Ki a jobb matekból?
Annak ellenére, hogy az AMD a Kaverivel a jelenleg kapható legösszetettebb processzort készítette el, ez a kialakítás nem feltétlenül gyorsabb az Intel saját boszorkánykonyhájában kifőzött megoldásainál, hisz a rengeteg aprólékos szempontból vizsgálható processzorok erősségéről, illetve gyengeségéről szóló véleményeket érdemes kicsit szkeptikusan kezelni, mivel ezek az adatok, ha nem is torzítanak, de könnyedén manipulálhatók. Éppen ezért mi is fontosnak tartottuk, hogy mikor összevetjük a két gyártó aktuális processzorait, legyen legalább egy olyan közös szempont, amiben a Kaveri és a Haswell modellek nagyjából egységet képeznek. Tehát objektív tesztek hiányában két nagyjából egyező teljesítményű architektúra képességeit vetettük össze, majd két másik kialakítást vizsgáltunk, melyek megegyeznek bolti árukban, hogy megtudjuk, mit kapunk az Inteltől és mit az AMD-től hasonló összegért.
Fogyasztás alapján az AMD A8-7600 (négy mag egyenként 3,3 GHz-es maximum) típusú processzorát érdemes összevetnünk az Intel Core i3-4130-cal (két mag, egyenként 3,4 GHz-es órajelen). Hasonló tesztkörnyezetben a processzor üresjárati áramigénye mindkét esetben 35-40 watt volt, míg komolyabb terhelés során ez a szám 75-80 wattig is felkúszott. A processzor teljesítményének vizsgálatakor a Haswell (annak ellenére, hogy csupán két mag állt rendelkezésére a feladatok elvégzéséhez) 20 százalékkal gyorsabban hajtotta végre a rá bízott taskokat, mint a Kaveri. Grafikus teljesítményben azonban meg sem közelítette vetélytársa az AMD-t, hiszen a HD Graphics 4400-zal szerelt Intel lapka 60 százalékkal nagyobb teljesítmény elérésére volt képes.
Következő összehasonlításul az AMD A10-7850K (négy mag 3,7 GHz, TPD: 95 watt) processzorát ugrasztottuk össze az Intel Core i5-4440-es (négy mag 3,1 GHz, TPD: 84 watt) típusú modelljével. A két eszköz nagyjából azonos áron vásárolható meg hazánkban (cirka 43 000 forintért), így érdekes összemérni a tudást, amit egyazon összegért kínál az AMD, illetve az Intel megoldása. CPU-teljesítmény alapján ismételten egyértelmű Intel-fölényt tapasztalhatunk, mivel hiába rendelkezett az AMD a magasabb órajelű processzorral, a benchmarktesztek során a Haswell 50 százalékkal nagyobb teljesítményre volt képes. Grafikus teljesítményben már egészen más a helyzet: az izzasztó játékoknak alávetett processzorok közül az AMD majdnem kétszer nagyobb fps-számot produkált, mint a Haswell processzor az Intel HD Graphics 4600-zal.
Összegzésként tehát kijelenthetjük, hogy a Kaveri piacra dobásával az AMD egy nagyszerű és kiegyensúlyozott APU-t adott a vásárlók kezébe. A CPU és GPU kombinációjából kialakított chip tökéletes az alapvető multimédiás feladatok elvégzésére, sőt az alkalmi játékosok igényeit is képes lehet kiszolgálni (amennyiben nem brutális grafikával megáldott programokon igyekeznek hódolni szenvedélyüknek). Azonban akik egyszerre több programmal dolgoznak, videókat szerkesztenek, vágnak, tehát elsősorban megfelelő CPU-teljesítményre van szükségük, azoknak érdemesebb a Haswell mellett dönteni, mely a többszálas adatkezelés és a komolyabb hardveres megpróbáltatások esetén jobban szuperál. Ha pedig szem előtt tartjuk az áramfogyasztást is, mindenképp az Intel terméke mellett kell letennünk a voksunkat, ugyanis a fejlett gyártási technológiák során kialakított hardverelemeknek és a visszafogottabb igényű áramköröknek köszönhetően lényegesen kevesebbet „esznek” a Haswellek az AMD CPU-inál.
Processzorkisokos
Ha a CPU-k misztikus világába vezet utazásunk, rengeteg rövidítéssel és ismeretlen szakszóval találkozhatunk, melyek azonban sokszor hasznos információkkal szolgálnak az adott lapkáról. Hogy olvasóink könnyebben eligazodjanak ezek között, összegyűjtöttük a cikkben is említett néhány alapvetőnek számító fogalom magyarázatát. A könnyebb kereshetőség érdekében ABC-sorrendbe raktuk a különböző fogalmakat, így vásárlás esetén a lapot felütve megtudhatjuk, mit is jelentenek a termék leírásánál feltüntetett értékek.
AGU (Address Generation Unit)
A címszámításért felelős egység, melynek feladatai közé tartozik a programutasítások címeinek kezelése, illetve a konténerek védelmi hibáinak szűrése is.
APU (Accelerated Processing Unit)
Az AMD processzorkoncepciójának lényege, hogy a CPU-t és a GPU-t egyetlen lapkán helyezik el. Ennek köszönhetően rendkívül hatékony és gyors lesz a feldolgozás, hiszen a nagy számításigényű feladatok végrehajtása automatikusan a grafikus processzorra kerül.
ALU (Arithmetic Logic Unit)
Az aritmetikai és logikai műveleteket elvégzésére kifejlesztett digitális áramkör alapvetően a számítógépek központi vezérlőegységének része. Neumann János fektette le az alapjait.
AVX2 (Advanced Vector Extensions 2)
Az Intel fejlesztette utasításkészlet valójában az x86-os architektúra kiterjesztésekor (vagyis a Haswell megjelenésével egy időben) debütált. Legnagyobb újítása, hogy képes egyszerre több memóriacímből is olvasni.
Dual Graphics
Dual grafikus kialakításról akkor beszélünk, ha a CPU integrált videovezérlője mellett gépünkben még egy külső grafikus kártya is megtalálható.
FPU (Floating Point Unit)
A magyarul csak lebegőpontos alegységnek hívott alkotóelem a CPU azon szerves része, ami a matematikai műveletekért felelős.
GCN (Graphic Core Next)
2011 végén vezette be az AMD a grafikus feldolgozóegységgel kibővült processzorarchitektúrát, az ALU-t, ami azért hatékony, mert az egymással összefüggő utasítások nem okoznak galibát a programkód futtatása során.
hQ (Heterogeneous Queuing)
A kis kétbetűs jelző garancia arra, hogy a CPU és a GPU képes az adatcserére egymás között anélkül, hogy az operációs rendszerhez kellene fordulniuk közvetítésért.
hSA (Heterogeneous System Architecture)
Az AMD processzorkoncepciója, melyben a CPU és a grafikus memória egyetlen chipben egyesül. Az így létrejött architektúrában hihetetlenül hatékonyan valósul meg a két egység közös működése.
hUMA (Heterogeneous Uniform Memory Access)
A CPU és a GPU megegyező munkaterületen, címtáron és műveleti memórián osztozik, melynek köszönhetően a megfelelő feladatokat az arra legoptimálisabb eszköz végzi el.
ILP (Instruction-level parallelism)
Az utasításszintű párhuzamosság egy érték, ami azt mutatja meg, hogy mennyi feladatot képes egymással párhuzamosan végezni a processzor.
Shared System Memory
A CPU és a GPU ugyanazon a műveleti memórián osztozik, melynek köszönhetően a megfelelő feladatokat az arra legoptimálisabb eszköz végzi el.
SIMD (SIngle Instruction Multiple Data)
Az x86os architektúra kiterjesztése hozta magával, a fogalom lényege, hogy az audio-, kép- és videotartalmak feldolgozása egyidejűleg, párhuzamosan, több szálon zajlik.
System Agent
A Sany Bridge architektúrával vezették be, és a processzorba integrált egységek (memóriavezérlő, PCI-E-vezérlő) tápellátásáért felelős ez a modul.
TDP (Thermal Design Power)
A CPU tényleges hőleadását adja meg, a hűtés tervezésekor van kiemelten fontos szerepe. Sajnos a termékek összevetése nem lehet pontos, mert gyártószinten is eltérő lehet a TDP számításának folyamata.
TMU (Texture Mapping Unit)
A textúrák címzését és szűrését, majd pixelekhez társítását végzi. Az e képességgel megáldott grafikus egységek sokkal jobb textúrafeldolgozási képességekkel bírnak.
VLIW (Very Long Instruction Word)
Egy olyan típusú architektúra, ami az utasításszintű párhuzamosság előnyeit használja ki. A VLIW-képes processzor az egymás után végrehajtandó utasításokat szétválasztja, és egymással párhuzamosan végrehajtja őket.