A mobileszközök használói hosszú üzemidőt szeretnének, de nem a teljesítmény rovására. Az Intel új architektúrájának, a Haswellnek a központi célja az, hogy ezt a két egyelőre ellentmondásos követelményt kiegyensúlyozottan érhesse el. A hónap első felében, a 2012-es Intel Deceloper Forum-on, az Intel szakemberei mélyebb betekintést engedtek a cég új üdvöskéjének képességeibe és felépítésébe. Lássuk mivel lesz erősebb a 2013-ra várt eszköz, melyeket táblagépek, ultrabookok, asztali gépek és szerverek egyaránt használhatnak majd.
Az Intel ütemezése szerint a Haswell esetében ismét egy Tock-ot tisztelhetünk. Az Intel CPU fejlesztési programjában, melyet csak tick-tock-ként emlegetnek, a tick fázis képviseli azt, amikor egy már létező CPU architektúrát csak némileg változtatnak, miközben a fejlettebb gyártási technológia minden jótékony hatását élvezi. Ilyen az Ivy Bridge is, mely a Sandy Bridges alapokra épül, de már 22 nanométeres gyártási technológiával készül. Az új architektúrák esetében az Intel nem bízza a vak szerencsére a dolgot. Még csak az előzetes számításokban sem bízik. Azt a gyártási technológiát alkalmazza, amely már bizonyított. Jelen esetben tehát marad a 22 nm-es technológia. Erre már nyugodtan alapozhat a tock fázis.
Habár ennek fényében a Haswell egy szimpla tock, mégis azt kell mondjuk, hogy az új architektúrának hatalmas hatása lehet majd a piacra. Az Intel már egy ideje szellőzteti az információkat, miszerint a kétmagos kevesebb mint 10 W-ot fogyasztó Haswell alapú processzoroktól elkezdve a négymagos erőművekig mindent letesznek az asztalra, mégpedig úgy, hogy ezek az APU-k 20x jobb energiahatékonysággal fognak rendelkezni, mint az Ivy Bridges elődjeik. Az utóbbi momentum olyannyira érdekes, hogy még az architektúra bemutatása előtt érdemes az új energiamenedzsmenttel megismerkedni.
Éber álom
A modern CPU Energia Szabályozó Egysége (Power Control Unit) szinte tranzisztor szinten képes szabályozni az energiát. A PCU figyeli, hogy a processzor melyik részei nincsenek használatban és csak azokat a szegmenseket aktiválja, melyek működésére valóban szükség van. A többiek alvó státuszba kerülnek. A probléma azonban nem ezzel van, hanem azzal, hogy az alvó részek onnan milyen hamar képesek használható állapotba evickélni. Erősen sarkított példával élve körülbelül olyan ez, mintha minden egyes alkalommal legalább egy percet kellene várnunk, mikor a laptop hibernálva volt. Vélhetőleg már falhoz vágtuk volna a noteszgépet. Az Intel CPU-k egészen az Ivy Bridge-ig két fő állapottal rendelkeztek. Volt az aktív és az alvó. Ettől persze komplikáltabb a dolog, de általánosságban ez a lényeg. Az évek folyamán az Intel csökkentette az alvó elemek "felébredési" idejét. A mostani Ivy Bridges processzoroknak mindössze pár másodpercre van szüksége, hogy mély hibernált állapotból üzemkésszé váljanak. A mérnököknek azonban ez nem elég, hiszen ez a pár másodperc hol van még az azonnalihoz képest.
Így azzal a megoldással álltak elő, hogy egy harmadik fő állapotot, egy aktív készenléti (Active Idle) állapotot adtak a képlethez. A S0ix néven is ismert rendkívül alacsony energiaszintű állapot 20× kevesebb energiát igényel, mint az Ivy Bridge esetében az S0, vagyis az aktív állapot. Mit jelent ez a gép számára? Az aktív készenléti állapot során a gép úgy érzékeli, hogy "éber", eközben azonban a CPU nagyrészt szunyókál. A legrosszabb esetben, ahhoz hogy a CPU teljesen felébredjen mindössze fél másodpercre van szükség. Felhasználói szempontból ez pedig mindenképpen jobb, mint a pár másodperc. A Haswell működés közben valahol mindig ezen az azonnali felébredés mezsgyéjén fog mozogni. Egyébként az itt használt energiamenedzsment nem újdonság, hiszen a technológia számos részét közvetlenül az Intel Atom processzoroktól kölcsönözte a Haswell.
Ez persze csak hab a tortán. Van itt bőven más is, ami megkönnyíti a CPU felébredését. A két fő állapotot energiahatékonyabbá tették és ezáltal a felébredési idő is csökkent. Fentebb alvó, és aktív készenléti állapotokról beszéltünk, de ezek valójában több kisebb állapotból tevődnek össze. A mini állapotok (C-státusz) határozzák meg, hogy a CPU melyik része legyen lekapcsolva. Az energiamenedzsment finomítása érdekében a Haswell új C-állapotot vezetett be. Ennek köszönhetően a hordozható eszközök hosszabb üzemidővel rendelkeznek majd, mivel a PCU nem fogja folyamatosan felkeltegetni a CPU azon részeit, amelyek nem kellenek, annak érdekében, hogy a szükséges részek felébredhessenek.
Az Intel ezen felül arra is vetett egy pillantást, hogyan viselkedik a CPU, ha egy kijelzőre dobja ki a képeket. Abban az esetben, ha a felhasználó mondjuk egy konstans képet vagy szöveget néz a kijelzőjén, anélkül, hogy görgetne vagy nagyítana, a Haswell CPU nagyrészt alvó állapotba kerül és a kép frissítésének feladatát a monitor önfrissítő panelja veszi át. Mikor a felhasználó megmozdítja az egeret vagy leüt egy billentyűt a processzor felébred. Ezt a technológiát a tavalyi IDF-en mutatta be az Intel.
Most, hogy kis betekintést nyertünk, hogyan is gazdagodott a Haswell energiamenedzsmentje, nézzük meg miben fejlődött a processzor architektúrája.
Nagyobb teljesítmény, jobb hatásfok
A technológiai ülések egyikén Ronak Singhal többször is elismételte, hogy semmilyen újításnak számító funkciót nem kapott a CPU, hogy hatékonyabban dolgozhasson. A CPU tervezők már így is számos trükkel bírnak, hogy a teljesítmény növelése mellett a kis kegyencük megfelelően egyensúlyozhasson energiafelhasználás vékonyka kötelén.
Az egyik trükk a hatékonyabb elágazásbecslés, aminek köszönhetően a CPU úgymond belekukkanthat a jövőbe és láthatja, hogy melyik utasításokkal kell majd számolnia. Amennyiben tudja milyen feladatok ömlenek rá a csőből, sokkal pontosabban oszthatja szét az erőforrásokat. Csak azokat az eszközöket fogja igénybe venni, amelyekre valóban szüksége lesz. Az Intel mérnökei a jobb elágazásbecslés érdekében megnövelték a L2 TLB (Translation Lookaside Buffer) méretét, valamint nagyobb out-of-order ablakot kapott a processzor.
Ha egy processzor egy ciklus alatt több feladatot képes elvégezni, akkor ugyanazon energiafelvétel mellett hatékonyabbá, nagyobb teljesítményűvé válik. Az Intel ezért az ütemező mögé két plusz portot toldott. Ide került egy integer ALU, valamint egy plusz címtár egység. Ezeknek köszönhetően egy ciklus alatt két lebegőpontos művelet végezhető, ami azt eredményezi, hogy ugyanazon az energiaszinten hatékonyabb a Haswell, mint az Ivy Bridge. Ezt javarészt azonban az AVX2 utasításkészletnek köszönheti az architektúra. Az AVX2 megduplázza a Haswell FP teljesítményét. Egy gyors matek után kiderül, hogy így a Haswell csúcs FP teljesítménye a négyszerese a Nehalemének. A 256 bites feldolgozókat azonban táplálni is kell ezért az L1 és L2 gyorsítótárak sávszéle is javult. A read és write portok mindegyike 32 Byte széles lett, eliminálták a bank konfliktusokat, valamint csökkentették a késleltetést. Az L1 így 96 Byte (64 B read + 32 B write), az L2 pedig 64 Byte szóhosszal képes megbirkózni egy ciklus alatt. Ez annyit tesz, hogy egy ciklus alatt a CPU-nak kevesebbet kell várnia, hogy megérkezzen a feldolgozandó adat. Ez azonban nem jár áldozatok nélkül. Míg az energiahatékonyság javult, addig ennek a chip ára látta a kárát, hiszen ugyanazon méretű szeleten kevesebb Haswell chip fog majd elférni, mint amennyi Ivy Bridges elférne. A méret növekedésének persze nem a fenti két extra port az oka. Legfőbb kiváltója az IGP.
Csúcs Pc-s játékok tableten!
A Haswell a már létező Intel HD grafikus magra, a Gen 7-re épít, melyen finomítottak és fejlesztették az energiahatékonyságát. Erre utal a Gen 7.5 elnevezés is. Ez a darab már jobban skálázható ezért a Haswell három különböző integrált grafikus vezérlővel rendelkezik majd. Kapunk GT1-t, GT2-t és GT3-t is, ellenben az Intel HD 2500 és HD 4000-zal szemben, amit az Ivy Bridge nyújt.
Teljesítmény szempontjából a GT3 a legérdekesebb, hiszen a feldolgzóegységek (4 shader tömbben 40 feldolgozó) megduplázásával az Intel megkétszerezi a teljesítményét a HD 4000-nek. A feldolgozóegységek a GPU-k fő számító egységei, melyeket közös moduláris egységekbe, úgynevezett shader tömbökbe építenek. Két shader tömb az Intel fordításában pedig Slice Common-nak nevezendő.
Ezek a shader tömbök a feldolgozóegységeken kívül számos kulcsfontosságú eszközt tartalmaznak, hogy elbírjanak a valós idejű grafikával. Ilyen eszközök a raszterezők és a gyorsító tárak. Annak érdekében, hogy az Intel a GT3-ban megduplázhassa a HD 4000 feldolgozóegységeinek a számát szimplán egy újabb slice commont vetett be. Ezen egy render tömb két shader tömböt szolgál ki. Ez további chip területet foglal el, ám energiát takarít meg, hiszen a GPU-nak nem kell minden egyes alkalommal turbó módba kapcsolnia, ha etxtra teljesítményt várnak tőle.
Ezen felül számos finomhangoláson esett keresztül a GPU. Fontos kiemelni, hogy GT3 mellé kerülő - eddig L4 néven pletykált - memória mérete 32, 64 vagy 128 MB lesz. Azt hogy az IGP mennyivel gazdálkodik majd modellfüggő, de annyi teljesen biztos, hogy ehhez a memóriához a processzor magok nem nyúlhatnak. Ez azt jelenti, hogy buffermérettől függően az IGP-nek már nem feltétlenül kell a rendszermemóriáért visítania. Bár a mai játékok erőforrásigényét nézve ez úgyis megtörténik majd. A dedikált memóriák mibenlétéről egyelőre nincs pontos információ, de előfordulhat, hogy az Intel a floating body cell névre hallgató megoldást veti majd be, amivel egy ideje már foglalatoskodik.
Másik apró, de fontos részlet, hogy az IGP innentől kezdve anélkül szippanthatja magába az energiát, hogy felkellene húznia a processzor feszültségét. Ezt úgy oldották meg, hogy a front endre betoltak egy erőforrás elosztót, ami képes levenni a processzor válláról egyes driver munkák okozta terhet, így a CPU mehet szunyálni, miközben a GPU végzi a maga feladatát.
Ezek a funkciók összességében annyit jelentenek, hogy a Haswell legerősebb GPU-jának úgy növelték meg a teljesítményét, hogy eközben a fogyasztáson nem kellett emelni. Az IDF 2012 első keynote-jára kilátogatók megtekinthették, hogy mire is képes egy Haswellel szerelt tesztrendszer a gyakorlatban. Az Intel két különböző alkalmazást futtatott. Az egyik egy szintetikus grafikai tesztprogram, az Unigine Heaven volt, a másik pedig a népszerű PC-s RPG, a Skyim. A két program alatt jól látható volt, hogy a Haswell fele akkora energiafelhasználással szerepelt olyan jól, mint az Ivy Bridges processzor.
Nagyon jól tudjuk, hogy az Intel jócskán megkésett a szoftveres támogatás felpakolásával, de a Haswell változtat ezen, hiszen már támogatja a legújabb API-kat, vagyis a DirectX 11.1-et (Windows 7 és Windows 8), az OpenCL 1.2-t, valamint az OpenGL 4.0-t.. Habár az integrált 3D motor teljesítménye ennyit javul, az asztali felhasználók továbbra is megtoldják majd a gépeiket diszkrét grafikus kártyákkal, hogy a lehető legszebb képek tárulhassanak eléjük a lehető legjobb teljesítményen. De arról ne felejtkezzünk el, hogy a Haswellel olyan hosszú üzemidejű ultrabookok és táblagépek érkezhetnek, melyekkel a legfrissebb játékokkal is szórakozhatunk.