Your Weblog Name myBloggie 2.1.3 © 2005   
14 Jul 2006   11:18:43 am
Megérkezett a Conroe
Az Intel a 2004-es év folyamán kénytelen volt belátni, hogy az eredetileg rendkívül magas órajelek elérésére kifejlesztett NetBurst architektúra napjai meg vannak számlálva, a szivárgási áram olyan gondokat okozott (magas fogyasztás és hőtermelés), melyekkel még a világ legnagyobb chipgyártója sem volt képes megbirkózni. Szerencsénkre ez a fordulat egyben a többmagos központi egységek eljövetelét is jelentette, hiszen mindkét processzorgyártó úgy vélte, hogy a jövő a párhuzamos adatfeldolgozásé. Az Intel először egy gyorsan összedobott Pentium D-vel (Smithfield) rukkolt ki (ekkor még az volt a kérdés, hogy az AMD vagy az Intel fog hamarabb kétmagos processzort bemutatni), melyben két Pentium 4-es core volt "összedrótozva", majd később a Presler kódnéven ismert újabb kiadású Pentium D-ben az ötlet továbbfejlesztése volt megtalálható, ezúttal a tok alá két különálló processzormagot zsúfoltak be (egyszerűbb és költséghatékonyabb gyártás). Ugyanakkor a Presler egyben a 2000-ben megjelent NetBurstre épülő processzorok utolsó zászlóvivője is lett, hiszen az Intel már gőzerővel egy új mikroarchitektúra bevezetésének utolsó simításait végezte, ami végül a Core nevet kapta.



Az Intel Core egy teljesen új fejlesztése az Intel-architektúrákon alapuló asztali, mobil és szerver multi-core processzoroknak. Ez a több magra optimalizált, energiahatékony felépítésű architektúra a megnövelt teljesítmény, illetve teljesítmény per fogyasztás jegyében született. Legfőbb elődjének a mobilplatformra kifejlesztett Pentium M tekinthető, azt persze rengeteg újítással és továbbfejlesztéssel megfűszerezve.

Érdekes módon most, hogy az Intel egy teljesen új felépítésű CPU-családot vezet be, kiemelkedő fontosságú tényezővé lép elő a processzor, illetve a rendszer fogyasztása, és a fejlesztők dokumentumok tucatjain keresztül magyarázzák mindenféle csili-vili képlettel kiegészítve, hogy a teljesítmény nem csak az órajeltől, hanem az órajelenként végrehajtott utasítások számától is függ. Emlékezzünk csak vissza, ugyanez az Intel 2000-től 2005-ig, a kétmagos processzorok megjelenéséig azt állította, hogy csakis a megahertzek számítanak, vegyünk minél magasabb órajelű processzort, annál jobb lesz nekünk, mindeközben a Pentium 4 processzorok fogyasztása 130 watt fölé emelkedett; ez persze akkor nem volt lényeges kérdés... Micsoda fordulat!


Conroe (balra az óriási L2 cache)

Az Intel szerint az új képlet mostantól: teljesítmény = órajel x órajelenként végrehajtott utasítások (IPC) száma. Az AMD már az Athlonok megjelenése után ugyanezen az állásponton volt, mégsem vették komolyan a kisebb processzorgyártót, mert az Intel sokkal nagyobb befolyással bír. Ez a képlet végeredményben a MIPS (million instructions per second) értékének meghatározása, tehát kimondhatjuk, hogy az Intel ismét feltalálta a spanyolviaszt... Azonban napjaink egyre fejlettebb processzorai esetében ez a képlet már nem állja meg a helyét, mert a teljesítmény másképpen is fokozható, mint az órajel vagy az IPC növelése. Vannak még különböző módszerek, mellyekkel ugyanez a "hatás" érhető el, gondolunk itt arra, hogy például bizonyos módszerekkel csökkenthetjük a végrehajtandó utasítások számát, így végeredményben nő az egységnyi idő alatt végrehajtott utasítások száma (lényegében ugyanoda lyukadunk ki), ezt hivatottak elősegíteni a Single Instruction Multiple Data (SIMD) utasításkészletek is, mint amilyen az 1996-ban bevezetett MMX-technológia, vagy a később bevezetésre kerülő SSE, SSE2, SSE3, 3DNow!, 3DNow!+ is, és ugyanezt a nemes feladatot látja el a Pentium M-ben debütáló Micro-Ops Fusion, avagy mikroutasítások fúziója is. Erről később még szó lesz.

A teljesítmény kifejezésére már van egy képletünk, azonban ez még nem elegendő, mert ezúttal a rendszer fogyasztása is központi szerepet tölt be, így ezt is meg kell határozni valamilyen módon. Az Intel szerint a képlet: fogyasztás = áramköri elemek száma x feszültség x feszültség x órajel. Mindez mit is jelent? Ahhoz, hogy processzorunk minél kevesebbet fogyasszon, meg kell próbálni a felvett feszültséget csökkenteni (hiszen a feszültségtől négyzetesen függ a fogyasztás), a processzor órajelét meg kell próbálni alacsonyan tartani (ami persze nem olyan egyszerű, hiszen az alacsonyabb órajel egyet jelent az alacsonyabb teljesítménnyel is), és meg kell próbálni – amennyire csak lehet – leszorítani a működő alkatrészek számát, ami szintén nem egy szimpla feladat, elvégre napjaink csúcsprocesszoraiban (pl. Pentium EE 965) már 300 milliónál is több tranzisztor található.

A lecke fel van adva, lássuk, hogy az Intel fejlesztőmérnökeinek hogyan sikerült válaszolniuk a kihívásokra.


Az Intel a Core mikroarchitektúrában megpróbálta vegyíteni a Pentium 4-gyel debütáló NetBurst és a Pentium M-ben bemutatkozó mobil-mikroarchitektúra előnyeit. A Pentium M az 1995-ben bemutatkozó Pentium Pro (P6) leszármazottjának tekinthető, és igen alacsony fogyasztásával, illetve órajeléhez képest magas teljesítményével emelkedett ki a tömegből, míg a NetBurst szintén hozott magával jó néhány újítást, melyeket az Intel sajnált a kukába dobni (Quad Pumped Bus, SIMD utasításkészletek).

Kicsit térjünk ki az Intel P6-ra, amely az x86-os világ hatodik mikroprocesszor-architektúrájaként vonult be a történelembe. A P6 elsőként a szerverekbe szánt Pentium Próban mutatkozott be 1995-ben (!), és lényegében a P5 (azaz Pentium) utódjának tekinthető. A P6 a világon elsőként alkalmazta a következő technológiákat:

superpipeline-elvű megvalósítás; a Pentium 5 lépcsőből álló futószalagját 14-re terjesztették ki (a Pentium 3-ban 10, a Pentium 4-ben 20, majd 31 lépcsős futószalag található),
először integrálták a lapkára a másodszintű (L2) gyorsítótárat, amely a processzor órajelén futott, ellenben a korábbi processzorokkal, melyeken az L2 cache a magon kívül (alaplapon) volt megtalálható, és a magfrekvencia bizonyos hányadán működött,
szélesebb, 36 bites fizikai címzést tett lehetővé, így 4 GB-nál nagyobb méretű memória vált megcímezhetővé (a lineáris címzés továbbra is max. 4 GB maradt),
a spekulatív és soron kívüli (out-of-order) végrehajtás itt mutatkozott be, ez csökkenti a futószalag-várakozásokat, és magasabb órajelek elérését teszi lehetővé (jobb skálázódás),
regiszter-átnevezés (register renaming), amellyel hatékonyabbá vált a a parancsok végrehajtása,
itt mutatkozott be a GTL+ rendszerbusz is, amely azóta sem tűnt el az Intel processzorokból (Pentium Pro-P3: GTL+, Pentium 4-től AGTL+).

A P6 architektúra alacsony hőtermeléséről, magas integerteljesítményéről és magas IPC-jéről volt ismert, amit a Pentium 4 bevezetésével az Intel lényegében eltemetett – most pedig újra előásta azt.

A Core esetében a chipgyártó (majdnem) minden, a NetBurstben és P6-ban megtalálható nemkívánatos elemet kizárt, majd öt főbb újítást eszközölt, és így megszületett egy teljesen új generáció, a Core.

A Core mikroarchitektúra öt legfőbb újítása a következő:

Intel Wide Dynamic Execution
Intel Advanced Digital Media Boost
Intel Advanced Smart Cache
Intel Smart Memory Access
Intel Intelligent Power Capability

A Dynamic Execution (dinamikus végrehajtás) olyan technikák kombinációja, melyet az Intel anno a P6-ban mutatott be (Pentium Pro). A Pentium 4-ben a Dynamic Execution továbbfejlesztett változatát, az Advanced Dynamic Execution névre keresztelt verziót találhattuk, amely egy igen mély, továbbfejlesztett spekulatív elágazásbecslésű (out-of-order speculative execution) engine lett, mellyel még tovább csökkent az elhibázott elágazásbecslések száma a Pentium III-ban találhatóhoz képest.

A Core esetében az Intel ezt a részegységet ismét továbbfejlesztette, így megszületett a Wide Dynamic Execution. Ez órajelenként több utasítás végrehajtását teszi lehetővé (wide = széles), aminek hatására gyorsul a végrehajtás sebessége és javul a fogyasztási mutató. Az Intel Mobile és NetBurst mikroarchitektúra (és a K8 is) egy időben három x86-os utasítás végrehajtására képes, ezzel szemben a Core már négyet (egyes esetekben ötöt, lásd későb Macro-Ops Fusion) tud elvégezni. Ennek következtében azonos órajeleket feltételezve a Core minden valószínűség szerint gyorsabb, mint az előzőleg felsorolt architektúrák. A hatékonyság további növelése érdekében még pontosabb lett az elágazásbecslő és nagyobbak lettek az utasításpufferek is. A Pentium III 10 lépcsős és a Pentium 4 (Northwood) 20, illetve 31 (Prescott) lépcsős futószalagjával ellentétben a Core-ban 14 lépcsős pipeline-ok találhatóak.



Korábban volt szó a Micro-Ops Fusionról, melynek egy továbbfejlesztett változata is megtalálható a Core-ban, illetve egy Macro-Fusion névre keresztelt technológia is elősegíti a processzor hatékonyságát. Az előző generációs processzorokban az utasítások egyenként hajtódtak végre, azonban a Macro-Fusion segítségével a Core az olyan gyakori utasításpárokat, mint pl. cmp és jmp összevonhatja egyetlen utasításba (micro-op), ezzel pedig csökken a processzorra háruló munka, így adott idő alatt nő az elvégzett utasítások száma.

A mikroutasítások fúziója (Micro-Ops Fusion – a Pentium M-ből ered) révén a Core képes több olyan mikroutasítást újra összefűzni (fuzionálni), melyek eredetileg egy macro-op-ból származnak (egy modern x86-os processzor a macro-opokat micro-opokra bontja le, mielőtt elküldené őket a futószalagnak feldolgozásra), ezzel csökkentve a micro-opok számát. A micro-opok számának csökkentése hatékonyabb ütemezést és magasabb teljesítményt tesz lehetővé alacsonyabb energiaigény mellett. Egyes kísérletek szerint a micro-op fusion a soron kívüli végrehajtást végző logika által kezelt micro-opok számát 10%-kal képes csökkenteni.



Végül, de nem utolsósorban továbbfejlődött az ALU-egység is (Aritmethic Logical Unit), amely elősegíti a Macro-Fusion sikeres működését.

A nevéből (továbbfejlesztett digitális médiagyorsítás) is sejthető, hogy a következő újítás azokkal az utasításkészletekkel foglalkozik, melyeket ezidáig Streaming SIMD Extension (SSE) néven ismertünk. Ezek az utasítások oroszlánrészt vállalnak az olyan feladatok elvégzése során, mint pl. videó-, zene- vagy képszerkesztés, kódolások, konvertálások és minden olyan program, amelyek kihasználják az SSE-utasításkészletek által felkínált lehetőségeket. Ezek a 64 vagy 128 bites integer és lebegőpontos operandusok csökkentik az összes végrehajtandó utasítás számát, így növekszik a teljesítmény. Az előző CPU-generációkkal volt egy probléma, ugyanis ezidáig egyetlen 128 bites SSE utasítás végrehajtásához két órajelciklusra volt szükség, hiszen ezek az egységek csak 64 bites feldolgozásra lettek felkészítve. Ezzel szemben a Core egyetlen órajelciklus alatt két 128 bites SSE operandussal képes végezni, ami a korábbi processzorokhoz képest kétszeres gyorsulást jelent, amennyiben 128 bites SSE utasításokkal dolgozik a processzor (64 bites utasítások esetén a Core 4, a K8 pedig 3 kalkulációval tud végezni órajelenként). A Core mikroarchitektúrára építkező processzorokat az Intel felvértezte egy új, SSE4 nevű utasításkészlettel is, amely állítólag a soha meg nem jelent Tejasban debütált volna eredetileg (TNI-ként is ismert, azaz Tejas New Instructions), és 16 új utasítást tartalmaz:

PSIGNW, PSIGND, PSIGNB
PSHUFB
PMULHRSW, PMADDUBSW
PHSUBW, PHSUBSW, PHSUBD
PHADDW, PHADDSW, PHADDD
PALIGNR
PABSW, PABSD, PABSB

Az Advanced Smart Cache (továbbfejlesztett intelligens gyorsítótár) nem más, mint a Core processzorokban található gyorsítótár elnevezése. Vajon miért intelligens (smart)? Mert a Core-ban a másodlagos gyorsítótáron a két processzormag megosztozik. Az Intel úgy fejlesztette ki az L2 cache-t, hogy ahhoz a két mag bármikor hozzáférjen, így azok nem csak a rendszerbuszon keresztül látják egymás adatait, ahogy az a Pentium D vagy Athlon 64 X2 processzorok esetében már ismert. A Core processzorok modelltől függően összesen 2 vagy 4 MB L2-cache-en osztoznak meg. A magok dinamikusan osztják fel egymás között a gyorsítótárat, vagyis akár az is elképzelhető, hogy az egyik mag lefoglalhatja maga számára a teljes gyorsítótárat, ha a másiknak éppen nincsen rá szüksége. Ha mindkét magnak szüksége van a cache-re, akkor attól függően oszlik kétfelé, hogy az egyes magok milyen sűrűn szeretnének hozzányúlni a benne található adatokhoz. Ha mindkét mag ugyanazon az adatfolyamon dolgozik, akkor ezt az adatot csak egyszer kell elhelyezni a gyorsítótárban, így azt mindkét processzormag ugyanolyan gyorsan eléri. Ennek következménye pedig az optimális működés, elvégre nem kell felesleges köröket futnia a magoknak a rendszerbuszon és a cache-eken keresztül, mint ahogy ez egy Pentium D vagy Athlon 64 X2 esetében történik.

Intel Smart Memory Access

A Smart Memory Access (intelligens memóriaelérés) égisze alatt két új technológiával ismerkedhetünk meg. Az egyik az Advanced Pre-fetch, amely továbbfejlesztett előbehívást jelent. A prefetcherek detektálják az alkalmazások adatmozgatási sémáit, és a gyakran igényelt adatokat gyorsabban elérhetővé teszik (beteszik a cache-be), ezzel csökkentve a memóriakésleltetést. A Core processzorokban összesen 8 prefetcher található, magonként 2 adat és 1 utasítás (ezek képesek szimultán több sémát is kezelni), további 2 prefetcher pedig az L2 cache-ben található (magonként több sémát is képesek követni). A prefetcherek folyamatosan figyelik, hogy mikor milyen adatokra van szükség, és ennek megfelelően irányítják az adatforgalmat.



Az Advanced Pre-fetchen kívül a Smart Memory Access rendelkezik egy Memory Disambiguation (egyértelműsítés) nevezetű technológiával is, amely a soron kívüli (out-of-order) algoritmusok írási és olvasási hatékonyságát próbálja meg növelni azáltal, hogy a LOAD műveleteket a STORE-ok elé helyezi (lényegében a memóriaműveleteket újrarendezik a gyorsabb végrehajtás érdekében). Ez a kis optimalizálás igen nagy teljesítménynövekedést (30-40%) idézhet elő abban az esetben, ha az algoritmus jól "jósolt", és az adatok közötti függőségben ez a "kavar" nem okoz galibát később (vagyis a LOAD utasítással előretöltött adattól a később meghívásra kerülő STORE nem függ). Ha viszont a művelet nem végződik sikeresen, a Memory Disambiguation detektálja a problémát, visszatölti az eredeti adatokat és újraindítja a kódot.

A Memory Disambiguation nem önmagában fejti ki csodálatos hatását, hanem az Advanced Pre-fetchcsel karöltve alkot egy komolyan előremutató újítást, utóbbi ugyanis képes előre megjósolni, hogy milyen adatokra lesz szükség a későbbiekben, ami pont kapóra jön a Memory Disambiguation számára. Ez a páros jelentősen képes növelni a processzor és a memória közti kommunikáció hatékonyságát (később látni fogjuk).

Intel Intelligent Power Capability



Az IIPC (intelligens energia-vezérlés) olyan tulajdonságok gyűjtőneve, melyek a hőtermelés kordában tartásáért felelősek.

Ultra fine-grained Power Control (rendkívül finoman szemcsézett energiavezérlés): a processzormagok kihasználatlan részei egyszerűen leállhatnak, miközben a mag más részei még dolgoznak. Itt nem az egész magról van szó, hanem annak egyes részeiről!
Split Buses: a processzormagok és a belső adatbuszok feloszthatóak több kisebb részegységre, melyeket így egymástól elkülönülve tud vezérelni (ki-be kapcsolni) egy vezérlőáramkör.
Platformization of Power Management Architecture, három részből tevődik össze:
PSI-2 vagyis Power Status Indicator (mobil CPU-k): a processzor jelzi a rendszer felé a terhelést, így együttesen képesek optimalizálni a feszültségszabályzó áramkör és a leadott teljesítmény hatékonysági mutatóit.
DTS (Digital Thermal Sensor): a processzorban immár nem egy, hanem több hőszenzor található, melyek a processzor minden egyes részén külön-külön felügyelik a hőmérsékletet, ezzel a precíz mérési metódussal pedig tovább tökéletesíthetőek a különböző hőmérsékletszabályozási sémák (az alaplapgyártókon sok múlik).
PECI Interface (Platform Environment Control): a processzor képes egy külön erre a célra tervezett chipen keresztül a hőmérséklettől függően szabályozni a rendszer többi elemét is (ventilátorok).

Az új architektúra tehát a következő főbb részletekben tér el az elődtől, Core Duótól (Yonah):

továbbfejlesztett utasításdekóder, az x86-os macro-opok száma 4-re nőtt (a Core Duóban 3 van),
a 128-bites SIMD utasítások végrehajtása duplájára gyorsult a Yonah-hoz képest, mivel egy utasítás hajtódik végre ciklusonként,
jelentősen továbbfejlesztett prefetch,
az L2 cache a két mag számára megosztott, a mérete dinamikusan változik az egyes magok terhelésének függvényében (ez már a Core Duóban is így volt),
jobb energiatakarékossági technológiák,
új SIMD utasításkészlet támogatása (SSE4).

A Core 2 és Athlon 64 X2-es processzorok összehasonlítása:
Processzor Core 2 Duo (Extreme) Athlon 64 X2 (FX)
Órajel 1866-2933 MHz 2000-2800 MHz
Támogatott memória DDR2-800 DDR2-800
Gyártástechnológia 0,065 µ 0,09 µ SOI
Tranzisztor (millió) 291 (Conroe) 227 vagy 154 (Windsor)
Magméret (mm2) 143 (Conroe) 230 (Windsor)
L1 cache 2 x 32 kB adat és 32 kB utasítás (8-utas) 2 x 64 kB adat és 64 kB utasítás (2-utas)
L2 cache 2 vagy 4 MB megosztott
(16-utas; 256-bit) 2 x 512 KB vagy 2 x 1 MB
(16-utas; 128-bit)
SIMD MMX, SSE, SSE2, SSE3, SSE4 3DNow!, MMX, SSE, SSE2, SSE3
Rendszerbusz órajele 266 MHz FSB - 1066 MHz QPB 1000 MHz HyperTransport
Feszültség 0,8500 - 1,3625 V 1,025-1,40 V
Maximális fogyasztás 75 W (Extreme), 65 W (Duo) 125 W (FX-62), 89 vagy 65 W
Architektúra Core K8
Futószalag hossza 14 lépcső 12/17 (integer/float) lépcső
x86-végrehajtók száma 4 3
FP-végrehajtók Multiply+Add+Load+Store(+1) Multiply+Add+Store
SSE-végrehajtók száma 2 (128-bit) 3 (64-bit)


A két teljesen eltérő processzor jelen pillanatban kb. ugyanabban a frekvenciatartományban tartózkodik. Mindkét processzor a DDR2-es platformot támogatja, azon belül is legfeljebb a DDR2-800-as memóriákat. Gyártástechnológia terén egyelőre jobban áll az Intel, hiszen már 0,065 mikronon gyártja a Core 2-es processzorokat, míg az AMD a már jól bejáratott 0,09 mikronon futtatja Athlon 64-eit. Ez az Intel számára igen jelentős előny, hiszen alacsonyabb csíkszélességgel olcsóbb az előállítási költség és alacsonyabb a hőtermelés is. A Conroe magmérete 143 mm2, ami jóval kisebb a Windsor magos Athlon 64 X2-énél (ez eleve 0,09 mikronon készül), és kisebb két Cedar Mill magnál (162 mm2) is (ami egyébként a Preslernek felel meg).

A gyorsítótárak esetében is jelentős különbségek vannak, L1 cache-ben például első látásra jobban áll az Athlon 64, hiszen duplaannyi memóriát tartalmaz, mint Core 2-es ellenfele. Azonban a Core 2-ben 8-utas, az Athlon 64-ben pedig 2-utas csoportasszociatív cache található, ennek következtében pedig jóval kevesebb a cache-miss (magasabb a találati arány) a Core 2-es rendszerekben. Általános szabály, hogy az asszociativitás megduplázása 4-utasig felér a cache megduplázásával, efölött már viszont nem ez a jellemző. A Core 2-ben kétszer vagy négyszer annyi L2-es cache található, mint az Athlon 64 X2-ben, ráadásul a sávszélesség is duplája ellenfelének (256-bit vs. 128-bit), és ha még ez sem lenne elég, akkor meg kell említenünk, hogy a Core 2-ben a gyorsítótár dinamikusan oszlik fel a magok között: ezen a területen egyértelmű fölényben van a Core 2.

Az utasításkészletek terén is az Intel áll jobban, hiszen a Core 2 már ismeri az SSE4-et (valószínűleg az AMD is át fogja venni). A 64-bites utasításkészletet (EM64T vagy x86-64) mindkét architektúra támogatja. A feszültséget tekintve mindkét processzor kb. azonos tartományban tartózkodik, igaz, a Core 2 üresjáratban megelégszik 0,85 volttal is, ebben az esetben pedig (órajelcsökkentéssel együtt) a TDP értéke 65-75 wattról leesik 20-22 wattra. Az Athlon 64 egyelőre itt is le van maradva, hiszen a leggyorsabb FX-62 125 wattos maximális fogyasztással kerül forgalomba, és az alacsonyabb órajelű példányok is 89, esetenként 65 wattot (Energy Efficiency modellek) fogyasztanak. Ha az AMD átáll a 0,065 mikronos gyártásra, akkor a Core 2-nek ez az előnye valószínűleg el fog tűnni.




A rendszerbuszt nem véletlenül hagytuk a végére, ugyanis ez az egyetlen pont, ahol a Core – elméleti síkon – egyértelmű lemaradásban van a K8-cal szemben, és itt nem a maximális sávszélesség kérdésére gondolunk, ami a Core 2 esetében 8,53 GB/s, az Athlon 64-nél pedig 14,4 GB/s. Az AMD a K8-as processzorok esetében azt a HyperTransport buszt használja, melyet ő maga fejlesztett ki, majd a HyperTransport konzorcium tagjaival együtt finomított tovább. Ez a szó szoros értelmében nem egy rendszerbusz (FSB), hanem egy nagyon magas órajelű, csomagalapú, chipből-chipbe összeköttetés, amely 16 vagy 32 biten továbbítja az adatokat. Ezzel szemben az Intel azt a GTL+-ból (Gunning Transceiver Logic) továbbfejlesztett AGTL+ nevű rendszerbuszt használja, amely a Pentium Próban szerepelt először, most, 2006-ban. Miért is baj ez? A busz maximális órajele 266 MHz, és csak az adatbusz négyszeres sebességű, azaz 1066 MHz-es. A cím- és parancsbusz még mindig csak 266 MHz-en jár, kétirányú, de nem full-duplex, ami azt jelenti, hogy adott órajel alatt az adat/cím/utasítás-folyam egyszerre csak egy irányba mozoghat. Természetesen az adatok egy időben ide-oda szeretnének vándorolni, így az a tény, hogy egyidejűleg csak egy irányba mehetnek, igencsak visszafoghatja az új Intel processzorokat.

Ez a probléma egyprocesszoros környezetben még nem ütközik ki, azonban amikor 2, 4, esetleg 8 processzoros szerverekről van szó, az AGTL+ busz már korlátozó tényező lehet az amúgy igen impozáns felépítésű Core magok számára. Valószínűleg az Intel is jól tudta ezt, amikor kiadta a Bensley platformot (Intel 5000P és 5000V chipset), melyek két egymástól független memóriavezérlőt tartalmaznak, így a processzoroknak nem kell megosztozniuk egymással egyetlen busz szűkös sávszélességén. Ez azonban csak egy átmeneti megoldás lehet, ezért mi azt gondoljuk, hogy a K8 szerverekben valószínűleg jobban fog skálázódni a HyperTransportnak köszönhetően (ez főleg 4 vagy 8+ processzoros szerverekben lesz érezhető).

Processzor megnevezése Órajel L2 cache mérete FSB TDP
Core 2 Extreme X6800 2,93 GHz 4 MB 266 MHz 75 W
Core 2 Duo E6700 2,66 GHz 4 MB 266 MHz 65 W
Core 2 Duo E6600 2,4 GHz 4 MB 266 MHz 65 W
Core 2 Duo E6400 2,13 GHz 2 MB 266 MHz 65 W
Core 2 Duo E6300 1,86 GHz 2 MB 266 MHz 65 W

Az Intel ezúttal 5 processzort indít útjára. A csúcskiépítés továbbviszi az Extreme megkülönböztető jelzőt, és Core 2 Extreme néven kerül a boltokba, az egyszerű CPU-k pedig a Core 2 Duo nevet kapták. Az első kiadású Extreme verzió csak és kizárólag magasabb órajele miatt lett Extreme, egyes pletykák szerint a döntés hátterében az Intel magabiztossága áll, hiszen az AMD-t ez az egyszerű, órajelemelt CPU is szinte megoldhatatlan feladat elé állítja, így felesleges lett volna azonnal egy olyan Extreme processzorral előrukkolni, amiben pl. nagyobb az L2 cache, vagy még ennél is magasabb az órajel (pl. 3,13 GHz), netán az FSB (333 MHz). Mások szerint az Intel nem képes ennél magasabb órajelű példányt gyártani egyelőre. A kérdés irreleváns, a teljesítmény a lényeg.

A Core 2 processzorok sem órajel szerint lesznek megkülönböztetve, hanem egy modellszám alapján. A Core 2 márkanév mögött egy Exxxx vagy Xxxxx jelölés látható, az E betüjel után található szám határozza meg egy adott típus besorolását a családba, míg az X jelöli az Extreme verziót (T - mobil CPU). Idővel elképzelhető, hogy megjelenik egy új Extreme processzor, ekkor valószínűleg az X6800-asat átnevezik E6800-ra, és a legújabb Extreme felveszi az X6900 jelölést.
Category : Hardware | By : zsolti | Comments [74] | Trackbacks [0]
13 Jul 2006   09:52:10 am
Érkezik a színes Lightscribe
A TG Daily úgy tudja, hogy a Hewlett-Packard még idén piacra dobná Lightscribe technológiájának színes változatát.


Mindezt az eljárást támogató DVD írók használati útmutatójából következtették ki. A Lightscribe technológia lehetővé teszi, hogy bizonyos írható lemezek adathordozó felületével ellentétes oldalára (vagyis a borítóra) a DVD író lézere grafikát égessen.

A gyakran feltett kérdések szekcióban a "Lehetőség van színes borító létrehozására is?" kérdésre a válasz nem szimplán "Nem" - ehelyett ez áll ott: "A Lightscribe technológia jelenleg csak szürkeárnyalatos grafikák előállítására alkalmas. A fejlesztési stratégia részét képezik további lehetőségek is, habár ezekről egyelőre nincsenek pontosabb információk."

Az oldal szerint ez a HP részéről nyílt szándékbejelentésnek minősül. A HP PR részlegét felkeresve azt a választ kapták, hogy még év vége előtt várhatóak az első színes Lightscribe DVD írók.
Category : Hardware | By : zsolti | Comments [73] | Trackbacks [0]
12 Jul 2006   11:49:23 am
S3 Chrome: készen a DirectX 10-re
Míg az NVIDIA és az ATI nagy hévvel harcol a videokártyák virtuális világának elsőségéért, egy elfeledett, de egykoron híres előd szép csendben fejlesztget.

Bár az S3 Graphics-nak koránt sem megy már olyan jól, mint régen, ennek ellenére mégsem adja fel a videokártyák piacát, és csendben elkészítették az új generációs Chrome-ot, mely már a DirectX 10-et és a Pixel Shaderek 4. generációját is támogatja. A hír már csak azért is érdekes, mivel tudjuk, hogy az NVIDIA és az ATI először mindig a High-end szekciós kártyákkal jelentkezik, melyeket majd lassan követnek a közép-, majd az alsókategória résztvevői. Ebben az esetben az időben színre lépő S3 esélyes lehet a középkategóriát megcélzó kártyáival, már csak azért is, mivel bár teljesítményben nem veheti fel a versenyt, de áraival biztosan a többiek alá kerülhet.
Category : Hardware | By : zsolti | Comments [87] | Trackbacks [0]
12 Jul 2006   11:48:56 am
32 magos processzorok az Inteltől 2010-re
A világ vezető mikroprocesszor-gyártója az évtized végére tervezi piacra dobni 32 magos központi egységeit.

A processzorgyártók korábban az órajelek folyamatos növelésétől várták a nagyobb teljesítményt, olyannyira, hogy az Intel nemrég még több tíz gigahertzes CPU-kat ígért. Azonban a nagyobb órajelérték magasabb fogyasztást és hőtermelést eredményezett, olyannyira, hogy hamar el is érték az egymagos megoldások korlátait. Ezt követően jelentek meg az első kétmagos processzorok, melyek még most is újdonságnak számítanak. Az alacsonyabb órajel ellenére jóval gyorsabban végzik el a számítási műveleteket egymagos társaiknál, ráadásul mindezt alacsonyabb hőleadás mellett teszik.

A jelenlegi ütemterv szerint 2007 januárjában várható az első négymagos Intel processzor megjelenése, és 2010-re már a 32 magos is piacon lesz. Az X-bit labs írása szerint a Gulftown kódnéven futó lapka 32 nm-es gyártástechnológiával fog készülni, minden egyes magja 512 KB másodszintű gyorsítótárt kap, órajele csupán 2 gigahertz lesz, ennek ellenére tizenötször gyorsabb sebesség várható napjaink processzorainál. Persze a legfőbb probléma itt is adott: a többmagos adatfeldolgozók képességeit csak a párhuzamos végrehajtásra kellőképpen felkészített szoftverek képesek kihasználni.
Category : Hardware | By : zsolti | Comments [82] | Trackbacks [0]
12 Jul 2006   11:38:19 am
Az új mágneses memóriachipek forradalma
A Freescale bemutatta a MRAM (Magneto-Resistive Random Access Memory) mikrochipet, amely a merevlemezekhez hasonló módon képes adatokat tárolni. Az új egység forradalmasítja a memóriák technológiáját.


A magnetorezisztív véleltlenszerű eléréssel rendelkező memória (MRAM) a mágnesesség tulajdonságait kihasználva képes az adatokat tárolni, szemben a chipekben eddig megszokott elektromos töltéstől.

Egyes elemzők szerint ez a chip az utóbbi évtized egyik legkiemelkedőbb találmánya a számítógépes memóriák tekintetében. A technológia legnagyobb előnye, hogy az információt azután is képes tárolni, hogy a chip már nincs áram alatt. A vállalat már sikeresen le is gyártott néhány 4 megabites MRAM prototípust.

Több nagy gyártó is (köztük az IBM) évek óta próbálkozik hasonló megoldásokkal, de a Freescale Semiconductor, a Motorola nemrégiben önállósodott félvezetőgyártó üzletága volt az első, aki ezt a gyakorlatban is meg tudta valósítani. A flash memória is képes energiabefektetés nélkül adatokat tárolni, ám az MRAM jóval gyorsabb írási és olvasási sebességgel rendelkezik, ráadásul a használat során nem amortizálódnak az alaktrészek.


A flash memóriákat főként digitális kamerákban, mp3 lejátszókban és hasonló hordozható eszközökben használják, az MRAM viszont inkább számítógépekben történő használatra lesz alkalmas, például operációs rendszer tárolására. Ezzel a megoldással az operációs rendszer sokkal gyorsabban betöltődhet.

A Freescale képviselője elmondta, hogy már számos nagy érdeklődőt szereztek a technológia iránt, ám ezekről egyelőre nem nyilatkozott. Bár a sorozatgyártás már megkezdődött, egyelőre azt sem tudni, a technológia mikor kerülhet valóban a boltokba.
Category : Hardware | By : zsolti | Comments [68] | Trackbacks [0]
 
Prev 1 2 3 4 ...15 16 17 Next
Mar 2026 April 2026 May 2026
S M T W T F S
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30   
Categories
Hardware[63]
ITech[17]
Software[4]
Recent
Fél évszázados a merevlemez
Új Intel chipsetek grafikus maggal
Útjára indult a Core 2 Duo
A világ legjobb processzora!?
Érkezik a Radeon X1950
Az AMD is idén mutatja be négymagos processzorát
Megérkezett a kétmagos Intel Itanium szerverchip
Még az idén jönnek az Intel négymagosai
Nyár végén érkezhetnek az új Xeon MP-k
Végül, de nem utolsósorban: kétmagos Intel Itanium!
Archives
September 2006[1]
July 2006[21]
June 2006[13]
May 2006[33]
April 2006[16]
User List
zsolti[84]
Search
Syndication
Template theme : aura
Powered by myBloggie 2.1.3 Copyright © 2004 2005
-- myWebland --