myBloggie 2.1.3 - by myWebland

Your Weblog Name

Time [GMT ++2] : 28 Apr , 06:51:42

| | |


14 Jul 2006 11:18:43 am
Megérkezett a Conroe


Az Intel a 2004-es év folyamán kénytelen volt belátni, hogy az eredetileg rendkívül magas órajelek elérésére kifejlesztett NetBurst architektúra napjai meg vannak számlálva, a szivárgási áram olyan gondokat okozott (magas fogyasztás és hõtermelés), melyekkel még a világ legnagyobb chipgyártója sem volt képes megbirkózni. Szerencsénkre ez a fordulat egyben a többmagos központi egységek eljövetelét is jelentette, hiszen mindkét processzorgyártó úgy vélte, hogy a jövõ a párhuzamos adatfeldolgozásé. Az Intel elõször egy gyorsan összedobott Pentium D-vel (Smithfield) rukkolt ki (ekkor még az volt a kérdés, hogy az AMD vagy az Intel fog hamarabb kétmagos processzort bemutatni), melyben két Pentium 4-es core volt "összedrótozva", majd késõbb a Presler kódnéven ismert újabb kiadású Pentium D-ben az ötlet továbbfejlesztése volt megtalálható, ezúttal a tok alá két különálló processzormagot zsúfoltak be (egyszerûbb és költséghatékonyabb gyártás). Ugyanakkor a Presler egyben a 2000-ben megjelent NetBurstre épülõ processzorok utolsó zászlóvivõje is lett, hiszen az Intel már gõzerõvel egy új mikroarchitektúra bevezetésének utolsó simításait végezte, ami végül a Core nevet kapta. Az Intel Core egy teljesen új fejlesztése az Intel-architektúrákon alapuló asztali, mobil és szerver multi-core processzoroknak. Ez a több magra optimalizált, energiahatékony felépítésû architektúra a megnövelt teljesítmény, illetve teljesítmény per fogyasztás jegyében született. Legfõbb elõdjének a mobilplatformra kifejlesztett Pentium M tekinthetõ, azt persze rengeteg újítással és továbbfejlesztéssel megfûszerezve. Érdekes módon most, hogy az Intel egy teljesen új felépítésû CPU-családot vezet be, kiemelkedõ fontosságú tényezõvé lép elõ a processzor, illetve a rendszer fogyasztása, és a fejlesztõk dokumentumok tucatjain keresztül magyarázzák mindenféle csili-vili képlettel kiegészítve, hogy a teljesítmény nem csak az órajeltõl, hanem az órajelenként végrehajtott utasítások számától is függ. Emlékezzünk csak vissza, ugyanez az Intel 2000-tõl 2005-ig, a kétmagos processzorok megjelenéséig azt állította, hogy csakis a megahertzek számítanak, vegyünk minél magasabb órajelû processzort, annál jobb lesz nekünk, mindeközben a Pentium 4 processzorok fogyasztása 130 watt fölé emelkedett; ez persze akkor nem volt lényeges kérdés... Micsoda fordulat! Conroe (balra az óriási L2 cache) Az Intel szerint az új képlet mostantól: teljesítmény = órajel x órajelenként végrehajtott utasítások (IPC) száma. Az AMD már az Athlonok megjelenése után ugyanezen az állásponton volt, mégsem vették komolyan a kisebb processzorgyártót, mert az Intel sokkal nagyobb befolyással bír. Ez a képlet végeredményben a MIPS (million instructions per second) értékének meghatározása, tehát kimondhatjuk, hogy az Intel ismét feltalálta a spanyolviaszt... Azonban napjaink egyre fejlettebb processzorai esetében ez a képlet már nem állja meg a helyét, mert a teljesítmény másképpen is fokozható, mint az órajel vagy az IPC növelése. Vannak még különbözõ módszerek, mellyekkel ugyanez a "hatás" érhetõ el, gondolunk itt arra, hogy például bizonyos módszerekkel csökkenthetjük a végrehajtandó utasítások számát, így végeredményben nõ az egységnyi idõ alatt végrehajtott utasítások száma (lényegében ugyanoda lyukadunk ki), ezt hivatottak elõsegíteni a Single Instruction Multiple Data (SIMD) utasításkészletek is, mint amilyen az 1996-ban bevezetett MMX-technológia, vagy a késõbb bevezetésre kerülõ SSE, SSE2, SSE3, 3DNow!, 3DNow!+ is, és ugyanezt a nemes feladatot látja el a Pentium M-ben debütáló Micro-Ops Fusion, avagy mikroutasítások fúziója is. Errõl késõbb még szó lesz. A teljesítmény kifejezésére már van egy képletünk, azonban ez még nem elegendõ, mert ezúttal a rendszer fogyasztása is központi szerepet tölt be, így ezt is meg kell határozni valamilyen módon. Az Intel szerint a képlet: fogyasztás = áramköri elemek száma x feszültség x feszültség x órajel. Mindez mit is jelent? Ahhoz, hogy processzorunk minél kevesebbet fogyasszon, meg kell próbálni a felvett feszültséget csökkenteni (hiszen a feszültségtõl négyzetesen függ a fogyasztás), a processzor órajelét meg kell próbálni alacsonyan tartani (ami persze nem olyan egyszerû, hiszen az alacsonyabb órajel egyet jelent az alacsonyabb teljesítménnyel is), és meg kell próbálni – amennyire csak lehet – leszorítani a mûködõ alkatrészek számát, ami szintén nem egy szimpla feladat, elvégre napjaink csúcsprocesszoraiban (pl. Pentium EE 965) már 300 milliónál is több tranzisztor található. A lecke fel van adva, lássuk, hogy az Intel fejlesztõmérnökeinek hogyan sikerült válaszolniuk a kihívásokra. Az Intel a Core mikroarchitektúrában megpróbálta vegyíteni a Pentium 4-gyel debütáló NetBurst és a Pentium M-ben bemutatkozó mobil-mikroarchitektúra elõnyeit. A Pentium M az 1995-ben bemutatkozó Pentium Pro (P6) leszármazottjának tekinthetõ, és igen alacsony fogyasztásával, illetve órajeléhez képest magas teljesítményével emelkedett ki a tömegbõl, míg a NetBurst szintén hozott magával jó néhány újítást, melyeket az Intel sajnált a kukába dobni (Quad Pumped Bus, SIMD utasításkészletek). Kicsit térjünk ki az Intel P6-ra, amely az x86-os világ hatodik mikroprocesszor-architektúrájaként vonult be a történelembe. A P6 elsõként a szerverekbe szánt Pentium Próban mutatkozott be 1995-ben (!), és lényegében a P5 (azaz Pentium) utódjának tekinthetõ. A P6 a világon elsõként alkalmazta a következõ technológiákat: superpipeline-elvû megvalósítás; a Pentium 5 lépcsõbõl álló futószalagját 14-re terjesztették ki (a Pentium 3-ban 10, a Pentium 4-ben 20, majd 31 lépcsõs futószalag található), elõször integrálták a lapkára a másodszintû (L2) gyorsítótárat, amely a processzor órajelén futott, ellenben a korábbi processzorokkal, melyeken az L2 cache a magon kívül (alaplapon) volt megtalálható, és a magfrekvencia bizonyos hányadán mûködött, szélesebb, 36 bites fizikai címzést tett lehetõvé, így 4 GB-nál nagyobb méretû memória vált megcímezhetõvé (a lineáris címzés továbbra is max. 4 GB maradt), a spekulatív és soron kívüli (out-of-order) végrehajtás itt mutatkozott be, ez csökkenti a futószalag-várakozásokat, és magasabb órajelek elérését teszi lehetõvé (jobb skálázódás), regiszter-átnevezés (register renaming), amellyel hatékonyabbá vált a a parancsok végrehajtása, itt mutatkozott be a GTL+ rendszerbusz is, amely azóta sem tûnt el az Intel processzorokból (Pentium Pro-P3: GTL+, Pentium 4-tõl AGTL+). A P6 architektúra alacsony hõtermelésérõl, magas integerteljesítményérõl és magas IPC-jérõl volt ismert, amit a Pentium 4 bevezetésével az Intel lényegében eltemetett – most pedig újra elõásta azt. A Core esetében a chipgyártó (majdnem) minden, a NetBurstben és P6-ban megtalálható nemkívánatos elemet kizárt, majd öt fõbb újítást eszközölt, és így megszületett egy teljesen új generáció, a Core. A Core mikroarchitektúra öt legfõbb újítása a következõ: Intel Wide Dynamic Execution Intel Advanced Digital Media Boost Intel Advanced Smart Cache Intel Smart Memory Access Intel Intelligent Power Capability A Dynamic Execution (dinamikus végrehajtás) olyan technikák kombinációja, melyet az Intel anno a P6-ban mutatott be (Pentium Pro). A Pentium 4-ben a Dynamic Execution továbbfejlesztett változatát, az Advanced Dynamic Execution névre keresztelt verziót találhattuk, amely egy igen mély, továbbfejlesztett spekulatív elágazásbecslésû (out-of-order speculative execution) engine lett, mellyel még tovább csökkent az elhibázott elágazásbecslések száma a Pentium III-ban találhatóhoz képest. A Core esetében az Intel ezt a részegységet ismét továbbfejlesztette, így megszületett a Wide Dynamic Execution. Ez órajelenként több utasítás végrehajtását teszi lehetõvé (wide = széles), aminek hatására gyorsul a végrehajtás sebessége és javul a fogyasztási mutató. Az Intel Mobile és NetBurst mikroarchitektúra (és a K8 is) egy idõben három x86-os utasítás végrehajtására képes, ezzel szemben a Core már négyet (egyes esetekben ötöt, lásd késõb Macro-Ops Fusion) tud elvégezni. Ennek következtében azonos órajeleket feltételezve a Core minden valószínûség szerint gyorsabb, mint az elõzõleg felsorolt architektúrák. A hatékonyság további növelése érdekében még pontosabb lett az elágazásbecslõ és nagyobbak lettek az utasításpufferek is. A Pentium III 10 lépcsõs és a Pentium 4 (Northwood) 20, illetve 31 (Prescott) lépcsõs futószalagjával ellentétben a Core-ban 14 lépcsõs pipeline-ok találhatóak. Korábban volt szó a Micro-Ops Fusionról, melynek egy továbbfejlesztett változata is megtalálható a Core-ban, illetve egy Macro-Fusion névre keresztelt technológia is elõsegíti a processzor hatékonyságát. Az elõzõ generációs processzorokban az utasítások egyenként hajtódtak végre, azonban a Macro-Fusion segítségével a Core az olyan gyakori utasításpárokat, mint pl. cmp és jmp összevonhatja egyetlen utasításba (micro-op), ezzel pedig csökken a processzorra háruló munka, így adott idõ alatt nõ az elvégzett utasítások száma. A mikroutasítások fúziója (Micro-Ops Fusion – a Pentium M-bõl ered) révén a Core képes több olyan mikroutasítást újra összefûzni (fuzionálni), melyek eredetileg egy macro-op-ból származnak (egy modern x86-os processzor a macro-opokat micro-opokra bontja le, mielõtt elküldené õket a futószalagnak feldolgozásra), ezzel csökkentve a micro-opok számát. A micro-opok számának csökkentése hatékonyabb ütemezést és magasabb teljesítményt tesz lehetõvé alacsonyabb energiaigény mellett. Egyes kísérletek szerint a micro-op fusion a soron kívüli végrehajtást végzõ logika által kezelt micro-opok számát 10%-kal képes csökkenteni. Végül, de nem utolsósorban továbbfejlõdött az ALU-egység is (Aritmethic Logical Unit), amely elõsegíti a Macro-Fusion sikeres mûködését. A nevébõl (továbbfejlesztett digitális médiagyorsítás) is sejthetõ, hogy a következõ újítás azokkal az utasításkészletekkel foglalkozik, melyeket ezidáig Streaming SIMD Extension (SSE) néven ismertünk. Ezek az utasítások oroszlánrészt vállalnak az olyan feladatok elvégzése során, mint pl. videó-, zene- vagy képszerkesztés, kódolások, konvertálások és minden olyan program, amelyek kihasználják az SSE-utasításkészletek által felkínált lehetõségeket. Ezek a 64 vagy 128 bites integer és lebegõpontos operandusok csökkentik az összes végrehajtandó utasítás számát, így növekszik a teljesítmény. Az elõzõ CPU-generációkkal volt egy probléma, ugyanis ezidáig egyetlen 128 bites SSE utasítás végrehajtásához két órajelciklusra volt szükség, hiszen ezek az egységek csak 64 bites feldolgozásra lettek felkészítve. Ezzel szemben a Core egyetlen órajelciklus alatt két 128 bites SSE operandussal képes végezni, ami a korábbi processzorokhoz képest kétszeres gyorsulást jelent, amennyiben 128 bites SSE utasításokkal dolgozik a processzor (64 bites utasítások esetén a Core 4, a K8 pedig 3 kalkulációval tud végezni órajelenként). A Core mikroarchitektúrára építkezõ processzorokat az Intel felvértezte egy új, SSE4 nevû utasításkészlettel is, amely állítólag a soha meg nem jelent Tejasban debütált volna eredetileg (TNI-ként is ismert, azaz Tejas New Instructions), és 16 új utasítást tartalmaz: PSIGNW, PSIGND, PSIGNB PSHUFB PMULHRSW, PMADDUBSW PHSUBW, PHSUBSW, PHSUBD PHADDW, PHADDSW, PHADDD PALIGNR PABSW, PABSD, PABSB Az Advanced Smart Cache (továbbfejlesztett intelligens gyorsítótár) nem más, mint a Core processzorokban található gyorsítótár elnevezése. Vajon miért intelligens (smart)? Mert a Core-ban a másodlagos gyorsítótáron a két processzormag megosztozik. Az Intel úgy fejlesztette ki az L2 cache-t, hogy ahhoz a két mag bármikor hozzáférjen, így azok nem csak a rendszerbuszon keresztül látják egymás adatait, ahogy az a Pentium D vagy Athlon 64 X2 processzorok esetében már ismert. A Core processzorok modelltõl függõen összesen 2 vagy 4 MB L2-cache-en osztoznak meg. A magok dinamikusan osztják fel egymás között a gyorsítótárat, vagyis akár az is elképzelhetõ, hogy az egyik mag lefoglalhatja maga számára a teljes gyorsítótárat, ha a másiknak éppen nincsen rá szüksége. Ha mindkét magnak szüksége van a cache-re, akkor attól függõen oszlik kétfelé, hogy az egyes magok milyen sûrûn szeretnének hozzányúlni a benne található adatokhoz. Ha mindkét mag ugyanazon az adatfolyamon dolgozik, akkor ezt az adatot csak egyszer kell elhelyezni a gyorsítótárban, így azt mindkét processzormag ugyanolyan gyorsan eléri. Ennek következménye pedig az optimális mûködés, elvégre nem kell felesleges köröket futnia a magoknak a rendszerbuszon és a cache-eken keresztül, mint ahogy ez egy Pentium D vagy Athlon 64 X2 esetében történik. Intel Smart Memory Access A Smart Memory Access (intelligens memóriaelérés) égisze alatt két új technológiával ismerkedhetünk meg. Az egyik az Advanced Pre-fetch, amely továbbfejlesztett elõbehívást jelent. A prefetcherek detektálják az alkalmazások adatmozgatási sémáit, és a gyakran igényelt adatokat gyorsabban elérhetõvé teszik (beteszik a cache-be), ezzel csökkentve a memóriakésleltetést. A Core processzorokban összesen 8 prefetcher található, magonként 2 adat és 1 utasítás (ezek képesek szimultán több sémát is kezelni), további 2 prefetcher pedig az L2 cache-ben található (magonként több sémát is képesek követni). A prefetcherek folyamatosan figyelik, hogy mikor milyen adatokra van szükség, és ennek megfelelõen irányítják az adatforgalmat. Az Advanced Pre-fetchen kívül a Smart Memory Access rendelkezik egy Memory Disambiguation (egyértelmûsítés) nevezetû technológiával is, amely a soron kívüli (out-of-order) algoritmusok írási és olvasási hatékonyságát próbálja meg növelni azáltal, hogy a LOAD mûveleteket a STORE-ok elé helyezi (lényegében a memóriamûveleteket újrarendezik a gyorsabb végrehajtás érdekében). Ez a kis optimalizálás igen nagy teljesítménynövekedést (30-40%) idézhet elõ abban az esetben, ha az algoritmus jól "jósolt", és az adatok közötti függõségben ez a "kavar" nem okoz galibát késõbb (vagyis a LOAD utasítással elõretöltött adattól a késõbb meghívásra kerülõ STORE nem függ). Ha viszont a mûvelet nem végzõdik sikeresen, a Memory Disambiguation detektálja a problémát, visszatölti az eredeti adatokat és újraindítja a kódot. A Memory Disambiguation nem önmagában fejti ki csodálatos hatását, hanem az Advanced Pre-fetchcsel karöltve alkot egy komolyan elõremutató újítást, utóbbi ugyanis képes elõre megjósolni, hogy milyen adatokra lesz szükség a késõbbiekben, ami pont kapóra jön a Memory Disambiguation számára. Ez a páros jelentõsen képes növelni a processzor és a memória közti kommunikáció hatékonyságát (késõbb látni fogjuk). Intel Intelligent Power Capability Az IIPC (intelligens energia-vezérlés) olyan tulajdonságok gyûjtõneve, melyek a hõtermelés kordában tartásáért felelõsek. Ultra fine-grained Power Control (rendkívül finoman szemcsézett energiavezérlés): a processzormagok kihasználatlan részei egyszerûen leállhatnak, miközben a mag más részei még dolgoznak. Itt nem az egész magról van szó, hanem annak egyes részeirõl! Split Buses: a processzormagok és a belsõ adatbuszok feloszthatóak több kisebb részegységre, melyeket így egymástól elkülönülve tud vezérelni (ki-be kapcsolni) egy vezérlõáramkör. Platformization of Power Management Architecture, három részbõl tevõdik össze: PSI-2 vagyis Power Status Indicator (mobil CPU-k): a processzor jelzi a rendszer felé a terhelést, így együttesen képesek optimalizálni a feszültségszabályzó áramkör és a leadott teljesítmény hatékonysági mutatóit. DTS (Digital Thermal Sensor): a processzorban immár nem egy, hanem több hõszenzor található, melyek a processzor minden egyes részén külön-külön felügyelik a hõmérsékletet, ezzel a precíz mérési metódussal pedig tovább tökéletesíthetõek a különbözõ hõmérsékletszabályozási sémák (az alaplapgyártókon sok múlik). PECI Interface (Platform Environment Control): a processzor képes egy külön erre a célra tervezett chipen keresztül a hõmérséklettõl függõen szabályozni a rendszer többi elemét is (ventilátorok). Az új architektúra tehát a következõ fõbb részletekben tér el az elõdtõl, Core Duótól (Yonah): továbbfejlesztett utasításdekóder, az x86-os macro-opok száma 4-re nõtt (a Core Duóban 3 van), a 128-bites SIMD utasítások végrehajtása duplájára gyorsult a Yonah-hoz képest, mivel egy utasítás hajtódik végre ciklusonként, jelentõsen továbbfejlesztett prefetch, az L2 cache a két mag számára megosztott, a mérete dinamikusan változik az egyes magok terhelésének függvényében (ez már a Core Duóban is így volt), jobb energiatakarékossági technológiák, új SIMD utasításkészlet támogatása (SSE4). A Core 2 és Athlon 64 X2-es processzorok összehasonlítása: Processzor Core 2 Duo (Extreme) Athlon 64 X2 (FX) Órajel 1866-2933 MHz 2000-2800 MHz Támogatott memória DDR2-800 DDR2-800 Gyártástechnológia 0,065 µ 0,09 µ SOI Tranzisztor (millió) 291 (Conroe) 227 vagy 154 (Windsor) Magméret (mm2) 143 (Conroe) 230 (Windsor) L1 cache 2 x 32 kB adat és 32 kB utasítás (8-utas) 2 x 64 kB adat és 64 kB utasítás (2-utas) L2 cache 2 vagy 4 MB megosztott (16-utas; 256-bit) 2 x 512 KB vagy 2 x 1 MB (16-utas; 128-bit) SIMD MMX, SSE, SSE2, SSE3, SSE4 3DNow!, MMX, SSE, SSE2, SSE3 Rendszerbusz órajele 266 MHz FSB - 1066 MHz QPB 1000 MHz HyperTransport Feszültség 0,8500 - 1,3625 V 1,025-1,40 V Maximális fogyasztás 75 W (Extreme), 65 W (Duo) 125 W (FX-62), 89 vagy 65 W Architektúra Core K8 Futószalag hossza 14 lépcsõ 12/17 (integer/float) lépcsõ x86-végrehajtók száma 4 3 FP-végrehajtók Multiply+Add+Load+Store(+1) Multiply+Add+Store SSE-végrehajtók száma 2 (128-bit) 3 (64-bit) A két teljesen eltérõ processzor jelen pillanatban kb. ugyanabban a frekvenciatartományban tartózkodik. Mindkét processzor a DDR2-es platformot támogatja, azon belül is legfeljebb a DDR2-800-as memóriákat. Gyártástechnológia terén egyelõre jobban áll az Intel, hiszen már 0,065 mikronon gyártja a Core 2-es processzorokat, míg az AMD a már jól bejáratott 0,09 mikronon futtatja Athlon 64-eit. Ez az Intel számára igen jelentõs elõny, hiszen alacsonyabb csíkszélességgel olcsóbb az elõállítási költség és alacsonyabb a hõtermelés is. A Conroe magmérete 143 mm2, ami jóval kisebb a Windsor magos Athlon 64 X2-énél (ez eleve 0,09 mikronon készül), és kisebb két Cedar Mill magnál (162 mm2) is (ami egyébként a Preslernek felel meg). A gyorsítótárak esetében is jelentõs különbségek vannak, L1 cache-ben például elsõ látásra jobban áll az Athlon 64, hiszen duplaannyi memóriát tartalmaz, mint Core 2-es ellenfele. Azonban a Core 2-ben 8-utas, az Athlon 64-ben pedig 2-utas csoportasszociatív cache található, ennek következtében pedig jóval kevesebb a cache-miss (magasabb a találati arány) a Core 2-es rendszerekben. Általános szabály, hogy az asszociativitás megduplázása 4-utasig felér a cache megduplázásával, efölött már viszont nem ez a jellemzõ. A Core 2-ben kétszer vagy négyszer annyi L2-es cache található, mint az Athlon 64 X2-ben, ráadásul a sávszélesség is duplája ellenfelének (256-bit vs. 128-bit), és ha még ez sem lenne elég, akkor meg kell említenünk, hogy a Core 2-ben a gyorsítótár dinamikusan oszlik fel a magok között: ezen a területen egyértelmû fölényben van a Core 2. Az utasításkészletek terén is az Intel áll jobban, hiszen a Core 2 már ismeri az SSE4-et (valószínûleg az AMD is át fogja venni). A 64-bites utasításkészletet (EM64T vagy x86-64) mindkét architektúra támogatja. A feszültséget tekintve mindkét processzor kb. azonos tartományban tartózkodik, igaz, a Core 2 üresjáratban megelégszik 0,85 volttal is, ebben az esetben pedig (órajelcsökkentéssel együtt) a TDP értéke 65-75 wattról leesik 20-22 wattra. Az Athlon 64 egyelõre itt is le van maradva, hiszen a leggyorsabb FX-62 125 wattos maximális fogyasztással kerül forgalomba, és az alacsonyabb órajelû példányok is 89, esetenként 65 wattot (Energy Efficiency modellek) fogyasztanak. Ha az AMD átáll a 0,065 mikronos gyártásra, akkor a Core 2-nek ez az elõnye valószínûleg el fog tûnni. A rendszerbuszt nem véletlenül hagytuk a végére, ugyanis ez az egyetlen pont, ahol a Core – elméleti síkon – egyértelmû lemaradásban van a K8-cal szemben, és itt nem a maximális sávszélesség kérdésére gondolunk, ami a Core 2 esetében 8,53 GB/s, az Athlon 64-nél pedig 14,4 GB/s. Az AMD a K8-as processzorok esetében azt a HyperTransport buszt használja, melyet õ maga fejlesztett ki, majd a HyperTransport konzorcium tagjaival együtt finomított tovább. Ez a szó szoros értelmében nem egy rendszerbusz (FSB), hanem egy nagyon magas órajelû, csomagalapú, chipbõl-chipbe összeköttetés, amely 16 vagy 32 biten továbbítja az adatokat. Ezzel szemben az Intel azt a GTL+-ból (Gunning Transceiver Logic) továbbfejlesztett AGTL+ nevû rendszerbuszt használja, amely a Pentium Próban szerepelt elõször, most, 2006-ban. Miért is baj ez? A busz maximális órajele 266 MHz, és csak az adatbusz négyszeres sebességû, azaz 1066 MHz-es. A cím- és parancsbusz még mindig csak 266 MHz-en jár, kétirányú, de nem full-duplex, ami azt jelenti, hogy adott órajel alatt az adat/cím/utasítás-folyam egyszerre csak egy irányba mozoghat. Természetesen az adatok egy idõben ide-oda szeretnének vándorolni, így az a tény, hogy egyidejûleg csak egy irányba mehetnek, igencsak visszafoghatja az új Intel processzorokat. Ez a probléma egyprocesszoros környezetben még nem ütközik ki, azonban amikor 2, 4, esetleg 8 processzoros szerverekrõl van szó, az AGTL+ busz már korlátozó tényezõ lehet az amúgy igen impozáns felépítésû Core magok számára. Valószínûleg az Intel is jól tudta ezt, amikor kiadta a Bensley platformot (Intel 5000P és 5000V chipset), melyek két egymástól független memóriavezérlõt tartalmaznak, így a processzoroknak nem kell megosztozniuk egymással egyetlen busz szûkös sávszélességén. Ez azonban csak egy átmeneti megoldás lehet, ezért mi azt gondoljuk, hogy a K8 szerverekben valószínûleg jobban fog skálázódni a HyperTransportnak köszönhetõen (ez fõleg 4 vagy 8+ processzoros szerverekben lesz érezhetõ). Processzor megnevezése Órajel L2 cache mérete FSB TDP Core 2 Extreme X6800 2,93 GHz 4 MB 266 MHz 75 W Core 2 Duo E6700 2,66 GHz 4 MB 266 MHz 65 W Core 2 Duo E6600 2,4 GHz 4 MB 266 MHz 65 W Core 2 Duo E6400 2,13 GHz 2 MB 266 MHz 65 W Core 2 Duo E6300 1,86 GHz 2 MB 266 MHz 65 W Az Intel ezúttal 5 processzort indít útjára. A csúcskiépítés továbbviszi az Extreme megkülönböztetõ jelzõt, és Core 2 Extreme néven kerül a boltokba, az egyszerû CPU-k pedig a Core 2 Duo nevet kapták. Az elsõ kiadású Extreme verzió csak és kizárólag magasabb órajele miatt lett Extreme, egyes pletykák szerint a döntés hátterében az Intel magabiztossága áll, hiszen az AMD-t ez az egyszerû, órajelemelt CPU is szinte megoldhatatlan feladat elé állítja, így felesleges lett volna azonnal egy olyan Extreme processzorral elõrukkolni, amiben pl. nagyobb az L2 cache, vagy még ennél is magasabb az órajel (pl. 3,13 GHz), netán az FSB (333 MHz). Mások szerint az Intel nem képes ennél magasabb órajelû példányt gyártani egyelõre. A kérdés irreleváns, a teljesítmény a lényeg. A Core 2 processzorok sem órajel szerint lesznek megkülönböztetve, hanem egy modellszám alapján. A Core 2 márkanév mögött egy Exxxx vagy Xxxxx jelölés látható, az E betüjel után található szám határozza meg egy adott típus besorolását a családba, míg az X jelöli az Extreme verziót (T - mobil CPU). Idõvel elképzelhetõ, hogy megjelenik egy új Extreme processzor, ekkor valószínûleg az X6800-asat átnevezik E6800-ra, és a legújabb Extreme felveszi az X6900 jelölést.

		Category : Hardware \| By : zsolti \| Comments [74] \| Trackbacks [0]


13 Jul 2006 09:52:10 am
Érkezik a színes Lightscribe


A TG Daily úgy tudja, hogy a Hewlett-Packard még idén piacra dobná Lightscribe technológiájának színes változatát. Mindezt az eljárást támogató DVD írók használati útmutatójából következtették ki. A Lightscribe technológia lehetõvé teszi, hogy bizonyos írható lemezek adathordozó felületével ellentétes oldalára (vagyis a borítóra) a DVD író lézere grafikát égessen. A gyakran feltett kérdések szekcióban a "Lehetõség van színes borító létrehozására is?" kérdésre a válasz nem szimplán "Nem" - ehelyett ez áll ott: "A Lightscribe technológia jelenleg csak szürkeárnyalatos grafikák elõállítására alkalmas. A fejlesztési stratégia részét képezik további lehetõségek is, habár ezekrõl egyelõre nincsenek pontosabb információk." Az oldal szerint ez a HP részérõl nyílt szándékbejelentésnek minõsül. A HP PR részlegét felkeresve azt a választ kapták, hogy még év vége elõtt várhatóak az elsõ színes Lightscribe DVD írók.

		Category : Hardware \| By : zsolti \| Comments [73] \| Trackbacks [0]


12 Jul 2006 11:49:23 am
S3 Chrome: készen a DirectX 10-re


Míg az NVIDIA és az ATI nagy hévvel harcol a videokártyák virtuális világának elsõségéért, egy elfeledett, de egykoron híres elõd szép csendben fejlesztget. Bár az S3 Graphics-nak koránt sem megy már olyan jól, mint régen, ennek ellenére mégsem adja fel a videokártyák piacát, és csendben elkészítették az új generációs Chrome-ot, mely már a DirectX 10-et és a Pixel Shaderek 4. generációját is támogatja. A hír már csak azért is érdekes, mivel tudjuk, hogy az NVIDIA és az ATI elõször mindig a High-end szekciós kártyákkal jelentkezik, melyeket majd lassan követnek a közép-, majd az alsókategória résztvevõi. Ebben az esetben az idõben színre lépõ S3 esélyes lehet a középkategóriát megcélzó kártyáival, már csak azért is, mivel bár teljesítményben nem veheti fel a versenyt, de áraival biztosan a többiek alá kerülhet.

		Category : Hardware \| By : zsolti \| Comments [87] \| Trackbacks [0]


12 Jul 2006 11:48:56 am
32 magos processzorok az Inteltõl 2010-re


A világ vezetõ mikroprocesszor-gyártója az évtized végére tervezi piacra dobni 32 magos központi egységeit. A processzorgyártók korábban az órajelek folyamatos növelésétõl várták a nagyobb teljesítményt, olyannyira, hogy az Intel nemrég még több tíz gigahertzes CPU-kat ígért. Azonban a nagyobb órajelérték magasabb fogyasztást és hõtermelést eredményezett, olyannyira, hogy hamar el is érték az egymagos megoldások korlátait. Ezt követõen jelentek meg az elsõ kétmagos processzorok, melyek még most is újdonságnak számítanak. Az alacsonyabb órajel ellenére jóval gyorsabban végzik el a számítási mûveleteket egymagos társaiknál, ráadásul mindezt alacsonyabb hõleadás mellett teszik. A jelenlegi ütemterv szerint 2007 januárjában várható az elsõ négymagos Intel processzor megjelenése, és 2010-re már a 32 magos is piacon lesz. Az X-bit labs írása szerint a Gulftown kódnéven futó lapka 32 nm-es gyártástechnológiával fog készülni, minden egyes magja 512 KB másodszintû gyorsítótárt kap, órajele csupán 2 gigahertz lesz, ennek ellenére tizenötször gyorsabb sebesség várható napjaink processzorainál. Persze a legfõbb probléma itt is adott: a többmagos adatfeldolgozók képességeit csak a párhuzamos végrehajtásra kellõképpen felkészített szoftverek képesek kihasználni.

		Category : Hardware \| By : zsolti \| Comments [82] \| Trackbacks [0]


12 Jul 2006 11:38:19 am
Az új mágneses memóriachipek forradalma


A Freescale bemutatta a MRAM (Magneto-Resistive Random Access Memory) mikrochipet, amely a merevlemezekhez hasonló módon képes adatokat tárolni. Az új egység forradalmasítja a memóriák technológiáját. A magnetorezisztív véleltlenszerû eléréssel rendelkezõ memória (MRAM) a mágnesesség tulajdonságait kihasználva képes az adatokat tárolni, szemben a chipekben eddig megszokott elektromos töltéstõl. Egyes elemzõk szerint ez a chip az utóbbi évtized egyik legkiemelkedõbb találmánya a számítógépes memóriák tekintetében. A technológia legnagyobb elõnye, hogy az információt azután is képes tárolni, hogy a chip már nincs áram alatt. A vállalat már sikeresen le is gyártott néhány 4 megabites MRAM prototípust. Több nagy gyártó is (köztük az IBM) évek óta próbálkozik hasonló megoldásokkal, de a Freescale Semiconductor, a Motorola nemrégiben önállósodott félvezetõgyártó üzletága volt az elsõ, aki ezt a gyakorlatban is meg tudta valósítani. A flash memória is képes energiabefektetés nélkül adatokat tárolni, ám az MRAM jóval gyorsabb írási és olvasási sebességgel rendelkezik, ráadásul a használat során nem amortizálódnak az alaktrészek. A flash memóriákat fõként digitális kamerákban, mp3 lejátszókban és hasonló hordozható eszközökben használják, az MRAM viszont inkább számítógépekben történõ használatra lesz alkalmas, például operációs rendszer tárolására. Ezzel a megoldással az operációs rendszer sokkal gyorsabban betöltõdhet. A Freescale képviselõje elmondta, hogy már számos nagy érdeklõdõt szereztek a technológia iránt, ám ezekrõl egyelõre nem nyilatkozott. Bár a sorozatgyártás már megkezdõdött, egyelõre azt sem tudni, a technológia mikor kerülhet valóban a boltokba.

		Category : Hardware \| By : zsolti \| Comments [68] \| Trackbacks [0]


Prev 1 2 3 4 ...15 16 17 Next

	April 2026
S	M	T	W	T	F	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Categories
	Hardware	[63]
	ITech	[17]
	Software	[4]

Recent
	Fél évszázados a merevlemez
	Új Intel chipsetek grafikus maggal
	Útjára indult a Core 2 Duo
	A világ legjobb processzora!?
	Érkezik a Radeon X1950
	Az AMD is idén mutatja be négymagos processzorát
	Megérkezett a kétmagos Intel Itanium szerverchip
	Még az idén jönnek az Intel négymagosai
	Nyár végén érkezhetnek az új Xeon MP-k
	Végül, de nem utolsósorban: kétmagos Intel Itanium!

Archives
	September 2006	[1]
	July 2006	[21]
	June 2006	[13]
	May 2006	[33]
	April 2006	[16]

User List
	zsolti	[84]