Liivasildade põlvkond. Sandy Bridge protsessorid. Sandy Bridge'ist Skylake'ini: mis on Inteli protsessorites muutunud

Üldine informatsioon

Asjaolu, et Intel kavatseb süstemaatiliselt protsessorisse üle kanda varem loogikakomplektides realiseeritud funktsioone, sai selgeks enam kui kaks aastat tagasi. Esimesed Nehalemi mikroarhitektuuriga protsessorid – Bloomfield – omandasid sisseehitatud mälukontrolleri. Järgmise põlvkonna Lynnfieldis lisati mälukontrollerile siinikontroller PCI Express. Seejärel ilmus Clarkdale'is protsessorisse sisseehitatud graafikatuum, kuigi seda rakendas eraldi pooljuhtkristall. Sandy Bridge annab sellele järjekindlale integratsioonile viimase lihvi – uue mikroarhitektuuriga protsessorid sisaldavad kõike korraga ühes kiibis: protsessori tuumad, graafikatuum, mälukontroller ja PCI Expressi siinikontroller.

Sandy Bridge pooljuhtkristallide pindala saab olema ligikaudu 225 ruutmeetrit. mm, see tähendab tänu kaasaegsele 32 nm tehnoloogiline protsess see kristall on veelgi väiksem kui neljatuumaliste Bloomfieldi ja Lynnfieldi protsessorite või kuuetuumaliste Gulftowni kristall.

Sandy Bridge'i jõudluse osas ei tehta järeleandmisi. Protsessorite üldine struktuur eeldab kahe või nelja protsessorituuma olemasolu, mis toetavad Hyper-Threading tehnoloogiat, kolmanda taseme vahemälu kuni 8 MB, kahe kanaliga DDR3 mälukontrollerit, 16 PCI Express 2.0 raja tuge ja kaasaegse DirectX 10.1 graafikatuuma olemasolu. See tähendab, et uue põlvkonna protsessoritel on olemas kõik, mida neil on vaja erinevates turusegmentides, sealhulgas tipptasemel.

Sandy Bridge'iga integreerimise taustal on madalamal tasemel tehtud olulisi parandusi. Arvutussüdamike mikroarhitektuur on läbinud olulise ümberkujundamise, need on saanud mitmeid täiustusi, tänu millele on uued protsessorid eelkäijatest märgatavalt kiiremad ka samadel taktsagedustel töötades. Samal ajal tehti täiustusi soojuse tootmise vähendamiseks, et Sandy Bridge saaks lihtsalt kõrgematel sagedustel töötada. Lisaks on protsessorid mikroarhitektuuri tasandil lisanud toe uuele vektorkäskude komplektile AVX (Advanced Vector Extensions), mis on kasulikud mitmete multimeedia-, finants- või teadusalgoritmide rakendamisel. Põhiline erinevus AVX-i ja SSE perekonna varasemate vektorkäskude komplektide vahel on operandi laiuse suurendamine 128 bitilt 256 bitti, nii et paljude ülesannete puhul võimaldavad need töödelda suuri andmemahtusid madalamate kuludega. Seega võib Sandy Bridge’i iseloomustada kui märkimisväärset edasiminekut mitmes suunas korraga, mis annab alust kõige meelitavamateks väideteks selle paljulubava toote kohta.

Järgmise aasta alguses Sandy Bridge'i käivitamisega loodab Intel kiiresti vallutada enamiku hinnasegmendid. Nii maksis kohe aasta alguses lai valik uue mikroarhitektuuriga Core i3, Core i5 ja Core i7 erinevaid valikuid mis jääb vahemikku 100–300 dollarit. Ja hiljem 2011. aastal esitletakse odavamaid modifikatsioone.

Olemasolevatel andmetel on Sandy Bridge'i perekonna esimese esindajate grupi väljakuulutamine kavandatud 5. jaanuarile ning nende müügi algus on 9. jaanuaril. Sel päeval täieneb ettevõtte hinnakiri järgmiste lauaarvutitele mõeldud neljatuumaliste mudelitega:

Tuleb märkida, et lisaks ülaltoodule Inteli mudelid pakub ka tervet klassi mobiilsete ja lauaarvutite energiatõhusaid Sandy Bridge protsessoreid. Töölauale keskendunud versioonidele keskendudes võime teatada ka mitmest Sandy Bridgest, mis käivitati 5. jaanuaril ja mille tüüpiline TDP on 65, 45 ja 35 W.

Seega on ainsaks hinnakategooriaks, mis jääb Nehalemi protsessorite domineerima pikaks ajaks, kallid CPU-d, kus LGA1366 Bloomfiledi ja Gulftowni protsessoreid jätkatakse ka järgmise aasta jooksul. Nende väljavahetamine võib toimuda mitte varem kui 2011. aasta lõpus, kui Intel valmistab ette ja kohandab oma paljutõotavat LGA2011 serveriplatvormi lauaarvutitele. Spetsiaalsed "laetud" protsessori variatsioonid Sandy Bridge-E, mida hakatakse selle platvormi osana pakkuma, suudab entusiastidele pakkuda kuni 8 arvutustuuma, 16 MB L3 vahemälu, nelja kanaliga mälukontrollerit, 32 PCI Express 2.0 rada ja muud head. ainult unistus täna. See on aga kauge väljavaade; Sandy Bridge'i esimene versioon saab olmelisema, kuid siiski uue platvormi aluseks.

Kuigi Sandy Bridge võrreldes Clarkdale’iga põhimõtteliselt uusi sõlme ei toonud, tulevad uue põlvkonna protsessorid turule koos LGA1155 platvormiga. Kahjuks ei ühildu see LGA1156-ga, mis tähendab, et uued protsessorid nõuavad spetsiaalse protsessoripesaga spetsiaalsete emaplaatide kasutamist.

Koos Sandy Bridge'iga tuleb kasutusele ka värskete kiibikomplektide perekond, mille selgrooks saab enamkasutatav Intel P67 kiibistik ja Intel H67 graafikat toetav süsteemikiibistik. Nii nagu LGA1156 protsessorite kiibistikud, on ka P67 ja H67 äärmiselt lihtsad: pärast põhjasilla funktsioonide ülekandmist protsessorile koosnevad need ühest kiibist - üsna tüüpilise omaduste komplektiga lõunasillast. Lisaks Sandy Bridge'i ühilduvusele peamine omadus Need uued tooted toetavad kahte SATA-porti ribalaiusega 6 Gbit/s.

Kahjuks puudub uutel kiibikomplektidel USB3 tugi, kuid kahtlemata on valdav enamus LGA1155 emaplaatidest vastavad pordid realiseeritud läbi lisakontrollerite. Sama kehtib ka PCI siini kohta – vastava standardkontrolleri puudumine uute süsteemiloogikakomplektide osana ei tähenda sugugi seda, et traditsiooniline PCI pistikud kaob emaplaatidelt.

Hoolimata sellest, et Sandy Bridge mikroarhitektuuri ja LGA1155 platvormiga päris protsessorite väljakuulutamiseni on veel veidi aega jäänud, võimaldab olemasolev info teha väga konkreetseid prognoose tulevaste süsteemide jõudluse kohta. Seega, kui võrrelda Sandy Bridge'i ja Lynnfieldi protsessoreid, millel on sama tuumade arv ja mis töötavad sama taktsagedusega, siis uus mikroarhitektuur tagab 5-10% suurema tegeliku jõudluse.

Toimivus vastavalt inpai.com.cn. Võrreldes
neljatuumalised protsessorid sagedusel 3,4 GHz

Samas on Sandy Bridge’i protsessorite voolutarve ligikaudu 20% väiksem ehk vati jõudluse osas on uued protsessorid astunud kaugele ette. Ja muide, kui võtta arvesse, et Sandy Bridge mudelite taktsagedused ületavad samaväärsete Lynnfieldi protsessorite sagedusi umbes 10%, siis võib üldiselt öelda, et kogu LGA1155 platvorm on eelmisest LGA1156 platvormist kiirem. vähemalt 25%. Seda numbrit saab kasutada juhisena uue mikroarhitektuuri praktilise väärtuse pealiskaudseks hindamiseks, kui sulgete silmad sügavamate täiustuste ees, nagu täiustatud graafikatuum ning uute AES-NI ja AVX käsukomplektide tugi.

Kõrge jõudluse päritolu

Paljud mikroarhitektuurilised muudatused, mille kaudu insenerid Intel Protsessori jõudlust oli võimalik suurendada, vähendades samal ajal nende energiatarbimist ja soojuse hajumist, mis oli pehmelt öeldes ootamatu. Fakt on see, et Sandy Bridge ei olnud lihtsalt Nehalemi edasiarendus – see kasutas mitmeid näiliselt ebaõnnestunud Pentium 4 projektist laenatud ideid Jah, jah, kuigi NetBursti mikroarhitektuur oli Inteli poolt selle ebaökonoomsuse tõttu pikka aega tagasi lükatud, mõned funktsionaalsed elemendid Pentium protsessorid 4 võib nüüd leida tulevastest Core i3-st, Core i5-st ja Core i7-st. Ja see on eriti irooniline, et Sandy Bridge'i laenud kümnendi vanusest mikroarhitektuurist ei paranda mitte ainult jõudlust, vaid ka vähendavad soojuse hajumist.

Olulised muudatused Sandy Bridge'i mikroarhitektuuris algavad juba torujuhtme algfaasis - x86 juhiste dekodeerimise etapis lihtsamateks protsessori mikrooperatsioonideks. Sisendkäsuvoo dekodeerimisseade ise jääb samaks, mis Nehalemis – see töötleb kuni 4 käsku taktitsükli kohta ning toetab Micro-Fusion ja Macro-Fusion tehnoloogiaid, mis muudavad väljundkäsuvoo keerukuse osas ühtlasemaks. selle täitmine. Uues mikroarhitektuuris aga protsessori mikrokäskudeks dekodeeritud käske ei suunata lihtsalt järgmisse töötlemisetappi, vaid need salvestatakse ka vahemällu. Teisisõnu, lisaks tavapärasele 32 KB esimese taseme käskude vahemälule, mis on peaaegu iga x86 protsessori atribuut, on Sandy Bridge lisanud veel ühe täiendava "nulltaseme" vahemälu – dekodeerimistulemuste vahemälu. See vahemälu on esimene viide NetBursti mikroarhitektuurile, sest üldiste tööpõhimõtete seisukohalt on see alati meeldejääva Execution Trace Cache'i otsene analoog.

Dekodeerimistulemuste vahemälu maht on umbes 6 KB ja see mahutab kuni poolteist tuhat mikrokäsku, mis teeb sellest dekoodrile olulise abi. Fakt on see, et kui dekooder tuvastab vahemälus sisendkäsuvoos varem uuesti tõlgitud juhised, asendab see need kohe ilma uue dekodeerimiseta sisemiste mikrokäskudega. Dekodeerimistulemuste vahemälu olemasolu võimaldab märkimisväärselt leevendada dekoodri koormust, mis on protsessori üsna energiamahukas osa. Inteli sõnul on see täiendav vahemälu kasulik umbes 80% ajast, mis kustutab kõik kahtlused selle ebatõhususe kohta. Lisaks lülitatakse jõudeoleku ajal Sandy Bridge'i dekooder välja, mis aitab oluliselt kaasa nende protsessorite energiatarbimise vähendamisele.

Teine oluline täiustus torujuhtme algfaasis on harude prognoosimisüksuse täiustamine. Selle sõlme õige töö tähtsust on raske üle hinnata, sest iga vale haru ennustus toob kaasa vajaduse torujuhe peatada ja täielikult lähtestada. Selle tulemusena toovad ennustamisvead kaasa mitte ainult jõudluse vähenemise, vaid ka vajaduse lisaenergia järele konveieri täitmiseks. Peab ütlema, et Intelil õnnestus oma viimastes protsessorites saavutada selle seadme väga kõrge efektiivsuse. Sandy Bridge'is kujundati aga ümber kõik puhvrid, mis salvestavad üleminekute aadresse ja nende ajalugu, et neis sisalduvat teavet tihendada. Selle tulemusel suutis Intel säilitada haru sügavama ajaloo, suurendamata haruennustusüksuses kasutatavate andmestruktuuride suurust. Ja see avaldas positiivset mõju ennustaja jõudlusele, mille jõudlus on otseselt seotud statistilise teabe hulgaga, mida ta kasutab teostatavate tingimuslike üleminekute kohta. Hinnanguliselt on õigesti ennustatud harude arv Sandy Bridge'is eelkäijaga võrreldes kasvanud enam kui 5%.

Kuid kõige huvitavamad muudatused puudutasid käskude ümberjärjestusüksust, mis on kõigi out-of-order protsessorite võtmesõlm. Just siin on kõige selgemalt nähtav Sandy Bridge'i mikroarhitektuuri sugulus NetBurstiga – Inteli insenerid tagastasid oma uuele protsessorile füüsilise registrifaili, mis Core'is ja Nehalemis tühistati tsentraliseeritud eraldi registrifaili kasuks. Muudatuste olemus seisneb selles, et kui varem salvestati mikrokäskude ümberjärjestamisel puhvrisse nende iga töödeldud käsu jaoks kasutatud registrite täielikud koopiad, siis nüüd kasutatakse ainult viiteid füüsilises registrifailis salvestatud registriväärtustele. Selline lähenemine ei välista mitte ainult tarbetuid andmeedastusi, vaid ka registri sisu mitmekordset dubleerimist, mis säästab ruumi registrifailis.

Selle tulemusel suudab Sandy Bridge'i protsessorite käsutäitmisüksus hoida kuni 168 mikrokäsku "silmas", samas kui Nehalemi protsessorites paigutati ümberjärjestuspuhvrisse vaid 128 mikrokäsku. Lisaks saavutatakse teatav energiasääst. Registriväärtuste asendamisel viidetega nendele väärtustele on aga ka negatiivne külg - täitmiskonveier omandab osutite viitamise tühistamiseks vajalikud lisaetapid.

Kuid Sandy Bridge'i puhul polnud arendajatel üldiselt muud valikut. See protsessor tutvustab uusi AVX-käske, mis töötavad 256-bitistel registritel, mille väärtuste mitmekordne ülekandmine tekitaks tõsiseid ülekulusid. Ja insenerid hoolitsesid eriti selle eest, et Sandy Bridge'i mikroarhitektuuris täidetaks uusi käske hea kiirusega. Suur jõudlus nendega töötamisel on nende heakskiitmise võti tarkvaraarendajate poolt, kuna ainult sel juhul saavad nad vektoriarvutuste paralleelsuse ja läbilaskevõime astet tõesti suurendada.

AVX-juhised ise on SSE edasiarendus, mis laiendab tüüpiliste SIMD-vektorite operatsioonide bitivõimsust 256-bitiste operandideni. Pealegi, uus komplekt võimaldab toiminguid läbi viia mittepurustavalt, st ilma algandmeid registrites kaotamata. Tänu nendele omadustele võib AVX-i käsukomplekti koos mikroarhitektuuri täiustustega pidada ka jõudluse suurendamiseks ja energiasäästu suurendamiseks mõeldud uuendusteks, kuna nende rakendamine lihtsustab paljusid algoritme ja teeb rohkem tööd, kasutades väiksem arv käske AVX-i juhised sobivad hästi ujukomamahukate multimeediumi-, teadus- ja finantsrakenduste jaoks.

256-bitiste käskude tõhusaks täitmiseks kujundati protsessori ajamid spetsiaalselt ümber. Muudatuste olemus seisneb selles, et 256-bitiste andmetega töötamiseks kombineeritakse 128-bitised ajamid paarikaupa. Ja arvestades, et Sandy Bridge'i kolmel täitmispordil (nagu Nehalem) on seadmed, mis töötavad samaaegselt kolme tüüpi andmetega – 64-bitine, 128-bitine täisarv või 128-bitine reaalandmetega –, näeb SIMD-seadmete paarikaupa kombinatsioon välja ühes pordis. nagu täiesti loomulik ja mõistlik lahendus. Ja mis kõige tähtsam, selline ressursside ümberjagamine ei kahjusta protsessori täitmisüksuse üldist läbilaskevõimet.

Sandy Bridge'i keskendumine 256-bitiste vektorjuhistega töötamisele sundis protsessorite arendajaid mõtlema jõudluse suurendamisele funktsionaalsed seadmed andmete peale- ja mahalaadimine. Kolm Nehalemis rakendatud andmetega töötamiseks mõeldud porti migreerusid Sandy Bridge'ile. Kuid nende tõhususe suurendamiseks ühendasid insenerid kaks porti, mis olid varem mõeldud aadresside salvestamiseks ja andmete laadimiseks. Nüüd on need muutunud samaväärseks ja mõlemad saavad laadida aadresse ja andmeid või aadresse üles laadida. Kolmas port jääb muutumatuks ja on mõeldud andmete salvestamiseks. Arvestades, et iga port on võimeline läbima kuni 16 baiti tsükli kohta, on esimese taseme andmevahemälu koguläbilaskvus uues mikroarhitektuuris kasvanud 50%. Selle tulemusel suudavad Sandy Bridge'i mikroarhitektuuriga protsessorid laadida kuni 32 baiti andmeid ja salvestada 16 baiti andmeid ühe taktitsükli kohta.

Kõiki kirjeldatud uuendusi võrreldes leiame, et Sandy Bridge’i protsessorite arvutustuumade mikroarhitektuur on muutunud enam kui oluliselt. Kasutusele võetud uuendused on kahtlemata üsna lähedal asjaolule, et nende protsessorite arvele ei saa tõesti panna Nehalemi kitsaskohtade lihtlabast viimistlemist, vaid üsna tõsist töötlust.

Uued lähenemised integratsioonile

Nehalemi arhitektuuri arendamisega hakkas Intel astuma tõelisi samme oma protsessorite integreerimise taseme tõstmiseks. Nad hakkasid järjestikku üle kandma funktsionaalseid üksusi, mis olid varem loogikakomplekti eesõigus: mälukontroller, PCI kontroller Express, graafiline tuum. Samuti lisati protsessorile kolmanda taseme vahemälu. Teisisõnu, protsessorist on saanud mitte ainult kohalik "arvutuskeskus", vaid ka suure hulga heterogeensete kompleksplokkide kontsentratsioon.

Loomulikult on sellisel liidul palju positiivseid külgi ja võimaldab suurendada tootlikkust, vähendades andmevahetuse viivitusi. Mida rohkem on aga protsessoris erinevaid plokke, seda keerulisemaks muutub nendevaheliste suhete realiseerimine elektritasandil. Ja kõige tõsisem probleem sellega seoses on jagatud L3 vahemälu ühendamine protsessori tuumadega, eriti arvestades nende arvu edasist suurenemist. Teisisõnu, Sandy Bridge'i protsessorite mikroarhitektuuri kallal töötades olid arendajad sunnitud tõsiselt mõtlema protsessoris asuvate funktsionaalsete üksuste vahelise mugava interaktsiooniskeemi korraldamisele. Varem kasutatud tavalist ristühendust võiks kasutada kahe-, nelja- ja kuuetuumalises Nehalemis, kuid modulaarse protsessori konstruktsiooni jaoks suur summa See ei sobi enam erinevatele tuumadele.

Tegelikult on sellega juba arvestatud kaheksatuumalistes serveriprotsessorites Nehalem-EX, kus kasutati arvutituumade ja L3 vahemälu vahelise ühenduse põhimõtet. uus tehnoloogia. See tehnoloogia, mis on edukalt Sandy Bridge'ile üle läinud, on ringbuss. Täiustatud protsessorites on arvutussüdamikud, vahemälu, graafikatuum ja põhjasilla elemendid kombineeritud spetsiaalse QPI-laadse protokolliga ringsiiniga, mis on võimaldanud oluliselt vähendada signaalide marsruutimiseks vajalike protsessorisiseste ühenduste arvu.

Protsessori funktsionaalsete plokkide ja kolmanda taseme vahemäluga suhtlemise tõhusaks rakendamiseks ringsiini kaudu jagatakse see Sandy Bridge'i protsessorites võrdseteks pankadeks, igaüks 2 MB. Algne disain eeldab, et nende pankade arv vastab protsessori tuumade arvule. Kuid turunduseesmärkidel, ilma vahemälu terviklikkust kahjustamata, saab pangad siini küljest lahti ühendada, vähendades nii üldist vahemälu suurust. Iga vahemälupanka juhib oma vahekohtunik, kuid samal ajal töötavad nad kõik tihedas koostöös - teave neis ei dubleerita. Pankadeks jagamine ei tähenda L3 vahemälu tükeldamist, see võimaldab lihtsalt suurendada selle läbilaskevõimet, mis selle tulemusena skaleerub tuumade ja vastavalt ka pankade arvu suurenemisega. Näiteks arvestades, et andmeedastuseks kasutatava "rõnga" laius on 32 baiti, on neljatuumalise protsessori sagedusel 3,4 GHz töötava L3 vahemälu maksimaalne ribalaius 435,2 GB/s.

Rõngassiin on hea mitte ainult selle skaleeritavuse poolest, kuna protsessorituumade arv suureneb. Arvestades, et info vahetamisel mööda “rõngast” kasutatakse lühimat marsruuti, on vähenenud ka L3 vahemälu latentsus. Nüüd on see 26–31 tsüklit, samas kui Nehalem L3 vahemälu pakkus latentsust 35–40 tsüklit. Arvestada tuleb aga sellega, et kogu Sandy Bridge’i vahemälu töötab protsessori sagedusel ehk on tänu sellelegi muutunud kiiremaks.

Rõngassiini eeliseks on ka see, et see võimaldas protsessorisse integreeritud graafikatuuma ühendada ühistele andmeedastusteedele. See tähendab, et Sandy Bridge'i graafika töötab mäluga mitte otse, vaid sarnaselt protsessori tuumadega - läbi kolmanda taseme vahemälu. See suurendab selle jõudlust ja vähendab ka kahju, mida integreeritud graafika võib süsteemi üldisele jõudlusele põhjustada, konkureerides mälusiini pärast töötlemistuumadega.

Graafika tuum saab uusi funktsioone

Integreeritud graafikatuuma ilmumine protsessorisse pole uus, sisseehitatud Intel HD Graphics GPU-ga Clarkdale’i perekonna protsessorid on turul olnud pea aasta. Kuid Sandy Bridge'is on graafika ja andmetöötluse tuumad lõpuks sõbraks saanud, need asuvad samal pooljuhtkiibil ja on ühendatud ühise ringsiiniga, mille kaudu kasutatakse võrdselt kõiki teisi protsessori ressursse. See arhitektuuri ümberkorraldamine, mis tõi graafikatuumiku mälukontrollerile lähemale ja andis selle käsutusse kõik kolmanda taseme vahemälu võimalused, avaldas jõudlusele positiivset mõju. Kuid sarnaselt arvutussüdamikele on ka graafikatuum saanud muid olulisi täiustusi, tänu millele kuulub see formaalselt järgmisele põlvkonnale.

Üldiselt pole graafikatuuma arhitektuur muutunud põhimõtteliselt teistsuguseks: see põhineb endiselt 12 juhtival (shader) protsessoril. Kuid arendajad suutsid oma jõudlust mitmete toimingute puhul peaaegu kahekordistada ja lisaks saavutasid oma töös parema paralleelsuse. Tänu tehtud muudatustele lisandus uue graafikatuumiku omadustele ka Shader Model 4.1 ja DirectX 10.1 tugi.

Kuna graafika tuum kolis 32-nm pooljuhtkristallile, sai võimalikuks valutult tõsta selle taktsagedust, mis võib ulatuda kuni 1,35 GHz-ni. Kõigi nende toimingute tulemusena muutub Sandy Bridge'i graafika reaalsetes rakendustes kiiruselt võrreldavaks diskreetsete videokaartidega algtaseme. Intel mõtles isegi täisekraani antialiase rakendamisele, kasutades oma paljutõotavat graafikatuuma! Teisisõnu, Sandy Bridge'il on kõik võimalused saada kõige produktiivsemaks integreerituks graafiline lahendus, mis suudab madalama hinnaklassi diskreetsete videokaartide positsioonid tallata. Kuigi loomulikult rõhutavad AMD ja NVIDIA vastuargumendina kindlasti DirectX 11 toe puudumist, mis võib olla kasulik mitte ainult viimased mängud, aga ka näiteks rakendusi, mis kasutavad DirectCompute'i, nagu homsed Interneti-brauserid.

Asi ei piirdunud aga ainult olemasoleva graafikatuuma arhitektuuri täiustamisega. Sandy Bridge'i graafilisele osale on lisatud uued spetsiaalsed plokid, mis on mõeldud videovoogude dekodeerimiseks ja kodeerimiseks populaarsetes MPEG2, VC1 ja AVC vormingutes.

Muidugi ei üllata te täna kedagi riistvaralise videodekodeerimisega, seda saab teha ka Clarkdale'i graafikatuum. Kui aga varem oli see toiming määratud Shader protsessoritele, siis nüüd tegeleb sellega eraldi funktsionaalne üksus. Selle rollide ümberjaotamise mõte on uus ühilduvus 3D-videoga; uue graafikatuuma puhul ei tekita stereo 3D Blu-ray või MVC voo riistvaraline dekodeerimine probleeme.

Veelgi huvitavam lisand oli riistvarakoodek, mis suudab videovoo AVC-vormingusse kodeerida. Praktikas tähendab see, et Sandy Bridge'i graafikatuumal on kõik ressursid, mida see vajab videote suure jõudlusega ümberkodeerimiseks ilma traditsioonilist töötlemisvõimsust tarbimata. Mida tegelikult, arvestades Inteli protsessorite laialdast kasutust, hakkavad tarkvaraarendajad kindlasti edukalt kasutama. Lisaks plokid riistvaraline kodeering ja dekodeerimist saab kasutada ka Intel P67 kiibistikul põhinevates süsteemides, st kasutades välist diskreetset graafikakaarti.

Konkreetseid näiteid ei pea kaugelt otsima: on teada, et Sandy Bridge'i uute meediumivõimaluste tugi on olemas sellistes populaarsetes toodetes nagu ArcSoft MediaConverter, Corel DVD Factory, CyberLink MediaEspresso, Movavi Video Converter, Roxio Creator jne. . Ja muide, kui kasutate video ümberkodeerimiseks Sandy Bridge'i graafikatuuma multimeediumiüksusi, jäävad varjude protsessorid koormusevabaks, mida keegi ei vaevu protsessiga ühendama. täiendav töötlemine video või eriefektid.

IN erinevaid mudeleid Sandy Bridge mikroarhitektuuriga protsessorite puhul on graafikatuum olemas kahes versioonis: Intel HD Graphics 2000 ja Intel HD Graphics 3000. Erinevus on aktiivse täitmise (shader) protsessorite arvus. Graafika südamiku vanem mudel, mis on ette nähtud mobiilsed lahendused ja vanematel töölaua segmendi protsessoritel on kõik 12 täitmisüksust, samas kui selle tuuma lihtsustatud variant Intel HD Graphics 2000 on rahul vaid kuue sellise üksusega. Samuti on Intel HD Graphics 2000 sagedus veidi madalam. Kuid GPU kõige huvitavamad elemendid - riistvarakooder ja dekooder - on mõlemas versioonis täielikult olemas.

Northbridge uuel viisil - süsteemiagent

Uurimata jäi vaid üks Sandy Bridge'i protsessorite funktsionaalne üksus – nn süsteemiagent, mis ühendab endas kontrollerid väliste protsessoriliideste jaoks: PCI Express, DMI, mälu- ja kuvaliidesed. Tegelikult on meil süsteemiagendi isikus ligikaudu sama asi, mida Nehalemi protsessorites nimetati Uncore'iks. Sandy Bridge'i süsteemiagent pole aga endiselt Uncore'i täielik analoog. See ei sisalda L3 vahemälu, mis uues mikroarhitektuuris toimib eraldiseisva funktsionaalse üksusena, mis töötab protsessori sagedusel. Teine erinevus süsteemiagendi vahel on see, et andmevahetus selle ja protsessori ja graafika tuumade vahel, samuti kolmanda taseme vahemäluga, toimub sama ringsiini kaudu, mis ühendab kõik Sandy Bridge'i üksused.

Rääkides süsteemiagendis saadaolevatest uuendustest, tahaksin kõigepealt öelda mälukontrolleri kauaoodatud täiustamise kohta. Westmere'i (Clarkdale) protsessorites ei toiminud mälukontroller koos graafikatuumaga hästi parim pool. Sandy Bridge'is on see regressioon lõpuks kõrvaldatud; uus mälukontroller pole vähemalt aeglasem kui Lynnfieldi protsessorite mälukontroller. Samas toetab kontroller kahe kanaliga DDR3 SDRAM-i: formaalselt – DDR3-1067 või DDR3-1333, kuid tegelikult on Sandy Bridge’i protsessoritel kordijate komplekt, mis võimaldab mälu taktida sagedustel 1600, 1866 ja 2133. MHz.

Võite ette kujutada näiteks Sandy Bridge mälukontrolleri ligikaudset jõudluse taset olemasolevate Aida64 testi tulemuste põhjal.

xfastest.com andmetel. Testimine viidi läbi Core i7-2400-ga
kahe kanaliga DDR3-1600 mälu ajastustega 7-7-7-21-1T

Mälu alamsüsteemi latentsus Sandy Bridge protsessoriga süsteemis osutub võrreldavaks sarnase platvormi latentsusega LGA1156 Core i7 protsessoritega. Samal ajal on uutel protsessoritel selgelt kasu mälu alamsüsteemi läbilaskevõimest.

Sandy Bridge'i PCIE siinikontroller sarnaneb sarnase LGA1156 protsessorite kontrolleriga. See toetab 16 PCI Express 2.0 rada, mida saab rühmitada kas üheks PCIE 16x siiniks või kaheks PCIE 8x siiniks. Seetõttu ei kaota vana LGA1366 platvorm LGA1155 süsteemide väljalaskmisega oma tähtsust: see on ka edaspidi ainus võimalus, mis võimaldab teil kokku panna täiskiirusel video alamsüsteeme, mis ühendavad mitu PCIE siiniga ühendatud GPU-d maksimaalse ribalaiusega.

Oluline muudatus on toimunud ka toetatud kuvaliideste osas. Uute protsessorite graafiline tuum hakkab kasutama HDMI versiooni 1.4, mille põhiomaduseks on 3D-pildi edastamise tugi.

Toitehaldus ja kiirendamine

Sandy Bridge süsteemiagendi teine oluline osa lisaks välistele liidese kontrolleritele on PCU (Power Control Unit). Nii nagu Nehalemi protsessorites, on ka see seade programmeeritav mikrokontroller, mis kogub infot erinevate protsessorisõlmede temperatuuride ja voolutarbimise kohta ning millel on võimalus interaktiivselt juhtida nende sagedust ja toitepinget. PCU rakendab nii energiasäästufunktsioone kui ka turborežiimi, mida Sandy Bridge'is edasi arendati.

Kõik Sandy Bridge'i protsessoreid moodustavad funktsionaalsed moodulid on jagatud kolmeks domeeniks, mis kasutavad sõltumatut sageduskella ja toiteühenduse ahelat. Esimene ja peamine domeen ühendab protsessori tuumad ja L3 vahemälu, mis töötavad üks sagedus ja pinget. Teine domeen on graafiline tuum, mis kasutab oma sagedust. Kolmas domeen on süsteemiagent ise.

See eraldamine võimaldas inseneridel rakendada täiustatud Intel SpeedStepi ja Turbo Boost samaaegselt ja sõltumatult graafika ja protsessori tuumade jaoks. Sarnast lähenemist on juba rakendatud mobiilsed protsessorid Arrandale, kuid seal töötas see lihtsal viisil, juhi kaudu. Sandy Bridge'is on see täielikult rakendatud riistvaraline lahendus, mis juhib arvuti- ja graafikatuumade sagedusi omavahel seotud viisil, võttes arvesse nende hetketarbimist. See võimaldab teil saada protsessorituumade tõsisemat kiirendamist, mida rakendatakse turborežiimi kaudu, samal ajal kui graafikatuum on jõude, ja vastupidi - graafikatuuma olulist kiirendamist, kui arvutustuumad pole täielikult laetud. Sandy Bridge'i turborežiimi agressiivsust on lihtne hinnata selle järgi, et protsessori sagedus võib kasvada nelja sammu võrra võrreldes nimisagedus, ja graafikatuuma sageduse kõikumine võib ulatuda kuue kuni seitsme astmeni.

Kuid see pole veel kõik uuendused Turbo tehnoloogia Boost. Selle eelis uus teostus See seisneb ka selles, et PCU-l on võimalus sagedusi intelligentsemalt juhtida, keskendudes protsessori komponentide tegelikele temperatuuridele, mitte ainult nende energiatarbimisele. See tähendab, et kui protsessor töötab soodsates termilistes tingimustes, on selle energiatarbimisel lubatud ületada TDP piiri.

Tavalise igapäevase töö ajal protsessori koormus kõigub. Protsessor veedab suurema osa ajast energiasäästlikus olekus ja suurt jõudlust on vaja vaid lühikest aega. Selliste intervallide ajal ei ole protsessori kuumutamisel aega tõsiste väärtuste saavutamiseks - jahuti soojusjuhtivuse tekitatud inerts mõjutab seda. Sandy Bridge'is sagedusi kontrolliv PCU usub õigusega, et midagi hullu ei juhtu, kui sellistel hetkedel protsessorit ülekiiretatakse rohkem, kui teoreetiline soojuse hajumise väärtus teoreetiliselt lubab. Kui protsessori temperatuur hakkab lähenema kriitilistele väärtustele, vähendatakse sagedust ohutute väärtusteni.

See toob automaatselt kasu maksimaalse jõudluse saavutamise seisukohast, kasutades kvaliteetset jahutust Sandy Bridge'il põhinevates süsteemides. Kuid ärge petke ennast – olekus "TDP-st väljaspool" piirab riistvara maksimaalne tööaeg 25 sekundiga.

Mis puudutab tavapärast kiirendamist, siis sooritatud traditsioonilised meetodid, siis ootavad meid siin ees kardinaalsed muutused, mida overclockerid tõenäoliselt entusiastlikult vastu ei võta. Kogu kurja juur peitub samas integratsioonisoovis – LGA1155 platvormidel viis Intel baassagedusgeneraatori süsteemiloogikakomplekti. Traditsioonilisele kiirendamisele ei põhjustanud saatuslikke tagajärgi aga mitte see, vaid see, et sagedusgeneraator sai ainsaks ja sellega genereeritakse süsteemis kõik sagedused. Nagu teate, ei saa kõik bussid ja kontrollerid kiirendamisega hästi hakkama. Näiteks PCI Expressi siini sageduse või kiiruse suurendamisel USB töö või SATA-kontrollerite puhul võib ebastabiilsus tekkida väga kiiresti. Ja just see tegur saab sageduse suurendamisel tõsiseks takistuseks keskprotsessor baassagedusgeneraatorit kiirendades.

Faktid on järgmised. Sandy Bridge'i protsessorites kasutatav põhitaktsagedus on seatud 100 MHz peale. Generaator ise võimaldab teil selle sageduse väärtusi muuta väga laias vahemikus ja isegi 0,1 MHz sammuga. Kuid katsed seda väga kiiresti suurendada põhjustavad süsteemi ebastabiilsust või töövõimetust. Seega ei tea me ühtegi edukat kogemust baassageduse tõstmisel üle 105 MHz. Teisisõnu, traditsiooniline ja ajaproovitud ülekiirendamise meetod kellageneraatori sageduse suurendamisega Sandy Bridge'il põhinevates süsteemides ebaõnnestub ega lase kiirendamisel ületada kergemeelset 5%.

Seega on ainus tõeliselt mõttekas võimalus paljutõotavate LGA1155 protsessorite kiirendamiseks nende korrutusteguri suurendamine. Sandy Bridge'i mudelite hulgas, mida Intel klientidele pakkuma hakkab, on spetsiaalsed tooted, millel pole lukustatud kordajat ja mida saab teoreetiliselt kiirendada 5,7 GHz-ni (57 on mikroarhitektuuri sisseehitatud maksimaalne kordaja väärtus). Sellised protsessorid, mida protsessori numbris tähistatakse järelliitega "K", klassifitseeritakse aga ülemisteks. hinnakategooria ja samal ajal maksavad need veidi rohkem kui nende tavalised kolleegid.

Tavaliste protsessorimudelite kasutajatele pakutakse kunstlikult piiratud kiirendamist - sellised protsessorid võimaldavad suurendada ka korrutustegurit, kuid mitte rohkem kui 4 sammu võrra võrreldes standardväärtusega. Veelgi enam, me räägime konkreetselt kiirendamisest, kordaja muutmine ei mõjuta kuidagi Turbo Boosti tehnoloogiat, mis lisaks sellele käsitsi sageduse suurendamisele lisab ka oma automaatse. Lisaks ei piira Intel kõigis oma protsessorites kordajaid, mis määravad graafikatuuma ja mälu sageduse. See tähendab, et graafikatuuma ja mälu kiirendamine on saadaval süsteemides, millel on Sandy Bridge'i mis tahes modifikatsioonid - nii kiirendavad kui ka tavalised.

Tõenäoliselt ei pea ülekiirendajad seda piisavaks hüvitiseks, nii et tõenäoliselt on nad huvitatud ainult lukustamata protsessoritest - Core i5-2500K ja Core i7-2600K. Veelgi enam, kättesaadav teave nende sageduspotentsiaali kohta tundub väga julgustav. Näiteks on tõendeid Core i7-2600K stabiilse jõudluse kohta, kui see on kiirendatud ja kuni 5,0 GHz õhkjahutusega.

windwithme andmed, http://itbbs.pconline.com.cn/diy/12120702.html

Kirjeldatud tulemus saavutati Prolimatech Mega Shadow Deluxe Edition jahuti kasutamisega ja protsessori südamiku pinge tõstmisega 1,45 V-ni. Loomulikult ei sobi selline tõsine pingetõus tõenäoliselt igapäevaseks kasutamiseks, kuid usume, et sagedustel ca. 4,8 GHz Sandy Bridge protsessorid töötavad 24/7 režiimis, mida nad kindlasti saavad.

Võtame selle kokku

Naastes selle artikli alguse juurde, tahaksin teile meelde tuletada, et Intel positsioneerib Sandy Bridge'i kui "tick-tock" strateegiat. See tähendab, et tootja sõnul on see protsessor uue mikroarhitektuuri kandja. Samas ei leidnud me selle ülesehitust uurides põhimõtteliselt uusi ideid, mis kujutlusvõimet rabaksid. Tegelikult on ainult palju väikseid täiustusi, vanade edukate tehnoloogiate taaselustamine ja edasine integratsioon. Kas antud juhul on mõistlik rääkida uue põlvkonna protsessoritest või tuleks Sandy Bridge’i tõesti pidada vaid arenenud Nehalemiks?

Ja siin pole meil kahtlusi - nõustume täielikult Inteli arvamusega. Sandy Bridge'i protsessorid illustreerivad suurepäraselt kvantitatiivsete muutuste kuhjumise tõttu uue kvaliteedi esilekerkimist. Arvutussüdamike mikroarhitektuuris on palju uuendusi, 256-bitiste AVX-juhiste toe lisamine, täiustatud graafikatuum, riistvaraüksuste välimus video kodeerimiseks ja dekodeerimiseks, uus L3 vahemälu, ringbuss, intelligentne süsteem agent, agressiivsem Turbo Boost tehnoloogia ja kõrgendatud taktsagedused – see on kõik Üksiti võib see tunduda pisiasjana, kuid kokkuvõttes toodab see toote, mis on põhjalikult paranenud. Pealegi on selle paremus üsna käegakatsutav – seda on selgelt näha faktis, et Sandy Bridge on muutunud oma eelkäijatest oluliselt kiiremaks, jäädes samas samasse termopaketti.

Muidugi, kui me ütleme "oluliselt", ei pea me silmas märkimisväärset kiiruse suurenemist. Asendades Lynnfieldil või Clarkdale'il põhineva LGA1156 süsteemi aga sarnase hinnaga LGA1155 emaplaadi ja Sandy Bridge'i protsessori komplektiga, võite oodata vähemalt 25% jõudluse kasvu kõigis protsessorist sõltuvates rakendustes.

Siiski on ka teatud klasside probleeme, kus Sandy Bridge on uute konstruktsiooniplokkide tõttu oma eelkäijatest suurusjärgu võrra parem. Esiteks on oodata olulist jõudluse kasvu paljudes video ümberkodeerimise utiliitides, mille vajadusteks on uutele protsessoritele lisatud spetsiaalsed riistvarakoodekid ja dekooderid. Samuti suudavad uusi AES-NI ja AVX käsukomplekte kasutavad multimeedia, krüptograafilised, teaduslikud või finantsalgoritmid uutel protsessoritel oluliselt kiiremini töötada. Loomulikult on kõiki neid eeliseid võimalik saavutada ainult spetsiaalse tarkvara optimeerimisega, kuid tundub, et te ei pea seda liiga kaua ootama, kuna Inteli insenerid on teinud kõik endast oleneva, et uuendused oleksid arendajatele mugavad.

Ka need kasutajad, kes kavatsevad kasutada sisseehitatud graafikat, saavad uuest platvormist palju kasu. Võrreldes Intel HD Graphicsi eelmise versiooniga on see muutunud oluliselt kiiremaks, mida tulevaste Sandy Bridge-il põhinevate sülearvutite omanikud ja uus platvorm Huroni jõgi. Ja kui uusi protsessoreid plaanitakse kasutada koduarvutite või HTPC-de osana, rõõmustab sisseehitatud graafikatuum HDMI 1.4 liidese toega, mis võimaldab edastada 3D-pilte välisseadmetesse.

Üldiselt tundub, et Sandy Bridge'il on ainult üks tõsine miinus - probleemid ülekiirendamisega. Ja kui kõrgemasse hinnakategooriasse kuuluvate protsessorite ostjad saavad veidi juurde makstes endale ülekiirendamise sõbraliku lukustamata protsessori, siis odavamate kui 200 dollari protsessorite hulgas selliseid võimalusi pole. Seega tähistab LGA1155 platvorm veel üht trendi – Intel soovib piirata odavate protsessorite kiirendamisvõimalusi. Tõenäoliselt pole sellel aga suurt mõju ülekiirendamise kui nähtuse populaarsusele – oma võimaluste piirini töötavate seadmete järgijaid võtab AMD oma poolehoidjate seas hea meelega vastu, mis sel aastal peab välja laskma oma toote, mitte vähem epohhiloov kui Sandy Bridge – Buldooser.

Lõpuks teatas Intel ametlikult uutest protsessoritest, mis töötavad uuel mikroarhitektuuril. Enamiku inimeste jaoks on "Sandy Bridge'i teadaanne" vaid sõnad, kuid üldiselt on Intel Core ll põlvkond kui mitte uus ajastu, siis vähemalt peaaegu kogu protsessorituru värskendus.

Esialgu teatati, et turule tuuakse vaid seitse protsessorit, kuid kõige kasulikumal lehel ark.intel.com info kõigi uute toodete kohta on juba ilmunud. Protsessoreid või õigemini nende modifikatsioone oli veel mitu (sulgudes märkisin ligikaudse hinna - kui palju iga protsessor 1000 tüki partiis maksab):

Mobiil:

Intel Core i5-2510E (~ 266 dollarit)
Intel Core i5-2520M
Intel Core i5-2537M
Intel Core i5-2540M

Teise põlvkonna Intel Core i5 mobiilprotsessorite visuaalne üksikasjalik võrdlus.

Intel Core i7-2617M
Intel Core i7-2620M
Intel Core i7-2629M
Intel Core i7-2649M
Intel Core i7-2657M
Intel Core i7-2710QE (~ 378 dollarit)
Intel Core i7-2720QM
Intel Core i7-2820QM
Intel Core i7-2920XM Extreme Edition

Teise põlvkonna Intel Core i7 mobiilprotsessorite visuaalne üksikasjalik võrdlus.

Lauaplaat:

Intel Core i3-2100 (~ 117 dollarit)
Intel Core i3-2100T
Intel Core i3-2120 (138 dollarit)

Visuaalne ja üksikasjalik võrdlus teise põlvkonna Intel Core i3 lauaarvutiprotsessorite kohta.

Intel Core i5-2300 (~ 177 dollarit)
Intel Core i5-2390T
Intel Core i5-2400S
Intel Core i5-2400 (~ 184 dollarit)
Intel Core i5-2500K (~ 216 dollarit)
Intel Core i5-2500T
Intel Core i5-2500S
Intel Core i5-2500 (~ 205 $)

Visuaalne ja üksikasjalik võrdlus teise põlvkonna Intel Core i5 lauaarvutiprotsessorite kohta.

Intel Core i7-2600K (~ 317 dollarit)
Intel Core i7-2600S
Intel Core i7-2600 (~ 294 dollarit)

Visuaalne ja üksikasjalik võrdlus teise põlvkonna Intel Core i7 lauaarvutiprotsessorite kohta.

Nagu näete, on mudelinimede nimes nüüd neli numbrit – seda tehakse selleks, et vältida segadust eelmise põlvkonna protsessoritega. Koosseis osutus üsna terviklikuks ja loogiliseks - kõige huvitavamad i7 seeriad on tehnoloogia olemasolu tõttu i5-st selgelt eraldatud Hüperlõime ja suurendas vahemälu suurust. Ja i3 perekonna protsessorid erinevad i5-st mitte ainult väiksema tuumade arvu, vaid ka tehnoloogia puudumise poolest. Turbo Boost.

Tõenäoliselt märkasite protsessorite nimedes ka tähti, ilma milleta oli koosseis oluliselt vähenenud. Nii et siin on kirjad S Ja T rääkida vähendatud energiatarbimisest ja TO – tasuta kordaja.

Uute protsessorite visuaalne struktuur:

Nagu näha, on lisaks graafika- ja arvutussüdamikele, vahemälule ja mälukontrollerile nn. Süsteemi agent– sinna visatakse palju asju, näiteks DDR3 mälukontrollerid ja PCI-Express 2.0, toitehaldusmudel ja plokid, mis vastutavad riistvara tasemel sisseehitatud GPU töö ja pildiväljundi eest, kui see on kasutatud.

Kõik põhikomponendid (sealhulgas graafikaprotsessor) on omavahel ühendatud kiire ringsiiniga, millel on täielik juurdepääs L3 vahemällule, mille tõttu on protsessori enda üldine andmevahetuse kiirus suurenenud; Huvitav on see, et see lähenemisviis võimaldab teil tulevikus jõudlust suurendada, lihtsalt suurendades siinile lisatud tuumade arvu. Kuigi ka praegu tõotab kõik olla oma parimal moel - võrreldes eelmise põlvkonna protsessoritega on uute jõudlus kohanemisvõimelisem ning suudab tootja sõnul paljudes ülesannetes demonstreerida 30-50% ülesande täitmise kiiruse tõusu. !

Kui soovite rohkem teada saada uus arhitektuur, siis vene keeles võin soovitada neid kolme artiklit - , , .

Uued protsessorid on täielikult toodetud 32 nm protsessitehnoloogia järgi ja neil on esmakordselt "visuaalselt nutikas" mikroarhitektuur, mis ühendab endas oma klassi parimad. arvutusvõimsus ja 3D-graafika töötlemise tehnoloogia ühel kiibil. Sandy Bridge'i graafikas on tõesti palju uuendusi, mis on peamiselt suunatud jõudluse suurendamisele 3D-ga töötamisel. Integreeritud videosüsteemi “kehtestamise” üle võib vaielda kaua, aga muud lahendust kui sellist pole. Kuid ametlikust esitlusest on see slaid, mis väidetavalt on usutav, sealhulgas mobiilitoodetes (sülearvutid):

Ma räägin osaliselt Intel Core'i teise põlvkonna protsessorite uutest tehnoloogiatest, nii et ma ei korda ennast. Keskendun ainult arengule Intel Insider, kelle välimus üllatas paljusid. Nagu ma aru saan, on see omamoodi pood, mis annab arvutiomanikele juurdepääsu filmidele kõrglahutus, otse nende filmide loojatelt – midagi, mis varem ilmus alles mõni aeg pärast DVD- või Blu-ray-plaatide väljakuulutamist ja ilmumist. Selle funktsiooni demonstreerimiseks Inteli asepresident Muli Eden(Mooly Eden) kutsus lavale Kevin Tsujiharu(Kevin Tsujihara), Warner Home Entertainment Groupi president. Tsiteerin:

« Warner Bros. leiab isiklikud süsteemid kõige mitmekülgsem ja laiemalt levinud platvorm kvaliteetse meelelahutussisu edastamiseks ning nüüd muudab Intel platvormi veelgi töökindlamaks ja turvalisemaks. Nüüdsest saame WBShopi poe ja ka meie partnerite, nagu CinemaNow, abiga pakkuda arvutikasutajatele oma kataloogi uusi väljalaseid ja filme tõelises HD-kvaliteedis."- Muli Eden demonstreeris selle tehnoloogia tööd filmi "Inception" näitel. Koostöös juhtivate tööstuse stuudiote ja meediahiiglastega (nagu Best Buy CinemaNow, Hungama Digital Media Entertainment, Image Entertainment, Sonic Solutions, Warner Bros. Digital Distribution jt) loob Intel turvalise ja piraatluskindla (riistvara) ökosüsteemi kvaliteetse video levitamine, salvestamine ja taasesitus.

Ülalmainitud tehnoloogia toimimine ühildub kahe mitte vähem huvitava arenguga, mis on olemas ka kõigis uue põlvkonna protsessorite mudelites. Ma räägin (Intel WiDi 2.0) ja Intel InTru 3-D. Esimene on mõeldud HD-video juhtmevabaks edastamiseks (toetab eraldusvõimet kuni 1080p), teine on mõeldud stereosisu kuvamiseks monitoridel või kõrglahutusega telerites ühenduse kaudu. HDMI 1.4.

Veel kaks funktsiooni, mille jaoks ma artiklist sobivamat kohta ei leidnud - Inteli täiustatud vektorlaiendid(AVX). Protsessori tugi nendele käskudele parandab andmemahukate rakenduste, nagu heliredaktorite ja tarkvara professionaalseks fototöötluseks.

… Ja Inteli kiirsünkroonimise video- tänu koos töötama Tarkvarafirmadega, nagu CyberLink, Corel ja ArcSoft, on protsessorigigant suutnud selle ülesande (H.264 ja MPEG-2 vormingute vahelise ümberkodeerimise) jõudlust 17 korda suurendada võrreldes eelmise põlvkonna integreeritud graafika jõudlusega.

Oletame, et on olemas protsessorid – kuidas neid kasutada? Täpselt nii - koos nendega kuulutati välja ka uued kiibistikud (loogikakomplektid), mis on “kuuekümnenda” seeria esindajad. Ilmselt on uute toodete järele janunenud tarbijatele reserveeritud vaid kaks komplekti, need on Intel H67 Ja Intel P67, millele ehitatakse enamus uusi emaplaate. H67 on võimeline töötama protsessorisse integreeritud videotuumaga, P67 aga on varustatud Performance Tuning funktsiooniga protsessori kiirendamiseks. Kõik protsessorid töötavad uues pesas, 1155 .

Mul on hea meel, et uued protsessorid näivad ühilduvat järgmise põlvkonna arhitektuuriga Inteli protsessoripesadega. See pluss on kasulik kui tavakasutajatele ja tootjad, kes ei pea ümber kujundama ja uusi seadmeid looma.

Kokku tutvustas Intel üle 20 kiibi, kiibistiku ja juhtmevaba adapteri, sealhulgas uued Intel Core i7, i5 ja i3 protsessorid, Inteli 6. seeria kiibistikud ning Intel Centrino Wi-Fi ja WiMAX adapterid. Lisaks ülalnimetatutele võivad turule ilmuda järgmised "märgid":

Sel aastal oodatakse uutele protsessoritele enam kui 500 maailma juhtivate kaubamärkide lauaarvutite ja sülearvutite mudelit.

Ja lõpetuseks taaskord üks vinge video, juhuks kui keegi veel näinud pole:

Kas esimese Core i (Nehalem ja 2009. aastal Westmere) paremus konkureerivate protsessorite ees on lõplik? Olukord meenutab veidi esimest aastat pärast Pentium II väljaandmist: loorberitele puhkades ja rekordkasumit saades oleks tore teha edukale arhitektuurile jätk, ilma selle nime palju muutmata, uusi lisades, mille kasutamine parandab oluliselt jõudlust, unustamata ka muid uuendusi, mis kiirendavad tänapäevaste versioonide programme. Tõsi, vastupidiselt 10 aasta tagusele olukorrale tuleb pöörata tähelepanu praegu moekale energiatõhususe teemale, mida mängib üles mitmetähenduslik omadussõna Cool – “jahe” ja “külm” – ning mitte vähem moekas soov integreeruda protsessor kõik, mis veel olemas on eraldiseisvana. See on kaste, millega uut toodet serveeritakse.

Inteli protsessorite “üleeile”, “eile” ja “täna”.

Konveieri esiosa. Värvid näitavad erinevad tüübid teave ja plokkide töötlemine või salvestamine.

Ennustus

Alustame Inteli teatega täielikult ümber kujundatud seadmest (BPU). Nagu Nehalemis, ennustab see iga kella tsükkel (ja enne tegelikku täitmist) koodi järgmise 32-baidise osa aadressi sõltuvalt hüppekäskude eeldatavast käitumisest just ennustatud osas – ja ilmselt sõltumata üleminekute arv ja tüüp. Täpsemalt, kui praegune osa sisaldab väidetavalt käivitatud üleminekut, väljastatakse selle enda ja sihtaadressid, vastasel juhul antakse üleminek reas järgmisele osale. Ennustused ise on muutunud veelgi täpsemaks tänu kahekordistamisele (BTB), pikendamisele (GBHR) ja juurdepääsu räsifunktsiooni (BHT) optimeerimisele. Tõsi, tegelikud testid on näidanud, et mõnel juhul on prognoosimise efektiivsus siiski veidi halvem kui Nehalemis. Võib-olla ei sobi tootlikkuse suurendamine väheneva tarbimisega kokku kvaliteetse üleminekuprognoosiga? Proovime selle välja mõelda.

Nehalemis (nagu ka teistes kaasaegsetes arhitektuurides) on BTB olemas kahetasandilise hierarhia kujul - väike-"kiire" L1 ja suur-"aeglane" L2. See juhtub samal põhjusel, miks on mitu taset: ühetasandiline lahendus on kõigis aspektides (suurus, reageerimiskiirus, tarbimine jne) liiga kompromiss. Kuid SB-s otsustasid arhitektid panna ühe taseme ja selle suurus oli kaks korda suurem kui Nehalemi L2 BTB, st tõenäoliselt vähemalt 4096 rakku - täpselt nii palju on neid Atomis. (Tuleb arvestada, et kõige sagedamini käivitatava koodi suurus kasvab aeglaselt ja mahub üha harvemini vahemällu, mille suurus on kõikidel Inteli protsessoritel alates esimesest Pentium M-ist sama.) Teoreetiliselt on see suurendada BTB poolt hõivatud pinda ja kuna kogupindala ei ole soovitatav (see on üks arhitektuuri algpostulaate), siis tuleb mõnelt muult ehitiselt midagi ära võtta. Kuid on ka kiirust. Arvestades, et SB peaks olema sama tehnilise protsessiga konstrueeritud veidi suurema kiiruse jaoks, siis võib eeldada, et see suur konstruktsioon on kogu konveieri kitsaskoht - kui just seda ka ei veeta (piisab juba kahest). Tõsi, ühe taktitsükli kohta töötavate transistoride koguarv BTB-s kahekordistub, mis ei aita energiasäästule üldse kaasa. Jälle tupik? Sellele vastab Intel, et uus BTB salvestab aadressid omamoodi kokkusurutud olekus, mis võimaldab sul olla kaks korda rohkem sarnase pindala ja tarbimisega rakke. Kuid seda pole veel võimalik kontrollida.

Vaatame teiselt poolt. SB ei saanud uusi ennustusalgoritme, vaid optimeeris vanu: üldist, kaudsete üleminekute, silmuste ja tagastamiste jaoks. Nehalemil on 18-bitine GBHR ja teadmata suurusega BHT. Siiski saame garanteerida, et tabelis on lahtrite arv alla 2 18, vastasel juhul hõivaks see suurema osa tuumast. Seetõttu on olemas spetsiaalne räsifunktsioon, mis koondab kõigi üleminekute ajaloo 18 bitti ja käsu aadressi bitid lühema pikkusega indeksiks. Pealegi on suure tõenäosusega vähemalt kaks räsi - kõigi GBHR-i bittide jaoks ja nende jaoks, mis kajastavad kõige keerulisemate üleminekute käivitamist. Ja seega määrab ennustaja edukuse erinevate käitumismustrite kaootilise jaotuse tõhusus indeksite järgi BHT rakkude arvu järgi. üldine vaade. Kuigi seda pole otseselt öeldud, on Intel räsisid kindlasti täiustanud, võimaldades kasutada pikemaid GBHR-i pikkusi võrdse polsterduse efektiivsusega. Kuid BHT suuruse kohta võite veel aimata - nagu ka seda, kuidas ennustaja energiatarve tervikuna on tegelikult muutunud... Mis puutub (RSB-sse), siis see on endiselt 16-aadress, kuid uus piirang on kehtestatud kasutusele kõnedele endile – mitte rohkem nelja 16 baidi koodi kohta.

Enne kui läheme edasi, räägime väikesest lahknevusest deklareeritud teooria ja vaadeldud praktika vahel - ja see näitas, et tsükli ennustaja SB-s eemaldati, mille tulemusena tehakse ennustus lõplikust üleminekust tsükli algusesse. üldise algoritmi järgi, st hullem. Inteli esindaja kinnitas meile, et midagi hullemat ei tohiks siiski juhtuda...

Dekodeerimine ja IDQ

Eelnevalt ennustatud täidetavate käskude aadressid (vaheldumisi iga lõime jaoks – kui tehnoloogia on sisse lülitatud) väljastatakse nende olemasolu kontrollimiseks käsuvahemälludes (L1I) ja (L0m), kuid viimasest me vaikime – kirjeldame ülejäänud käske praegu esiosa. Kummalisel kombel säilitas Intel L1I-st loetavate käskude osa suuruse 16 baidini (siin mõistetakse sõna “portsion” meie oma järgi). Siiani on see olnud takistuseks koodidele, mille keskmine käsu suurus on kasvanud üle 4 baiti ja seetõttu ei mahu 4 käsku, mida tahetakse ühe taktitsükli kohta täita, enam 16 baiti. AMD lahendas selle probleemi K10 arhitektuuris, laiendades juhiste osa 32 baidile – kuigi selle protsessoritel pole praegu rohkem kui 3 torujuhet. SB-s põhjustab suuruse ebavõrdsus kõrvalmõju: ennustaja loob 32-baidise ploki järgmise aadressi ja kui ta tuvastab (arvatavasti) käivitamise ülemineku selle esimeses pooles, siis pole vaja teist lugeda ja dekodeerida. - siiski tehakse.

L1I-st läheb osa eeldekoodrisse ja sealt pikkusmõõturisse endasse (), mis töötleb kuni 7 või 6 käsku tsükli kohta (koos ja ilma; Nehalem saaks hakkama maksimaalselt 6-ga) olenevalt nende kogupikkusest ja keerukus. Vahetult pärast üleminekut algab töötlemine käsuga sihtaadressil, vastasel juhul - baidiga, mille juures eeldekooder peatus üks tsükkel varem. Samamoodi ka lõpp-punktiga: kas tegemist on (tõenäoliselt) käivitatud üleminekuga, mille viimase baidi aadress tuli BTB-st, või osa viimase baidi enda – kui just 7 käsu/tsükli limiit pole saavutatud, või "ebamugavat" käsku ei kohta. Suure tõenäosusega on pikkusemõõtja puhvris vaid 2-4 portsjonit, aga pikkusmõõtja saab sealt suvalise 16 järjestikused bait. Näiteks kui osa alguses tuvastatakse 7 kahebaidist käsku, siis järgmises taktitsüklis saab töödelda veel 16 baiti, alates 15. kuupäevast.

Pikkusmõõtur tuvastab muu hulgas makroliidetud käskude paare. Paaridest endist räägime veidi hiljem, kuid praegu pangem tähele, et nagu ka Nehalemis, ei saa iga kellatsükli jooksul tuvastada rohkem kui ühte sellist paari, kuigi märgistada saab neist maksimaalselt 3 (ja veel ühe üks käsk). Käskude pikkuste mõõtmine on aga osaliselt järjestikune protsess, mistõttu ei oleks taktitsükli jooksul võimalik määrata mitut makroliituvat paari.

Sildistatud käsud jõuavad ühte kahest käsust (IQ: käsujärjekord) – üks lõime kohta, kummaski 20 käsku (mis on 2 võrra rohkem kui Nehalem). vaheldumisi loeb käske järjekordadest ja kannab need üle mopsile. Sellel on 3 lihtsat (tõlgib 1 käsu 1 mopiks ja makroühendamisel - 2 käsku 1 mopiks), keeruline tõlkija (1 käsk 1–4 uopsiks või 2 käsku 1 mopiks) ja mikrojärjestaja kõige keerukamate jaoks. käsud, mis nõuavad 5 ja enamat moppi alates . Veelgi enam, see salvestab ainult iga jada "sabad", alates 5. uop-st, kuna esimesed 4 on valmistatud keeruka tõlkija poolt. Veelgi enam, kui mikroprogrammi uopide arv ei jagu 4-ga, siis on nende neli viimast mittetäielikud, kuid samas tsüklis ei saa tõlkijatelt veel 1–3 uops sisestada. Dekodeerimise tulemus läheb ja kaks (üks voo kohta). Viimastel (ametliku nimega IDQ - instruction decode queue, queue of decoded commands) on veel 28 uops ja võimalus blokeerida silmus, kui selle käivitatav osa sinna mahub.

Kõik see (välja arvatud mopi vahemälu) oli juba Nehalemis. Millised on erinevused? Esiteks, mis on ilmne, õpetati dekoodrit töötlema uusi alamhulga käske. Toetus SSE komplektid kõigi numbritega ei üllata enam kedagi ja Westmere'ile (Nehalemi 32 nm versioon) lisati käskude (sh PCLMULQDQ) krüptimise kiirendamine. Siin on üks lõks: see funktsioon ei tööta käskude puhul, millel on nii konstantne kui ka RIP-suhteline aadress (RIP-relatiivne, käsuosuti suhtes olev aadress - tavaline viis juurdepääs andmetele 64-bitise koodiga). Sellised käsud nõuavad 2 moodulit (eraldi laadimine ja töö), mis tähendab, et dekooder töötleb ainult ühte neist ühe taktitsükli jooksul, kasutades ainult keerulist tõlki. Intel väidab, et need ohvrid tehakse energia säästmiseks, kuid pole selge, mille osas: topeltpaigutus, täitmine ja uops võtavad selgelt rohkem ressursse ja tarbivad seega rohkem energiat kui üks.

Makrode ühendamine on optimeeritud - varem ainult aritmeetiline või loogiline võrdlus(CMP või TEST), nüüd on lubatud lihtsad aritmeetilised liitmise ja lahutamise käsud (ADD, SUB, INC, DEC) ning loogiline “AND” (AND), muutudes ka hüppeks (paari teine käsk). See võimaldab teil peaaegu igas tsüklis vähendada 2 viimast käsku 1 mopiks. Muidugi jäävad ühendatud käskude piirangud, kuid need pole kriitilised, kuna käsupaari loetletud olukorrad täidetakse peaaegu alati:

esimese käsu esimene peab olema register;
kui esimese käsu teine operaand on mälus, ei ole RIP suhteline adresseerimine lubatud;
teine käsk ei tohi olla alguses ega ületada joonepiiri.

Ülemineku enda reeglid on järgmised:

ainult TEST ja JA ühilduvad mis tahes tingimusega;
võrdlused (mitte) võrdne ja mis tahes märgiga ühilduvad mis tahes lubatud esimese käsuga;
võrdlused (mitte)carga ja mis tahes allkirjastamata võrdlustega ei ühildu INC ja DEC;
muud võrdlused (märk, ülevool, paarsus ja nende eitused) kehtivad ainult TEST ja AND puhul.

Peamine muudatus uop-järjekordades seisneb selles, et IDQ-sse kirjutades jagatakse ühendatud uop-id tüübiga , mille puhul mälu juurdepääs nõuab indeksiregistri lugemist (ja mitmed muud haruldased tüübid). Isegi kui selliseid lööke on 4, salvestatakse IDQ-sse kõik 8 kokku. Seda tehakse seetõttu, et uop (IDQ), dispetšer (ROB) ja reserveerimisjärjekorrad kasutavad nüüd lühendatud uop-vormingut ilma 6-bitise indeksiväljata (muidugi, et säästa uopide liigutamist). Eeldatakse, et selliseid juhtumeid tuleb harva ette ja seepärast kiirust väga palju ei mõjuta.

Allpool räägime teile selles puhvris silmuse blokeerimisrežiimi ilmumise ajaloost, kuid siin juhime tähelepanu ühele väikesele detailile: üleminek silmuse algusesse võttis varem 1 täiendava kellatsükli, moodustades "mulli". tsükli lõpu ja alguse lugemise vahel, kuid nüüd on see kadunud. Ühe taktitsükli kohta loetud neli uop-i ei saa aga sisaldada viimaseid praegusest iteratsioonist ja esimesi järgmisest, nii et ideaaljuhul peaks tsüklis olevate uopide arv jaguma täpselt 4-ga. Noh, selle blokeerimise kriteeriumid pole peaaegu muutunud:

loop uops ei tohiks genereerida rohkem kui 8 lähtekoodi 32-baidist osa;
need osad tuleb vahemällu salvestada L0m-s (Nehalemis muidugi L1I-s);
Lubatud on kuni 8 käivitatuna ennustatud tingimusteta üleminekut (kaasa arvatud viimane);
helistamine ja tagastamine ei ole lubatud;
Sidumata juurdepääsud virnale pole lubatud (kõige sagedamini siis, kui PUSH- ja POP-käske on ebavõrdne arv) – selle kohta lähemalt allpool.

Virna mootor

On veel üks mehhanism, mille toimimist me eelmistes artiklites ei käsitlenud - IDQ ees asuv virna osuti jälgija. See ilmus Pentium M-is ja pole veel muutunud. Selle olemus seisneb selles, et pinukursori (ESP/RSP register 32/64-bitise režiimi jaoks) muutmine koos sellega töötamise käskudega (PUSH, POP, CALL ja RET) toimub eraldi liitjaga, tulemus salvestatakse spetsiaalne register ja tagastatakse uop-ile konstantsena - selle asemel, et muuta kursorit pärast iga käsku, nagu vaja ja nagu see oli Inteli protsessorites enne Pentium M-i.

See juhtub seni, kuni mõni käsk pöördub otse kursori poole (ja mõnel muul harvadel juhtudel) – pinumootor võrdleb varikursorit nulliga ja kui väärtus on nullist erinev, lisab uops-i voogu sünkroniseeriva uop enne käsu väljakutsumist. kursor, kirjutades kursorile eriregistrist kehtiva väärtuse (ja register ise lähtestatakse). Kuna seda läheb harva vaja, kasutab enamik pinu kõnesid, mis kursorit kaudselt muudavad. varikoopia, muudetud samaaegselt teiste toimingutega. See tähendab, et konveieriplokkide seisukohast on sellised juhised kodeeritud ühe ühendatud uop-iga ja ei erine tavalistest mälupöördustest, ilma et oleks vaja ALU-s töötlemist.

Tähelepanelik Lugeja (tere pärastlõunal!) märkab seost: uop-järjekorra loopimisel on sidumata kõned pinu vastuvõetamatud just seetõttu, et pinumootor asub torujuhtmes enne IDQ - kui pärast järgmist iteratsiooni on varikursori väärtus nullist erinev, peate uude sisestama sünkromopi, kuid tsüklilises režiimis on see võimatu (moppe loetakse ainult IDQ-st). Pealegi on korstnamootor energia säästmiseks üldiselt välja lülitatud, nagu ka kõik muud esiosa osad.

Noppide salaelu

Pikkusmõõturis tehti veel üks muudatus, kuid see korpus paistab mõnevõrra silma. Kõigepealt meenutagem, mis need on ja miks neid vaja on. Kunagi oli x86 arhitektuuris ainult 1-baidine mälu. Kui oli vaja koodi nihutada rohkem kui 1 baidi võrra või asendada käske, mis on pikemad kui 1 bait, sisestati nop lihtsalt mitu korda. Kuid hoolimata asjaolust, et see käsk ei tee midagi, kulub selle dekodeerimisele ikkagi aega ja seda proportsionaalselt sammude arvuga. Tagamaks, et “paigatud” programmi jõudlus ei kannataks, saab nopi pikendada. Kuid 90ndate protsessorites langes järsult dekodeerimiskäskude kiirus, mille eesliidete arv ületab teatud väärtuse (mis on palju väiksem kui maksimaalne lubatud x86 käsu pikkus 15 baiti). Lisaks kasutatakse spetsiaalselt nopa jaoks reeglina sama tüüpi eesliidet, kuid seda korratakse mitu korda, mis on lubatud ainult soovimatu erandina, raskendades pikkusmõõturit.

Nende probleemide lahendamiseks mõistavad Pentium Pro ja Athlon protsessorid modR/M baidiga "long nop", et "ametlikult" laiendada käsku registrite ja aadressi nihkete abil. Mälu ja registritega tehteid loomulikult ei toimu, kuid pikkuse määramisel kasutatakse sama pikkusega meetriplokke, mis tavaliste mitmebaidiliste käskude puhul. Pikkade sõlmede kasutamist soovitavad nüüd ametlikult nii Inteli kui ka AMD madala tasemega tarkvara optimeerimise õpetused. Muide, SB eeldekooder on poole võrra (6-lt 3-le taktitsüklile) vähendanud trahvi prefiksite 66 ja 67 eest, mis muudavad konstandi ja aadressi nihke pikkust – kuid nagu Nehalemi puhul, trahvi ei kohaldata juhistele, kus need eesliited ei muuda tegelikult pikkust (näiteks kui eesliide 66 rakendatakse käsule ilma vahetu operandita) või on osa lülitite loendist (mida kasutatakse sageli vektorkoodis).

Õigesti vormindatud pika sõlme maksimaalne pikkus ei ületa Inteli puhul 9 baiti ja AMD puhul 11 baiti. Seetõttu võib 16 või 32 baidi võrra joondamiseks siiski olla mitu sõlme. Kuid kuna see käsk on lihtne, ei võta selle dekodeerimine ja "täitmine" rohkem ressursse kui kõige lihtsamate töökäskude töötlemine. Seetõttu on pikkade jalgadega katsetamine olnud konveieri esiosa, eelkõige pikkusmõõturi ja dekoodri parameetrite määramise standardmeetod. Ja siin esitas Sandy Bridge väga kummalise üllatuse: tavaliste programmide jõudluse testimisel ei ilmnenud viivitusi ega aeglustusi, kuid dekoodri parameetrite rutiinne sünteetiline kontroll näitas ootamatult, et selle jõudlus on võrdne ühe käsuga taktitsükli kohta! Samal ajal ei andnud Intel ametlikke teateid selliste radikaalsete muudatuste kohta dekoodris.

Mõõtmisprotseduur töötas suurepäraselt isegi Nehalemil ja näitas õiget 4. Süüdistada võib uut ja “liiga” aktiivset Turbo Boost 2.0, mis rikub mõõdetud kellanäidud, kuid testide jaoks keelati see ära. Samuti on välistatud ülekuumenemine sagedust aeglustava drosseliga. Ja kui põhjus lõpuks avastati, muutus asi veelgi kummalisemaks: selgub, et pikki SB-sõlmi töötleb ainult esimene lihtne tõlkija, kuigi 1-baidiseid sõlmi mis tahes arvu eesliidete ja sarnaste "tegevusetuse" käskudega (näiteks registri endasse kopeerimine) on kõik neli hõlpsasti aktsepteeritavad. Miks nii tehti, pole selge, kuid vähemalt üks sellise tehnilise lahenduse puudus on end juba selgelt näidanud: meie uurimisrühmal kulus kümme päeva, et välja selgitada dekoodri salapärase aegluse põhjused... Kättemaksuks tegime me palu Vastaslaagri tulihingelistel fännidel välja mõelda mingi vandenõuteooria mingi firma salakavalate plaanide kohta I. ajada segadusse naiivsed vaprad protsessoriuurijad. :)

Muide, nagu selgus, oli ringhääling nr 1 teiste seas juba “võrdsem”. Nehalemis dekodeeriti ka eksplitsiitse konstantse operandiga tsüklilised kerimiskäsud (ROL ja ROR) ainult esimeses translaatoris ja samas tsüklis lülitati neljas välja, nii et IPC väärtus langes 3-le. Näib – miks tuua siia nii haruldane näide? Aga just selle konksu tõttu oli tippkiiruse saavutamiseks SHA-1 laadsete räsimisalgoritmidega vaja väga täpset juhiste paigutust, millega kompilaatorid hakkama ei saanud. SB-s muutusid sellised juhised lihtsalt 2-režiimiliseks, nii et kui nad võtavad kasutusele keeruka tõlkija (mis on juba üks), käituvad nad protsessori jaoks peaaegu eristamatult, kuid inimeste ja kompilaatori jaoks paremini etteaimatavad. Nopsidega juhtus vastupidi. Vahemälu üles

Eesmärgid ja eelkäijad

Pole asjata, et me eraldasime selle peatüki muust esikülje kirjeldusest – uop-vahemälu lisamine demonstreerib ilmekalt teed, mille Intel on valinud kõikidele oma protsessoritele, alustades Core 2-st. Viimast esimest korda ( Inteli jaoks), lisas ploki, mis saavutas samaaegselt kaks, näib olevat vastuolulised eesmärgid: kiiruse suurendamine ja energia säästmine. Jutt käib eeldekoodri ja dekoodri vahelisest käsujärjekorrast (IQ), mis seejärel salvestas kuni 18 käsku pikkusega kuni 64 baiti. Kui see vaid siluks erinevusi käskude ettevalmistamise ja dekodeerimise tempos (nagu tavaline puhver) - kasu oleks väike. Kuid Intel mõtles IQ külge kinnitada väikese LSD-seadme (vaevalt, et poisid midagi “aksepteerisid”, neil on lihtsalt selline huumor) - Loop Stream Detector, “tsüklilise voolu detektor”. Kui tuvastatakse tsükkel, mis mahub 18 juhisesse, keelab LSD kõik eelmised etapid (ennustus, L1I vahemälu ja eeldekooder) ning seab tsükli juhised dekoodrisse järjekorda, kuni see lõpeb või kuni üleminek toimub üle selle piiri (kõned ja naasmised ei ole vastuvõetavad). See säästab energiat, keelates ajutiselt jõudeolevad plokid ja suurendab jõudlust tänu dekoodrile garanteeritud 4 käsu voolule tsükli kohta, isegi kui need olid "varustatud" kõige ebamugavamate eesliidetega.

Intelile see idee ilmselgelt meeldis, nii et vooluahel optimeeriti Nehalemi jaoks: IQ dubleeriti (kahe lõime jaoks) ning dekoodri ja dispetšeri vahel (st täpselt esi- ja tagaosa piiril) kaks IDQ järjekorda, igaüks 28 uops. paigutati ja LSD-üksus viidi nende juurde. Nüüd, kui tsükkel on blokeeritud, lülitatakse ka dekooder välja ja jõudlus on suurenenud, sealhulgas mitte 4 käsu, vaid 4 uops-i garanteeritud sissevoolu tõttu kellatsükli kohta, isegi kui nende genereerimine toimus minimaalselt (näiteks Core 2/i) tempoga 2 moppi löögi kohta. Raevunud vastaslaagri fännid, kes vaatavad hetkeks oma lemmikajaviitest üles, torkavad kohe juuksenõela sisse: kui LSD on nii hea asi, siis miks ei olnud seda Atomi sisse ehitatud? Ja nipp on õiglane – omades dekoodri järel 32-režiimilist järjekorda, ei tea Atom, kuidas selles tsüklit blokeerida, mis oleks väärtuslike millivattide säästmiseks väga kasulik. Kuid Intel ei kavatsenud ideest loobuda ja valmistas uutele protsessoritele värskenduse ja milline suurepärane!

UOP vahemälu ametlik sisenimi on DSB (decode stream buffer), kuigi see ei ole nii kirjeldav kui soovitatav termin DIC (dekodeeritud juhiste vahemälu). Kummalisel kombel see ei asenda, vaid täiendab IDQ järjekordi, mis on nüüd ühendatud dekoodriga või koos vahemälu ups. Järgmise haru ennustamise ajal kontrollitakse sihtaadressi samaaegselt käsu- ja uop-vahemälus. Kui viimane töötab, siis sealt tuleb edasine lugemine ja ülejäänud esiosa on välja lülitatud. Seetõttu on uop-vahemälu uops-i 0-taseme vahemälu, st L0m.

Huvitaval kombel saab seda ideed jätkata, nimetades IDQ vahemälu "miinus esimene" tase. :) Aga kas nii keeruline hierarhia isegi mitte kogu tuumiku, vaid ainult esiosa raames pole üleliigne? Isegi kui Intel erandina ruumi ei säästnud, kuid kas paar IDQ-d toovad märkimisväärset täiendavat kokkuhoidu, arvestades, et nende töötamise ajal on nüüd keelatud ainult UOP vahemälu, kuna ülejäänud esiosa (välja arvatud ennustaja ) kas juba magab? Ja kiirus ei suurene ka palju, kuna uop-i vahemälu on samuti konfigureeritud genereerima 4 uops tsükli kohta. Ilmselt otsustasid Inteli insenerid, et 3-tasemeline mäng on millivatti küünalt väärt.

Lisaks salvestamisele kiirendab uop vahemälu jõudlust, sealhulgas vähendades trahvi haru vale ennustamise eest: Nehalemis, kui L1I-st leiti õige kood, oli karistus 17 tsüklit, SB-s - 19, kuid kui kood oli leitud L0m, siis ainult 14. Veelgi enam, need on maksimaalsed arvud: kui üleminek on vale ennustatud, peab planeerija ikkagi käivitama ja lõpetama eelmised uops programmi järjekorras ning selle aja jooksul suudab L0m õiged uopsid üles pumbata et planeerijal oleks aega need käivitada kohe pärast käskude vabastamist enne üleminekut. Nehalemis see tehnika töötas IDQ ja servaga, kuid esimesel juhul on tõenäosus, et õige sihtaadress on ka 28-mopi tsükli sees, väga väike ja teisel juhul serva aeglus enamikul juhtudel. ei võimalda viivitust nullini vähendada. SB-l on paremad võimalused.

Seade

Topoloogiliselt koosneb L0m 32 8 joonest (8- ). Iga rida salvestab 6 uops (kogu vahemälus - 1536, st "poolteist kilomopi") ning vahemälu saab kirjutada ja lugeda ühe rea ühe kellatsükli kohta. Ennustaja toodab 32-baidiste plokkide aadresse ja just see suurus töötab L0m puhul, nii et allpool olev termin "osa" tähendab 32-baidist koodiplokki, mis on joondatud ja ennustatud käivitatavaks (mitte 16-baidseks). , nagu dekoodri puhul). Dekodeerimisel ootab L0m kontroller osa töötlemist lõpuni või kuni selles vallandatakse esimene üleminek (muidugi oletatavasti - siin ja allpool eeldame, et ennustused on alati õiged), kogudes saatmisega samal ajal uops need tahapoole. Seejärel fikseerib see osa sisenemis- ja väljumispunktid vastavalt üleminekute käitumisele. Tavaliselt on sisenemispunktiks eelmises osas käivitatud ülemineku sihtaadress (täpsemalt aadressi alumised 5 bitti) ja väljumispunkt on enda aadress käivitas ülemineku selles osas. IN viimase abinõuna, kui eelmises ega praeguses osas ei käivitata ühtki üleminekut (st osi mitte ainult ei täideta, vaid ka salvestatakse reas), siis teostatakse mõlemad tervikuna – nende sisend on sisse lülitatud nullrežiim ja esimese bait, mis mahub täielikult käsu sellesse osasse, ning väljund on viimase täielikult sobiva käsu ja selle algbaidi viimasel uop-il.

Kui osa sisaldab rohkem kui 18 uopsi, ei salvestata seda vahemällu. See seab juhiste minimaalseks keskmiseks (tüki piires) suuruseks 1,8 baiti, mis ei ole enamikus programmides tõsine piirang. Meenub IDQ piirangute teine punkt – kui tsükkel mahub portsjonisse, aga võtab 19-28 uops, siis ei L0m vahemälu ega IDQ järjekord seda ei paranda, kuigi suuruselt mahuks kuhugi. Sel juhul peaks aga käskude keskmine pikkus olema 1,1–1,7 baiti, mis on kahe tosina järjestikuse käsu puhul äärmiselt ebatõenäoline.

Tõenäoliselt kirjutatakse vahemällu samaaegselt osa uopsid, mis hõivavad ühest komplektist 1–3 rida, nii et L0m puhul rikutakse komplekti assotsiatiivse vahemälu üht peamist tööpõhimõtet: tavaliselt käivitatakse komplekti üks rida. Kuni kolmerealised sildid võivad kohe saada sama osa aadressi, mis erinevad ainult seerianumbrite poolest. Kui ennustatud aadress tabab L0m, toimub lugemine samamoodi – käivitatakse 1, 2 või 3 soovitud komplekti rada. Tõsi, selline skeem on täis puudusi.

Kui käivitatav programm kõigis osades dekodeeritakse 13–18 uopsiks, mis võtab kõigi osade jaoks 3 rida L0m, ilmneb järgmine: kui praegune komplekt on juba hõivatud kahe 3-realise osaga ja kolmandaga üritab sellele kirjutada (millest ühe rea jaoks ei piisa), peate ühe vanadest välja tõrjuma ja selle ühenduvust arvesse võttes - kõik 3 vana. Seega ei tohiks komplekti mahtuda rohkem kui kaks osa "peeneteralist" koodi. Seda eeldust praktikas testides juhtus nii: suurte võistkondadega portsjonid, mis nõudsid alla 7 uopsi, pakiti L0m-i numbriga 255 (teise ei saanud millegipärast võtta), mahutades ligi 8 KB koodi. Keskmised osad (7–12 uops) hõivasid kõik 128 võimalikku positsiooni (igaüks 2 rida), hoides vahemällu täpselt 4 KB. Noh, väikesed käsud mahuvad 66 ossa, mis on kaks rohkem kui oodatav väärtus (2112 baiti versus 2048), mis on ilmselt seletatav meie testkoodi piiriefektidega. Puudus on ilmne – kui 256 6-op rida saaks täielikult täita, piisaks neist 85 täistripleti jaoks, mille koodi kogumaht on 2720 baiti.

Võib-olla Intel ei oota, et mõnes koodis on nii palju lühikesi ja lihtsaid käske, et üle 2/3 sellest on 3-realiste osadena, mis sunnivad üksteist L0m-st varem kui vaja. Ja isegi kui selline kood avastatakse, saavad selle dekodeerimise lihtsust arvestades ülejäänud esiosa plokid hõlpsalt hakkama ülesandega varustada tagaosa jaoks vajalikku 4 uops/tsüklit (kuigi ilma lubatud vattide ja trahvitsüklite säästmiseta). vale ennustamiseks). Huvitav on see, et kui L0m-l oleks 6 rada, siis probleemi ei tekiks. Intel otsustas, et vahemälu kolmandiku võrra suurem just assotsiatiivsuse tõttu on olulisem...

Mõõtmed

Pidagem meeles, et idee salvestada x86 käskude asemel suur hulk uops vahemällu pole uus. See ilmus esmakordselt Pentium 4-s uop-jälgede vahemälu kujul - uop-ide jadad pärast tsükli lahtipakkimist. Pealegi ei täiendatud jälgimisvahemälu, vaid asendati puuduvad L1I - dekoodri käsud loeti kohe alates . Vaatamata NetBursti arhitektuuri unustamisele on mõistlik eeldada, et Inteli insenerid kasutasid varasemaid kogemusi, ehkki ilma silmuse lahtirullimiseta ja vahemälule pühendatud ennustajata. Võrdleme vanu ja uusi lahendusi (uute CPU-de nimi on siin Core i 2, sest peaaegu kõigi SB arhitektuuriga mudelite numbrid algavad kahega):

* - arvatavasti

Siin on vaja mõningast selgitust. Esiteks määratakse L0m läbilaskevõime, võttes arvesse üldist konveieri laiuse piirangut 4 uopast. Eespool eeldasime, et L0m suudab lugeda ja kirjutada 18 uops taktitsükli kohta. Lugedes ei saa aga kõiki 18 (kui neid oli algse osa dekodeerimisel täpselt nii palju) taktitsüklis saata ja saatmine toimub mitme taktitsüklina.

Lisaks viitab mopi suurus bittides üldiselt väga tundlikule teabele, mida tootjad kas üldse välja ei anna või ainult siis, kui need surutakse vastu seina (öeldakse, et olete juba kõik välja arvutanud, olgu nii - kinnitame) . Inteli protsessorite puhul on Pentium Pro puhul viimane usaldusväärselt teadaolev arv 118 bitti. On selge, et sellest ajast alates on suurus kasvanud, kuid siit algab oletus. 118 bitti 32-bitise x86 CPU jaoks on võimalik saada, kui mopil on väljad selle genereerinud käsu aadressi (32 bitti), vahetu operandi (32 bitti), aadressi nihke (32 bitti), registrioperandide (3 x) jaoks. 3 bitti + 2 bitti skaala kohta indeksiregistri jaoks) ja opkood (11 bitti, milles on kodeeritud x86 käsu konkreetne versioon, võttes arvesse eesliiteid). Pärast ja SSE2 lisamist suurenes opkoodi väli tõenäoliselt 1 biti võrra, seega number 119.

Pärast üleminekut (Prescott ja kaugemal) peaksid teoreetiliselt kõik 32-bitised väljad suurenema 64 bitini. Kuid siin on mõningaid nüansse: 64-bitised konstandid x86-64-s on lubatud ainult ükshaaval (st mõlemad käsus olevad konstandid ei võta kindlasti rohkem kui 8 baiti) ja siis ja praegu saavad nad ikka hakkama. 48 bitiga. Nii et uop-i suuruse suurendamiseks on vaja ainult 16 bitti aadressi ja 3 täiendavat registrinumbrite bitti (mida on 16) - saame (ligikaudu) 138 bitti. Noh, SB-s on uop ilmselt veel 1 biti võrra kasvanud tänu veel mõnesaja käsu lisamisele alates viimasest P4-st ja veel 8 võrra suurenemise tõttu maksimaalne arvÜhes käsus on kuni 5 selgesõnaliselt määratud registrit (AVX-i kasutamisel). Viimane on aga kaheldav: sellest ajast, kujutage vaid ette, pole x86 arhitektuurile lisatud ühtegi i386. uus käsk, mis nõuab vähemalt 4 baiti konstanti (ainukese hiljutise ja äärmiselt peene erandiga AMD failis SSE4.a, millest isegi enamik programmeerijaid ei tea). Ja kuna Intel AVX ja AMD on värskendanud ainult vektorkäskude kodeeringut, mahuvad täiendavate registrinumbrite bitid osaliselt kasutamata (nende juhiste jaoks) 32-bitise vahetu operandi välja kõrgemasse poolde. Veelgi enam, x86 käsus endas on 4. või 5. register kodeeritud vaid nelja konstantse bitiga.

On ilmne, et selliste "koletiste" salvestamine ja saatmine kõigile suured hulgad- väga kallis. Seetõttu tuli Intel isegi P4 jaoks välja uop-i lühendatud versiooniga, milles mõlema konstandi jaoks on ainult üks väli ja kui need sinna ei mahu, siis paigutatakse puuduvad bitid kõrvaloleva uop-i samale väljale. . Kui ta aga juba salvestab sinna oma konstandid, siis peab ta lisabittide doonor-kandjana naabriks sisestama nopi. Selle skeemi järjepidevust täheldatakse ka SB-s: lisasõlmesid ei sisestata, kuid 8-baidiste konstantidega (või konstandi suuruste summa ja aadressi nihke summaga 5–8 baiti) käsud on kahekordse suurusega. L0m. Arvestades aga selliste käskude pikkust, ei mahu rohkem kui 4 neist ühte portsjonisse, seega ei ole hõivatud uops-ide piiramine ilmselgelt kriitiline. Siiski märgime: erinevalt eelmistest protsessoritest on SB-l koguni 3 uop-vormingut - dekodeeritav (kõige täielikum), salvestatud uop-i vahemällu (pideva vähendamisega) ja peamine (ilma indeksiregistri väljata), mida kasutatakse edasi. torustikus. Kuid enamik moppe läheb dekodeerimisest pensionile puutumata.

Piirangud

"Vahemälu kasutamise reeglid" ei lõpe mopi erivorminguga. Ilmselgelt ei saanud selline mugav plokk nagu L0m olla täiesti ilma ühe või teise astme piiranguteta, millest meile reklaammaterjalides ei räägitud. :) Alustame sellest, et kõik tõlgitud käsu uopsid peavad mahtuma ühele reale, muidu kantakse üle järgmisele. Seda saab seletada asjaoluga, et ridade uop-ide aadressid salvestatakse eraldi (et igas uop-is salvestatakse 48 bitti) ja kõik käsuga genereeritud uop-d peavad vastama selle esimese baidi aadressile, mis on salvestatud ainult ühe uop-i märgendisse. rida. Algsete aadresside taastamiseks salvestatakse uops genereerinud käskude pikkused siltidesse. Uopsi “talumatus” rikub L0m kasutamise efektiivsust mõnevõrra, kuna aeg-ajalt esinevatel käskudel, mis genereerivad mitu uop’i, on märkimisväärne võimalus, et nad ei mahu järgmisele reale.

Veelgi enam, kõige keerukamate käskude mopid on endiselt salvestatud mikrokoodiga ROM-i ja L0m-s on ainult 4 esimest järjestust, pluss link jätkule, nii et kõik kokku võtab terve rea. Sellest järeldub, et ühes osas ei tohi esineda rohkem kui kolm mikrokoodikäsku ja kui arvestada käsu keskmist suurust, oleks tõenäolisem piir kaks. Tegelikkuses kohtab neid aga palju harvemini.

Teine oluline punkt - L0m-l pole oma. Tundub, et see peaks kiirendama aadresside kontrollimist (mis on ainult virtuaalsed) ja vähendama energiatarbimist. Kuid kõik on palju huvitavam - pole asjata, et kõigil kaasaegsetel vahemäludel on. OS-is käivitatavate programmide virtuaalsed aadressiruumid võivad kattuda, nii et ülesande konteksti vahetamisel, et mitte lugeda vanu andmeid või samadel aadressidel koodi, tuleb virtuaalselt adresseeritav vahemälu lähtestada (täpselt nii juhtus ka P4-ga jälgede vahemälu). Loomulikult on selle tõhusus madal. Mõned arhitektuurid kasutavad nn. ASID (aadressiruumi identifikaator) on kordumatud numbrid, mille OS määrab igale lõimele. Kuid x86 ei toeta ASID-d mittevajalikuna – arvestades kõigi vahemälude füüsiliste siltide olemasolu. Siis aga tuli L0m ja segas pilti. Lisaks pidage meeles, et uop-i vahemälu, nagu enamik kerneli ressursse, on jagatud kahe lõime vahel, nii et see sisaldab eri programmide teateid. Ja kui lisate sobivas režiimis virtuaalsete OS-ide vahel vahetamise, võivad kahe programmi modifikatsioonid aadressi järgi ühtida. Mida teha?

Lõngadega seotud probleem lahendatakse lihtsalt - L0m jagatakse kogumite vahel pooleks, nii et lõime number annab komplekti arvust kõige olulisema biti. Lisaks on L1I-l salvestuspoliitika L0m suhtes. Seega, kui kood L1I-st välja tõrjutakse, eemaldatakse selle uops ka L0m-st, mis nõuab kahe kõrvuti asetseva osa kontrollimist (kaasaegsete protsessorite kõigi vahemälude rea suurus, arvestamata L0m-i ennast, on 64 baiti). Seega saab vahemällu salvestatud uopide virtuaalset aadressi alati kontrollida L1I siltides, kasutades selle TLB-d. Selgub, et kuigi L0m-l on virtuaalne adresseerimine, laenab see koodi jaoks füüsilisi silte L1I-st. Siiski on olukord, kus L0m lähtestatakse täielikult - ja asendamine L1I TLB-s, samuti selle täielik lähtestamine (sealhulgas protsessori töörežiimide vahetamisel). Lisaks on L0m täielikult keelatud, kui koodivalija (CS) baasaadress ei ole null (mis on tänapäevaste operatsioonisüsteemide puhul äärmiselt ebatõenäoline).

Töö

Uop-vahemälu põhisaladuseks on algoritm, mis asendab eesmise töö käskude töötlemisel uops-i lugemitega L0m-st. See algab sellest, et järgmise ülemineku ajal kasutab L0m komplekti valimiseks ülemineku sihtmärgi aadressi bitte 5–9 (või bitte 5–8 pluss lõime number - 2 lõimega). Komplekti sildid näitavad portsjoni sisenemispunkti, mille modifikatsioonid on kirjutatud märgisele vastavale reale, ja selle rea seerianumbrit osa sees. 1–3 rida võivad sobida, mis (kõige tõenäolisemalt) loetakse samaaegselt 18-mopi puhvrisse. Sealt saadetakse mopid neljakaupa IDQ-sse, kuni jõutakse väljumispunkti – ja kõik kordub uuesti. Veelgi enam, kui portsjoni viimased 1–3 uops on saatmata, saadetakse need koos uue portsjoni esimese 3–1 uopiga, mis teeb kokku tavalised neli. See tähendab, et vastuvõtva IDQ järjekorra seisukohast silutakse kõik üleminekud ühtlaseks koodivooks - nagu P4-s, kuid ilma jälgi vahemälu.

Ja nüüd huvitav punkt - reas pole lubatud rohkem kui kaks üleminekut ja kui üks neist on tingimusteta, siis on see rea jaoks viimane. Meie tähelepanelik lugeja mõistab, et kogu osa jaoks on lubatud kuni 6 tingimuslikku üleminekut (millest igaüks võib töötada ilma väljumispunktita) või 5 tingimuslikku ja 1 tingimusteta üleminekut, mis on osa viimane käsk. Inteli protsessori haru ennustaja on loodud nii, et see ei märka tingimuslikku haru enne, kui see vähemalt korra käivitub, ja alles siis ennustatakse selle käitumist. Kuid ka "igavestele" üleminekutele kehtivad piirangud. Tegelikult tähendab see, et on lubatud lõpule viia osa uops ja enne selle väljumispunktid.

Kuid sarnane trikk mitme sisendiga ei tööta - kui üleminek toimub juba vahemällu salvestatud osale, kuid selles on erinev nihe (näiteks kui tingimusteta üleminek on rohkem kui üks), siis L0m salvestab puudujäägi, lülitub sisse esiküljele ja kirjutab saadud uops uude ossa. See tähendab, et vahemällu on lubatud koopiad erinevate sisendite ja sama, täpselt teadaoleva väljundiga osade jaoks (lisaks mitmele muule võimalikule). Ja kui kood nihutatakse L1I-lt L0m-le, kustutatakse kõik read, mille sisenemispunktid jäävad kahe osa 64-baidisse. Muide, koopiad olid võimalikud ka P4 jälitusmälus ja need vähendasid oluliselt koodi salvestamise efektiivsust...

Sellised piirangud vähendavad L0m ruumi saadavust. Proovime välja arvutada, kui palju sellest jääb tegelikuks kasutamiseks. Keskmine x86-64 käsu suurus on 4 baiti. Keskmine moppide arv meeskonna kohta on 1,1. See tähendab, et portsjoni kohta on tõenäoliselt 8–10 moppi, mis on 2 rida. Nagu varem arvutatud, suudab L0m salvestada 128 sellist paari, millest piisab 4 KB koodi jaoks. Arvestades aga stringide ebaideaalset kasutamist, on tegelik arv tõenäoliselt 3–3,5 KB. Huvitav, kuidas see sobib vahemälu alamsüsteemi mahtude üldisesse tasakaalu?

1 (tegelikult osa L3-st, keskmiselt tuuma kohta) - 2 MB;
L2 - 256 KB, 8 korda vähem;
mõlemad L1 - kumbki 32 KB, 8 korda vähem;
Vahemällu salvestatud maht L0m on ligikaudu 10 korda väiksem.

On uudishimulik, et kui leiate kernelist mõne muu struktuuri, mis salvestab palju käske või uops, siis osutub see ROB-i dispetšerijärjekorraks, mis mahutab 168 uops, mis on genereeritud ligikaudu 650–700 baidi koodiga, mis on 5. korda väiksem kui efektiivne ekvivalentmaht L0m (3–3,5 KB) ja 9 korda väiksem kui täismaht (6 KB). Seega täiendab uop vahemälu erinevate koodihoidlate korrastatud hierarhiat erinevate, kuid hästi tasakaalustatud parameetritega. Intel väidab, et keskmiselt 80% tabamustest langeb L0m-sse. See on oluliselt madalam kui 32 KB L1I vahemälu näitaja 98–99%, kuid siiski õigustab uop vahemälu neljal juhul viiest selle olemasolu.

Lõpuks teatas Intel ametlikult uutest protsessoritest, mis töötavad uuel mikroarhitektuuril Liivasild. Enamiku inimeste jaoks on "Sandy Bridge'i teadaanne" vaid sõnad, kuid üldiselt on Intel Core ll põlvkond kui mitte uus ajastu, siis vähemalt peaaegu kogu protsessorituru värskendus.

Mobiil:

Intel Core i5-2510E (~ 266 dollarit)
Intel Core i5-2520M
Intel Core i5-2537M
Intel Core i5-2540M

Teise põlvkonna Intel Core i5 mobiilprotsessorite visuaalne üksikasjalik võrdlus.

Teise põlvkonna Intel Core i7 mobiilprotsessorite visuaalne üksikasjalik võrdlus.

Lauaplaat:

Intel Core i3-2100 (~ 117 dollarit)
Intel Core i3-2100T
Intel Core i3-2120 (138 dollarit)

Visuaalne ja üksikasjalik võrdlus teise põlvkonna Intel Core i3 lauaarvutiprotsessorite kohta.

Visuaalne ja üksikasjalik võrdlus teise põlvkonna Intel Core i5 lauaarvutiprotsessorite kohta.

Intel Core i7-2600K (~ 317 dollarit)
Intel Core i7-2600S
Intel Core i7-2600 (~ 294 dollarit)

Visuaalne ja üksikasjalik võrdlus teise põlvkonna Intel Core i7 lauaarvutiprotsessorite kohta.

Nagu näete, on mudelinimede nimes nüüd neli numbrit – seda tehakse selleks, et vältida segadust eelmise põlvkonna protsessoritega. Koosseis osutus üsna täielikuks ja loogiliseks - kõige huvitavamad i7 seeriad on tehnoloogia olemasolu tõttu i5-st selgelt eraldatud Hüperlõime ja suurendas vahemälu suurust. Ja i3 perekonna protsessorid erinevad i5-st mitte ainult väiksema tuumade arvu, vaid ka tehnoloogia puudumise poolest. Turbo Boost.

Tõenäoliselt märkasite protsessorite nimedes ka tähti, ilma milleta oli koosseis oluliselt vähenenud. Nii et siin on kirjad S Ja T rääkida vähendatud energiatarbimisest ja TO- tasuta kordaja.

Uute protsessorite visuaalne struktuur:

Kui soovite uue arhitektuuri kohta rohkem teada saada, siis võin soovitada neid kolme artiklit vene keeles - , , .

Uued protsessorid on täielikult toodetud 32-nm protsessitehnoloogia järgi ja neil on esmakordselt "visuaalselt nutikas" mikroarhitektuur, mis ühendab oma klassi parima arvutusvõimsuse ja 3D-graafika töötlemise tehnoloogia ühel kiibil. Sandy Bridge'i graafikas on tõesti palju uuendusi, mis on peamiselt suunatud jõudluse suurendamisele 3D-ga töötamisel. Integreeritud videosüsteemi “kehtestamise” üle võib vaielda kaua, aga muud lahendust kui sellist pole. Kuid ametlikust esitlusest on see slaid, mis väidetavalt on usutav, sealhulgas mobiilitoodetes (sülearvutid):

Olen juba osaliselt rääkinud Intel Core'i teise põlvkonna protsessorite uutest tehnoloogiatest, nii et ma ei korda ennast. Keskendun ainult arengule Intel Insider, kelle välimus üllatas paljusid. Nagu ma aru saan, on see omamoodi pood, mis annab arvutiomanikele juurdepääsu kõrglahutusega filmidele otse nende filmide loojatelt – midagi, mis varem ilmus alles mõni aeg pärast DVD või Blu-ray väljakuulutamist ja ilmumist. plaadid. Selle funktsiooni demonstreerimiseks Inteli asepresident Muli Eden(Mooly Eden) kutsus lavale Kevin Tsujiharu(Kevin Tsujihara), Warner Home Entertainment Groupi president. Tsiteerin:

« Warner Bros. Leiab isiklikud süsteemid kõige mitmekülgsemaks ja laiemalt levinud platvormiks kvaliteetse meelelahutussisu edastamiseks ning nüüd muudab Intel platvormi veelgi töökindlamaks ja turvalisemaks. Nüüdsest saame WBShopi poe ja ka meie partnerite, nagu CinemaNow, abiga pakkuda arvutikasutajatele oma kataloogi uusi väljalaseid ja filme tõelises HD-kvaliteedis."- Muli Eden demonstreeris selle tehnoloogia tööd filmi "Inception" näitel. Koostöös juhtivate tööstuse stuudiote ja meediahiiglastega (nagu Best Buy CinemaNow, Hungama Digital Media Entertainment, Image Entertainment, Sonic Solutions, Warner Bros. Digital Distribution jt) loob Intel turvalise ja piraatluskindla (riistvara) ökosüsteemi kvaliteetse video levitamine, salvestamine ja taasesitus.

Veel kaks funktsiooni, mille jaoks ma artiklist sobivamat kohta ei leidnud - Inteli täiustatud vektorlaiendid(AVX). Protsessori tugi nendele käskudele parandab andmemahukate rakenduste (nt heliredaktorid ja professionaalne fototöötlustarkvara) kiirust.

… Ja Inteli kiirsünkroonimise video- tänu koostööle tarkvarafirmadega, nagu CyberLink, Corel ja ArcSoft, suutis protsessorigigant selle ülesande (H.264 ja MPEG-2 vormingute vahel ümberkodeerimise) jõudlust 17 korda suurendada võrreldes eelmise põlvkonna integreeritud graafika.

Mul on hea meel, et uued protsessorid näivad ühilduvat järgmise põlvkonna arhitektuuriga Inteli protsessoripesadega. See pluss on kasulik nii tavakasutajatele kui ka tootjatele, kes ei pea ümber kujundama ja uusi seadmeid looma.

Sel aastal oodatakse uutele protsessoritele enam kui 500 maailma juhtivate kaubamärkide lauaarvutite ja sülearvutite mudelit.

Ja lõpetuseks taaskord üks vinge video, juhuks kui keegi veel näinud pole:

Jaanuari alguses tutvustas Intel ametlikult protsessoreid Inteli perekond Teise põlvkonna Core, koodnimega Sandy Bridge, samuti Inteli 6-seeria kiibistikud neile.

Teise põlvkonna Intel Core perekonna (2nd Generation Intel Core Processor Family), tuntud ka koodnime Sandy Bridge all, uusi protsessoreid võib liialdamata nimetada üheks kauaoodatud tooteks. Kahtlemata saavad neist 2011. aastal kõige populaarsemad protsessorid. AMD valmistab oma vastust ette uuel Bulldozeri mikroarhitektuuril põhinevate protsessorite näol, kuid esiteks pole veel selge, millal need protsessorid ilmuvad ja teiseks võib juba praegu öelda, et nad ei suuda Sandyga konkureerida. Sildprotsessorid igas mõttes.jõudlust ega ka hinna/jõudluse suhte osas. Üldiselt tulevikku vaadates märgime, et uued Inteli protsessorid osutusid nii edukaks, et konkurentide tooted lihtsalt kahvatuvad nendega võrreldes.

Oleme oma ajakirja lehekülgedel juba üksikasjalikult rääkinud uuest Sandy Bridge protsessori mikroarhitektuurist, nii et selles artiklis me ei korda end, vaid tutvustame lugejatele mudelivalik uusi protsessoreid ja kiibikomplekte ning räägime ka nende kiirendamisvõimalustest ja nende jõudluse testimise tulemustest.

Kõigepealt tuletagem meelde, et teise põlvkonna Intel Core protsessorid, nagu ka esimese põlvkonna Intel Core protsessorid, koosnevad kolmest perekonnast: Intel Core i7, Core i5 ja Core i3. Teise põlvkonna Intel Core protsessorite eristamiseks esimese põlvkonna protsessoritest on nende märgistussüsteemi muudetud. Kui esimese põlvkonna protsessorid märgiti kolmekohalise numbriga (näiteks Intel Core i5-650), siis teise põlvkonna protsessorid märgitakse neljakohalise numbriga, kusjuures esimene number - 2 - tähistab teist põlvkonda.

Kokku teatas Intel samaaegselt 29 uuest Sandy Bridge'i perekonna protsessori mudelist laua- ja sülearvutitele ning kümnest uuest kiibistikust. 29 uuest protsessorimudelist 15 mudelit on mobiilsed protsessorid, ülejäänud 14 mudelit on aga mõeldud lauaarvutitele. Kümnest uuest kiibistikust viis on mõeldud sülearvutitele, ülejäänud viis aga personaalarvutitele.

Enne Sandy Bridge mobiili- ja lauaarvutite protsessorite mudelivalikuga lähemalt tutvumist anname nende kohta üldinfot.

Sandy Bridge'i protsessorite omadused

Kõik Sandy Bridge'i protsessorid toodetakse esialgu 32 nm protsessitehnoloogia abil. Tulevikus, kui toimub üleminek 22 nm protsessitehnoloogiale, saavad Sandy Bridge mikroarhitektuuril põhinevad protsessorid koodnime Ivy Bridge.

Iseloomulik omadus Kõigil Sandy Bridge'i protsessoritel on uue põlvkonna integreeritud graafikatuum (Intel HD Graphics 2000/3000). Veelgi enam, kui eelmise põlvkonna protsessorites (Clarkdale ja Arrandale) paiknesid protsessori ja graafika tuumad erinevatel kiipidel ning pealegi toodeti erinevaid tehnilisi protsesse kasutades, siis Sandy Bridge'i protsessorites valmistatakse kõik protsessori komponendid kasutades 32-nm tehniline protsess ja asuvad ühel kiibil.

Oluline on rõhutada, et ideoloogiliselt võib Sandy Bridge’i protsessori graafilist tuuma pidada viiendaks protsessorituumaks (neljatuumaliste protsessorite puhul). Veelgi enam, graafikatuumal, nagu ka protsessori andmetöötlustuumadel, on juurdepääs L3 vahemällule.

Nii nagu eelmise põlvkonna protsessoritel (Clarkdale ja Arrandale), on ka Sandy Bridge'i protsessoritel integreeritud PCI Express 2.0 liides diskreetsete graafikakaartide kasutamiseks. Lisaks toetavad kõik protsessorid 16 PCI Express 2.0 rada, mida saab rühmitada kas üheks PCI Express x16 portiks või kaheks PCI Express x8 pordiks.

Samuti tuleb märkida, et kõigil Sandy Bridge'i protsessoritel on integreeritud kahe kanaliga DDR3 mälukontroller. Kolme kanaliga mälukontrolleriga variante pole veel plaanis välja anda.

Sandy Bridge'i mikroarhitektuuril põhinevate protsessorite eripäraks on ka see, et QPI (Intel QuickPath Interconnect) siini asemel, mida varem kasutati üksikute protsessori komponentide omavaheliseks ühendamiseks, kasutatakse nüüd põhimõtteliselt teistsugust liidest, mida nimetatakse Ring Busiks.

Sandy Bridge'i protsessori arhitektuur eeldab üldiselt modulaarset, kergesti skaleeritavat struktuuri.

Sandy Bridge'i mikroarhitektuuri teine omadus on see, et see toetab Intel AVX (Intel Advanced Vector Extension) käsukomplekti.

Intel AVX on Inteli arhitektuuri uus laienduste komplekt, mis pakub 256-bitist SIMD (Single Instruction, Multiple Data) vektor-ujukomaarvutust.

Sandy Bridge protsessori mikroarhitektuurist rääkides tuleb märkida, et tegemist on Nehalemi ehk Intel Core mikroarhitektuuri arendusega (kuna Nehalemi mikroarhitektuur ise on Intel Core mikroarhitektuuri arendus). Erinevused Nehalemi ja Sandy Bridge'i vahel on üsna märkimisväärsed, kuid siiski ei saa seda mikroarhitektuuri nimetada põhimõtteliselt uueks, nagu Intel Core'i mikroarhitektuur omal ajal oli. See on täpselt modifitseeritud Nehalemi mikroarhitektuur.

Teise põlvkonna Intel Core mobiilprotsessorite valik

Mobiilsete protsessorite perekonda kuulus 15 mudelit: kümme Core i7 perekonna mudelit, neli Core i5 perekonna mudelit ja üks Core i3 perekonna mudel.

Mobiilsete protsessorite perekonda kuuluvad nii nelja- kui ka kahetuumalised mudelid. Lisaks on kõigil mobiilsetel protsessoritel sisseehitatud Intel HD Graphics 3000 graafikatuum ja need toetavad Hyper-Threading režiimi. Üksikute mudelite erinevus seisneb energiatarbimises, standardses taktsageduses ja maksimaalses sageduses Turbo Boost režiimis, L3 vahemälu suuruses, toetatud mälusageduses, graafika tuuma sageduses tavaline mood ja Turbo Boost režiimis.

Seega on Core i7 perekonna kümnest mudelist viis neljatuumalised (neljatuumaliste protsesside tähistuses on täht Q või X). Veelgi enam, üks mudel - Intel Core i7-2920XM - kuulub Extreme Editioni seeriasse. See on mobiilsete protsessorite segmendi parim ja kalleim mudel. On ebatõenäoline, et tootjad hakkavad Core i7-2920XM protsessoril põhinevaid sülearvuteid masstootma, kuna selle maksumus ületab $ 1000. Tõenäoliselt põhinevad sellel ainult eksklusiivsed eritellimusel valmistatud sülearvutimudelid.

Kulude ja jõudluse poolest järgmine protsessorimudel on Core i7-2820QM. Selle erinevus Põhimudelid Ainus erinevus i7-2920XM-iga on see, et selle standardne taktsagedus on kaks astet madalam (Sandy Bridge'i protsessorites on süsteemisiini sagedus vastavalt 100 MHz, taktsageduse üks samm on võrdne 100 MHz-ga). Seega on Core i7-2920XM protsessori standardne taktsagedus 2,5 GHz ja Core i7-2820QM mudeli puhul 2,3 GHz. Turbo Boost režiimis võib Core i7-2920XM protsessori maksimaalne sagedus olla 3,5 GHz ja Core i7-2820QM protsessor 3,4 GHz. Teine erinevus Core i7-2920XM ja Core i7-2820QM protsessorite vahel on see, et mudeli Core i7-2920XM TDP on 55 W, samas kui mudeli Core i7-2820QM TDP on 45 W. Kõik muud Core i7-2920XM ja Core i7-2820QM protsessorite omadused on samad. Need on neljatuumalised mudelid, millel on 8 MB L3 vahemälu. Mõlemad mudelid toetavad DDR3-1600 mälu ja neil on Intel HD Graphics 3000 graafikakontroller, mille sagedus on tavarežiimis 650 MHz ja Turbo Boost režiimis 1300 MHz.

Nagu näete, ei erine Core i7-2920XM ja Core i7-2820QM protsessorid oma omaduste, sealhulgas jõudluse poolest, üksteisest palju. Kuid hind on peaaegu kahekordne. Seetõttu eeldame, et Core i7-2820QM mudel on tipplahendus ja Core i7-2920XM jääb omamoodi eksklusiivseks, mida suure tõenäosusega ei müüda.

Kõik teised neljatuumaliste mobiilsete protsessorite mudelid (Core i7-2720QM, i7-2635QM, i7-2630QM) on varustatud 6 MB L3 vahemäluga. Core i7-2720QM mudel toetab DDR3-1600 mälu, ülejäänud protsessorid aga DDR3-1333 mälu. Mudelid i7-2635QM ja i7-2630QM ei erine üksteisest praktiliselt üldse – ainsaks erinevuseks on Turbo Boost režiimis graafikatuuma maksimaalne sagedus. Kuid meie arvates ei ole neljatuumaliste protsessorimudelite puhul mõtet pöörata tähelepanu integreeritud graafikatuuma omadustele, kuna sellistel sülearvutitel põhinevad sülearvutid. võimsad protsessorid ilma diskreetse graafikata neid tõenäoliselt välja ei lasta (see oleks lihtsalt ebaloogiline).

Vaatame nüüd Sandy Bridge'i mobiilsete protsessorite kahetuumalisi mudeleid. Kõigil Core i7 perekonna kahetuumalistel mudelitel on 4 MB L3 vahemälu ja need toetavad DDR3-1333 mälu. Tegelikult seisneb Core i7 perekonna protsessorite üksikute kahetuumaliste mudelite erinevus nende energiatarbimises (erinevad TDP väärtused), standardse taktsageduse ning Turbo Boost režiimis protsessori tuumade ja graafika tuumade maksimaalses taktsageduses.

Core i5 perekonna mobiilsete protsessorite kahetuumalistel mudelitel (kokku on neid neli) on L3 vahemälu juba 3 MB suurune. Kõik need protsessorid toetavad DDR3-1333 mälu ja erinevad üksteisest energiatarbimise, nominaalse taktsageduse ning protsessori ja graafikatuumade maksimaalse taktsageduse poolest Turbo Boost režiimis.

Nagu juba märgitud, esindab Core i3 protsessorite nooremat perekonda ainult üks mudel - Core i3-2310M. Core i3 protsessorite perekonna eripäraks on asjaolu, et need ei toeta protsessorituumade puhul Turbo Boost režiimi (graafika tuuma puhul toetatakse Turbo Boost režiimi). Muus osas on need protsessorid sarnased Core i5 perekonna mudelitega. Seega on Core i3-2310M mudelis L3 vahemälu suurus 3 MB ja see toetab DDR3-1333 mälu.

Sandy Bridge mobiilsete protsessorite tehnilised omadused on toodud tabelis. 1 .

Teise põlvkonna Intel Core lauaarvutiprotsessorite valik

Sandy Bridge'i lauaarvutiprotsessorite valikut esindavad ka kolm perekonda: Core i7, Core i5 ja Core i3.

Kõik Core i7 perekonna lauaarvutiprotsessorid on neljatuumalised, toetavad Hyper-Threading režiimi ja DDR3-1333 mälu ning neil on 8 MB L3 vahemälu. Tegelikult esindab Core i7 perekonda praegu ainult üks mudel, kuid kolmes versioonis: Core i7-2600K, Core i7-2600 ja Core i7-2600S. Baasmudel on Core i7-2600. Selle neljatuumalise protsessori TDP on 95 W ja põhitaktsagedus 3,4 GHz. Maksimaalne taktsagedus Turbo Boost režiimis on 3,8 GHz. Core i7-2600 protsessorisse on integreeritud Intel HD Graphics 2000, mille maksimaalne taktsagedus on Turbo Boost režiimis kuni 1350 MHz.

Core i7-2600K mudel erineb Core i7-2600-st eelkõige selle poolest, et see on lukustamata. Kõigil protsessoritel, mille märgistuses on täht “K”, on lukustamata kordaja ja need on suunatud kiirendamisele. Sandy Bridge'i lauaarvutiprotsessorite kiirendamisfunktsioonidest räägime hiljem, kuid praegu paneme tähele, et Põhiprotsessor Mudelil i7-2600K on integreeritud Intel HD Graphics 3000, mille maksimaalne taktsagedus on Turbo Boost režiimis kuni 1350 MHz.

Üldiselt tuleb märkida, et kui kõikidel mobiiliprotsessoritel on integreeritud graafikatuum Intel HD Graphics 3000, siis lauaarvuti protsessoritel võib olla integreeritud graafikatuum nii Intel HD Graphics 3000 kui ka Intel HD Graphics 2000. Kõik lukustamata protsessorid (tähega Märgistuses "K") Intel HD Graphics 3000 graafikatuum on integreeritud ja kõigil teistel protsessoritel on Intel HD Graphics 2000 tuum. Arutleme Intel HD Graphics 3000 ja 2000 tuumade erinevuste üle, kuid tulevikku vaadates ütleb, et Intel HD Graphics 3000 tuum on tootlikum ja otsus integreerida võimsam graafikatuum lukustamata protsessoritesse tundub meile täiesti ebaloogiline. Fakt on see, et protsessorite kiirendamine on võimalik ainult sellel põhinevatel emaplaatidel Inteli kiibistik P67 Express. Kuid just need plaadid ei toeta protsessorisse sisseehitatud graafikatuuma (st Intel P67 Expressi kiibistikul põhinevatel plaatidel pole võimalust kasutada sisseehitatud graafikatüdamikku). Integreeritud graafikatuuma saab kasutada vaid Intel H67 Expressi kiibistikuga plaatidel, kuid need ei võimalda protsessorituumade ülekiiretamist (kiibikomplektide omadustest räägime veidi hiljem). Loomulikult on lukustamata K-seeria protsessoreid mõttekas kasutada ainult Intel P67 Expressi kiibistikul põhinevate tahvlitega, kuid sel juhul ei saa te kasutada neisse sisseehitatud graafikatuuma ja mis mõtet on lukustamata protsessoreid võimsamaga varustada. graafika tuum on täiesti ebaselge.

Core i7-2600S protsessor erineb kahest ülejäänud Core i7 perekonna mudelist väiksema energiatarbimise poolest. Selle TDP on 65 W. Noh, lisaks on sellel protsessorimudelil madalam baassagedus (2,8 GHz), kuid Turbo Boost režiimis võib taktsagedus olla sama, mis mudelitel Core i7-2600 ja Core i7-2600K ehk 3 . 8 GHz. Möödaminnes märgime, et kui protsessori märgistuses on täht “S”, tähendab see, et räägime vähendatud energiatarbimisega protsessorist.

Vaatame nüüd Core i5 lauaarvutiprotsessorite perekonda. See on üsna kummaline, kuna see sisaldab nii kahe- kui ka neljatuumalisi protsessoreid Hüperkeermestamise tugi, ja ilma selleta. Täpsemalt, kui poleks Core i5-2390T mudelit, siis oleks kõik loogiline ja Intel Core i5 võiks iseloomustada neljatuumaliste protsessorite perekonda, millel puudub 6 MB L3 vahemäluga Hyper-Threading tehnoloogia tugi. Core i5-2390T mudel rikub aga kogu klassifitseerimissüsteemi, kuna see on kahetuumaline protsessor, mis toetab Hyper-Threading tehnoloogiat ja 3 MB L3 vahemälu. Tundub, et see protsessor sattus Core i5 perekonda lihtsalt kogemata – see kuulub Core i3 perekonda. Kõigi Core i3 protsessorite tunnuseks on aga toetuse puudumine Turbo režiim Boost protsessori tuumade jaoks ja Core i5-2390T mudel toetab Turbo Boosti. Ühesõnaga Core i5-2390T protsessorimudel lihtsalt ei sobi ühtegi perekonda. Seetõttu iseloomustame Core i5 neljatuumaliste protsessorite perekonda, mis ei toeta Hyper-Threading-tehnoloogiat ja millel on 6 MB L3 vahemälu, kuid ühe erandiga Core i5-2390T mudeli näol.

Core i5 perekond sisaldab täna kolme põhimudelit erinevates variatsioonides. Seega on Core i5-2500 baasmudel nelja tüüpi: Core i5-2500K, Core i5-2500, Core i5-2500S ja Core i5-2500T. Core i5-2500K mudel on Core i5-2500 protsessori lukustamata versioon ja isegi Intel HD Graphics 3000-ga.

Core i5-2500S on Core i5-2500 protsessori väiksema võimsusega variant. Seega, kui Core i5-2500 mudeli puhul on TDP 95 W, siis mudeli Core i5-2500S puhul on see 65 W.

Core i5-2500T on veelgi väiksema energiatarbimisega protsessor. Selle protsessori TDP on 45 W ning lisaks on sellel tavarežiimis ja Turbo Boost režiimis vähendatud tuumasagedus.

Core i5-2400 protsessor on saadaval kahes variandis: Core i5-2400 ja i5-2400S. Nende erinevus seisneb energiatarbimises ja taktsageduses.

Kuid Core i5-2300 protsessoril pole veel variatsioone.

Core i3 protsessorite perekonda esindab hetkel kolm mudelit. Kõik selle perekonna protsessorid on kahetuumalised, toetavad Hyper-Threading režiimi, neil on 3 MB L3 vahemälu ja nagu juba märgitud, ei toeta need protsessorituumade puhul Turbo Boost režiimi. Integreeritud graafikatuuma HD Graphics 2000 maksimaalne sagedus (Turbo Boost režiimis) on 1100 MHz.

Kõikide Sandy Bridge lauaarvutite protsessorite tehnilised omadused on toodud tabelis. 2.

Intel HD Graphics 2000/3000 graafikatuumade omadused

Nagu juba märgitud, on kõigil Sandy Bridge'i protsessoritel uue põlvkonna sisseehitatud graafikatuum, mida ideoloogiliselt võib pidada teiseks protsessori tuumaks. Kõik mobiilsed protsessorid, aga ka K-seeria lauaarvutiprotsessorid (lukustamata kordajatega) integreerivad Intel HD Graphics 3000 graafikatuuma ja ülejäänud protsessorid Intel HD Graphics 2000 graafikatuuma.

Muidugi ei saa Sandy Bridge'i protsessorite graafikatuuma jõudlust võrrelda diskreetne graafika(muide, DirectX 11 toetust uuele tuumale pole isegi välja kuulutatud), kuid ausalt öeldes märgime, et see tuum pole positsioneeritud mängutuumana.

Intel HD Graphics 3000 ja Intel HD Graphics 2000 tuumade erinevus seisneb täitmisüksuste (EU) arvus. Seega on Intel HD Graphics 3000 tuumal 12 täitmisüksust, samas kui Intel HD Graphics 2000 tuumal on ainult 6.

Pange tähele, et Intel HD Graphics 3000/2000 graafikatuumade täitmisüksusi ei saa võrrelda NVIDIA või AMD GPU-de ühtsete varjutusprotsessoritega, kus neid on sadu. Inteli graafikatuum on keskendunud eelkõige mitte 3D-mängudele, vaid riistvaralisele video dekodeerimisele ja kodeerimisele (sh HD-video). See tähendab, et graafika tuuma konfiguratsioon sisaldab riistvaradekoodereid. Neid täiendavad tööriistad eraldusvõime muutmiseks (skaleerimine), müra vähendamiseks (müra summutamise filtreerimine), vahelduvate joonte tuvastamiseks ja eemaldamiseks (deinterlace / filmirežiimi tuvastamine) ja filtrid detailide parandamiseks. Taasesituse piltide täiustamiseks mõeldud järeltöötlus hõlmab STE-d (nahatooni suurendamine), ACE (adaptiivse kontrastsuse suurendamine) ja TCC-d (täielik värvihaldus).

Mitmeformaadiline riistvarakoodek toetab MPEG-2, VC1 ja AVC vorminguid, teostades kõiki dekodeerimisetappe spetsiaalse riistvara abil, samas kui praeguse põlvkonna integreeritud graafikaprotsessorite puhul täidavad seda funktsiooni universaalsed täitmisüksused EU (joonis 1).

Riis. 1. Riistvaralise graafika dekodeerimise võimaluste võrdlus
uute ja eelmiste põlvkondade kontrollerid

Üldiselt, kui võrrelda eelmise põlvkonna Inteli Clarkdale/Arrandale protsessoritesse integreeritud graafikakontrollereid ja Sandy Bridge protsessoritesse integreeritud graafikakontrollereid, siis tuleb märkida, et erinevus nende vahel ei seisne ainult riistvaralise dekodeerimise toes. Uue ja eelmiste põlvkondade graafikakontrollerite tehniliste omaduste ja funktsionaalsuse võrdlus on toodud joonisel fig. 2 ja 3.

Riis. 2. Uute graafikakontrollerite funktsionaalsuse võrdlus
ja eelmised põlvkonnad

Riis. 3. Graafikakontrollerite uue ja eelmise põlvkonna tehniliste omaduste võrdlus

Sandy Bridge'i lauaarvutiprotsessorite kiirendamisvõimalused

Sandy Bridge'i lauaarvutiprotsessorite perekond sisaldab nii lukustamata kiirendamisele orienteeritud protsessoreid kui ka tavalisi protsessoreid. Tavalisi protsessoreid saab aga (ja peakski) ka ülekiirendada. Üldiselt on õigem jagada kõik Sandy Bridge'i lauaarvutiprotsessorid mitte tavalisteks ja lukustamata, vaid Fully Unlocked ja Limited Unlocked. Tegelikult on see Sandy Bridge'i protsessorite üks huvitavamaid omadusi – need on kõik ühel või teisel määral lukustamata.

Esiteks on kõigil protsessoritel täielikult lukustamata mälu kiirendamise võimalused. Tahvli BIOS-is saate valida mälu korrutusteguri (8,00; 10,66; 13,33; 16,00; 18,66; 21,33). Võttes arvesse, et süsteemisiini standardsagedus on 100 MHz, valides näiteks kordaja 16,00, saame mälusageduseks 1600 MHz.

Loomulikult on kõigil protsessoritel täielikult lukustamata võimalus seadistada mälu ja protsessori tuumade toitepinget. Tegelikult on see alati nii olnud.

Noh, nüüd peamisest. Täielikult lukustamata protsessorites (K-seeria protsessorid) saate protsessori tuumade taktsageduse jaoks määrata mis tahes kordaja. Täpsemalt võib maksimaalne korrutustegur olla võrdne vastavalt 57-ga, protsessori tuumade maksimaalne taktsagedus võib ulatuda 5,7 GHz-ni (teoreetiliselt). Osaliselt lukustamata protsessorites (st mitte-K-seeria protsessorites) saate muuta ka korrutustegurit, kuid väiksemas vahemikus. Siin on reegel selline. Osaliselt lukustamata protsessorite maksimaalne kordaja võib olla neli ühikut suurem kui kordistaja puhul maksimaalne sagedus protsessor Turbo Boost režiimis tavarežiimis.

Mõelge näiteks osaliselt lukustamata Core i5-2400 protsessorile. Selle standardne taktsagedus on 3,1 GHz ja Turbo Boost režiimis võib maksimaalne taktsagedus olla 3,4 GHz (ühe aktiivse tuumaga). Sellest lähtuvalt on selle protsessori puhul Turbo Boost režiimis maksimaalse sageduse korrutustegur 34. See tähendab, et maksimaalne seadistatav korrutustegur on 38.

Nii täielikult lukustamata kui ka osaliselt lukustamata Sandy Bridge protsessorid võimaldavad kohandatavaid Turbo Boost režiime. See tähendab, et Sandy Bridge'i protsessorite puhul saate Turbo Boost režiimis määrata protsessori tuumade korrutustegureid. Neljatuumaliste protsessorite puhul on võimalik määrata korrutustegureid neljale, kolmele, kahele ja ühele aktiivsele tuumale. Täielikult lukustamata protsessorite korral võivad korrutustegurid olla mis tahes (kuid alla 57) ja osaliselt lukustamata protsessorite puhul kehtib sama reegel: maksimaalne korrutustegur on neli ühikut suurem kui protsessori maksimaalse sageduse korrutustegur Turbo Boost režiimis tavarežiim (joonis 4).

Riis. 4. Ülekiirendamise võimaluste täielik võrdlus
ja osaliselt lukustamata Sandy Bridge'i protsessorid

Võtame näiteks sellesama osaliselt lukustamata Core i5-2400 protsessori. Vaikimisi (tavarežiimis) on selle protsessori Turbo Boost režiim konfigureeritud järgmiselt. Kui kõik neli tuuma on aktiivsed, võib korrutustegur olla võrdne 32-ga (kui protsessori maksimaalset voolu ja TDP piire ei ületata). Kui kolm või kaks protsessori tuuma on aktiivsed, võib korrutustegur olla võrdne 33-ga ja kui aktiivne on ainult üks tuum, võib korrutustegur jõuda väärtuseni 34.

Kuna selle protsessori maksimaalne korrutustegur on 4 ühikut suurem kui 34, st võrdne 38-ga, saab Turbo Boost režiimi konfigureerida nii, et kõigi aktiivsete tuumade korral ei oleks korrutustegur suurem kui 38. Näiteks üks aktiivne tuum - 38, kahel - 37, kolmel - 36 ja neljal - 35. Või võib olla nii, et ühe, kahe, kolme ja nelja aktiivse tuuma korral on korrutustegur 38.

Veel üks Turbo Boost režiimi seadistuse funktsioon on see, et nii täielikult lukustamata kui ka osaliselt lukustamata protsessorite jaoks saate määrata väärtusi maksimaalne vool ja energiatarbimist. Tuletame meelde, et Turbo Boost dünaamiline kiirendamise režiim rakendub ainult siis, kui protsessori maksimaalset voolu- ja voolutarbimise piire ei ületata. Seega saate maksimaalse voolu ja energiatarbimise väärtused ise määrata.

Sandy Bridge'i protsessorite kiirendamisvõimalustest rääkides tuleb märkida, et need on tõeliselt muljetavaldavad. Meil oli võimalus testida kolme lauaarvuti protsessorit: Core i7-2600K, Core i5-2500K ja Core i5-2400 ning peab ütlema, et need kõik ülekiiretasid hästi. Näiteks Core i7-2600K protsessor töötas suurepäraselt sagedusel 4,6 GHz (nimisagedusega 3,4 GHz) ja osaliselt lukustamata Core i5-2400 protsessor nimisagedusega 3,1 GHz töötas suurepäraselt sagedusel 3,8 GHz. Räägime teile üksikasjalikumalt nende protsessorite jõudluse ja kiirendamise võimalustest järgmine number meie ajakiri. Tuletame meelde, et saate Sandy Bridge'i lauaarvutiprotsessoreid kiirendada ainult siis, kui kasutate Intel P67 Expressi kiibistikul põhinevat emaplaati. Teistel kiibikomplektidel põhinevad plaadid ei võimalda protsessorite kiirendamist.

Nüüd on aeg vaadata lähemalt Sandy Bridge'i protsessorite uusi kiibikomplekte.

Inteli 6-seeria kiibistikud

Intel esitles korraga kümmet 6-seeria kiibikomplekti, millest viis mudelit on personaalarvutitele (P67, H67, Q65, Q67, B65) ja veel viis (QS67, QM67, HM67, HM65, UM67) sülearvutitele.

Kõik uued kiibistikud või Inteli terminoloogias platvormi jaoturid (Platform Controller Hub, PCH) on ühe kiibiga lahendused, mis asendavad traditsioonilisi põhja- ja lõunasildu.

Sandy Bridge'i protsessorites realiseeritakse protsessori ja kiibistiku interaktsioon DMI siini kaudu. Sellest lähtuvalt on Inteli 6-seeria kiibikomplektidel DMI-kontroller.

Töölaua kiibistikud

Kui me räägime lauaarvutite kiibistikust, siis kõige laialdasemalt kasutatavad kiibistikud on Intel P67 Express (P67) ja Intel H67 Express (H67). Need on suunatud koduarvutitele. Ülejäänud kiibistikud (Q65, Q67, B65) on mõeldud turu ettevõtete segmendile ega paku huvi lõppkasutajatele ning seetõttu keskendume eelkõige P67 ja H67 kiibistiku ülevaatamisele.

Nagu korduvalt mainitud, on P67 ja H67 kiibistiku põhierinevus see, et P67 kiibistik võimaldab esiteks protsessoreid kiirendada ja teiseks ei võimalda kasutada protsessorisse ehitatud graafikakontrollerit. H67 kiibistik, vastupidi, ei paku protsessorite kiirendamist, vaid võimaldab kasutada protsessorisse sisseehitatud graafikakontrollerit. Selleks on H67 kiibistik Intel FDI (Flexible Display Interface) siin, mille kaudu kiibistik suhtleb protsessoriga. Kuid P67 kiibistikus pole sellist siini ja just sel põhjusel ei saa P67 kiibistikuga plaatidel kasutada Sandy Bridge'i protsessori sisseehitatud graafikatuuma.

Ülejäänud P67 ja H67 kiibistiku funktsionaalsus on peaaegu sama. Mõlemad kiibistikud toetavad 14 USB 2.0 porti. Lisaks on neil sisseehitatud 6-pordiline SATA-kontroller, mis toetab kahte SATA 6 Gb/s (SATA III) porti ja nelja SATA 3 Gb/s (SATA II) porti. See kontroller toetab Inteli RST-tehnoloogiat, mis võimaldab luua RAID-tasemeid 0, 1, 5, 10 või JBOD.

P67 ja H67 kiibistikud toetavad kaheksat täiskiirusega PCI Express 2.0 rada, mida saavad kasutada emaplaadile integreeritud kontrollerid ja korraldada. PCI pesad Express 2.0 x1 ja PCI Express 2.0 x4. Kuid P67 ja H67 kiibistikud ei toeta traditsioonilist PCI siini.

Pange tähele ka seda, et P67 ja H67 kiibistikul on juba sisseehitatud gigabitise võrgukontrolleri MAC-tase.

Kiibikomplektide P67 ja H67 plokkskeemid on näidatud joonisel fig. 5 ja 6. Tabelis. 3 antakse spetsifikatsioonid P67 ja H67 kiibistikud, samuti Q67 ja B65 kiibistikud.

Riis. 5. Intel P67 Expressi kiibistiku plokkskeem

Riis. 6. Intel H67 Expressi kiibistiku plokkskeem

Kiibikomplektid mobiilsete arvutite jaoks

Viiest mobiilsete personaalarvutite kiibistikust on mudelid QM67 ja QS67 suunatud turu ettevõtete segmendile ja neid ei leia kodukasutajate sülearvutites. Kuid HM67, HM65 ja UM67 kiibikomplekte hakatakse kasutama kodukasutajate sülearvutites.

Üldiselt, kui vaadata kõigi mobiilsete kiibikomplektide omadusi (vt tabel 3), siis märkad, et nende omadused erinevad väga vähe. Näiteks HM67 ja UM67 kiibistikud erinevad üksteisest vaid 0,5 W energiatarbimise erinevuse poolest ja nende funktsionaalsus on täiesti sama.

Kõikidel mobiilsetel kiibikomplektidel on Intel FDI (Flexible Display Interface) siin ja need toetavad protsessorisse integreeritud graafikakontrollerit. Lisaks toetavad need kiibistikud DVI, VGA, Kuva port, HDMI 1.4 ja LVD. Lisaks toetatakse Intel Wireless Display, PAVP ja SDVO tehnoloogiaid.

QM67, QS67, HM67 ja UM67 kiibistikud toetavad 14 USB 2.0 porti, samas kui HM65 kiibistik toetab ainult 12 porti. Pidagem siiski meeles, et me räägime sülearvutitest ja rohkem kui nelja USB-pordi füüsiline rakendamine on väga problemaatiline. Seega on erinevus toetatud USB-portide arvus sel juhul võib ignoreerida.

Lisaks on kõikidel mobiilikiibikomplektidel sisseehitatud 6-pordiline SATA-kontroller, mis toetab kahte SATA 6 Gb/s (SATA III) porti ja nelja SATA 3 Gb/s (SATA II) porti. QM67, QS67 ja HM67 kiibistikud toetavad Inteli RST-tehnoloogiat võimega luua 0 ja 1 tasemega RAID-massiivid ning QM67 ja HM67 kiibistikud toetavad ka 5. ja 10. tasemega RAID-massiivide loomist, kuigi pole väga selge, miks seda on vaja sülearvutites.

Kõik mobiilikiibistikud toetavad kaheksat täiskiirusega PCI Express 2.0 rada, mida saavad kasutada integreeritud kontrollerid. Samuti märgime, et mobiilikiibistikul on sisseehitatud gigabitise võrgukontrolleri MAC-tase.

Kõikide mobiilsete kiibikomplektide tehnilised omadused on esitatud