Kas Sse 4.1 mõjutab Windowsi kiirust? AMD buldooseri arhitektuur. Juhised

Tere kõigile, täna räägime sellest, kuidas teada saada, milliseid SSE juhiseid protsessor toetab. Aga mis on SSE, kas sa tead? Ma ei tea ja asi pole selles, et ma ei tea, ma ei saa isegi aru, mis see on. Noh, see tähendab, ma saan aru, et see on protsessori käsk, mida on vaja selle töö optimeerimiseks, see tähendab, et sama sagedusega saaks selle juhisega protsessor rohkem käske töödelda. Aga see on nii jämedalt öeldes nii-öelda...

SSE kohta ma isegi ei tea, kus seda elus vaja on, võib-olla mängude jaoks? Ma tean, mis on Hyper-threading (kuigi see pole protsessori juhis, vaid tehnoloogia), mis on VT-x, VT-d, ma tean, mis on EM64T, aga ma ei tea, mis on SSE! Noh, need on pirukad

Lühidalt, poisid, ma ütlen teile kohe, et selle asjaga on väike segadus, ma mõtlen seda, et tavalisi vahendeid Windowsis ei saa sellist asja nagu SSE teada, kas see on olemas või mitte. Siin peate alla laadima spetsiaalse programmi. Aga ärge muretsege, see super duper programm on tasuta, kaalub väga vähe, ei koorma üldse arvutit, aga samas on MEGA KASULIK ja selle nimi on CPU-Z (muide, saate selle alla laadida siin: cpuid.com/softwares/cpu-z.html, see on ametlik veebisait).

Nii et poisid, laadisid alla CPU-Z, installisid selle ja käivitasid siis. Ja kohe saate kõik teada, nii palju neid SSE-sid mul on:

Mitte üks, mitte kaks, vaid kuus, vau poisid!

Muide, nagu näete, on siin veel palju kasulikku teavet, näete? Kui teil on kiiresti vaja midagi oma protsessi kohta teada saada, käivitage kiiresti CPU-Z ja oi, kõik vajalik on teie käeulatuses! Ma ütlen teile, et CPU-Z programm on ainulaadne! Ei usu mind? Noh, pole probleemi, ma tõestan seda teile kohe. Vaata, kas sa tead, millal see või teine ​​mälupulk välja anti? Noh, see on nii-öelda selle tehases ilmumise kuupäev. Või pole te huvitatud? No mõned inimesed on väga huvitatud, aga näiteks mina olen väga huvitatud! Ja CPU-Z programm suudab sellist teavet näidata! Nii et poisid, vaadake, käivitasime CPU-Z, minge vahekaardile SPD, seal valite kronsteiniga pesa (vasakul), st pistiku, kuhu see on installitud, ja vaadake valitud klambri teavet. Mul on neljandas pesas üks 8-giga pulk ja CPU-Z programm näitas seda teavet:

Siin on näha, et minu latt ilmus 2014. aasta 30. nädalal. Samuti on kirjas, et minu tootja on Hyundai Electronics, noh, nii nimetatakse Hynixi riba

No lühidalt öeldes on CPU-Z super, kui on vaja kiiresti näha arvuti või sülearvuti riistvara olulisemat infot, siis see näitab seda kõike ilma nöörideta! Ühesõnaga, ma soovitan seda poisid!

Lisaks unustasin ma midagi SSE kohta kirjutada. SSE-d ei saa lubada ega keelata. Sest see juhend kas on olemas või mitte. Näiteks Hyper-threading saab lubada/keelata, aga SSE mitte!

See on kõik, poisid, ma loodan, et siin oli teile kõik selge ja kui midagi on valesti, siis vabandan. Kas see teave oli teile kasulik, ausalt? Loodan kogu südamest, et jah! Edu sulle elus, olgu terve ja ära ei jää haigeks, edu

09.12.2016

Mõned kuud tagasi tutvustas AMD uut arhitektuuri, mida hakatakse kasutama uutes protsessorites alates 2011. aastast. Uus arhitektuur nimetatakse Bulldozeriks ja see erineb täielikult praegusest AMD64 arhitektuurist, mida AMD on kasutanud alates 2003. aastast.

Bulldooseri arhitektuur pärib osa AMD64 arhitektuuriga kasutusele võetud tehnoloogiast, näiteks integreeritud mälu ja siinikontroller Hüpertransport protsessori ja kiibistiku vaheliseks suhtluseks.

Buldooser on arhitektuuri koodnimi, mitte konkreetse protsessori nimi. Nagu tavaliselt, keskendutakse protsessorite esimene väljalase serveriturule, seejärel kallite suure jõudlusega arvutite turule, seejärel keskmise hinnaga segmendile ja lõpuks eelarvetaseme turule.

Kuigi AMD ei avaldanud uute protsessorite tehnilisi andmeid, märkisid nad, et esimesed protsessorid lauaarvuti, teostatakse uues pistikupesas AM3+, mis ühildub olemasoleva pistikupesaga AM3. Socket AM3+ aga ei ühildu emaplaadid pesa AM3 all.

Buldooseri arhitektuuril on Inteliga sarnane tehnoloogia Turbo Boost, mis võimaldab protsessorit automaatselt kiirendada.
Enne kui räägime sisemisest Buldooseri arhitektuur, vaatame juhiste komplekti, mida uus arhitektuur toetab.

Bulldooseri arhitektuur toetab lisaks x86 juhiste standardiga ühilduvusele ka järgmist lisakomplektid juhised:

  • SSE4.1 ja SSE4.2
  • AVX (Advanced Vector Extensions) kahe lisajuhisega XOP ja FMA4
  • AES (Advanced Encryption Standard) – täiustatud krüpteerimisstandard
  • LWP (kerge kaaluprofiil)

SSE4.1 ja SSE4.2

Lõpuks AMD protsessorid hakkab toetama värbamist SSE juhised 4. AMD protsessorid ei toeta praegu seda juhiste komplekti, mis suurendab jõudlust multimeediumirakendused(näiteks pildi- ja videotöötlusrakendused). Peal Sel hetkel AMD protsessorid toetavad oma käsukomplekti nimega SSE4a, mis ei ole sama mis SSE4.

AVX (täiustatud vektorlaiendid)

Korra tegi AMD ettepaneku kasutada uus komplekt SSE5 juhised. Seetõttu otsustas Intel luua oma enda rakendamine mida nimetati SSE5-ks ja selle juhiseks - AVX (Advanced Vector Extensions). AMD ettevõte otsustas lisada selle juhiste komplekti buldooseri arhitektuuri jaoks.

AVX-i juhiseid toetavad ka Inteli uued protsessorid, mis põhinevad Sandy Bridge'i arhitektuuril.

komplekt AVX juhised lisab 12 uut käsku ja suurendab XMM-registrite suurust 128 bitilt 256 bitile.

Bulldooseri arhitektuuris otsustas AMD kasutada mõnda SSE5 jaoks pakutud juhist. Seega on AVX-i kasutamine buldooseri arhitektuuris täielikum kui Inteli oma. Need täiendavad juhised nimega XOP ja FMA4. AMD märkis ka, et AVX-l on FMAC (Fused Multiply Accumulate) juhiste alamhulk, kuid tegelikult on see osa XOP-käsukomplektist.

AES (täiustatud krüpteerimisstandard)

Seda juhiste komplekti kasutatakse juba uutes Inteli protsessorites, mis põhinevad “Westmere” arhitektuuril (va Core i3), ja see koosneb kuuest uuest krüpteerimisega seotud juhisest. Intel nimetab seda juhiste komplekti AES-NI.

LWP (kerge kaaluprofiil)

LWP juhised parandavad mitme keermega jõudlust tarkvara nimel töötades mitmetuumalised protsessorid. LWP sisaldab kuut uut juhist.

Uues Nehalemi mikroarhitektuuris jätkas Intel oma varem võetud kursi, suurendades toetatud SIMD-juhiste arvu. Uuendatud juhiste komplekti täiendati seitsme uue juhisega ja see sai nimeks SSE4.2 (tähistust SSE4.1 kasutati Penryni protsessorite SIMD käsusüsteemi kohta). Samas juhib Intel konkreetselt tähelepanu asjaolule, et SSE4.2 komplekti toodud juhised on keskendunud mitte niivõrd striimiva meedia sisu töötlemise kiirendamisele, kuivõrd muudele eesmärkidele. Seetõttu said Nehalemis tutvustatud uued juhised ka sümboli ATA (Application Targeted Accelerators). ATA kontseptsioon on esitatud nii, et kaasaegsed tehnoloogilised protsessid võimaldavad kasutada osa protsessori transistoridest mitte ainult universaalsete funktsionaalplokkide jaoks, vaid ka spetsiifiliste vajaduste jaoks, suurendades konkreetsete ülesannete jõudlust. Seega on selle kontseptsiooni kohaselt SSE4.2-sse lisatud viis juhist, mis on loodud XML-failide parsimise kiirendamiseks. Samuti on samu juhiseid kasutades võimalik suurendada stringide ja tekstide töötlemise kiirust. Veel kaks uut SSE4.2 juhist on suunatud täiesti erinevatele rakendustele. Esimene neist, CRC32, kogub CRC32c kontrollsumma ja teine, POPCNT, loendab nullist erineva bittide arvu allikas. Neid käske saab laialdaselt kasutada ka erinevates rakendustes ja võrgurakendustes.

Integreeritud mälukontroller

Nehalem oli esimene Inteli mikroarhitektuur, mis integreeris protsessorisse mälukontrolleri. Näib, et Inteli insenerid laenasid siin oma kolleegide idee AMD-st, kes on protsessoritesse mälukontrollerit ehitanud alates 2003. aastast. See pole aga täiesti tõsi, kuna esimesed integreeritud mälukontrolleriga protsessorid pidid olema kunagi välja antud Intel Timna, mille kallal töötati aktiivselt 1999. Lisaks tuleks tagasi lükata plagiaadisüüdistused, kuna Inteli Nehalemi jaoks välja töötatud mälukontroller erineb oluliselt olemasolevates AMD protsessorites kasutatavast kontrollerist. Inteli lähenemine probleemile osutus palju ambitsioonikamaks. Nehalemi protsessorite perekonna mälukontrolleri peamine omadus on paindlikkus. Arvestades kogu paljutõotava protsessoripere modulaarset ülesehitust, mis võib sisaldada tooteid, mille omadused ja turupositsioon on väga erinevad, on Intel pakkunud võimalust mitte ainult lubada või keelata puhvermoodulite tuge, vaid ka muuta kanalite arvu ja mälu. kiirust. Samal ajal saavad esimesed neljatuumalise versioonina ilmuvad Nehalemi mikroarhitektuuriga protsessorid kolme kanaliga DDR3 SDRAM-i toega mälukontrolleri. Seega saavad uutele protsessoritele ehitatud lauaarvutisüsteemid kiidelda mälu alamsüsteemi ületamatu läbilaskevõimega, mis kolme mooduli kasutamise korral DDR3-1067 jõuab 25,6 GB/s. DRAM-kontrolleri protsessorile viimise peamine eelis pole aga niivõrd kasv ribalaius, kui palju mälu alamsüsteemi latentsusaega vähendada. Vaatamata asjaolule, et Intel pakub uute DDR3 protsessoritega suhteliselt kõrge latentsusmälu, on Nehalemi mälule juurdepääsu latentsusajad igal juhul väiksemad kui süsteemides, mis põhinevad Põhiprotsessorid 2 ja kasutades DDR3 SDRAM-i (ja kindlasti ka DDR2 SDRAM-i). Nende sõnade kinnituseks tahaksin esitada andmed, mis on saadud Everest 4.60 testutiliidi Nehalemil põhineva süsteemi mälu alamsüsteemi praktiliste parameetrite mõõtmisel.

Tabel 2. Mälu jõudluse testimine

Tegelikult on Nehalemi mälukontroller isegi ühe kanaliga režiimis töötades võimeline näitama paremat jõudlust kui tänapäevaste LGA775 platvormide mälukontroller. See on täiesti loogiline tulemus, kuna uue põlvkonna süsteemides pole protsessori ja mälu vahelisel teel vaheseadmeid - kui varem vastutas mäluga töötamise eest kiibistiku põhjasild, mis tõi kaasa oma väga olulised viivitused, mille põhjustas vaja sünkroonida mälusiinid ja FSB. Protsessorisse sisseehitatud mälu kaudne eelis on ka see, et selle töö ei sõltu nüüd ei kiibistikust ega emaplaadist. Selle tulemusena näitab Nehalem erinevate arendajate ja tootjate platvormidel töötades sama mälu jõudlust.

Sageli kaasaegne tarkvara või mängud nõuavad protsessoril SSE 4.1–4.2 juhiseid. Kui neid pole, jookse õige rakendus See ei tööta, ilmneb mõni viga või lihtsalt ei juhtu midagi.

FarCry 5 kurdab SSE 4.2 puudumise üle

Samas võib protsessori võimsusest enam-vähem piisata mugav mäng(näiteks mõned Xeoni protsessorid 775 pesa jaoks suudavad nad endiselt uutes toodetes rahuldavat FPS-i pakkuda) ja juhiste nõue on mõnikord vajalik isegi mitte mängu enda jaoks, vaid kopeerimiskaitse toimimiseks. Näiteks ei lubanud Denuvo kaitse vanemate protsessorite omanikel Assassin's Creed Originsit mängida, kuigi mäng ise oli saadaval uusimad juhised ei nõudnud seda.

Muud populaarsed mängud või nende komponendid nõuavad samuti SSE 4.1 või 4.2: No Man Sky, Far Cry 5, Dishonored 2, Mafia 3 ja teised.

Sellegipoolest on lahendus olemas, kuigi see ei taga 100% edu. Soovitud rakenduse käivitamiseks võite kasutada emulaatorit sde väline, mille saab alla laadida lingilt (valige Windowsi jaoks mõeldud versioon) või selle artikli allosas.

Kuidas kasutada SSE 4.1-4.2 emulaatorit

  • Laadige arhiiv alla saidilt sde external ja pakkige see lahti nii, et sde.exe oleks kaustas õige mäng või programm
  • Looge sde.exe otsetee. Seejärel avage otsetee omadused ja lisage objekti parameeter - vajalik .exe-fail. Näiteks: D:\Games\No Man"s Sky\Binaries\sde.exe" – NMS.exe. Viimase jutu järel peab olema tühik, vastasel juhul ei luba süsteem otseteed salvestada.
  • Samuti peaksite vahekaardi „Ühilduvus” otsetee atribuutides märkima suvandi „Käivita administraatorina”.
  • Salvestage otsetee ja käivitage see. Ilmub must aken, saate selle sulgeda. Mõne aja pärast peaks soovitud rakendus käivituma.