Videokaardid. Muutused renderduskvaliteedis. Välimus ja mõõdud

Päris pikka aega, Radeon HD 2000 seeria ajast, graafikaarhitektuur AMD protsessorid ei toimunud põhjapanevaid muudatusi enne, kui HD 6000 “Cayman” seeria AMD kasutas oma graafikalahenduste jaoks VLIW (Very Long Instruction Words) arhitektuuri, mis on suures osas töötlemisel väga tõhus. graafilised juhised, mis on 3D-graafika andmetöötluse aluseks, kuid on osutunud ebaefektiivseks üldotstarbelise andmetöötluse jaoks, kus GPU peab üldotstarbeliste rakenduste puhul järjekorda panema töid skalaarsete käskudega. Ja nüüd, alates HD 7000 seeriast, kasutab GPU uut mikroarhitektuuri - GCN (Graphics Core Next), mis on mõeldud peamiselt 3D-ga otseselt mitteseotud arvutuste tõhususe parandamiseks.

Näiteks teatud juhiste järjekorra täitmiseks kulutab VLIW4 arhitektuuri GPU kuus taktitsüklit, samas kui GCN arhitektuuri GPU täidab samu juhiseid vaid nelja taktitsükliga. Selle põhjal võib Radeon HD 7970 teoreetiline tippjõudlus ulatuda 7,5 korda suuremaks kui Radeon HD 6970, tänu uue GCN-i arhitektuuri arvutusressursside tõhusamale kasutamisele ja jaotusele.

GPU arhitektuur

Tahiti GPU on toodetud TSMC rajatistes täiustatud 28 nm protsessitehnoloogia abil. GPU struktuurne struktuur on näidatud alloleval pildil, nagu näete, et "Tahiti" kasutab 32 arvutusühikut (CU) 64 ALU-ga (aritmeetiline ja loogiline ühik) CU kohta, mis teeb kokku 2048 ALU-d 925 MHz, läbilaskevõime GPU 32-bitine matemaatilised arvutused ulatub 3,8 TFLOPS-i ja 947 GFLOPS-i kahekordse täpsusega GFLOPS-iga operatsioonide puhul.

L1 vahemälu tagab antud taktsagedusel ligikaudu 2 TB/s läbilaskevõimet, kasutades selle toetamiseks 768 KB L2 vahemälu.
Kuue 64-bitise mälukontrolleriga, mis moodustavad 384-bitise mälusiini ja kasutavad kiiret 1375 MHz GDDR5 mälu, on Radeon HD 7970 võimeline pakkuma muljetavaldavat 264 Gbps ribalaiust, mis on kuni 100 Gbps kiirem kui Radeon HD 6970.

Tahiti GPU-l on kaks uuendatud geomeetria mootorit, mis on optimeeritud tessellatsiooniks koos suurenenud tipupuhvri vahemäluga, mis parandab arvutusjõudlust 1,7–4 korda, sõltuvalt lähtetipule rakendatavate toimingute arvust.

AMD PowerTune tehnoloogia

Tahiti GPU üks huvitavaid uuendusi on PowerTune'i täiustatud toitehaldustehnoloogia, mis tagab otsese kontrolli GPU energiatarbimise üle. See tehnoloogia aitab luua kõrged sagedused GPU, saavutades mängudes suure jõudluse ja ärge kartke, et tarbimine võib ületada ohutuid piire. Sarnaseid tehnoloogiaid kasutati juba Radeon HD 5000 perekonnas, kuid need olid üsna primitiivsed ja muutsid Radeon HD 6900 GPU sagedust ja pinget astmeliselt, süsteem liikus kvalitatiivselt teisele tasemele.

GPU mõõdab pidevalt mõne millisekundilise intervalliga kõikide komponentplokkide koormust ja energiatarbimist ning teostab teostatava ülesande analüüsi põhjal automaatselt sagedust ja pinget, jäädes kindlaks määratud TPD piiresse ning võimalusel GPU taktsagedus suureneb.

Samuti on uuel GPU-l uus tehnoloogia - ZeroCore, mis võimaldab vähendada GPU energiatarbimist ooterežiimis. ZeroCore lülitab GPU unerežiimi, kui monitor ei saa arvutilt signaali.

AMD andmetel tarbib videokaart staatilise Windowsi keskkonna töötlemisel vaid 15 W ega tarbi energiat, kui monitorile pole signaali.

PCI Express 3.0

Radeon HD 7970 sisaldab PCI Expressi standardi (PCI-E 3.0) kolmanda põlvkonna tuge, mis peaks suurendama andmeedastuskiirust kuni 16 GB/s mõlemas suunas ja aitama kõrvaldada nõrkusi mõne raske rakendusega töötamisel.

Eyefinity 2.0

Uuendatud tehnoloogia toetab konfiguratsioone, kus on viis järjestikust horisontaal- või vertikaalpaigutusega ekraani. Nüüd võib keskmonitor olla vertikaalselt teistest suurem.

Toetatud samaaegne operatsioon Eyefinity, AMD HD3D ja CrossFire tehnoloogiad. “Kokkupandud” ekraani maksimaalne eraldusvõime on tõstetud 16384×16384 pikslini.

Radeon HD 7970

Tabelis on näidatud Radeon HD 7970 tehnilised omadused, võrreldes eelmise põlvkonna mudeliga - Radeon HD 6970. Tahiti GPU kõige olulisem uuendus on selle tootmine 28-nanomeetrilise tehnoloogia abil. Tahiti sisaldab 4,31 miljardit transistorit, mis on 63% rohkem kui tema eelkäijal Cayman, samas kui selle stantsi pindala on mõnevõrra kompaktsem - 365 versus 389 mm2. GPU taktsagedus on tõusnud 925 MHz-ni. Arvutusvõimsus on kasvanud ligikaudu 40%, 3,79 TFLOPS-ile. Tekstuuriühikute arv kasvas 96-lt 128-le, mis võimaldas saada tekstureerimiskiiruseks 118,4 GT/s.

Sarnaselt eelkäijale kasutab Radeon HD 7970 GDDR5 1375 MHz (5500 MHz) mälu, kuid 384-bitise siiniga, tänu millele suurendatakse mälu ribalaiust 176-lt 264 GB/s-le.

Radeon HD 7970 tehnilised andmed

Nimi Radeon HD 7970
Tuum Tahiti
Protsessi tehnoloogia (µm) 0.028
Transistorid (miljonid) 4312
Tuumsagedus 925
Mälu töösagedus (DDR) 5500
Siini ja mälu tüüp GDDR5 384-bitine
Ribalaius (Gb/s) 264
Ühendatud varjutusüksused 2048
Ühtne varjundi sagedus 925
TMU konveieril 128
ROP 32
Täitemäär (Mpix/s) 29600
Täitemäär (Mtex/s) 118400
DirectX 11
Mälu 3072
Liides PCI-E 3.0 x16

Välimus

Radeon HD 7970 jahutussüsteem ja üldine disain on esmapilgul sarnased Radeon HD 6970-ga, isegi mõõtmed (pikkus 26,25 cm ja laius 11,25 mm) on peaaegu identsed eelkäija mõõtmetega, kuid siiski HD 7970-l on mõned erinevused.

Videokaardi esikülg on kaetud läikiva plastikust korpusega, millel on erkpunane sisetükk ja eelkäijast “rafineeritum” disain.
C tagakülg Plaadil pole erinevalt Radeon HD 6970-st kaitsvat soojust hajutavat metallplaati.

Jahutussüsteem ise ei ole põhimõtteliselt muutunud, kuid sellel on mõned täiustused, mille eesmärk on parandada plaadi jahutamist. Jahutussüsteemi ventilaatoril on nüüd laiemad labad ja suurem tiiviku läbimõõt, arendajad eemaldasid tagapaneelilt teise DVI-pordi, et laiendada iluvõret kuuma õhu puhumiseks.

Kommentaaride jätmiseks peate olema sisse logitud.

Katsetulemused Metro 2033-s

Populaarses 3DMark 11 võrdlusaluses ei suutnud uus toode NVIDIA GTX 680-lt liidripositsiooni võtta, mis on kurb, arvestades, et mahajäämus on üsna märgatav. Batman AC-s on aga olukord juba mõnevõrra muutunud ja uus toode on haaranud juhtpositsiooni, mis annab lootust. Crysis 2 jahutab veidi HD 7970 GHz Editionit ja võimaldab ühe kaadri võrra edasi jõuda vaid eraldusvõimega 2560x1440.

Teises "Maffias" kordub olukord täielikult, uus toode võidab taas eraldusvõimega 2560x1440, kuid kaotab eraldusvõimega 1920x1080. Lost Planet 2-s osutub NVIDIA GTX 680 tugevamaks ja jätab uue toote teisele kohale.

Lühikese testi tulemuste põhjal oli skoor AMD Radeon HD 7970 GHZ Editioni ja NVIDIA GTX 680 vahel 100%. Sellest võime järeldada, et kaartidel on ligikaudu sama jõudlus ja kui teil on konkreetsed eesmärgid, siis peaksite enne ostmist tutvuma testitulemustega, et mitte eksida.

Järeldus

Niisiis, tutvusime AMD Radeon HD 7970 GHz Edition videokaardiga. Selle ainus erinevus "tavalisest" on GPU ja VRAM-i suurenenud taktsagedus.

Sellist lähenemist probleemi lahendamisele on praktiseeritud väga pikka aega. Saate värskendusi meeles pidada ATI videokaardid Radeon X800 XT kuni X850 XT, mis samuti ainult kasvas kella kiirused. Kuna vooprotsessorite arv ei ole muutunud ja kõik muud omadused pole muutunud, on see lihtsaim viis jõudude tasakaalu muutmiseks turul, mis ei nõua muud kui BIOS-i värskendused. Sisuliselt on tegemist pettusega, sest NVIDIA suudab ka sagedusi saja megahertsi võrra tõsta ja milleni see kaasa toob? Teisest küljest on sõjas kõik vahendid head.

Jätame kellasageduse tõstmise teema ja pöördume hinna poole. Kui nüüd ainult AMD ettevõteÜlekiirendatud versiooni eest poleks tahtnud 50 dollarit juurde maksta, siis kindlasti ei kurtnud ja arvestades, et suvaline HD 7970 viib GPU sageduse 1050 MHz peale, tundub selline samm veidi kummaline. Nii või teisiti õnnestus meil NVIDIA GTX 680-le järele jõuda ja see tekitab juba konkurentsi, mis tähendab, et see on kasulik meile kõigile.

Graafikakaardi temperatuuritabel

Isegi kui uus toode ei näitaks parimaid "temperatuure", suudaksime pärast nii kõrgeid tulemusi andestada. Kuid meie suuremeelsus pole vajalik. Radeon HD 7970 kuumeneb vähem kui tema eelkäija (Radeon HD 6970) ja on palju suurema jõudlusega. Samal ajal, nagu ma eespool ütlesin, kui te ise ventilaatori kiirust ei muuda, peate kaardi kuulmiseks kõvasti proovima. Arvan, et suletud juhtumiga on see täiesti võimatu.

Ülekiirendamisel on temperatuurid madalamad kui standardseaded, tänu samale käsitsi kiiruse suurendamisele stabiilsuse tagamiseks.

Muide, meil on veel mitu sama videokaardi testimist alternatiivse CO-ga ja erineval süsteemil. Saate vaadata tulemusi, et mõista, kuidas kaasaegsed protsessorid mõjutada jõudlust populaarsetes rakendustes. Väärib märkimist, et ASUSe videokaardi varujahutussüsteem kaotas XFX kahe ventilaatoriga süsteemile nimiväärtusest vaid ühe kraadi, see on hea tulemus.

Järeldus

ASUS HD 7970 videokaardi ülekiirendamine oli meeldiv üllatus. Graafikaprotsessor kiirendas vaikesageduselt 925 MHz 1200-le ilma pinget suurendamata. See on kiirendamise ajal nii suure jõudluse kasvu põhjus. Ausalt öeldes on see väga meeldiv hetk. Viimasel ajal on videokaardid aina hullemini ülekiirendamas, mistõttu vajadus kiirendamise järele on kadumas: kui videokaart vaikimisi mängu ei jookse, siis kehv 50 MHz kiirendamine olukorda ei paranda. See on selgelt erinev juhtum.

Ainus, mis uue toote puhul segadusse ajab, on üüratu müratase käsitsi kiiruse suurendamisel. Ja see on vajalik edukaks kiirendamiseks, vastasel juhul on teil kõik võimalused videokaardi põletamiseks. Kuid ma arvan, et aja jooksul see probleem lahendatakse - ilmub palju alternatiivseid jahutussüsteeme. Peaasi, et ülekiirendamise potentsiaal ei ole halvemaks muutunud.

Suur jõudlus, madal soojusenergia tootmine ja uued patenteeritud tehnoloogiad muudavad AMD Radeon HD 7970 videokaardi tänapäeval parimaks ühe protsessoriga videoadapteriks. Pealegi konkureerib uus toode ülekiirendamisel kergesti kahe protsessoriga koletisega Radeon HD 6990. Seega, kui tekib küsimus: “kumb on parem: HD 7970 või HD 6990?”, soovitan valida esimese variandi. Sellega ei teki teil CrossFireX-i aktiveerimisel probleeme, ei esine järske jõudluse langusi, nagu juhtub kahe peaga kaartide puhul. Kolm gigabaiti videomälu - kena boonus ostma. Kahjuks kasutatakse neid üliharva, kuid parem on nendega kui ilma.

Kokkuvõttes, ASUS videokaart HD 7970 õnnestus suurepäraselt ja jätab väga meeldiva mulje. Loodame, et uue rea jätk, mis ilmub peagi, rõõmustab meid mitte vähem.

Uued tippkiirendid tulevad turule alati mõni aeg pärast eelmiste väljakuulutamist, kuid seekord osutus ooteaeg varasemast pikemaks. Kuid täna on näha veel ühe liidri, kiirendi, mis on võimeline tõusma tippu, ületades senise liidri - ühe protsessoriga. Nvidia GeForce GTX 580. Tõsi, me räägime konkreetselt ühe protsessoriga 3D-kiirenditest: ärge unustage, et kahe protsessoriga omad on erilises nišis, mille hind on 800 dollarit ja rohkem, samuti oma nüansid. Arvata võib, et jõudluse kasv koos põlvkondade vahetumisega ei ületa poolteist korda, seega ei ületa uus toode kindlasti ka eelmise põlvkonna kaheprotsessorilisi kiirendeid.

See kõik tähendab, et lugejatel on aeg harjuda võrdlema üht protsessorit ühe protsessoriga ning mitte oodata, kuni selline uus kiirendi kohale jõuab. absoluutne jõudluse rekord. Kui uutel tuumadel põhinevad vastavad kahe protsessoriga hiiglased, suudavad nad juba vallutada absoluutväärtused, mille 3D eelmised liidrid on saavutanud. Vahepeal unustame ära kahe protsessoriga mudelid oma hindadega, mis jäävad rahvast väga kaugele.

Niisiis, Radeon HD 7970, koodnimega tuntud ka kui Tahiti. Mida selle lahenduse väljund meile annab? Mis teile meeldib? Anname sõna Alexey Berillole, ta räägib teema teooriast.

1. osa: teooria ja arhitektuur

See on lõpuks tehtud! Kuude pikkune ootamine uute 28 nm tehnoloogiliste standardite järgi toodetud uute GPU-de järele lõppes möödunud aasta lõpus. Oleme korduvalt kirjutanud probleemidest, mida tekitasid raskused ja viivitused uue tehnilise protsessi valdamisel, AMD ja Nvidia pidid välja laskma üha uusi vanadel GPU-del põhinevaid videokaartide mudeleid ning isegi vahelahenduste funktsionaalsuses kohandusi tegema. Näiteks Radeon HD 6900 seeria osutus üleminekuks Radeon HD 5800 teekonda alustanud arhitektuurilt täna välja kuulutatud täiesti uuele.

Varem või hiljem pidid probleemid uue lavastusega kindlasti lõppema ja nüüd, kui need pole veel täielikult kadunud, võimaldavad need vähemalt teatada värsked lahendused ja alustavad massilisi (nende massi ulatus on siiski küsimärgi all) tarneid. Aeg on käes – lõppude lõpuks on arvutimänguturul järjekordne väike buum seoses mängukonsoolide riistvara vananemisega, isegi kui arvestada mitmeplatvormiliste projektide domineerimist.

Isegi kui võtta puhtalt finantsnäitajad, ületas müük arvutimängude turul tänavu 15 miljardi dollari piiri ning kahe aasta jooksul ootavad analüütikud, et turu maht kasvab samas valuutas 20 miljardi dollarini. Samas on ka kiiresti kasvavaid turge, näiteks Hiina, mis on suurim arvutimängude turg – sealne müük ulatus 2010. aastal 4,8 miljardi dollarini. jah ja Venemaa turg on isegi lääne ettevõtete jaoks üks olulisemaid, piisab, kui meenutada spetsiaalsete piiratud väljalaskega videokaartide väljalaskmist, mis on mõeldud ka meie riigi jaoks.

On selge, et isegi kui võtta arvesse asjaolu, et enamik mänge on mitmeplatvormilised, muutuvad need graafiliselt keerukamaks. Paljude projektide arvutiversioonid näevad mitmes aspektis paremad välja kui nende konsoolikaaslased, ja mitte ainult ulatuslikumad, näiteks renderdamise eraldusvõime ja tekstuurid. Näiteks kuulus mäng Battlefield 3 kasutab paljusid DirectX 11 funktsioone renderduskvaliteedi parandamiseks. Kuivõrd see arendajatel õnnestub ja milliseid edusamme on tehtud pildikvaliteedi osas, pakub AMD vaadata selliseid näiteid nagu Battlefield ja Deus Ex seeriad:

Nagu näete isegi nendest väikestest ekraanipiltidest, on viimaste aastate kvaliteedihüpped üsna märgatavad. Kuid need muutuvad veelgi olulisemaks, kui võtta arvesse renderduseraldusvõime suurenemist kogu selle aja jooksul. Isegi kui võtta kolm aastat tagasi olukord, on turg sellest ajast saadik kaugele edasi astunud. Seega, kui 2008. aastal olid mängumonitoride turu peamised mudelid mudelid, mille ekraani suurus oli 22″ ja eraldusvõime 1680×1050 pikslit, siis 2011. aastal levisid laialt 24″ mudelid FullHD eraldusvõimega 1920×1080.

Kuid kõige huvitavam pole isegi ekraani suurus ja eraldusvõime. Kui 2008. aastal oli sellise ekraani hind umbes 360 dollarit, siis tänavu algavad 24-tolliste mudelite hinnad 170-180 dollarist. See tähendab, et ostja saab nüüd veidi suurema füüsilise ekraani, millel on peaaegu 20% rohkem piksleid, vähem kui poole odavamalt kui kolm aastat tagasi. halvim monitor. Seetõttu on FullHD eraldusvõimega seadmed turul juba levinuimaks muutunud – sest need on üsna odavad.

Teine viimaste aastate moekas suundumus on olnud energiatõhususe suurendamine. Kasutajad hääletavad tõhusate seadmete poolt, mis kasutavad võimalikult vähe elektrit. Need mõjutavad vähem keskkonda, mis mõjutab teadlike Maa kodanike meelt ja võimaldavad säästa raha elektriarvetelt, mis on väga oluline teistele vähem teadlikele inimestele. Ja AMD pöörab erilist tähelepanu oma GPU-de ja ka nendel põhinevate videokaartide energiatõhususe parandamisele.

Noh, ei saa jätta märkimata GPU-de olulist nihet mittegraafilise andmetöötluse (GGPPU) suunas. Kõik kaasaegsed graafikakiibid on nüüd loodud mitte ainult mängude jaoks, vaid ka arvutuslikult nõudlike ülesannete kiirendamiseks, mis sobivad hästi paralleelseks. Ja kuigi turu peamiseks veduriks selles suunas on Nvidia, mis toodab ainult arvutiturule mõeldud graafikakiipe, püüab AMD sammu pidada. Lisaks tipphetkel arvutusvõimsus Selle ettevõtte videokaardid on juhtpositsioonil. Teoreetiliselt saavutatava tootlikkuse tõusu võib jälgida diagrammil:

Nagu näete, on tippkiiruse hüpped iga uue tehnoloogilise protsessiga üsna märkimisväärsed. Arvestada tuleb ka sellega, et 28 nm protsessitehnoloogia on alles oma teekonda alustanud ning võib julgelt väita, et tulevikus see näitaja 3,79 teraflopsi oluliselt tõuseb.

Tehnilistest protsessidest rääkides on AMD GPU turul pioneer. Viimastel aastatel on see ettevõte kõigi uute tehnoloogiliste protsesside juurutamisel edestanud oma ainsat tugevat konkurenti Nvidiat. Ja nüüd olid nad esimesed, kes teatasid oma uuest tootest juba aastal 2011 (fotod kristallidest on kahjuks visandlikud):

28 nm on tänapäeval kõige arenenum kiibi tootmise tehnoloogia ja just seda tehnoloogiat kasutatakse täna välja kuulutatud AMD Radeon HD 7000 seeria videokiipide tootmiseks. Need lahendused toetavad kõiki kaasaegseid tööstusstandardeid: GDDR5, PCI Express, DirectX ja teised . Eelmine videokaartide seeria oli nii edukas, et AMD teatas hiljuti 100 miljoni DirectX 11 toega toote tarnimisest. Selle tulemusena on enam kui kahel kolmandikul kasutajate käes olevatest DX11-ga ühilduvatest videokaartidest ettevõtte valmistatud GPU.

Tänane maailma esimese liini väljakuulutamine näib olevat veelgi olulisem sündmus. graafika kiibid koodnimega "Lõunasaared" ("lõunasaared"), millel on tuge uuendatud PCI siinid Express 3.0 ja eelseisev DirectX 11.1. Allpool saate lugeda kõiki üksikasju sarja esimese videokaardi kohta, kuid nüüd räägime lühidalt uusimas reas sisalduvatest lahendustest.

seeria "Lõuna saared" sisaldab:

  • "Tahiti"- võimsaim lahendus, kõige keerulisem ja võimsam GPU Sel hetkel(sari Radeon HD 7900)
  • "Pitcairn"- keskmise hinnaga GPU, mis on mõeldud masskasutajatele (seeria Radeon HD 7800)
  • "Verde"- toode, millel on ületamatu hinna ja jõudluse kombinatsioon (väljastatakse nime all Radeon HD 7700)

Et täpselt aru saada, kuidas uued lahendused plaanitakse tootesarjas paigutada, pakub AMD järgmise slaidi (vertikaalne asend peegeldab lahenduste jõudlust, horisontaalasend näitab väljalaskeaega):

Nagu näha, jätkavad järgmisel aastal oma elu ka Radeon HD 6300, HD 6400, HD 6500 ja HD 6600 liinide juuniorvideokaardid. Kuid võimsamad lahendused asenduvad järk-järgult uute eeltoodud seeria videokaartidega, mis põhinevad esitatud arhitektuuril. Kuid täna tuleb välja vaid üks videokaart – Radeon HD 7900 liini võimsaim lahendus ja ülejäänud Southern Islands seeria kiibid jõuavad turule veidi hiljem – 2012. aasta esimese kvartali jooksul.

Eeldame, et enne selle materjali lugemist on lugejatel kasulik tutvuda detailne info ettevõtte varajaste videokiipide kohta meie veebisaidi järgmistes artiklites:

  • AMD Radeon HD 6950/6970: veidi nõrgem kui Geforce GTX 570/580, aga ka odavam
  • AMD Radeon HD 6870 ja HD 6850: teoreetiline teave uute lahenduste kohta keskmise hinnaga sektorile
  • ATI Radeon HD 5870: võimas mõju Kanadast – ATI (AMD) annab välja uue 3D-graafika kuninga
  • ATI Radeon HD 4870 (RV770): AMD võimsaim ühe GPU-ga 3D kiirendi

Noh, nüüd jätkame täna avalikustatud Radeon HD 7900 seeria esimese videokaardi tehniliste omaduste kirjeldamisega, mis põhinevad täiesti uuel GPU-l koodnimega Tahiti.

Radeon HD 7900 seeria graafikakiirendid

  • Kiibi koodnimi: "Tahiti"
  • Tootmistehnoloogia: 28 nm
  • 4,3 miljardit transistorit (üle 60% rohkem kui Caymanil ja täpselt kaks korda rohkem kui küpressil)
  • Ühtne arhitektuur koos tavaliste protsessorite massiiviga mitut tüüpi andmete vootöötluseks: tipud, pikslid jne.
  • DirectX 11.1 riistvaratugi, sealhulgas Shader Model 5.0
  • 384-bitine mälusiin: kuus 64-bitist laiust kontrollerit, mis toetavad GDDR5 mälu
  • Tuumakell: kuni 925 MHz (Radeon HD 7970 jaoks)
  • 32 GCN-i arvutusüksust, sealhulgas 128 SIMD-tuuma, mis koosnevad kokku 2048 ALU-st ujukomaarvutuste jaoks (täisarvude ja ujuvvormingud, FP32 ja FP64 täpsuse tugi IEEE standard 754)
  • 128 tekstuuriühikut, mis toetab trilineaarset ja anisotroopset filtreerimist kõigi tekstuurivormingute jaoks
  • 32 ROP-seadet, mis toetavad antialiasing-režiime ja mille programmeeritav diskreetimine on üle 16 proovi piksli kohta, sealhulgas FP16 või FP32 kaadripuhvervorminguga. Maksimaalne jõudlus kuni 32 näidist kella kohta ja ainult Z režiimis - 128 proovi kella kohta
  • Integreeritud tugi kuuele monitorile, sealhulgas HDMI 1.4a ja DisplayPort 1.2

Radeon HD 7970 graafikakaardi tehnilised andmed

  • Tuuma sagedus: 925 MHz
  • Kogus universaalsed protsessorid: 2048
  • Tekstuuriplokkide arv: 128, segamisplokkide arv: 32
  • Tõhus mälusagedus: 5500 MHz (4x1375 MHz)
  • Mälu tüüp: GDDR5
  • Mälu maht: 3 gigabaiti
  • Mälu ribalaius: 264 gigabaiti sekundis.
  • Teoreetiline maksimaalne kiirus Täitmiskiirus: 29,6 gigapikslit sekundis.
  • Teoreetiline tekstuuri diskreetimissagedus: 118,4 gigatekseli sekundis.
  • Kaks CrossFire pistikut
  • PCI Express 3.0 siin
  • Pistikud: DVI Dual Link, HDMI 1.4, kaks Mini-DisplayPort 1.2
  • Energiatarve: 3 kuni 250 W
  • Üks 8-kontaktiline ja üks 6-kontaktiline toitepistik
  • Kahe pesa disain
  • USA MSRP: 549 dollarit

Kohe juhitakse tähelepanu uue kiibi tohutule keerukusele - 4 312 711 873 transistorit (see on ülitäpne vorm, milles see arv on AMD materjalides antud - tõenäoliselt käsitsi loendatud), mis on üle poole vähem kui transistoride arvus. eelmine tipptasemel graafikaprotsessor. Nii keerulise kristalli valmistamise võimalus sai võimalikuks tänu uusima 28 nanomeetrise protsessitehnoloogia kasutamisele, uus kiip on pindalalt isegi pisut väiksem kui Caymanil. Kuid peaaegu kõik jõudlust mõjutavad omadused on märgatavalt paranenud: ALU-de, TMU-de ja mälusiinide arv. Ainult ROP-plokkide arv ei suurenenud ja GDDR5 videomälu sagedus jäi samale tasemele. Tänu suurenenud täitmisüksuste arvule, suurenenud efektiivsusele ja suurenenud GPU taktsagedusele peaks see kõigis rakendustes Caymanist märkimisväärselt ületama.

Ettevõtte videokaartide nimetamise põhimõte jäi samaks, jätkates eelmise seeria trendi, kus tipplahenduste indeksi teine ​​number muutus 8-lt 9-le. Radeon HD 7970 on kõige produktiivsem ühekiibiline lahendus ettevõttest tuleb mõne aja pärast välja ka juuniormudel HD 7950, kuid täna teatati, et seda ei tehta. Selge see, et HD 7970 oma spetsifikatsioonidega lihtsalt ei oma turul konkurente ja ei asenda veel ühtegi AMD liini videokaarti (kui just HD 6990 kohe maha ei kirjuta), vaid pigem nihutab allapoole. Võrdluseks konkurendiga pole Nvidia 28-nanomeetrine lahendus veel valmis ja seda tuleb veel paar kuud oodata. Vahepeal peab GeForce GTX 580 räppima, püüdes konkureerida HD 7950-ga, kuid selgelt mitte HD 7970-ga.

Uus AMD videokaart on varustatud sama GDDR5 mäluga (kuigi räägiti Rambuse väidetavalt täiesti erinevat tüüpi mälust, kuid AMD esindajad ei kommenteeri neid isegi), kuid eelmise põlvkonna 2 gigabaidi asemel helitugevus on kasvanud 3 gigabaidini. See juhtus tänu mälusiini laiendamisele 256-bitiselt 384-bitiseks. Ja nüüd edasi uus juhatus Saate panna kas 1,5 GB või 3 GB. Loomulikult oleks turunduse seisukohast väiksema mahu installimine selge lüüasaamine ja otsustati installida 3 GB, kuigi täna on see selgelt liialdatud. Ainult ülikõrgete eraldusvõimete ja MSAA 16x puhul ei piisa 1,5–2 GB-st. AMD-l on aga ka Eyefinity ning kolme, viie või kuue monitori mängude puhul võtab ekraanipuhver tohutult ruumi. Võib-olla tuleb kunagi kulude vähendamiseks välja noorem Radeon HD 7950 mudel 1,5 GB mäluga, kuid kindlasti mitte vanem.

Niisiis, vaatame kas või Radeon HD 7970. Uuel ülemise hinnaklassi videokaardil on kahepesaline jahutussüsteem, mis on kogu kaardi pikkuses kaetud kõikidele kaasaegsetele AMD plaatidele tuttava plastikust korpusega. Kuid ainult selle korpuse disain on veidi muutunud tagaosa kõik läheb ikka trükkplaadist kaugemale. Kuid tihvtidega riba kujundust muudeti - videokaardi jahutamise parandamiseks hõivas üks kahest pesast (pool ribast) eranditult soojuse eemaldamiseks mõeldud ventilatsiooniavaga.

Kuid kasutajad ei tohiks kannatada otse plaadile joodetud DVI-pistikute arvu vähenemise pärast. Nende mugavuse huvides on komplektis spetsiaalne HDMI-DVI adapter, mis võimaldab ühendada kaks DVI-pistikuga monitori. Muide, uue kaardi voolutarve pole väiksem kui Radeon HD 6970 omal, nii et see tuli varustada ühe 8-kontaktilise ja ühe 6-kontaktilise toitepistiku komplektiga.

Aga sisse uus Radeon HD 7970 jahutussüsteem on muutunud paremaks. Kasutatakse uue põlvkonna aurustuskambrit ja uus jahuti suurem suurus, muudetud tera kuju ja suurema jõudlusega (pakutakse rohkem õhuvoolu). Tulemuseks on jahuti efektiivsuse tõus, vähendades samal ajal müra.

Kahe BIOS-i püsivara lüliti, millest me kirjutasime Radeoni ülevaade HD 6900. Lühidalt: videokaardil on kaks BIOS-i versiooni, millest üks on püsivara kohandatud välguga ja teine ​​tehases kõvakodeeritud püsivaraga. See mugav lahendus Nii kasutajatele kui ka AMD-le endale meeldis see nii väga, et ta otsustas jätkata nende varustamist tipptasemel lahendustega.

Võib öelda ainult tere see otsus, mis aitab tõesti erinevatel juhtudel, mis on seotud ootamatute probleemidega vilkumise ajal (näiteks elektrikatkestus protsessi ajal) ja võimaldab kartmatult läbi viia erinevaid katseid BIOS-i piltidega. Pole üllatav, et AMD vihjab taas suurepärastele kiirendamisvõimalustele. uus videokaart:

Nagu näete, on ülekiirendamine sagedusele 1 GHz ja kõrgemale praktiliselt lubatud, kui te ei võta arvesse väikest kirja (see ei olnud raami sees, kuid on olemas), et garantii lakkab kehtimast isegi siis, kui videokaart ebaõnnestub videodraiveri sätetest sageduste tõstmise katse tulemusena. Muide, uut slaidi on huvitav võrrelda lehega ammu lahkunud Radeon HD 4890 esitlusest:

Lihtsalt silmatorkav sarnasus (slaidi paigutuses ja kujunduses), kas pole? Kahjuks pole sellest ajast saadik, kuigi uusi tehnilisi protsesse on õpitud, õnnetu gigahertsi võrdlussagedustega lõpptoodetes saadaval. Kuid tundub, et seal on 28 nm ja selgelt paranenud jahutus, kuid ei - jälle natuke, aga nad ei saanud hakkama. Teisest küljest on kasutajal vabal ajal midagi teha.

Radeon HD 7970 arhitektuurilised omadused

Lõunasaarte arhitektuuriliste modifikatsioonide asjakohasuse hindamiseks vaatame esmalt GPU-de arengut viimastel aastatel (AMD poolt). Enne 2002. aastat olid graafikakiibid spetsiifiline riistvara, mis oli võimeline töötlema ainult graafikat. Tollased videokiibid olid piiratud funktsionaalsusega, nad said rakendada ja filtreerida ainult tekstuure, töödelda geomeetriat ja teostada primitiivset rasterdamist ning seetõttu ei sobinud need üldse universaalsete arvutusülesannete jaoks.

Järgmise paari aasta jooksul lisati GPU-le põhiline programmeeritavus, kuid keskenduti ka ainult graafikaülesannetele. See oli aeg, mil toetati DirectX 8 ja 9, piiratud funktsionaalsusega varjutusprogramme, millel on võimalus arvutada ja ujukoma. Tollastel videokiipidel olid tippude ja pikslite töötlemiseks spetsialiseerunud ALU-üksused, samuti spetsiaalsed vahemälud pikslite, tekstuuride ja muude andmete jaoks. Mitmekülgsus polnud ikka veel ligilähedanegi.

Alles 2007. aastal omandas AMD ühtse DirectX 10 varjutusarhitektuuri ja ka võimaluse programmeerida GPU-d spetsiaalsete tööriistade abil: CAL, Brook, ATI Stream. Tollastel GPU-del oli juba täiustatud vahemälu ning kohalike ja globaalsete jagatud andmete tugi. Arhitektuuriliselt põhinesid kiibid VLIW5 ja VLIW4 plokkidel, mis olid piisavalt paindlikud mõne põhilise mittegraafilise arvutuse jaoks, kuid keskendusid siiski graafika algoritmidele.

Nüüd on aeg uue arhitektuuri jaoks, mis sobib veelgi paremini üldotstarbeliseks andmetöötluseks. Graphics Core Next (GCN). See on AMD jaoks uus arhitektuuriajastu, mistõttu see nimi valitigi. Uued GPU-d pakuvad suurepärast graafikatöötluse võimekust ja jõudlust, kuid tehtud arhitektuurimuudatused on mõeldud eelkõige positsioonide parandamiseks mittegraafilises andmetöötluses – suurendades jõudlust ja tõhusust keerukate üldotstarbeliste ülesannete puhul. Uus disain GPU on mõeldud nn heterogeenseks andmetöötluseks – segu graafilisest ja üldotstarbelisest andmetöötlusest multitegumtöökeskkonnas. GCN-i arhitektuur on muutunud paindlikumaks ja peaks veelgi paremini sobima erinevate ülesannete energiasäästlikuks täitmiseks.

Uue arhitektuuri põhiplokk on GCN-plokk. Nendel "ehitusplokkidel" põhinevad kõik uued Southern Islandsi seeria graafikaprotsessorid. AMD graafikakiipide arhitektuur kasutab esmakordselt mitte-VLIW-disaini, kasutab vektor- ja skalaarühikuid ning üks olulisemaid muudatusi on see, et igal GCN-arvutusüksusel on oma ajakava ja see suudab täita erinevatest programmidest pärit juhiseid. (tuum).

Uus andmetöötlusarhitektuur on loodud arvutusüksuste laadimise suure tõhususe jaoks mitme ülesandega keskkonnas. GCN-i arvutusüksus on jagatud neljaks alajaotuseks, millest igaüks töötab igal kellatsüklil oma käsuvoo alusel. Lõimed võivad kasutada ka GCN-i pakutavat skalaarplokki voo juhtimiseks või kursori toimingute jaoks. Vektor- ja skalaarplokkide kombinatsioon pakub väga lihtsat programmeerimismudelit. Näiteks funktsiooni- ja viruviiteid on palju lihtsam programmeerida ning kompilaatori ülesanne on nüüd oluliselt lihtsustatud, kuna täitmisühikud on skalaarsed.

Igal GCN-i plokil on spetsiaalne kohalik salvestusruum 64 KB andmeid andmete vahetamiseks või registrite lokaalse virna laiendamiseks. Plokk sisaldab ka lugemis- ja kirjutamisvõimalustega esimese taseme vahemälu ning täisväärtuslikku tekstuurikonveieri (proovivõtu- ja filtreerimisüksused). Seetõttu on uus arvutusüksus võimeline töötama iseseisvalt, ilma keskse planeerijata, mis varasemates arhitektuurides vastutas töö üksuste vahel jaotamise eest. Nüüd on kõik GCN-i plokid võimelised ise käske planeerima ja levitama.

AMD varasemad GPU arhitektuurid kasutasid VLIW4 ja VLIW5 arhitektuurimudeleid ja kuigi need on piisavalt head graafilised ülesanded, kuid ei ole universaalse andmetöötluse jaoks piisavalt tõhusad, kuna sellistes tingimustes on väga raske kõiki täitmisüksusi tööga laadida. Uus GCN-i arhitektuur pakub sama suur hulk täitmisühikud, kuid skalaarse täitmisega, mis eemaldab registrite ja käskude piirangud ja sõltuvused. Üleminek VLIW-arhitektuurilt skalaarsele täitmisele lihtsustab oluliselt koodi optimeerimise ülesandeid.

Käskude täitmisel eelmisel VLIW4 arhitektuuril peab kompilaator tegelema registrikonfliktidega, teostama koodi koostamise etapis käskude keerulist jagamist täitmisüksustele jne. Samas nõuab suure jõudluse saavutamine sageli mittetriviaalset optimeerimist, mis sobib enamiku graafikaülesannete jaoks ja palju vähem paindlik muudeks arvutusteks. Uus arhitektuur pakub olulist arendus- ja tugiteenuste lihtsustust, lihtsustatud loomist, analüüsi ja vigade püüdmist madala taseme koodis, stabiilset ja prognoositavat jõudlust.

Mälu vahemälu alamsüsteem

Ribalaiust, mälu ja vahemälu pole kunagi piisavalt ning alati on vajadus ja meetodid nende suurendamiseks. AMD uued GPU-d kasutavad täielikku kahetasandilist lugemis-/kirjutusvahemälu. Igal arvutusüksusel on 16 kilobaiti esimese taseme vahemälu ja teise taseme vahemälu kogumaht on 768 kilobaiti (kokku on kiibil 512 KB L1 ja 768 KB L2), mis on 50% rohkem kui eelmisel kiibil. , millel pole L2 vahemälus üldse kirjutamisvõimalusi.

Toimivuse osas suudab iga GCN-i arvutusüksus ühe taktitsükli jooksul vastu võtta või kirjutada 64 baiti andmeid L1 vahemällu või globaalsesse mällu, mida kasutatakse andmete vahetamiseks käsulõimede vahel. Teise taseme L2 vahemälu iga sektsioon on võimeline edastama ja vastu võtma sama palju andmeid. Selle tulemusena toodab ettevõtte tipptasemel GPU L1 jaoks 2 terabaiti/s ja L2 jaoks 700 GB/s, mis on 50% rohkem kui eelmisel tipptasemel. AMD lahendused.

Tahiti GPU

Nüüd, kui oleme vaatlenud uue Southern Islands seeria madalatasemelisi arhitektuurilisi muudatusi, on aeg liikuda edasi liini võimsaima lahenduse Radeon HD 7900 detailide juurde, mis sisaldab kahte mudelit. Kõigepealt pangem tähele uue graafikaprotsessori keerukust, sest see sisaldab enam kui 4,3 miljardit transistorit, mis on kaks korda rohkem kui Radeon HD 5870 aluseks olevas kiibis! Loomulikult sai selline võimas kiip võimalikuks ainult tänu uue 28 nm protsessitehnoloogia kasutamisele. Mis tal siis sees on?

Geomeetriliste klotside arv pole muutunud, võrreldes Caymaniga on neid endiselt kaks, kuid nende töö efektiivsus on oluliselt suurenenud - sellel peatume veidi hiljem. GPU diagrammil näeme Radeon HD 7970-s saadaolevaid 32 GCN-i arhitektuuri arvutusüksust ja madalama lahenduse puhul lülitatakse osa neist välja. Kui arvestada lahenduse tipparvutusjõudlust, on see peaaegu 3,8 teraflopsi (ujukomatoimingud sekundis), mis on GPU seni absoluutne rekord.

Iga GCN-i plokk sisaldab 16 tekstuuriühikut, mis annab lõplikuks arvuks 128 TMU kiibi kohta ehk rohkem kui 118 gigatekseli sekundis – ja see on järjekordne tänase päeva rekord ja see pole viimane. Kuid ROP-plokkide arv pole muutunud, neid on endiselt 32 8 suurendatud RBE-plokis. Veel üks huvitav arhitektuuriline muudatus on see, et ROP-plokid ei ole nüüd "kinnitatud" mitte mälukanalite külge, nagu varem, vaid GCN-plokkidega.

Kuigi teoreetiliselt on kaadripuhvri kirjutamiskiirus jäänud peaaegu muutumatuks ja maksimaalne võimalik on sama 32 värviväärtust ja 128 sügavuse väärtust kella kohta, on praktiline täituvus reaalmaailma rakendustes tänu suurenenud olekule oluliselt suurenenud. mälu ribalaius. AMD mõõtmiste järgi salvestas Cayman ainult 23 pikslit kella kohta, samas kui uus Tahiti jõudis teoreetilise 32 piksli lähedale.

See on arusaadav, sest AMD uuel videokiibil on 384-bitine mälusiin – kuus 64-bitist kanalit, nagu ka konkurendi praegusel tipplahendusel. Just see poolteist korda suurem mälu ribalaius võimaldab suurendada tekstuuri toomise ja kaadripuhvrisse kirjutamise tegelikku kiirust. Ribalaius 264 GB/sek peaks aitama välja pigistada lähedased teoreetilised näitajad 118 gigapikslit/sek ja 30 gigapikslit/sek ning praktilises osas me seda kontrollimegi.

Tessellatsiooni ja geomeetria töötlemine

Arhitektuurilisest vaatenurgast pole Tahiti geomeetriliste plokkide juures pärast Kaimanit suurt midagi muutunud. Geomeetriliste andmete töötlemiseks (tippude seadmiseks ja tesselleerimiseks) ja rasterdamiseks kasutatakse endiselt kahte plokki ning skeem on väga sarnane varem nähtule, välja arvatud see, et tessellaatoreid nimetatakse 9. põlvkonnaks:

Vaatamata skemaatilisele sarnasusele, viimane põlvkond Need plokid on võimelised märkimisväärselt suuremat tessellatsiooni ja geomeetria töötlemise jõudlust, kuna plokid on läbinud olulisi muudatusi. Kuigi tippjõudlus kasvas vaid peaaegu kahe miljardi tipuni ja primitiivini sekundis (925 MHz ja kaks tippu kella kohta), tõeline esitus kasvas rohkem. See saavutati vahemälu suurendamise, geomeetriaandmete puhverdamise parandamise ja tipuandmete taaskasutamise teel.

Selle tulemusel paraneb tessellatsiooni jõudlus kõigis kolmnurga suhetes eelmise põlvkonna Radeon HD 6970-ga võrreldes kuni neli korda. Kuid nelja korda ei saavutata kõigil juhtudel, isegi AMD enda diagrammil:

Diagramm võrdleb Radeon HD 7970 ja HD 6970 tessellatsiooni jõudlust jaotustegurite vahemikus 1 kuni 32. Ja nagu näete, on jõudluse erinevus 1,7 kuni 4 korda. Kuid see on sünteetiline. Ja reaalsusele lähemale jõudmiseks esitame rohkem andmeid mängurakenduste tessellatsioonikiiruse kohta:

Nagu näete, toetavad mängunumbrid hästi AMD sünteetilisi numbreid - jõudlus reaalsetes rakendustes, kus on "raske" tessellatsioon, on märkimisväärselt suurenenud. See on väga hea tulemus, mida me praktilises osas kindlasti ka kontrollime, kasutades sünteetika ja mängurakendused.

Mittegraafiline andmetöötlus

Heterogeensete ja mittegraafiliste arvutusülesannete seisukohalt on kahe asünkroonse arvutusmootori (Asynchronous Compute Engines – ACE) tekkimine väga oluline. Need on loodud töö ajastamiseks ja jaotamiseks täitmisüksuste vahel tõhusaks multitegumtööks ja töötamiseks koos graafilise käsuprotsessoriga (käsuprotsessor).

Radeon HD 7900-l on kaks sõltumatut andmetöötlusmootorit ja üks graafikamootor. Kokku annab see kolm programmeeritavat plokki ja kolm käsuvoogu, mis on üksteisest täiesti eraldiseisvad. Lisaks asünkroonsele käskude edastamisele kiireks kontekstivahetuseks on uuel GPU-l ka kaks Caymanis kasutusele võetud kahesuunalist otsemälu juurdepääsu (DMA) kontrollerit. Need kaks kontrollerit on vajalikud uue PCI Express 3.0 siini täielikuks ärakasutamiseks.

Nagu me teame, ei ole tõsise arvutamise seisukohalt oluline mitte ainult ühe täpsusega ujukomatehte sooritamise kiirus, vaid ka topelttäpsus. Ja uus AMD arhitektuur saab selle ülesandega päris hästi hakkama. Praegu eeldatakse, et GCN-i arvutusüksustel on kaks versiooni, millel on erinev FP64 käskude täitmise kiirus. Vanemate GPU-de puhul on täitmissagedus 1/4 FP32 kiirusest ja nooremate kiipide puhul 1/16, mis on ühilduvuse säilitamiseks täiesti piisav, kuid ei muuda odavaid lahendusi liiga keeruliseks. Tänu sellele on Radeon HD 7970 võimeline tegema 947 miljardit topelttäpsust sekundis (oi, need jäid lihtsalt teraflopile alla!) – see on uue AMD kiibi järjekordne kõrgeim saavutus.

Pealegi pole need samad gigaflopid nagu eelmiste arhitektuuride puhul, vaid “paksumad”. Lõppude lõpuks peaks uue GPU efektiivsus keerulistes arvutusülesannetes oluliselt tõusma. Esiteks on täiustatud mälu ja vahemälu alamsüsteemi. Teiseks on igal GCN-i arvutusüksusel oma planeerija, mis peaks parandama hargnemiskoodi täitmist ja üldist tõhusust. Noh, kolmandaks märgime ära skalaarse täitmise, mis ei nõua kompilaatorilt keerulisi optimeerimisi, mille tulemusena jäävad arvutusüksused jõude palju harvemini. Selle tulemusel on uuel kiibil mis tahes ülesannete puhul lihtsam näidata kõrget jõudlust ja ALU koormust.

Muude arvutusvõimalustega seotud uuenduste hulgas märgime ära täieliku ECC toe DRAM-ile ja SRAM-ile. Tarkvara poole pealt on oluline, et Tahiti on esimene GPU, millel on täielik tugi uutele API versioonidele: OpenCL 1.2, DirectCompute 11.1 ja C++ AMP ning nende võimalused. Näiteks OpenCL 1.2 võimaldab ühendada mitme arvutusseadme võimalused üheks ja AMD on juba välja andnud selle toetuse AMD APP SDK 2.6 ja Catalyst 11.12 draiveri näol.

Arhitektuuri jõudlus ja tõhusus

Pärast kõigi arhitektuuriliste uuenduste ülevaatamist Southern Islandi seeria tipptaseme kiibi näitel on aeg rääkida kõigi nende muudatuste tõhususest. On selge, et uute kiipide jõudlus on palju suurem kui eelmistel, vastupidine oleks üsna üllatav. Küsimus on selles, kui palju kiiremini. Erinevates ülesannetes on tulemused vahemikus 40-50% (minimaalselt!) kuni viiekordse erinevuseni. Arhitektuuri täiustused võimaldavad ületada teoreetilise 1,4-kordse erinevuse rumalate gigafloppide osas. Vaatame seda näidetega:

Diagramm võrdleb uut tipplahendust ja eelmist ühekiibiga lahendust: Radeon HD 7970 ja HD 6970, mis on üsna aus. Valitud jõudlustestid on erinevad: SmallptGPU ja LuxMark on kiirte jälgimine OpenCL-is, SHA256 on turvaline räsimisalgoritm ja AES256 on sümmeetriline krüpteerimisalgoritm. Noh, Mandelbrot on tuntud probleem, mis on arvutatud kahekordse täpsusega.

Vertikaalne katkendjoon graafikul tähistab teoreetilist jõudluse erinevust, kuid kiirusandmed näitavad, et kolmes ülesandes viiest oli uue GPU kiirus oluliselt suurem. Selle põhjuseks on kõik efektiivsuse suurendamisele suunatud muudatused: VLIW-st eemaldumine, igas arvutusüksuses planeerija olemasolu, vahemälu parandamine jne.

Muudatused renderduskvaliteedis

Tegelikult oleks võinud selle osa vabalt vahele jätta, kuna viimasel ajal pole pildikvaliteedi osas erilisi etteheiteid olnud ja ei saagi olla - erinevatel põhjustel. Näiteks erinevate tootjate videokaartide täisekraani aliasingu kvaliteet on väga sarnane, eriti kui arvestada järeltöötlusfiltreid kasutavate tarkvaraliste antialiasi meetodite laialdast kasutamist, mida teostatakse kõikidel GPU-del täpselt samamoodi.

Sama kehtib ka tekstuurifiltrimise kohta – nüüd on selle kvaliteet selline, et AMD ja Nvidia lahendustel on väga raske vahet teha isegi pikslite kaupa võrdlust tehes. Radeon HD 6900 - ettevõtte eelmise põlvkonna - anisotroopne filtreerimine on veidi paranenud ja nüüd ei aita isegi “mikroskoop” sealt olulisi puudusi leida. Ainus märkus on see, et liikumisel jäid Radeoni videokaardid Geforce'ile pisut alla märgatavamate spetsiifiliste artefaktide, nagu "müra" või "liiv" tõttu.

Uue põlvkonna videokiipide väljalaskmisel vaadati uuesti üle tekstuurifiltris olevad tekseli kaalud, muutes neid nii, et vähendada selliseid artefakte, mis on mõnikord Radeon HD 6900-s nähtavad teatud tüüpi tekstuuride juuresolekul ("kõrge" -sagedus”, näiteks teravate üleminekutega tumedast heledaks). Kvaliteedi muutusi on nii raske näidetega näidata, et AMD ei paku HD 7900 ja HD 6900 võrdlevaid pilte, vaid lihtsalt võrdleb "riistvara" algoritmi kvaliteeti puhtalt tarkvaralise algoritmiga, mida käivitatakse GPU vooprotsessorites ja seega ideaalne:

Nii väikesel ekraanipildil pole kvaliteedierinevust näha, kuid AMD kinnitab, et kõik tehtud muudatused ei toonud kaasa jõudluse langust ega halvendanud pildikvaliteeti ühestki aspektist – see ei sõltu siiski vaatenurgast ja filtreerimise kvaliteet on ideaalilähedane. Ühes tulevikus praktilised materjalid vaatame kindlasti üle.

Osaliselt püsivad tekstuurid

Osaliselt elavate tekstuuride (PRT) idee on kasutada esitatud GPU riistvaravõimalusi - Virtuaalne mälu. Kindlasti on paljud kasutajad juba näinud mängu RAGE by id Software, mis kasutab virtuaalset tekstureerimistehnoloogiat ehk nn megatekstuuri (“MegaTexture”), mis võimaldab kasutada tohutul hulgal tekstuuriandmeid ja neid videomällu voogesitada.

Virtuaalset videomälu kasutades on sellistele algoritmidele väga lihtne hankida tõhusat riistvaratuge, mis võimaldab rakenduses kasutada kuni 32 terabaiti tekstuure, mis võimaldab luua mängudes unikaalseid asukohti ilma tekstuuritükke kordamata. ilma probleemideta tekstuuriandmete laadimisega. Tõsi, AMD toob selge näite, mis on liiga kummaline, millest midagi eriti selgelt ei selgu:

PRT võimaldab saavutada kõrget pildikvaliteeti ja aitab parandada videomälu kasutamise efektiivsust. Sarnaseid algoritme kasutatakse juba ID-tarkvara mootoris ja need peaksid ilmuma paljudes järgmise põlvkonna mootorites. Tulevikumängud peavad töötama tohutute andmemahtudega ja uue GPU eeliseks on see, et see on kohalik graafikamälu algoritmides a la PRT töötab see riistvaralise vahemäluna ja sinna laetakse vajadusel tekstuure. Lõunasaarte perekonna GPU-d toetavad kuni 32 terabaidise mahuga "megatekstuure" (eraldusvõime kuni 16384 × 16384) ja mis kõige tähtsam - nende jaoks riistvaralise tekstuuri filtreerimist, mis pole varasematel videokiipidel saadaval.

Virtuaalsed tekstuurid jagatakse 64 kilobaidi suurusteks tükkideks (kilobaidid, mitte tekslid) ja see tükk on fikseeritud. Ja videokaardi kohalikku mällu laaditakse ainult need, mida on vaja praeguse kaadri renderdamisel. Tehnoloogia töötab olenemata tekstuurivormingust, lihtsalt tükkide suurused tekselites on erinevad. Näiteks tavalise tihendamata tekstuuri puhul, mille värvi kohta on 32 bitti, on tüki suurus 128 x 128 tekseli ja DXT3-vormingus tihendatud tekstuuri puhul 256 x 256 tekslit.

Tehnoloogia hõlmab ka tekstuurimipi tasemete kasutamist (tekstuuri filtreerimisel kasutatavad vähendatud koopiad). Need nõuavad renderdamise ja filtreerimise ajal mitut juurdepääsu. Vaatame näite abil algoritmi toimimist.

See pilt tõstab esile neli erinevat tükki erinevatest renderdamiseks vajalikest mip-tasemetest. Kui varjutaja programm neilt andmeid küsib, on osa tükke juba kohalikus mälus ja need andmed saadetakse kohe varjutajasse edasiste arvutuste tegemiseks. Kuid mõned tükid on tabelist puudu ja rakendus peab valima, mida selle puudujäägi korral edasi teha. Näiteks võite nõuda andmeid madalama eraldusvõimega mip tasemelt, siis on pilt udune, kuid vähemalt näeb see välja nagu päris ja renderdatakse viivitamata. Ja järgmise kaadri renderdamise ajaks saab selle juba laadida vahemällu - kohalikku videomällu. Need, kes mängisid RAGE'i, saavad meist aru.

See on võimas algoritm, mis võimaldab kasutada tohutuid tekstuure, mis on iga objekti jaoks ainulaadsed. Sarnaseid algoritme on võrguühenduseta renderdamisel pikka aega kasutatud, välja arvatud vajadus reaalajas arvutuste järele. AMD tegi isegi demo, kasutades Per-Face Texture Mapping tehnikat, mille on välja töötanud Walt Disney Animation Studios oma animafilmide jaoks. Kahjuks pole demo veel valmis ja oleme näinud ainult madala eraldusvõimega ekraanipilte.

Selle tekstuuri kaardistamise tehnika põhiolemus on määrata igale hulknurgale konkreetne tekstuuriosa, ilma et oleks vaja kasutada UV-teisendust (pinnakoordinaatide vahelise vastavuse leidmine kolmemõõtmeline objekt ja koordinaadid kahemõõtmelisel tekstuuril). See lähenemisviis lahendab mõned tesselleeritud sisu loomisega seotud probleemid, muutes nihke kaardistamise algoritmi väga lihtsaks. Ja selles meetodis kasutatakse PRT-d tekstuuriandmete tõhusaks salvestamiseks ja neile juurdepääsemiseks.

Meediumitöötluse juhised

Huvitav uuendus Lõunasaartel näib olevat spetsiaalsete staatiliste ja dünaamiliste piltide töötlemisel kasutatavate juhiste toetamine. Näiteks on täiustatud laialdaselt kasutatavat käsku, mida nimetatakse absoluutsete erinevuste summaks, paremini tuntud kui SAD (absoluutsete erinevuste summa). Selle täitmise kiirus on paljude pildi- ja videotöötlusalgoritmide, nagu liikumistuvastus, žestituvastus, pildiotsing, jõudluse seisukohalt kriitiline kitsaskoht. arvutinägemine ja paljud teised.

Kuid oodake, iidse Radeon HD 5870 videokaardi ülevaates kirjutasime juba SAD-i toest! Kõik on õige, kuid nüüd on Lõunasaartel lisaks tavapärasele SAD-ile (4x1). uued juhised- QSAD (quad SAD), mis ühendab SAD-i vahetusoperaatoritega, et suurendada jõudlust ja energiatõhusust, ning "maskeeritud" MQSAD-juhis, mis ignoreerib taustapiksleid ja mida kasutatakse kaadris liikuvate objektide taustast eraldamiseks.

Uued GPU-d suudavad töödelda kuni 256 pikslit GCN arvutusühiku kohta kella kohta, mis AMD Radeon HD 7970 mudeli puhul tähendab 8-bitiste täisarvuliste värviväärtuste puhul võimet töödelda kuni 7,6 triljonit pikslit sekundis. Kuigi see on teoreetiline näitaja, on uute GPU-de visuaalse töötlemise võimalused üsna muljetavaldavad – paljusid videotöötlusülesandeid saab täita reaalajas.

PCI Express 3.0

Me ei saanud ignoreerida PCI Expressi kolmanda versiooni tuge kogu Lõunasaarte uute graafikalahenduste rea poolt, mis avaldatakse täna ja tulevikus. See tugi oli üsna ootuspärane, kuna PCI Expressi kolmanda versiooni spetsifikatsioonid kinnitati lõpuks juba 2010. aasta sügisel, kuid selle toega riistvaralahendusi siiski polnud, kuigi emaplaadid juba ilmuvad, videokaardid ilmusid täna, nüüd on see keskprotsessorite käes.

Uuendatud liidese edastuskiirus on versiooni 2.0 puhul 5 GT/s asemel 8 gigatehingut sekundis ning selle läbilaskevõime on PCI Express 2.0 standardiga võrreldes taas kahekordistunud (32 GB/s). IN uus rehv siini kaudu saadetavate andmete jaoks kasutatakse teistsugust kodeerimisskeemi, kuid see on sellega ühilduv varasemad versioonid PCI Express on säilinud.

Esimesed PCI Express 3.0 toetavad emaplaadid esitleti peamiselt 2011. aasta suvel Inteli kiibistik Z68 ja need läksid üldmüüki alles sügisel. Nüüd on videokaardid saabunud ja AMD on taas kõige arenenumaid tehnoloogiaid toetavate uute graafikaprotsessorite väljalaskekiiruse poolest teistest ees. Kas PCI-E 3.0-l on praktilist mõtet, on veel vara hinnata, kuid kui selline võimalus avaneb, siis testime kindlasti kõiki võimalikke valikuid.

AMD PowerTune tehnoloogia

Üks huvitavamaid uuendusi Caymani puhul oli PowerTune'i täiustatud toitehaldustehnoloogia. Paindlik GPU toitehaldus on olnud juba pikka aega, kuid enne Radeon HD 6900 olid kõik need tehnoloogiad üsna primitiivsed ja enamasti kasutades tarkvara meetodeid ja muutis sagedust ja pinget sammude kaupa, suutmata suuri osi videokiipidest välja lülitada.

Isegi Radeon HD 5000 perekonnas tekkis teatud tarbimistaseme ületamisel jõudluse piiraja ja Radeon HD 6900 puhul liikus süsteem kvalitatiivselt teisele tasemele. Selleks sisaldas kiip kõikides plokkides spetsiaalseid andureid, mis jälgivad alglaadimisparameetreid. GPU mõõdab pidevalt koormust ja voolutarbimist ning ei lase viimasel minna üle teatud läve, reguleerides automaatselt sagedust ja pinget nii, et parameetrid jääksid määratud termopaketi piiresse.

Erinevalt varasematest toitehaldustehnoloogiatest pakub PowerTune otsest juhtimist GPU energiatarbimise üle, mitte kaudsele juhtimisele sageduste ja pingete muutmise kaudu. See tehnoloogia aitab teil seadistada oma GPU kellad suurele kiirusele, saavutades suure mängujõudluse, muretsemata energiatarbimise pärast, mis ületab ohutuid piire. Lõppude lõpuks, enamik mänge regulaarsed rakendused, mis kasutavad GPU andmetöötlust, neil on oluliselt madalamad võimsusnõuded ja need ei ületa stabiilsustestide, nagu Furmark ja OCCT, ohtlikke energiatarbimise piire.

Ka kõige raskemad mängud ei nõua maksimaalset voolutarbimist ja kui piirata tarbimist sagedusega, testides videokaarte ekstreemsete testidega, siis 3D mängude puhul jääb päris palju kasutamata jõudluse ja võimsuse potentsiaali. Juhul, kui videokaart ei ole saavutanud ohutut tarbimistaset, töötab GPU tehases määratud sagedusel ja FurMarki testid ja OCCT, siis GPU sagedus väheneb, et jääda tarbimispiiridesse.

Seega aitab PowerTune määrata kõrgemaid tehasesagedusi ja konfigureerida süsteemi nii, et see kasutaks installimisel GPU ressursse kõige tõhusamalt maksimaalne tase tarbimist. Ülaltoodud näites ei kasuta HD 5870 PowerTune'i ja GPU sageduse piirangu tõttu, mis on tingitud kestvustestide suurest tarbimisest, ei kasuta kõiki oma võimalusi. Kuigi Radeon HD 7970 on seatud maksimaalsele TDP-le ja videokiip lähtestab sagedused ainult siis, kui see on ületatud, saavutades mis tahes rakenduses kõrgeima võimaliku jõudluse.

See on selgelt näidatud järgmisel diagrammil. Mängurakenduste puhul on TDP saavutamine võimalik GPU sagedust suurendades ning tippkoormuse puhul vähendavad vastupidavustestid sagedust ohutule energiatarbimise tasemele. Ilma PowerTune'ita peaksite valima – või seisma silmitsi võimalusega, et videokaart ebaõnnestub pikk töö FurMark ja OCCT või vähendage potentsiaalset mängujõudlust. Uus tehnoloogia lahendab need probleemid võimalikult tõhusalt.

AMD PowerTune reageerib kiiresti muutuvatele tingimustele (mikrosekundites), kuna see on riistvaratehnoloogia. Seda eristavad ka paindlikud sagedusseaded, mitte astmelised, nagu eelmiste kiipide puhul. Kõik mõõtmised on draiverist sõltumatud, kuid kasutaja saab neid videokaardi seadete abil reguleerida.

PowerTune'i erinevus varasemast üldtunnustatud lähenemisest seisneb selles, et muudel juhtudel kasutatakse termilist drosselit, mis paneb GPU oluliselt vähendatud tarbimise režiimi, samas kui PowerTune lihtsalt vähendab sujuvalt oma sagedust, viies GPU tarbimise seatud piirajani. See saavutab suurema taktsageduse ja jõudluse.

AMD ZeroCore tehnoloogia

AMD ei piirdunud varasematest lahendustest juba tuntud toitehaldustehnoloogia kasutamisega. Lõunasaarte perekonna esimestes kiipides tutvustab see AMD ZeroCore tehnoloogiat, mis aitab saavutada veelgi suuremat energiatõhusust "sügaval tühikäigu" (või "unerežiimi") režiimis, kus kuvaseade on keelatud, mida toetavad kõik operatsioonisüsteemid.

Lõppude lõpuks veedab peaaegu iga süsteem, isegi mängusüsteem, suurema osa ajast graafikaprotsessori madala koormusega režiimis. Ja videokaart ei tohiks selles režiimis palju energiat tarbida. Ja veelgi enam, rääkimata väljalülitatud monitoriga režiimist – sel juhul on soovitav GPU täielikult välja lülitada. Seda tegi AMD. Tänu ZeroCore'ile tarbib uus GPU sügavas jõudeolekus vähem kui 5% täisrežiimi energiast, blokeerides enamiku selles režiimis olevatest funktsionaalsetest plokkidest.

AMD pakub skemaatilise võrdluse oma Radeon HD 5870-ga, mis sellist tehnoloogiat ei toetanud. ZeroCore on Lõunasaarte eksklusiivne uuendus, mis on toodud lauaarvutite lahendustesse sülearvutite jaoks mõeldud mobiilsetest GPU-dest. Muide, selle tehnoloogia eelised ei ole seotud mitte ainult tarbimise vähenemisega. Lisaks lülitab videokaart pikaajalises ooterežiimis, kui ekraan on välja lülitatud, täielikult välja ka videokaardi jahuti ventilaatori!

See on täpselt see, mida paljud kasutajad on pikka aega oodanud. Kõige huvitavam on see, et meie andmetel viidi sarnaste PowerTune'i ja ZeroCore'i lahenduste laboratoorsed testid läbi mitu põlvkonda videokaarte tagasi. Mõned juba ammu turult lahkunud AMD-seeria videokaartide näidised töötasid täpselt nii, lülitades jahuti tühikäigul täielikult välja.

Kuid mitte ainult ühe GPU kasutajad ei saa kasu AMD uute ZeroCore-toega graafikakaartide väiksemast mürast ja energiatarbimisest. Sarnased täiustused ootavad kahel, kolmel ja isegi neljal GPU-l põhinevate CrossFire süsteemide õnnelikke omanikke. On loogiline, et kahemõõtmelise liidese joonistamise režiimis operatsioonisüsteem Kas kõik videokaardid peale peamise ei peaks üldse töötama? Aga täpselt nii nad praegu töötavad!

2D-režiimis ZeroCore toega videokaartide CrossFire süsteemide puhul lülitatakse kõik sekundaarsed videokaardid minimaalse energiatarbimisega sügavasse unne ja jahuti välja lülitatakse. See režiim töötab mitme ühekiibilise videokaardi ja kahekiibiliste lahenduste puhul. Lisaks lülitub sellesse režiimi pikaajalise tegevusetuse korral ka peamine CrossFire graafikakaart, mis on Windowsis konfigureeritud. Toimimise erinevus näeb välja selline:

Muide, tehnoloogia pole nii lihtne, kui võib tunduda. AMD insenerid pidid lahendama palju probleeme, mis olid seotud operatsioonisüsteemi tööga ooterežiimis. Näiteks leidsid nad, et Windows proovib värskendada ekraanil olevat teavet isegi siis, kui monitor on välja lülitatud. Mis loomulikult ei võimalda teil GPU-d üldse keelata. Seetõttu pidid ettevõtte programmeerijad võtma lahenduse, ignoreerides kõiki ekraani joonistamise käske, kui monitor on puhkerežiimis välja lülitatud.

AMD Eyefinity 2.0 tehnoloogia

Loomulikult oli uues arhitektuuris ruumi täiustada ka tõestatud tehnoloogiat piltide kuvamiseks mitmel monitoril – AMD Eyefinity, nüüd versioonis 2.0. See sai uusi funktsioone, kõrgema eraldusvõime, rohkemate kuvade toe ja suurema paindlikkuse.

See tehnoloogia on üsna huvitav, kuigi väga vähesed kasutajad leiavad ruumis ruumi ja koguvad julgust oma perre rohkem kui kahe monitori paigaldamiseks. Kuid parem on võimalus seda alati kasutada kui üldse mitte omada. Veelgi enam, suurte diagonaalidega monitoride hinnad peaaegu ei lange, kuid keskmise taseme lahendused muutuvad pidevalt odavamaks.

Tõepoolest, nüüd on tulusam osta kolm 24-tollise ekraanidiagonaaliga monitori kui üks 30-tolline. AMD toob just sellise näite, kui 30-tolline 2560×1600 eraldusvõimega monitor maksab rohkem kui 1000 dollarit ja kolm 24-tollist FullHD-d saab osta poole odavamalt:

Kuid kuidas oma raha ja ruumi ruumis kulutada, on iga kasutaja isiklik asi. Peaasi, et selline võimalus on olemas. Lisaks toetab Eyefinity 2.0 nüüd HD3D-stereorežiimis kujutise väljundit – midagi, mis varasemates lahendustes puudus, mis jäid selle parameetri poolest alla konkureerivatele lahendustele. AMD Eyefinity ja HD3D tehnoloogiaid ühendav Radeon HD 7970 graafikakaart on esimene ühe kiibiga lahendus, mis toetab kolme stereorežiimis töötavat monitori.

Kõrge eraldusvõimega stereorenderdamine nõuab väga kiiret andmeliidest. Ja varasemate HDMI-väljundite versioonide puhul piirdusid võimalused 24 Hz-ga silma kohta, mis on Blu-ray 3D-filmide vaatamiseks täiesti piisav, kuid mängijate jaoks selgelt liiga madal.

Selliste ülesannete jaoks hakati kasutama kaadri pakkimise vormingut, kui vasaku ja parema silma raamid ühendatakse üheks ning AMD Radeon HD 7970 toetab stereopildi väljundiks HDMI 1.4a kaadri pakkimise vormingut. See on esimene videokaart, mis toetab 3 GHz HDMI-d koos kaadripakendiga, kui iga silm saab FullHD-pilti sagedusega 60 Hz (kokku 120 Hz):

Teine huvitav uudistoode tundub meile olevat Discrete Digital Multi-Point Audio (DDMA) mitme kanaliga heliväljundtehnoloogia, mis töötab koos Eyefinityga. Kõik varasemad GPU-d suudavad HDMI ja DisplayPorti kaudu väljastada ainult ühte helivoogu. See tähendab, et isegi kui kolm eri ruumides asuvat monitori on ühendatud arvutiga HDMI kaudu, siis helikanal edastatakse ainult üks. Kuid AMD Radeon HD 7900 sai tuge mitme sõltumatu helikanali samaaegseks väljundiks, mis võib olla kasulik mõnes mitme monitoriga konfiguratsioonis.

Sama funktsioon on väga kasulik kasutamiseks videokonverentsides, kus kuvatakse mitu vestluspartnerit eraldi ekraanidel, aga ka multitegumtöötlusrakendustes, nagu mängimine kolmel monitoril mänguheliga ja uudiste vaatamine eraldi ekraanil koos sõltumatu helivooga. Varem oli selleks kõigeks vaja kasutada mitut eraldi helisüsteemi, kuid nüüd toimib kõik võimalikult mugavalt.

Pole ka unustatud tarkvara tugi Eyefinity, tehnoloogiat uuendatakse peaaegu iga kuu – ilmuvad uued võimalused. Nii ilmus oktoobris eraldusvõime kuni 16384x16384 tugi ja uued mitme monitori konfiguratsioonid: horisontaalne ja vertikaalne 5x1, samuti kuue monitori baasil 3x2 režiimis.

Detsembrikuine AMD Catalyst videodraiveri värskendus võimaldas Eyefinity ja HD3D vahel koostööd teha ning veebruaris lubavad nad tuge kasutaja õigused, kohandades tegumiriba paigutust ja täiustades eelseadistatud haldust.

Kuue monitori väljundi saab saavutada kahe DisplayPort 1.2 pordi ja kahe MST-jaoturi abil (millest me varem kirjutasime), samas kui kolm või isegi neli monitori vajavad ainult ühte porti ja vastavat jaoturit. Sellised jaoturid võimaldavad pildiväljundsüsteemi paindlikku konfigureerimist; need toetavad kuni nelja FullHD-seadet DisplayPort 1.2 pistiku kohta ja peaksid müügile jõudma 2012. aasta suveks.

Rääkides resolutsioonist. Kõrgresolutsiooniga või isegi ülikõrge – ülikõrge eraldusvõime. Praegused seadmed, mille eraldusvõime on suuremal küljel 4000 pikslit, vajavad ühendamist, kasutades korraga mitut kaablit: kaks DP 1.1 või neli DVI-d. Selle eraldusvõimega järgmise põlvkonna monitorid ühendatakse ainult ühe kaabli kaudu: DP 1.2 HBR2 või HDMI 1.4a 3 GHz. Ja AMD uus videokaart on selliste monitoride jaoks juba valmis, taas sai see maailmas esimeseks.

Video kodeerimine ja dekodeerimine

On üsna loomulik, et AMD Radeon HD 7970 sisaldab videoandmete dekodeerimiseks sama UVD-seadet, mis ilmus ettevõtte eelmise põlvkonna videokiipides. See lihtsalt ei vaja muudatusi, toetades mitmevoolist MVC koodekit, dekodeerides MPEG-2/MPEG-4 (DivX), VC-1 ja H.264 vorminguid, samuti dekodeerides kahte FullHD voogu kõigis toetatud vormingutes.

AMD lahendused pakuvad videovoo dekodeerimise maksimaalset kvaliteeti, kasutavad mitut tosinat spetsiaalset kvaliteediparandusalgoritmi ja annavad maksimaalseid tulemusi kvaliteeditestides nagu HQV. Toetatud funktsioonide hulgas märgime: värvide ja toonide reguleerimine, müra vähendamine, teravustamine, kvaliteetne skaleerimine, dünaamiline kontrastsus, täiustatud deinterlacing ja inverse telecine. Siin on näide kontrasti parandamise kohta käigu pealt:

Aga dekodeerimine kõikidel videokiipidel on olnud enam-vähem korras juba ammu. Kõik uued GPU-d pakuvad videoandmete vaatamisel korralikku kvaliteeti ja jõudlust. Kuid video kodeerimine GPU-s on alles lapsekingades ja kasutajate peamised kaebused on suunatud madala kvaliteediga saadud tihendatud pilt.

Võib olla, Uus episood Radeon HD 7000 saab selleski abiks olla, sest kõik seeria GPU-d sisaldavad Video Codec Engine’i (VCE) videokodeerimisseadet. Radeon HD 7970 mudelist sai esimene videokaart, mis toetas spetsiaalse üksuse abil riistvaraliselt kiirendatud videokodeerimist ja tihendamist (varem osalesid kodeerimises vooprotsessorid).

Kvaliteet ja jõudlus peaksid olema varasemast selgelt paremad, toetades 1080p kodeeringut kiirusega 60 kaadrit sekundis ja isegi kiiremini kui reaalajas. Kvaliteedi kohta on ilma testideta raske midagi öelda, kuid meile lubatakse videoandmete ja mängude jaoks erineval tasemel kodeerija optimeerimist, aga ka muutuvat tihenduskvaliteeti (võimalus valida kvaliteedi või jõudluse tõstmise vahel).

Praegu pole VCE-d proovimiseks kohta – lihtsalt pole seda toetavaid rakendusi, kuid AMD teeb koostööd selliste partneritega nagu ArcSoft, et pakkuda VCE-le vastavat tuge. tarkvaratooted. Tulevikus plaanime videokodeerimise kiirendamiseks välja anda tarkvarateegi, mis teeb arendajatele järgmise põlvkonna AMD toodete toetamise lihtsamaks.

Kodeerimist saab teostada kahes režiimis: täis- ja hübriidrežiimis (kasutades GPU vooprotsessorite võimalusi). Täisrežiim on mõeldud ülesannete jaoks, mis nõuavad maksimaalset energiatõhusust ja ühtlast jõudlust. Sisse kodeerimine täisrežiim on VCE kiirem kui reaalajas ja pakub madalat latentsust. Kuid on ka hübriidrežiim:

Selles režiimis töötavad GPU matemaatilised plokid ka koos VCE-ga. Kõik väga paralleelsed etapid, mis on diagrammil kollasega välja toodud, saavad kasutada GCN-i arvutusüksuste võimsust, samas kui spetsiaalne VCE-seade tegeleb tõhusa riistvara entroopia kodeerimisega. See režiim sobib hästi suure matemaatilise võimsusega videokaartidele, näiteks Radeon HD 7970. Nende kahe režiimi kvaliteedi kohta jääb küsimusi, kuid see nõuab eraldi artiklis põhjalikku analüüsi.

AMD püsiv video

Lisaks videoandmete kodeerimisele ja dekodeerimisele on veel üks valdkond, kus saab toidet kasutada uus graafika AMD-lt – halva kvaliteediga videote parandamine käest, ilma statiivi või muid sarnaseid pildistabilisaatoreid kasutamata. Video stabiliseerimise tehnoloogia kannab nime AMD Steady Video ja selle teine ​​versioon on juba välja antud.

Tarkvarastabilisaatori tööalgoritm on üsna lihtne: videovoo põhjal kogutakse statistika kaamera liikumise kohta (nihutamine, pööramine, suum) ja see liikumine kompenseeritakse praeguses kaadris, võrreldes eelmistega - pilti nihutatakse. , pööratud ja skaleeritud, et pilt palju ei hüppaks ja püsiks stabiilne.

Nii lihtne, kui see kõlab, on seda sama keeruline rakendada. Lihtsalt sellepärast, et ekraanil on kaks miljonit pikslit ja kuni 30 või isegi 60 kaadrit sekundis. Kujutage ette, kui palju arvutusi tuleb teha, et jälgida kõiki võimalikke kaadrite nihkeid. Videotöötluses kasutatavast QSAD-funktsioonist oleme juba eespool kirjutanud, seda kasutatakse ka Steady Video 2.0-s liikumistuvastuse algoritmi kiirendamiseks. Seega peab GPU töötlema juhuslikke nihkeid amplituudiga kuni 32 pikslit mis tahes suunas ja see nõuab jõudlust, mis vastab enam kui 500 miljardile SAD-toimingule sekundis (1920 x 1080 60 kaadrit sekundis).

Täna tutvustatud Radeon HD 7970 uute QSAD-juhiste toe tõttu ületab selle eelis võimsate protsessorite ees liikumistuvastusalgoritmis 10x! See on, kõrge kvaliteediga video Nüüd pakutakse meile mitte ainult koduvideote töötlemisel videoredaktorites, vaid ka teiste inimeste võrguvideote vaatamisel, mis on tehtud kes teab mida ja kes teab kuidas. Vähemalt kõik ei värise nüüd nii...

Tarkvara tugi

Lugejad on meilt juba pikka aega küsinud: millal jõuavad lõpuks GPU-de mittegraafilise andmetöötluse eelised? tavakasutajatele? Lõppude lõpuks ei tegele kõik video kodeerimisega, kuid peaaegu kõik puutuvad kokku mis tahes tüüpi andmete tihendamise ja arhiveerimisega ja seda üsna sageli. Noh, meil on häid uudiseid mitte ainult 3D-graafika entusiastidele, vaid ka tavalistele inimestele – tuntud WinZip 16.5 arhiivis on ilmunud tugi AMD Fusioni ja Radeoni kiipidele.

See rakendus on tuntud juba pikka aega ja kuigi selle parimad aastad on seljataga ning võimsamad tihendusmeetodid on juba leiutatud, ZIP-vormingus on endiselt üks levinumaid ja kiireimaid erinevat tüüpi andmete arhiveerimiseks ja tihendamiseks. Ja nüüd muutub ta veelgi kiiremaks!

Koostöös AMD-ga suutsid WinZipi arendajad paketi mootorit kiirendada, kasutades OpenCL-i abil GPU võimalusi. Loomulikult ei ole GPU-s veel kõike kiirendatud, kuid GPU vooprotsessoritel on kasu tühjendatavast tihendamisest (LZ77 ja Huffmani algoritmide kombinatsioon), dekompressiooni suurendamisest ja AES-krüptimisest. Huvitav on see, et OpenCL võimaldab teil isegi jaotada koormust CPU ja GPU vahel, kasutades mõlemat seadet.

Aga parimad videokaardid nagu Radeon HD 7970 on mõeldud rohkem mängurakenduste jaoks. Kõige kaasaegsem ja töötab maksimaalsetel seadistustel. AMD programmeerimismeeskond on pidevas kontaktis erinevate mänguarendajatega, aidates neil juurutada kaasaegsed tehnoloogiad, mida toetavad ettevõtte GPU-d. AMD on alati toetanud mänguarvutite tööstust, kuna neil on selle õitsengu vastu otsene huvi. Seega kulutati 2010. aastal mängudele 16,2 miljardit dollarit ja tarbijad kulutasid arvutimängude riistvarale 16,6 miljardit dollarit (analüütikute hinnangul tõuseb see arv tänavu 22 miljardi dollarini). On selge, et AMD tahab osa sellest rahast.

Tuleval aastal on oodata arvukalt huvitavaid mänge PC-le. Projektide hulgas, mille loomisel AMD käsi oli ja mis aasta esimesel poolel välja tulevad, on järgmised: Blacklight: Retribution, Syndicate, Sniper Elite 2, Max Payne 3, Hitman: Absolution jt. Kuid pole vaja oodata järgmise aastani, hiljuti ilmus kõige populaarsema mängu Battlefield 3: Back to Karkandi esimene lisa. Kasutatud mootor on sama Frostbite 2, kuid lisandmoodulil Back to Karkand on täiustatud hävitatavus ja see sisaldab nelja Battlefield 2 ümberkujundatud mitme mängijaga kaarti, uusi sõidukeid, relvi jne. Ekraanipildid näevad suurepärased välja:

Et artikkel oleks võimalikult terviklik, mainime ka AMD Catalyst 12.1 peamist uuendust - kasutajaprofiilid 3D-rakenduste jaoks, mis võimaldab teil muuta põhiseaded kvaliteet ja CrossFire seaded iga programmi jaoks eraldi (AMD on lõpuks oma konkurentidele järele jõudnud):

Noh, et meie lugejate keevatele ajudele puhkust AMD uue toote võimaluste nii peenest kirjeldamisest, näitame lõpuks ka midagi meelelahutuslikku - ekraanipilti esimeste lahenduste väljakuulutamiseks ettevõtte tehtud demoprogrammist. Lõunasaarte perekonnast. Demo kannab nime “Leo” ja see näitab naljakat muinasjutulist stseeni, kasutades kaasaegseid graafikatehnoloogiaid:

Pärast seda, kui oleme tutvunud uue arhitektuuri teoreetiliste aspektidega, samuti Radeon HD 7970 omaduste ja funktsionaalsusega, on aeg pöörduda praktika poole. Materjali järgmine osa on pühendatud uue AMD videokaardi renderduskiiruse praktilisele uurimisele puhtalt sünteetilistes testides. Siin teeme kindlaks, kuidas Lõunasaarte perekonna esimese lahenduse jõudlus on võrreldav AMD varasemate lahenduste, aga ka Nvidia konkureerivate graafikakaartidega kõrgemas hinnaklassis.

AMD Radeon HD 7970 – 2. osa: videokaardi ja sünteetilised testid →