Videokaarten. Veranderingen in de weergavekwaliteit. Uiterlijk en afmetingen

Al geruime tijd, sinds de dagen van de Radeon HD 2000-serie, grafische architectuur AMD-processors onderging geen fundamentele veranderingen totdat de HD 6000 "Cayman" -serie AMD voor zijn grafische oplossingen de VLIW-architectuur (Very Long Instruction Words) gebruikte, die grotendeels zeer efficiënt is in de verwerking grafische instructies, die ten grondslag liggen aan 3D grafische computing, maar ineffectief is gebleken voor algemeen computergebruik waarbij de GPU taken in de wachtrij moet zetten met scalaire instructies in algemene toepassingen. En nu, te beginnen met de HD 7000-serie, gebruikt de GPU een nieuwe microarchitectuur - GCN (Graphics Core Next), voornamelijk ontworpen om de efficiëntie te verbeteren van berekeningen die niet direct verband houden met 3D.

Om bijvoorbeeld een bepaalde wachtrij met instructies uit te voeren, zal een GPU op de VLIW4-architectuur zes klokcycli gebruiken, terwijl een GPU op de GCN-architectuur dezelfde instructies in slechts vier klokcycli zal uitvoeren. Op basis hiervan kunnen de theoretische piekprestaties van de Radeon HD 7970 7,5 keer groter zijn dan die van de Radeon HD 6970, dankzij het efficiëntere gebruik en de distributie van computerbronnen van de nieuwe GCN-architectuur.

GPU-architectuur

De Tahiti GPU wordt vervaardigd met behulp van een geavanceerde 28nm-procestechnologie in TSMC-faciliteiten. De structurele structuur van de GPU wordt weergegeven in de onderstaande afbeelding, zoals u kunt zien, gebruikt "Tahiti" 32 rekeneenheden (CU) met 64 ALU (rekenkundige en logische eenheden) per CU, wat een totaal is van 2048 ALU 925 MHz, doorvoer GPU op 32-bit wiskundige berekeningen bereikt 3,8 TFLOPS en 947 GFLOPS voor operaties met GFLOPS met dubbele precisie.

De L1-cache biedt een doorvoersnelheid van ongeveer 2 TB/s bij een gegeven kloksnelheid en gebruikt een L2-cache van 768 KB om dit te ondersteunen.
Met zes 64-bit geheugencontrollers die een 384-bit geheugenbus vormen en gebruik maken van snel 1375 MHz GDDR5-geheugen, is de Radeon HD 7970 in staat een indrukwekkende bandbreedte van 264 Gbps te leveren, tot 100 Gbps sneller dan de Radeon HD 6970.

De Tahiti GPU beschikt over twee bijgewerkte geometrie-engines die zijn geoptimaliseerd voor mozaïekpatroon met een verhoogde vertexbuffercache, waardoor de rekenprestaties 1,7 tot 4 keer worden verbeterd, afhankelijk van het aantal bewerkingen dat op het bronvertex wordt toegepast.

AMD PowerTune-technologie

Een van de interessante innovaties in de Tahiti GPU is de geavanceerde energiebeheertechnologie van PowerTune, die directe controle biedt over het stroomverbruik van de GPU. Deze technologie helpt bij het vaststellen hoge frequenties GPU, hoge prestaties behalen in games, en wees niet bang dat het verbruik de veilige limieten overschrijdt. Soortgelijke technologieën werden al gebruikt in de Radeon HD 5000-familie, maar ze waren vrij primitief en veranderden de GPU-frequentie en -spanning in stappen; het systeem ging naar een kwalitatief ander niveau.

De GPU meet voortdurend, met tussenpozen van enkele milliseconden, de belasting en het stroomverbruik van alle componentblokken en past, op basis van een analyse van de uitgevoerde taak, automatisch de frequentie en spanning aan, waarbij hij binnen de gespecificeerde TPD blijft, en indien mogelijk, de GPU-klokfrequentie neemt toe.

Bovendien heeft de nieuwe GPU een nieuwe technologie: ZeroCore, waarmee u het stroomverbruik van de GPU in de inactieve modus kunt verminderen. ZeroCore zet de GPU in de slaapmodus wanneer de monitor geen signaal ontvangt van de pc.

Volgens AMD verbruikt de videokaart bij het verwerken van een statische Windows-omgeving slechts 15 W en verbruikt deze geen energie als er geen signaal naar de monitor komt.

PCI Express 3.0

De Radeon HD 7970 bevat ondersteuning voor de derde generatie van de PCI Express-standaard (PCI-E 3.0), die de gegevensoverdrachtsnelheden tot 16 GB/s in beide richtingen zou moeten verhogen en zwakke punten bij het werken met zware applicaties zou moeten helpen elimineren.

Eyefinity 2.0

De bijgewerkte technologie ondersteunt configuraties met vijf beeldschermen op een rij in liggende of staande richting. Nu kan de centrale monitor groter zijn dan de andere verticaal.

Ondersteund gelijktijdige werking Eyefinity-, AMD HD3D- en CrossFire-technologieën. De maximale resolutie van het “geassembleerde” scherm is verhoogd naar 16384×16384 pixels.

RadeonHD7970

De tabel toont de technische kenmerken van de Radeon HD 7970, in vergelijking met het model van de vorige generatie: de Radeon HD 6970. De belangrijkste innovatie in de Tahiti GPU is de productie met behulp van 28-nanometertechnologie. Tahiti bevat 4,31 miljard transistors, wat 63% meer is dan zijn voorganger Cayman, terwijl het die-oppervlak iets compacter is: 365 versus 389 mm2. De GPU-kloksnelheid is verhoogd naar 925 MHz. De rekenkracht is met ongeveer 40% toegenomen tot 3,79 TFLOPS. Het aantal texture-eenheden nam toe van 96 naar 128, waardoor een textureringssnelheid van 118,4 GT/s kon worden bereikt.

Net als zijn voorganger gebruikt de Radeon HD 7970 GDDR5 1375 MHz (5500 MHz) geheugen, maar met een 384-bit bus, waardoor de geheugenbandbreedte wordt vergroot van 176 naar 264 GB/s.

Radeon HD 7970-specificaties

Naam RadeonHD7970
Kern Tahiti
Procestechnologie (µm) 0.028
Transistors (miljoenen) 4312
Kernfrequentie 925
Geheugenwerkfrequentie (DDR) 5500
Bus- en geheugentype GDDR5 384-bits
Bandbreedte (Gb/s) 264
Uniforme shader-eenheden 2048
Uniforme frequentie van shader-eenheden 925
TMU op transportband 128
ROP 32
Vulsnelheid (Mpix/s) 29600
Vulsnelheid (Mtex/s) 118400
DirectX 11
Geheugencapaciteit 3072
Interface PCI-E 3.0x16

Verschijning

Het koelsysteem en het algemene ontwerp van de Radeon HD 7970 zijn op het eerste gezicht vergelijkbaar met de Radeon HD 6970, zelfs de afmetingen (26,25 cm lang en 11,25 mm breed) zijn vrijwel identiek aan de afmetingen van zijn voorganger, maar nog steeds is de HD 7970 heeft enkele verschillen.

De voorkant van de videokaart is bedekt met een glanzende plastic behuizing met een felrood inzetstuk en een "verfijnder" ontwerp dan zijn voorganger.
C achterkant Het bord heeft, in tegenstelling tot de Radeon HD 6970, geen beschermende, warmteafvoerende metalen plaat.

Het koelsysteem zelf is niet fundamenteel veranderd, maar kent enkele verbeteringen gericht op het verbeteren van de koeling van het bord. De ventilator van het koelsysteem heeft nu bredere bladen en een grotere waaierdiameter; de ontwikkelaars hebben de tweede DVI-poort van het achterpaneel verwijderd om het rooster uit te breiden voor het blazen van warme lucht.

Om reacties achter te laten moet je ingelogd zijn.

Testresultaten in Metro 2033

In de populaire 3DMark 11-benchmark kon het nieuwe product de leidende positie van de NVIDIA GTX 680 niet overnemen, wat triest is, aangezien de vertraging behoorlijk merkbaar is. In Batman AC is de situatie echter al enigszins veranderd en heeft het nieuwe product het voortouw genomen, wat ons hoop geeft. Crysis 2 koelt de HD 7970 GHz Edition een beetje af, en zorgt ervoor dat je slechts één frame vooruit kunt komen in een resolutie van 2560x1440.

In de tweede "Maffia" herhaalt de situatie zich volledig, het nieuwe product wint opnieuw in de resolutie van 2560x1440, maar verliest in 1920x1080. In Lost Planet 2 blijkt de NVIDIA GTX 680 sterker en laat het nieuwe product op de tweede plaats staan.

Op basis van de resultaten van een korte test was de score tussen de AMD Radeon HD 7970 GHZ Edition en NVIDIA GTX 680 gelijk aan 100%. Hieruit kunnen we concluderen dat de kaarten ongeveer dezelfde prestaties leveren, en als u specifieke doelen heeft, moet u de testresultaten bestuderen voordat u ze aanschaft, om geen fouten te maken.

Conclusie

Zo maakten we kennis met de AMD Radeon HD 7970 GHz Edition videokaart. Het enige verschil met de “gewone” versie zijn de hogere kloksnelheden van de GPU en VRAM.

Deze aanpak om het probleem op te lossen wordt al heel lang toegepast. U kunt de updates onthouden ATI videokaarten Radeon X800 XT naar X850 XT, die ook alleen maar toenam kloksnelheden. Aangezien het aantal streamprocessors niet is veranderd en alle andere kenmerken niet zijn veranderd, is dit de gemakkelijkste manier om het machtsevenwicht op de markt te veranderen, waarvoor niets meer nodig is dan BIOS-updates. In wezen is dit oplichterij, omdat NVIDIA de frequenties ook met honderd megahertz kan verhogen, en waar zal dit toe leiden? Aan de andere kant zijn in oorlog alle middelen goed.

Laten we de kwestie van het verhogen van de klokfrequentie achterwege laten en naar de prijs kijken. Als het nu maar zo is AMD-bedrijf Ik had geen $ 50 extra willen betalen voor de overgeklokte versie, dus er waren absoluut geen klachten, en gezien het feit dat elke HD 7970 de GPU-frequentie naar 1050 MHz zal brengen, ziet zo'n stap er een beetje vreemd uit. Op de een of andere manier zijn we erin geslaagd de NVIDIA GTX 680 in te halen, en dit genereert al concurrentie, wat betekent dat het ons allemaal ten goede zal komen.

Temperatuurgrafiek voor grafische kaarten

Zelfs als het nieuwe product niet de beste “temperaturen” zou laten zien, zouden we het na zulke hoge prestatieresultaten kunnen vergeven. Maar onze vrijgevigheid is niet nodig. De Radeon HD 7970 warmt minder op dan zijn voorganger (Radeon HD 6970) en levert veel hogere prestaties. Tegelijkertijd, zoals ik hierboven al zei, als je de ventilatorsnelheid niet zelf verandert, zul je heel je best moeten doen om de kaart te horen. Ik denk dat dit bij een gesloten zaak volstrekt onmogelijk is.

Bij overklokken zijn de temperaturen lager dan standaard instellingen, vanwege diezelfde handmatige snelheidsverhoging voor stabiliteit.

We hebben trouwens nog meerdere tests van dezelfde videokaart met een alternatieve CO en op een ander systeem. U kunt de resultaten bekijken om te begrijpen hoe moderne verwerkers invloed hebben op de prestaties in populaire toepassingen. Het is vermeldenswaard dat het voorraadkoelsysteem op de ASUS-videokaart slechts één graad in nominale waarde verloor ten opzichte van het dual-fan-systeem van XFX, dit is een goed resultaat.

Conclusie

Het overklokken van de ASUS HD 7970 videokaart was een aangename verrassing. De grafische processor is overgeklokt van de standaard 925 MHz naar 1200 zonder de spanning te verhogen. Dit is de reden voor zo'n hoge prestatieverbetering tijdens overklokken. Eerlijk gezegd is dit een heel aangenaam moment. De laatste tijd zijn videokaarten steeds slechter aan het overklokken, dus de noodzaak voor overklokken verdwijnt: als de videokaart het spel niet standaard draait, zal een slechte overklok van 50 MHz de situatie niet corrigeren. Dit is duidelijk een ander geval.

Het enige dat het nieuwe product in de war brengt, is het exorbitante geluidsniveau bij het handmatig verhogen van de snelheid. En het is nodig voor succesvol overklokken, anders heb je alle kans om de videokaart te verbranden. Maar ik denk dat dit probleem na verloop van tijd zal worden opgelost - er zullen veel alternatieve koelsystemen verschijnen. Het belangrijkste is dat overklokpotentieel is niet ten kwade veranderd.

Hoge prestaties, lage warmteontwikkeling en nieuwe eigen technologieën maken de AMD Radeon HD 7970-videokaart tot de beste videoadapter met één processor van dit moment. Bovendien concurreert het nieuwe product bij overklokken gemakkelijk met het monster met twee processors Radeon HD 6990. Als je dus een vraag hebt: "wat is beter: HD 7970 of HD 6990?", Raad ik aan om de eerste optie te kiezen. Hiermee heb je geen problemen met het activeren van CrossFireX, er zullen geen plotselinge prestatiedalingen zijn, zoals bij dual-head-kaarten gebeurt. Drie gigabyte videogeheugen - leuke bonus kopen. Helaas zullen ze uiterst zelden worden gebruikt, maar het is beter met hen dan zonder.

Al met al, ASUS-videokaart De HD 7970 was een groot succes en laat een zeer prettige indruk achter. Laten we hopen dat de voortzetting van de nieuwe lijn, die zeer binnenkort zal verschijnen, ons niet minder zal plezieren.

Nieuwe topversnellers komen altijd enige tijd na de aankondiging van de vorige op de markt, maar dit keer bleek de wachttijd langer dan voorheen. Tegenwoordig kunnen we echter nog steeds de opkomst zien van een andere leider, een accelerator die in staat is om naar de top te stijgen en de vorige leider te overtreffen: een single-processor Nvidia GeForce GTX 580. Het is waar dat we het specifiek hebben over 3D-versnellers met één processor: vergeet niet dat die met twee processors zich in een speciale niche bevinden, met een prijs van $ 800 en hoger, evenals hun eigen nuances. Aangenomen kan worden dat de prestatieverbetering bij de generatiewisseling niet meer dan anderhalf keer zal bedragen, dus het nieuwe product zal de dual-processorversnellers van de vorige generatie zeker niet overtreffen.

Dit alles wil zeggen dat het tijd is voor lezers om te wennen aan het vergelijken van één processor met één processor en niet te wachten tot zo’n nieuwe accelerator resultaten oplevert. absoluut prestatierecord. Wanneer de overeenkomstige dual-processor-giganten verschijnen op basis van de nieuwe kernen, zullen ze al in staat zijn de absolute waarden te bestormen die de vorige leiders in 3D hebben bereikt. In de tussentijd vergeten we modellen met twee processors met hun prijzen, die ver verwijderd zijn van de mensen.

Dus Radeon HD 7970, ook wel Tahiti genoemd in codenaam. Wat levert de output van deze oplossing ons op? Wat zal jou plezieren? We geven het woord aan Alexey Berillo, hij zal praten over de theorie van het probleem.

Deel 1: Theorie en architectuur

Het is eindelijk klaar! Het maandenlange wachten op nieuwe GPU's geproduceerd volgens de nieuwe 28 nm-technologische standaarden eindigde helemaal aan het einde van het voorgaande jaar. We hebben herhaaldelijk geschreven over problemen veroorzaakt door moeilijkheden en vertragingen bij het beheersen van een nieuw technisch proces; AMD en Nvidia moesten steeds meer nieuwe modellen videokaarten uitbrengen op basis van oude GPU's, en zelfs aanpassingen aanbrengen aan de functionaliteit van tussenoplossingen. De Radeon HD 6900-serie bleek bijvoorbeeld een overgang te zijn van de architectuur die zijn reis begon in de Radeon HD 5800 naar de volledig nieuwe die vandaag werd aangekondigd.

Vroeg of laat zouden er een einde komen aan de problemen met de nieuwe productie, en nu, als ze nog niet helemaal verdwenen zijn, maken ze het in ieder geval mogelijk om aan te kondigen frisse oplossingen en beginnen met massale (de omvang van hun massa staat echter nog steeds ter discussie) leveringen. Het werd tijd: de pc-gamingmarkt beleeft tenslotte opnieuw een kleine bloei als gevolg van de veroudering van de hardware van gameconsoles, zelfs als we rekening houden met de dominantie van multi-platformprojecten.

Zelfs als we puur financiële indicatoren nemen, bedroeg de omzet op de pc-gamingmarkt dit jaar meer dan $15 miljard, en binnen twee jaar verwachten analisten dat het marktvolume in dezelfde valuta zal groeien tot $20 miljard. Tegelijkertijd zijn er ook snelgroeiende markten, zoals China, de grootste markt voor pc-games; de omzet bedroeg in 2010 $4,8 miljard. Ja en Russische markt is een van de belangrijkste, zelfs voor westerse bedrijven is het voldoende om te herinneren aan de release van speciale videokaarten in beperkte oplage, ook ontworpen voor ons land;

Het is duidelijk dat zelfs als we rekening houden met het feit dat de meeste games multi-platform zijn, ze grafisch complexer worden. De pc-versies van veel projecten zien er in verschillende opzichten beter uit dan hun console-tegenhangers, en niet alleen in de uitgebreide versies, zoals weergaveresolutie en texturen. Het beroemde spel Battlefield 3 gebruikt bijvoorbeeld veel van de functies van DirectX 11 om de weergavekwaliteit te verbeteren. In hoeverre de ontwikkelaars hierin slagen en welke vooruitgang er is geboekt op het gebied van beeldkwaliteit, biedt AMD aan om naar voorbeelden als de Battlefield- en Deus Ex-serie te kijken:

Zoals je zelfs op deze kleine schermafbeeldingen kunt zien, zijn de kwaliteitssprongen van de afgelopen jaren behoorlijk merkbaar. Maar ze worden nog belangrijker als we rekening houden met de toename van de weergaveresolutie gedurende al die tijd. Zelfs als we de situatie van drie jaar geleden bekijken, heeft de markt sindsdien een grote stap voorwaarts gemaakt. Dus als in 2008 de belangrijkste modellen op de gamingmonitormarkt modellen waren met een schermgrootte van 22″ en een resolutie van 1680×1050 pixels, dan werden in 2011 24″-modellen met een FullHD-resolutie van 1920×1080 wijdverspreid.

Maar het meest interessante is niet eens de schermgrootte en resolutie. Als in 2008 de prijs van een dergelijk scherm ongeveer $360 bedroeg, dan beginnen de prijzen voor 24″-modellen dit jaar bij $170-180. Dat wil zeggen dat de koper nu een iets groter fysiek scherm krijgt, met bijna 20% meer pixels, voor minder dan de helft van de prijs van drie jaar geleden. slechtste monitor. Daarom zijn apparaten met FullHD-resolutie al de meest voorkomende op de markt geworden - omdat ze erg goedkoop zijn.

Een andere modieuze trend van de afgelopen jaren is het verhogen van de energie-efficiëntie. Gebruikers stemmen voor efficiënte apparaten die zo min mogelijk elektriciteit verbruiken. Ze hebben minder impact op het milieu, wat de geest van bewuste burgers van de aarde beïnvloedt, en ze zorgen ervoor dat je geld kunt besparen op de elektriciteitsrekening, wat erg belangrijk is voor andere mensen die minder bewust zijn. En AMD besteedt speciale aandacht aan het verbeteren van de energie-efficiëntie van zijn GPU's, evenals aan de daarop gebaseerde videokaarten.

Welnu, we kunnen niet anders dan de aanzienlijke verschuiving van GPU's naar niet-grafisch computergebruik (GPGPU) opmerken. Alle moderne grafische chips zijn nu niet alleen gemaakt voor games, maar ook voor het versnellen van rekenintensieve taken die zich goed lenen voor parallellisatie. En hoewel de belangrijkste aanjager van de markt in deze richting Nvidia is, dat alleen grafische chips voor de pc-markt produceert, probeert AMD bij te blijven. Bovendien, op het hoogtepunt rekenkracht Het zijn de videokaarten van dit bedrijf die voorop lopen. De toename van de theoretisch haalbare productiviteit is te zien in het diagram:

Zoals u kunt zien, zijn de sprongen in pieksnelheid bij elk nieuw technologisch proces behoorlijk aanzienlijk. Het is ook noodzakelijk om er rekening mee te houden dat de 28 nm-procestechnologie nog maar net aan zijn reis is begonnen, en het is veilig om te zeggen dat het aantal van 3,79 teraflops in de toekomst aanzienlijk zal toenemen.

Over technische processen gesproken: AMD is de pionier op de GPU-markt. De afgelopen jaren liep dit bedrijf zijn enige sterke concurrent, Nvidia, voor bij het introduceren van alle nieuwe technologische processen. En nu waren ze de eersten die hun nieuwe product in 2011 aankondigden (foto's van de kristallen zijn helaas vaag):

28 nm is de meest geavanceerde chipproductietechnologie die momenteel overal verkrijgbaar is, en het is deze technologie die wordt gebruikt om de vandaag aangekondigde videochips uit de AMD Radeon HD 7000-serie te produceren. Deze oplossingen ondersteunen alle moderne industriestandaarden: GDDR5, PCI Express, DirectX en andere . De vorige serie videokaarten was zo succesvol dat AMD onlangs meldde 100 miljoen producten met DirectX 11-ondersteuning te hebben verzonden. Als gevolg hiervan beschikt ruim tweederde van de DX11-compatibele videokaarten in handen van gebruikers over GPU's van het bedrijf.

De aankondiging vandaag van de eerste linie ter wereld lijkt een nog belangrijker gebeurtenis te zijn. grafische chips onder de codenaam "Southern Islands" ("zuidelijke eilanden"), die ondersteuning biedt voor de bijgewerkte versie PCI-bussen Express 3.0 en de komende DirectX 11.1. Je leest alle details over de eerste videokaart in de onderstaande serie, maar nu zullen we het kort hebben over de oplossingen die in de nieuwste lijn zijn opgenomen.

Serie "Zuidelijke eilanden" omvat:

  • "Tahiti"- de krachtigste oplossing, de meest complexe en krachtige GPU op op dit moment(serie RadeonHD 7900)
  • "Pitcairn"- een GPU uit het middensegment, ontworpen voor de massagebruiker (serie RadeonHD 7800)
  • "Verde"- een product met een onovertroffen combinatie van prijs en prestatie (wordt uitgebracht onder de naam RadeonHD 7700)

Om precies te begrijpen hoe de nieuwe oplossingen in de productlijn zullen worden gepositioneerd, biedt AMD de volgende dia (de verticale positie weerspiegelt de prestaties van de oplossingen, de horizontale positie toont de releasetijd):

Zoals je ziet zullen de junior videokaarten van de Radeon HD 6300, HD 6400, HD 6500 en HD 6600 lijnen volgend jaar hun leven voortzetten. Maar krachtigere oplossingen zullen geleidelijk worden vervangen door nieuwe videokaarten uit de bovengenoemde series, gebaseerd op de gepresenteerde architectuur. Maar vandaag wordt er slechts één videokaart uitgebracht - de krachtigste oplossing uit de Radeon HD 7900-lijn, en de rest van de chips uit de Southern Islands-serie zullen iets later op de markt komen - in het eerste kwartaal van 2012.

We gaan ervan uit dat het voor lezers nuttig zal zijn om er vertrouwd mee te raken voordat ze dit materiaal lezen gedetailleerde informatie over de vroege videochips van het bedrijf in de volgende artikelen op onze website:

  • AMD Radeon HD 6950/6970: iets zwakker dan Geforce GTX 570/580, maar ook goedkoper
  • AMD Radeon HD 6870 en HD 6850: theoretische informatie over nieuwe oplossingen voor de middenprijssector
  • ATI Radeon HD 5870: krachtige impact uit Canada - ATI (AMD) brengt de nieuwe koning van 3D-graphics uit
  • ATI Radeon HD 4870 (RV770): AMD's krachtigste single-GPU 3D-accelerator

Welnu, nu gaan we verder met het beschrijven van de technische kenmerken van de eerste videokaart uit de Radeon HD 7900-serie die vandaag is aangekondigd, gebaseerd op een volledig nieuwe GPU met de codenaam "Tahiti".

Grafische versnellers uit de Radeon HD 7900-serie

  • Chipcodenaam: "Tahiti"
  • Productietechnologie: 28 nm
  • 4,3 miljard transistors (ruim 60% meer dan de Cayman en precies twee keer zoveel als de Cypress)
  • Een uniforme architectuur met een reeks gemeenschappelijke processors voor de stroomverwerking van talloze soorten gegevens: hoekpunten, pixels, enz.
  • Hardwareondersteuning voor DirectX 11.1, inclusief Shader Model 5.0
  • 384-bit geheugenbus: zes 64-bit brede controllers die GDDR5-geheugen ondersteunen
  • Kernklok: tot 925 MHz (voor Radeon HD 7970)
  • 32 GCN-rekeneenheden, waaronder 128 SIMD-kernen, bestaande uit in totaal 2048 ALU's voor drijvende-kommaberekeningen (integer- en zwevende formaten, ondersteuning voor FP32- en FP64-precisie binnen IEEE-standaard 754)
  • 128 textuureenheden, met ondersteuning voor trilineaire en anisotrope filtering voor alle textuurformaten
  • 32 ROP-blokken met ondersteuning voor anti-aliasingmodi met de mogelijkheid om programmeerbaar meer dan 16 samples per pixel te samplen, inclusief met FP16- of FP32-framebufferformaat. Piekprestaties tot 32 samples per klok, en in alleen Z-modus - 128 samples per klok
  • Geïntegreerde ondersteuning voor zes monitoren, waaronder HDMI 1.4a en DisplayPort 1.2

Specificaties Radeon HD 7970 grafische kaart

  • Kernfrequentie: 925 MHz
  • Hoeveelheid universele processoren: 2048
  • Aantal textuurblokken: 128, overvloeiblokken: 32
  • Effectieve geheugenfrequentie: 5500 MHz (4x1375 MHz)
  • Geheugentype: GDDR5
  • Geheugencapaciteit: 3 gigabyte
  • Geheugenbandbreedte: 264 gigabyte per seconde.
  • Theoretisch maximale snelheid Vulling: 29,6 gigapixels per seconde.
  • Theoretische textuurbemonsteringssnelheid: 118,4 gigatexels per seconde.
  • Twee CrossFire-connectoren
  • PCI Express 3.0-bus
  • Connectoren: DVI Dual Link, HDMI 1.4, twee Mini-DisplayPort 1.2
  • Stroomverbruik: van 3 tot 250 W
  • Eén 8-pins en één 6-pins voedingsconnector
  • Ontwerp met dubbele sleuf
  • Aanbevolen prijs voor de Amerikaanse markt: $549

Onmiddellijk wordt de aandacht gevestigd op de enorme complexiteit van de nieuwe chip - 4.312.711.873 transistors (dit is de ultraprecieze vorm waarin dit aantal wordt gegeven in AMD-materialen - waarschijnlijk handmatig geteld), wat meer is dan de helft van het aantal transistors in de vorige topklasse grafische processor. De mogelijkheid om zo'n complex kristal te maken werd mogelijk gemaakt door het gebruik van de nieuwste 28-nanometer procestechnologie; de ​​nieuwe chip is zelfs iets kleiner in oppervlakte dan de Cayman. Maar bijna alle kenmerken die de prestaties beïnvloeden zijn merkbaar verbeterd: het aantal ALU's, TMU's en geheugenbus. Alleen het aantal ROP-blokken nam niet toe en de frequentie van GDDR5-videogeheugen bleef op hetzelfde niveau. Dankzij het grotere aantal uitvoeringseenheden, de verhoogde efficiëntie en de hogere GPU-kloksnelheid zou hij in alle toepassingen aanzienlijk beter moeten presteren dan de Cayman.

Het principe van de naamgeving van de videokaarten van het bedrijf bleef hetzelfde, waarmee de trend van de vorige serie werd voortgezet, waarin het tweede cijfer van de index in de topoplossingen veranderde van 8 naar 9. De Radeon HD 7970 is de meest productieve oplossing met één chip van het bedrijf; over een tijdje zal ook het juniormodel HD 7950 op de markt komen, maar vandaag werd aangekondigd dat dit niet het geval zal zijn. Het is duidelijk dat de HD 7970 met zijn specificaties simpelweg geen concurrenten op de markt heeft en nog geen enkele videokaart uit de AMD-lijn vervangt (tenzij de HD 6990 direct kan worden afgeschreven), maar deze eerder naar beneden schuift. Wat de vergelijking met zijn concurrent betreft: de 28-nanometeroplossing van Nvidia is nog niet klaar en zal nog een paar maanden moeten wachten. In de tussentijd zal de GeForce GTX 580 het moeten opnemen en proberen te concurreren met de HD 7950, maar duidelijk niet met de HD 7970.

De nieuwe AMD-videokaart is uitgerust met hetzelfde GDDR5-geheugen (hoewel er geruchten gingen over een zogenaamd heel ander type geheugen dan Rambus, maar AMD-vertegenwoordigers geven er niet eens commentaar op), maar het volume in plaats van 2 gigabyte in de vorige generatie is toegenomen tot 3 gigabyte. Dit gebeurde vanwege de uitbreiding van de geheugenbus van 256-bit naar 384-bit. En nu verder nieuw bord U kunt 1,5 GB of 3 GB plaatsen. Vanuit marketingoogpunt zou het installeren van een kleiner volume uiteraard een duidelijke nederlaag zijn, en er werd besloten om 3 GB te installeren, hoewel dit tegenwoordig duidelijk overdreven is. Alleen bij ultrahoge resoluties en bij MSAA 16x is 1,5-2 GB niet genoeg. AMD heeft echter ook Eyefinity, en bij games op drie, vijf of zes monitoren zal de schermbuffer enorm veel ruimte in beslag nemen. Misschien zal het jongere Radeon HD 7950-model ooit worden uitgebracht met 1,5 GB geheugen, om de kosten te verlagen, maar het oudere model zeker niet.

Laten we dus eens kijken naar de Radeon HD 7970. De nieuwe videokaart in de hogere prijsklasse heeft een dual-slot koelsysteem, bedekt met een plastic behuizing die bekend is bij alle moderne AMD-borden over de gehele lengte van de kaart. Alleen het design van deze behuizing is wel iets veranderd achterkant alles gaat nog steeds verder dan de printplaat. Maar het ontwerp van de strip met pinnen is veranderd: om de koeling van de videokaart te verbeteren, werd een van de twee slots (de helft van de strip) uitsluitend ingenomen door een ventilatiegat voor warmteafvoer.

Maar gebruikers mogen geen last hebben van een vermindering van het aantal DVI-connectoren dat rechtstreeks op het bord wordt gesoldeerd. Voor hun gemak wordt er een speciale HDMI-DVI-adapter in het pakket meegeleverd, waarmee u twee monitoren met DVI-connectoren kunt aansluiten. Het stroomverbruik van de nieuwe kaart is overigens niet lager dan dat van de Radeon HD 6970, waardoor deze voorzien moest worden van een setje van één 8-pins en één 6-pins stroomconnector.

Maar binnen nieuwe Radeon Het koelsysteem van de HD 7970 is ten goede veranderd. Er wordt gebruik gemaakt van een nieuwe generatie verdampingskamers nieuwe koeler groter formaat, met een gewijzigde bladvorm en verbeterde prestaties (er wordt voor meer luchtstroom gezorgd). Het resultaat is een toename van de efficiëntie van de koeler terwijl het geluid wordt verminderd.

De Dual BIOS-firmwareschakelaar, waarover we schreven in Radeon-recensie HD 6900. Kort gezegd: de videokaart heeft twee BIOS-versies, één met de mogelijkheid om de firmware op maat te flashen, en de tweede met firmware die in de fabriek hardgecodeerd is. Dit handige oplossing Zowel gebruikers als AMD zelf vonden het zo leuk dat het besloot hen te blijven uitrusten met topoplossingen.

Je kunt alleen maar hallo zeggen dit besluit, wat echt helpt in verschillende gevallen die verband houden met onverwachte problemen tijdens het flashen (bijvoorbeeld stroomuitval tijdens het proces), en waarmee je onbevreesd verschillende experimenten met BIOS-images kunt uitvoeren. Het is geen verrassing dat AMD opnieuw zinspeelt op uitstekende overklokmogelijkheden. nieuwe videokaart:

Zoals u kunt zien, wordt overklokken naar een frequentie van 1 GHz en hoger praktisch beloofd, als u geen rekening houdt met het kleine opschrift (het zat niet in het frame, maar bestaat wel) dat de garantie niet langer geldig is, zelfs als de videokaart faalt als gevolg van een experiment met het verhogen van de frequentie via de instellingen van het videostuurprogramma. Het is trouwens interessant om de nieuwe dia te vergelijken met een pagina uit de presentatie van de al lang overleden Radeon HD 4890:

Gewoon een opvallende gelijkenis (in de lay-out en het ontwerp van de dia), nietwaar? Helaas is de noodlottige gigahertz sindsdien, ondanks het beheersen van nieuwe technische processen, niet beschikbaar in eindproducten met referentiefrequenties. Maar het lijkt erop dat er 28 nm is en duidelijk verbeterde koeling, maar nee - opnieuw een beetje, maar ze hebben het niet gehaald. Aan de andere kant zal de gebruiker iets te doen hebben in zijn vrije tijd.

Architectonische kenmerken van de Radeon HD 7970

Om de relevantie van de architectonische aanpassingen op de Southern Islands te begrijpen, kijken we eerst naar de ontwikkeling van GPU’s in de afgelopen jaren (zoals gezien door AMD). Vóór 2002 waren grafische chips specifieke hardware die uitsluitend grafische afbeeldingen kon verwerken. Videochips uit die tijd hadden een beperkte functionaliteit; ze konden alleen texturen toepassen en filteren, geometrie verwerken en primitieve rasterisatie uitvoeren en waren daarom helemaal niet geschikt voor universele computertaken.

In de daaropvolgende jaren werd basisprogrammeerbaarheid aan de GPU toegevoegd, maar deze was ook uitsluitend gericht op grafische taken. Dit was de tijd van ondersteuning voor DirectX 8 en 9, beperkt in functionaliteit shader-programma's met de mogelijkheid om te berekenen en drijvende komma. Videochips uit die tijd hadden gespecialiseerde ALU-eenheden voor hoekpunt- en pixelverwerking, evenals speciale caches voor pixels, texturen en andere gegevens. Veelzijdigheid was nog steeds niet eens in de buurt.

Pas in 2007 verwierf AMD de uniforme DirectX 10-shader-architectuur, evenals de mogelijkheid om de GPU te programmeren met speciale tools: CAL, Brook, ATI Stream. GPU's uit die tijd beschikten al over geavanceerde caching en ondersteuning voor lokale en mondiale gedeelde gegevens. Architectonisch gezien waren de chips gebaseerd op VLIW5- en VLIW4-blokken, flexibel genoeg voor enkele niet-grafische basisberekeningen, maar nog steeds gericht op grafische algoritmen.

Nu is het tijd voor een nieuwe architectuur die nog beter geschikt is voor algemeen computergebruik - Grafische Core Next (GCN). Dit is een nieuw architectonisch tijdperk voor AMD en daarom is voor de naam gekozen. De nieuwe GPU's bieden uitstekende grafische verwerkingsmogelijkheden en prestaties, maar de aangebrachte wijzigingen in de architectuur zijn in de eerste plaats bedoeld om de posities in niet-grafisch computergebruik te verbeteren - waardoor de prestaties en efficiëntie bij complexe algemene taken worden verhoogd. Nieuw ontwerp De GPU is ontworpen voor zogenaamd heterogeen computergebruik - een combinatie van grafisch en algemeen computergebruik in een multitasking-omgeving. De GCN-architectuur is flexibeler geworden en moet nog beter geschikt zijn voor het energiezuinig uitvoeren van diverse taken.

Het basisblok in de nieuwe architectuur is het GCN-blok. Het is op deze “bouwstenen” dat alle nieuwe grafische processors uit de Southern Islands-serie zijn gebaseerd. De architectuur voor AMD grafische chips maakt voor het eerst gebruik van een niet-VLIW-ontwerp, het maakt gebruik van vector- en scalaire eenheden, en een van de belangrijkste veranderingen is dat elk van de GCN-computereenheden zijn eigen planner heeft en instructies van verschillende programma's kan uitvoeren. (kernel).

De nieuwe computerarchitectuur is ontworpen voor een hoge efficiëntie bij het laden van rekeneenheden in een multitaskingomgeving. De GCN-rekeneenheid is verdeeld in vier subsecties, die elk elke klokcyclus aan hun eigen instructiestroom werken. Threads kunnen ook het scalaire blok van GCN gebruiken voor flow control of pointer-bewerkingen. De combinatie van vector- en scalaire blokken biedt een zeer eenvoudig programmeermodel. Functiewijzers en stapelwijzers zijn bijvoorbeeld veel eenvoudiger te programmeren, en de taak van de compiler is nu aanzienlijk vereenvoudigd, omdat de uitvoeringseenheden scalair zijn.

Elk GCN-blok heeft een speciaal lokale opslag 64 KB aan gegevens voor het uitwisselen van gegevens of het uitbreiden van de lokale stapel voor registers. Het blok bevat ook een cache op het eerste niveau met lees- en schrijfmogelijkheden, en een volwaardige textuurpijplijn (bemonsterings- en filtereenheden). Daarom kan de nieuwe rekeneenheid onafhankelijk werken, zonder een centrale planner, die in eerdere architecturen verantwoordelijk was voor het verdelen van werk over de eenheden. Nu is elk van de GCN-blokken in staat zelf opdrachten te plannen en te distribueren; één rekenblok kan maximaal 32 verschillende opdrachtstromen uitvoeren, die afkomstig kunnen zijn uit verschillende virtuele adresruimten in het geheugen en volledig beschermd en onafhankelijk van elkaar zijn.

AMD's eerdere GPU-architecturen gebruikten de architectuurmodellen VLIW4 en VLIW5, en hoewel ze goed genoeg zijn voor grafische taken, maar zijn niet efficiënt genoeg voor universeel computergebruik, omdat het onder dergelijke omstandigheden erg moeilijk is om alle uitvoeringseenheden met werk te laden. De nieuwe GCN-architectuur biedt hetzelfde groot aantal uitvoeringseenheden, maar met scalaire uitvoering, waardoor de beperkingen en afhankelijkheden van registers en instructies worden opgeheven. De overgang van de VLIW-architectuur naar scalaire uitvoering zorgt voor een merkbare vereenvoudiging van code-optimalisatietaken.

Bij het uitvoeren van instructies op de vorige VLIW4-architectuur heeft de compiler te maken met registerconflicten, het uitvoeren van complexe distributie van instructies naar uitvoeringseenheden in de codecompilatiefase, enz. Tegelijkertijd vereist het bereiken van hoge prestaties vaak niet-triviale optimalisatie, die is geschikt voor de meeste grafische taken en veel minder flexibel voor andere berekeningen. De nieuwe architectuur biedt een aanzienlijke vereenvoudiging van de ontwikkeling en ondersteuning, vereenvoudigde creatie, analyse en detectie van fouten in code op laag niveau, en stabiele en voorspelbare prestaties.

Subsysteem voor geheugencaching

Er is nooit genoeg bandbreedte, geheugen en caches, en er zijn altijd behoeftes en methoden om deze uit te breiden. De nieuwe GPU's van AMD gebruiken een volledige lees-/schrijfcache met twee niveaus. Elke rekeneenheid heeft 16 kilobyte cache op het eerste niveau en het totale volume van de cache op het tweede niveau is 768 kilobyte (in totaal heeft de chip 512 KB L1 en 768 KB L2), wat 50% meer is dan in de vorige chip , die helemaal geen schrijfmogelijkheden heeft in de L2-cache.

Wat de prestaties betreft, kan elke GCN-rekeneenheid in één klokcyclus 64 bytes aan gegevens ontvangen of schrijven van/naar de L1-cache of het globale geheugen, dat wordt gebruikt om gegevens uit te wisselen tussen instructiethreads. Elke sectie van de L2-cache van het tweede niveau kan dezelfde hoeveelheid gegevens verzenden en ontvangen. Als gevolg hiervan produceert de top-GPU van het bedrijf 2 terabytes/s voor L1 en 700 GB/s voor L2, wat 50% meer is dan de vorige top-end AMD-oplossingen.

Tahiti-GPU

Nu we hebben gekeken naar de architecturale veranderingen op laag niveau in de nieuwe Southern Islands-serie, is het tijd om verder te gaan met de details van de krachtigste oplossing van de lijn, de Radeon HD 7900, die twee modellen omvat. Laten we allereerst de enorme complexiteit van de nieuwe GPU opmerken, want deze bevat meer dan 4,3 miljard transistors, wat twee keer zoveel is als de chip waarop de Radeon HD 5870 is gebaseerd! Uiteraard werd zo'n krachtige chip alleen mogelijk dankzij het gebruik van de nieuwe 28 nm-procestechnologie. Dus wat heeft hij binnen?

Het aantal geometrische blokken is niet veranderd, vergeleken met de Cayman, er zijn er nog steeds twee, maar de efficiëntie van hun werk is aanzienlijk toegenomen - we zullen hier later dieper op ingaan. In het GPU-diagram zien we 32 rekeneenheden met GCN-architectuur beschikbaar op de Radeon HD 7970, en in het geval van de lagere oplossing zullen sommige daarvan worden uitgeschakeld. Als we kijken naar de maximale rekenprestaties van de oplossing, bedragen deze bijna 3,8 teraflops (floating point operations per seconde), wat tot nu toe een absoluut record is voor een GPU.

Elk GCN-blok bevat 16 textuureenheden, wat een eindcijfer oplevert van 128 TMU per chip, of meer dan 118 gigatexels/sec - en dit is opnieuw een record voor vandaag, en het is niet het laatste. Maar het aantal ROP-blokken is niet veranderd, er zijn er nog steeds 32 in 8 vergrote RBE-blokken. Een andere interessante architectonische verandering is dat ROP-blokken nu niet “gekoppeld” zijn aan geheugenkanalen, zoals voorheen het geval was, maar aan GCN-blokken.

Hoewel theoretisch de schrijfsnelheid naar de framebuffer vrijwel onveranderd is gebleven, en het maximaal mogelijke dezelfde 32 kleurwaarden en 128 dieptewaarden per klok is, is de praktische opvulsnelheid in real-world toepassingen aanzienlijk toegenomen door de toegenomen geheugen bandbreedte. Volgens de metingen van AMD registreerde de Cayman slechts 23 pixels per klok, terwijl de nieuwe Tahiti dicht bij de theoretische 32 pixels per klok kwam.

Dit is begrijpelijk, omdat AMD's nieuwe videochip een 384-bit geheugenbus heeft - zes 64-bit kanalen, net als de huidige topoplossing van de concurrent. Het is deze anderhalf keer grotere geheugenbandbreedte die het mogelijk maakt om de werkelijke snelheid van het ophalen van texturen en het schrijven naar de framebuffer te verhogen. Een bandbreedte van 264 GB/sec zou moeten helpen om dicht bij de theoretische cijfers van 118 gigapixels/sec en 30 gigapixels/sec te komen, en we zullen dit in het praktische gedeelte controleren.

Mozaïekpatroon en geometrieverwerking

Vanuit architectonisch oogpunt is er sinds de Kaaiman niet veel veranderd aan de geometrische blokken van de Tahiti. Er worden nog steeds twee blokken gebruikt voor het verwerken (instellen van hoekpunten en mozaïekpatroon) van geometrische gegevens en rastering, en het schema lijkt sterk op wat we eerder zagen, behalve dat de tessellatoren de 9e generatie worden genoemd:

Ondanks de schematische gelijkenis, laatste generatie Deze blokken zijn in staat tot aanzienlijk grotere prestaties op het gebied van mozaïekpatroon en geometrie, omdat de blokken aanzienlijke wijzigingen hebben ondergaan. Hoewel de piekprestaties slechts toenamen tot bijna twee miljard hoekpunten en primitieven per seconde (925 MHz en twee hoekpunten per klok), echte prestaties is meer gegroeid. Dit werd bereikt door de omvang van de caches te vergroten, de buffering van geometriegegevens te verbeteren en hoekpuntgegevens te hergebruiken.

Als gevolg hiervan zijn de prestaties van de mozaïekpatroon over alle driehoeksverhoudingen tot vier keer verbeterd in vergelijking met de vorige generatie Radeon HD 6970. Maar vier keer worden niet in alle gevallen gehaald, zelfs niet op het diagram van AMD zelf:

De grafiek vergelijkt de mozaïekprestaties van de Radeon HD 7970 met die van de HD 6970 bij partitiefactoren variërend van 1 tot 32. En zoals je kunt zien, ligt het prestatieverschil tussen 1,7 en 4 keer. Maar dit is puur synthetisch. En om dichter bij de realiteit te komen, geven we wat meer gegevens over de snelheid van de mozaïekpatroon in gamingtoepassingen:

Zoals je kunt zien, worden de synthetische cijfers van AMD goed ondersteund door gaming-nummers - de prestaties in echte toepassingen met "zware" mozaïekpatroon zijn aanzienlijk toegenomen. Dit is een heel goed resultaat, dat we zeker in het praktijkgedeelte zullen bekijken, aan de hand van het voorbeeld van synthetische stoffen en gaming-applicaties.

Niet-grafisch computergebruik

Vanuit het oogpunt van heterogene en niet-grafische computertaken is de opkomst van twee asynchrone rekenmachines (Asynchronous Compute Engines - ACE) erg belangrijk. Ze zijn ontworpen om werk te plannen en te verdelen tussen uitvoeringseenheden voor efficiënt multitasken en werken in combinatie met de grafische opdrachtprocessor (Command Processor).

Radeon HD 7900 heeft twee onafhankelijke computerengines en één grafische engine. In totaal levert dit drie programmeerbare blokken en drie opdrachtstromen op, volledig gescheiden van elkaar. En naast asynchrone commandolevering voor snelle contextwisseling, beschikt de nieuwe GPU ook over twee bidirectionele direct memory access (DMA)-controllers die in de Cayman zijn geïntroduceerd. Deze twee controllers zijn nodig om optimaal te kunnen profiteren van de nieuwe PCI Express 3.0-bus.

Zoals we weten is vanuit het oogpunt van serieus computergebruik niet alleen de snelheid van het uitvoeren van drijvende-kommabewerkingen met enkele precisie belangrijk, maar ook drijvende-kommabewerkingen met dubbele precisie. En nieuw AMD-architectuur kan deze taak redelijk goed aan. Op dit moment wordt aangenomen dat er twee versies van GCN-rekeneenheden zijn die verschillende uitvoeringssnelheden van FP64-instructies hebben. Voor oudere GPU's is de uitvoeringssnelheid 1/4 van de FP32-snelheid, en voor jongere chips is de uitvoeringssnelheid 1/16, wat voldoende is om de compatibiliteit te behouden, maar goedkope oplossingen niet al te ingewikkeld maakt. Als gevolg hiervan is de Radeon HD 7970 in staat tot 947 miljard dubbele precisie-bewerkingen per seconde (oh, ze kwamen net onder een teraflop!) - dit is opnieuw een hoogste prestatie van de nieuwe AMD-chip.

Bovendien zijn dit niet dezelfde gigaflops als bij eerdere architecturen, maar dikkere. De efficiëntie van de nieuwe GPU bij complexe computertaken zou immers aanzienlijk moeten toenemen. Ten eerste is het geheugen- en caching-subsysteem verbeterd. Ten tweede heeft elke GCN-rekeneenheid zijn eigen planner, wat de uitvoering van vertakkingscodes en de algehele efficiëntie zou moeten verbeteren. Ten derde merken we de scalaire uitvoering op, die geen complexe optimalisaties van de compiler vereist, waardoor de rekeneenheden veel minder vaak inactief zullen zijn. En als resultaat zal het voor de nieuwe chip bij alle taken gemakkelijker zijn om hoge prestaties en ALU-belasting te demonstreren.

Naast andere innovaties met betrekking tot computermogelijkheden merken we volledige ECC-ondersteuning op voor DRAM en SRAM. Aan de softwarekant is het belangrijk dat Tahiti de eerste GPU is met volledige ondersteuning voor de nieuwe API-versies: OpenCL 1.2, DirectCompute 11.1 en C++ AMP en hun mogelijkheden. Met OpenCL 1.2 kunt u bijvoorbeeld de mogelijkheden van meerdere computerapparaten in één combineren, en AMD heeft hiervoor al ondersteuning uitgebracht in de vorm van AMD APP SDK 2.6 en het Catalyst 11.12-stuurprogramma.

Architectuurprestaties en efficiëntie

Nadat we alle architecturale innovaties hebben bekeken aan de hand van het voorbeeld van de topchip uit de Southern Island-serie, is het tijd om te praten over de effectiviteit van al deze veranderingen. Het is duidelijk dat de prestaties van de nieuwe chips veel hoger zijn dan die van de vorige; het tegenovergestelde zou behoorlijk verrassend zijn. De vraag is hoeveel sneller. Bij verschillende taken variëren de resultaten van 40-50% (minimaal!) tot een vijfvoudig verschil. Verbeteringen in de architectuur maken het mogelijk om de theoretische 1,4 keer het verschil in domme gigaflops te overschrijden. Laten we dit eens bekijken met voorbeelden:

Het diagram vergelijkt de nieuwe topoplossing met de vorige oplossing met één chip: Radeon HD 7970 en HD 6970, wat redelijk eerlijk is. De geselecteerde prestatietests zijn verschillend: SmallptGPU en LuxMark zijn ray tracing op OpenCL, SHA256 is een veilig hash-algoritme en AES256 is een symmetrisch encryptie-algoritme. Welnu, Mandelbrot is een bekend probleem dat met dubbele precisie wordt berekend.

De verticale stippellijn in de grafiek markeert het theoretische prestatieverschil, maar uit de snelheidsgegevens blijkt dat bij drie van de vijf taken de snelheid van de nieuwe GPU aanzienlijk hoger was. Dit wordt veroorzaakt door alle veranderingen die gericht zijn op het vergroten van de efficiëntie: het afstappen van VLIW, het hebben van een planner in elke rekeneenheid, verbeterde caching, enz.

Wijzigingen in de weergavekwaliteit

Eigenlijk had dit onderdeel gemakkelijk overgeslagen kunnen worden, aangezien er de laatste tijd geen speciale klachten zijn over de beeldkwaliteit en die ook niet kunnen bestaan ​​- om verschillende redenen. De kwaliteit van anti-aliasing op volledig scherm tussen videokaarten van verschillende fabrikanten is bijvoorbeeld zeer vergelijkbaar, vooral gezien het wijdverbreide gebruik van software-anti-aliasing-methoden met behulp van nabewerkingsfilters, die op alle GPU's precies hetzelfde presteren.

Hetzelfde geldt voor textuurfiltering - nu is de kwaliteit zodanig dat het erg moeilijk is om onderscheid te maken tussen AMD- en Nvidia-oplossingen, zelfs als je een pixel-voor-pixel-vergelijking maakt. In de Radeon HD 6900 - de vorige generatie van het bedrijf - is de anisotrope filtering iets meer verbeterd, en nu zal zelfs een "microscoop" niet helpen om daar significante tekortkomingen te vinden. De enige opmerking is dat de Radeon-videokaarten in beweging enigszins inferieur waren aan de Geforce vanwege meer opvallende specifieke artefacten, zoals "ruis" of "zand".

Met de release van een nieuwe generatie videochips werden de texelgewichten in het textuurfilter opnieuw beoordeeld, waarbij ze zodanig werden aangepast dat dergelijke artefacten werden verminderd, die soms zichtbaar zijn op de Radeon HD 6900 in de aanwezigheid van bepaalde soorten texturen (“hoge -frequentie”, met bijvoorbeeld scherpe overgangen van donker naar licht). De kwaliteitsveranderingen zijn zo moeilijk aan te tonen met voorbeelden dat AMD geen vergelijkende afbeeldingen geeft van de HD 7900 versus de HD 6900, maar eenvoudigweg de kwaliteit van het ‘hardware’-algoritme vergelijkt met een puur softwarematig algoritme dat wordt uitgevoerd op GPU-streamprocessors, en daarom ideaal:

In zo'n kleine schermafbeelding is het kwaliteitsverschil niet zichtbaar, maar AMD verzekert dat alle aangebrachte wijzigingen geen enkele prestatiedaling hebben veroorzaakt en de beeldkwaliteit in geen enkel opzicht hebben verslechterd - het hangt nog steeds niet af van de hoek en de De filterkwaliteit is bijna ideaal. In een van de toekomst praktische materialen wij gaan het zeker bekijken.

Gedeeltelijk residente texturen

Het idee van Partially Resident Textures (PRT) is om de hardwaremogelijkheden van de gepresenteerde GPU te gebruiken - virtueel geheugen. Veel gebruikers hebben vast al het spel RAGE van id Software gezien, dat gebruik maakt van virtuele textureringstechnologie, de zogenaamde megatexturing (“MegaTexture”), die het mogelijk maakt om grote hoeveelheden textuurgegevens te gebruiken en deze naar videogeheugen te streamen.

Met behulp van virtueel videogeheugen is het heel eenvoudig om effectieve hardwareondersteuning voor dergelijke algoritmen te krijgen, waardoor u tot 32 terabytes aan texturen in een applicatie kunt gebruiken, wat het mogelijk maakt om unieke locaties in games te creëren, zonder stukjes texture te herhalen, en zonder problemen met het laden van textuurgegevens. Toegegeven, AMD geeft een duidelijk voorbeeld dat te vreemd is, waaruit niets bijzonder duidelijk is:

Met PRT kunt u een hoge beeldkwaliteit bereiken en de efficiëntie van het gebruik van het videogeheugen verbeteren. Soortgelijke algoritmen worden al gebruikt in de id Software-engine en zullen naar verwachting in veel motoren van de volgende generatie verschijnen. Games van de toekomst moeten met enorme hoeveelheden data werken en het voordeel van de nieuwe GPU is dat ze lokaal zijn grafisch geheugen in algoritmen a la PRT werkt het als een hardwarecache, en indien nodig worden er texturen in geladen. GPU's van de Southern Islands-familie ondersteunen "megatextures" met een volume tot 32 terabytes (resolutie tot 16384 × 16384) en, belangrijker nog, hardwaretextuurfiltering daarvoor, wat niet beschikbaar is op eerdere videochips.

Virtuele texturen zijn verdeeld in stukken van 64 kilobytes (kilobytes, niet texels) en deze stukgrootte staat vast. En alleen degenen die nodig zijn bij het renderen van het huidige frame worden in het lokale geheugen van de videokaart geladen. De technologie werkt ongeacht het textuurformaat; alleen de afmetingen van de stukken in texels zullen anders zijn. Voor een gewone ongecomprimeerde textuur met 32 ​​bits per kleur is de stukgrootte bijvoorbeeld 128x128 texels, en voor een textuur gecomprimeerd in DXT3-formaat - 256x256 texels.

De technologie omvat ook het gebruik van texture mip-niveaus (verkleinde kopieën die worden gebruikt bij textuurfiltering). Ze vereisen meerdere toegangen tijdens het renderen en filteren. Laten we de werking van het algoritme bekijken aan de hand van een voorbeeld.

In deze afbeelding worden vier verschillende delen van verschillende mip-niveaus belicht die nodig zijn voor weergave. Wanneer een shader-programma gegevens van hen opvraagt, bevinden sommige chunks zich al in het lokale geheugen en worden deze gegevens onmiddellijk naar de shader gestuurd voor verdere berekeningen. Maar er ontbreken enkele stukjes in de tabel, en de applicatie moet kiezen wat ze vervolgens gaat doen bij die misser. U kunt bijvoorbeeld gegevens opvragen vanaf een mip-niveau met een lagere resolutie, dan is de afbeelding wazig, maar ziet deze er in ieder geval uit als het echte werk en wordt deze zonder vertraging weergegeven. En tegen de tijd dat het volgende frame wordt weergegeven, kan het al in de cache worden geladen: lokaal videogeheugen. Degenen die RAGE hebben gespeeld, zullen ons begrijpen.

Dit is een krachtig algoritme waarmee je enorme texturen kunt gebruiken die uniek zijn voor elk object. Soortgelijke algoritmen worden al lang gebruikt bij offline weergave, behalve de noodzaak van realtime berekeningen. AMD heeft zelfs een demo gemaakt met behulp van de Per-Face Texture Mapping-techniek, ontwikkeld door Walt Disney Animation Studios voor hun animatiefilms. Helaas is het demoprogramma nog niet klaar en hebben we alleen screenshots met een lage resolutie gezien.

De essentie van deze texture mapping-techniek is om aan elke polygoon een specifiek stuk textuur toe te wijzen, zonder de noodzaak van UV-transformatie (het vinden van een overeenkomst tussen oppervlaktecoördinaten driedimensionaal voorwerp en coördinaten op een tweedimensionale textuur). Deze aanpak lost een aantal problemen op bij het maken van mozaïekinhoud door het algoritme voor het in kaart brengen van verplaatsingen heel eenvoudig te maken. En PRT wordt bij deze methode gebruikt om textuurgegevens efficiënt op te slaan en te openen.

Instructies voor mediaverwerking

Een interessante innovatie op de Southern Islands lijkt de ondersteuning te zijn voor gespecialiseerde instructies die worden gebruikt bij beeldverwerking, statisch en dynamisch. Een veelgebruikte instructie genaamd ‘som van absolute verschillen’, beter bekend als SAD (Sum of Absolute Differences), is bijvoorbeeld verbeterd. De snelheid van de uitvoering ervan is een zeer prestatiekritisch knelpunt in veel beeld- en videoverwerkingsalgoritmen, zoals bewegingsdetectie, gebarenherkenning, zoeken naar afbeeldingen, computervisie en vele anderen.

Maar wacht, in onze review van de eeuwenoude Radeon HD 5870 videokaart schreven we al over SAD-ondersteuning! Alles klopt, maar nu, naast de gebruikelijke SAD (4x1), heeft Southern Islands dat ook nieuwe instructies- QSAD (quad SAD), dat SAD combineert met ploegendiensten om de prestaties en energie-efficiëntie te verbeteren, en de "gemaskeerde" MQSAD-instructie, die achtergrondpixels negeert en wordt gebruikt om bewegende objecten in het frame van de achtergrond te isoleren.

De nieuwe GPU's kunnen tot 256 pixels per GCN-rekeneenheid per klok verwerken, wat in het geval van het AMD Radeon HD 7970-model de mogelijkheid betekent om tot 7,6 biljoen pixels per seconde te verwerken in het geval van 8-bit gehele kleurwaarden. Hoewel dit een theoretisch cijfer is, zijn de visuele verwerkingsmogelijkheden van de nieuwe GPU's behoorlijk indrukwekkend: veel videoverwerkingstaken kunnen in realtime worden uitgevoerd.

PCI Express 3.0

We konden de steun van de derde versie van PCI Express door de hele reeks nieuwe grafische oplossingen van Southern Islands die vandaag en in de toekomst op de markt komen, niet negeren. Deze ondersteuning was redelijk te verwachten, aangezien de specificaties van de derde versie van PCI Express uiteindelijk in de herfst van 2010 werden goedgekeurd, maar er waren nog steeds geen hardwareoplossingen die dit ondersteunden, hoewel moederborden verschijnen al, videokaarten zijn vandaag uitgebracht, nu is het aan de centrale processors.

De vernieuwde interface heeft een overdrachtssnelheid van 8 gigatransacties per seconde in plaats van 5 GT/s voor versie 2.0, en de doorvoersnelheid is opnieuw verdubbeld (naar 32 GB/s) vergeleken met de PCI Express 2.0-standaard. IN nieuwe band Er wordt een ander coderingsschema gebruikt voor gegevens die via de bus worden verzonden, maar dit is compatibel eerdere versies PCI Express is behouden.

De eerste moederborden die PCI Express 3.0 ondersteunen, werden voornamelijk in de zomer van 2011 geïntroduceerd Intel-chipset Z68, en ze gingen pas in de herfst in de algemene verkoop. Dus de videokaarten arriveerden en AMD liep opnieuw een voorsprong op de rest wat betreft de snelheid van de release van nieuwe grafische processors die de meest geavanceerde technologieën ondersteunen. Het is nog te vroeg om te beoordelen of PCI-E 3.0 van enig praktisch nut zal zijn, maar wanneer een dergelijke mogelijkheid zich voordoet, zullen we zeker alle mogelijke opties testen.

AMD PowerTune-technologie

Een van de meest interessante innovaties in de Cayman was de geavanceerde energiebeheertechnologie van PowerTune. Flexibel GPU-energiebeheer bestaat al een hele tijd, maar vóór de Radeon HD 6900 waren al deze technologieën behoorlijk primitief en meestal met behulp van softwaremethoden en veranderde de frequentie en spanning stapsgewijs, waardoor grote delen van de videochips niet konden worden uitgeschakeld.

Zelfs in de Radeon HD 5000-familie verscheen er een prestatiebegrenzer wanneer een bepaald verbruiksniveau werd overschreden, en in de Radeon HD 6900 ging het systeem naar een kwalitatief ander niveau. Om dit te doen, bevatte de chip speciale sensoren in alle blokken die de opstartparameters bewaken. De GPU meet voortdurend de belasting en het stroomverbruik en laat deze niet boven een bepaalde drempel komen, waarbij de frequentie en spanning automatisch worden aangepast zodat de parameters binnen het opgegeven thermische pakket blijven.

In tegenstelling tot eerdere energiebeheertechnologieën biedt PowerTune directe controle over het GPU-stroomverbruik, in tegenstelling tot indirecte controle door veranderende frequenties en spanningen. Deze technologie helpt u uw GPU-klokken op hoge snelheden in te stellen, zodat u hoge gamingprestaties kunt bereiken zonder dat u zich zorgen hoeft te maken dat het stroomverbruik de veilige limieten overschrijdt. De meeste games en reguliere toepassingen, die gebruik maken van GPU-computing, hebben aanzienlijk lagere stroomvereisten en voldoen niet aan de gevaarlijke limieten voor energieverbruik van stabiliteitstests zoals Furmark en OCCT.

Zelfs de zwaarste games vereisen geen maximaal stroomverbruik, en als je het verbruik beperkt op frequentie en videokaarten test met extreme tests, dan zal er in het geval van 3D-games behoorlijk wat onbenut prestatie- en stroompotentieel zijn. In het geval dat de videokaart het veilige verbruiksniveau niet heeft bereikt, werkt de GPU op de in de fabriek ingestelde frequentie, en FurMark-tests en OCCT zal de GPU-frequentie afnemen om binnen de verbruikslimieten te blijven.

PowerTune helpt dus bij het instellen van hogere fabrieksfrequenties en het configureren van het systeem om zo efficiënt mogelijk gebruik te maken van GPU-bronnen met de geïnstalleerde GPU's maximaal niveau consumptie. In het bovenstaande voorbeeld gebruikt de HD 5870 geen PowerTune en gebruikt hij, vanwege de GPU-frequentiebeperking vanwege het hoge verbruik in de duurtests, niet al zijn mogelijkheden. Terwijl de Radeon HD 7970 is ingesteld op de maximale TDP, en de videochip de frequenties alleen reset als deze worden overschreden, worden de hoogst mogelijke prestaties in elke toepassing verkregen.

Dit wordt duidelijk weergegeven in het volgende diagram. In het geval van gamingtoepassingen is het bereiken van TDP mogelijk door de GPU-frequentie te verhogen, en voor piekbelastingen verlagen duurtests de frequentie tot een veilig niveau van energieverbruik. Zonder PowerTune zou u moeten kiezen - of geconfronteerd worden met de mogelijkheid dat de videokaart het begeeft lang werk FurMark en OCCT, of verminderen de potentiële spelprestaties. Nieuwe technologie lost deze problemen zo efficiënt mogelijk op.

AMD PowerTune reageert snel op veranderende omstandigheden (microseconden) omdat het een hardwaretechnologie is. Het onderscheidt zich ook door flexibele frequentie-instellingen, en niet stapsgewijs, zoals bij eerdere chips het geval was. Alle metingen zijn onafhankelijk van de driver, maar kunnen door de gebruiker worden aangepast via de videokaartinstellingen.

Het verschil tussen PowerTune en de eerder algemeen aanvaarde aanpak is dat in andere gevallen gebruik wordt gemaakt van thermische throttling, waardoor de GPU in een aanzienlijk lagere verbruiksmodus komt, terwijl PowerTune de frequentie eenvoudigweg soepel verlaagt, waardoor het GPU-verbruik op de ingestelde limiet komt. Hierdoor worden hogere kloksnelheden en prestaties bereikt.

AMD ZeroCore-technologie

AMD beperkte zich niet tot het gebruik van energiebeheertechnologie die al bekend was uit eerdere oplossingen. In de eerste chips van de Southern Islands-familie introduceert het AMD ZeroCore-technologie, die helpt een nog grotere energie-efficiëntie te bereiken in de "diepe inactieve" (of "slaap") modus met het weergaveapparaat uitgeschakeld, wat door alle besturingssystemen wordt ondersteund.

Bijna elk systeem, zelfs een gamingsysteem, brengt immers het grootste deel van zijn tijd door in de modus voor lage belasting van de grafische processor. En de videokaart zou in deze modus niet veel energie moeten verbruiken. En nog meer, om nog maar te zwijgen van de modus waarin de monitor is uitgeschakeld - in dit geval is het raadzaam om de GPU volledig uit te schakelen. Dat heeft AMD gedaan. Dankzij ZeroCore verbruikt de nieuwe GPU in diepe inactiviteit minder dan 5% van de energie van een volledige modus, waardoor de meeste functionele blokken in deze modus worden uitgeschakeld.

AMD geeft een schematische vergelijking met zijn eigen Radeon HD 5870, die dergelijke technologie niet ondersteunde. ZeroCore is een exclusieve innovatie van de Southern Islands die naar desktopoplossingen wordt gebracht vanaf mobiele GPU's die zijn ontworpen voor laptops. Overigens houden de voordelen van deze technologie niet alleen verband met een lager verbruik. Bovendien schakelt de videokaart in de langdurige inactieve modus, wanneer het display is uitgeschakeld, ook de ventilator op de videokaartkoeler volledig uit!

Dit is precies waar veel gebruikers al lang op wachten. Het meest interessante is dat, volgens onze gegevens, laboratoriumtests van vergelijkbare PowerTune- en ZeroCore-oplossingen verschillende generaties videokaarten geleden zijn uitgevoerd. Sommige technische voorbeelden van videokaarten uit de AMD-serie die al lang niet meer op de markt zijn, werkten precies zo, waarbij de koeler volledig werd uitgeschakeld wanneer deze niet werd gebruikt.

Maar het zijn niet alleen single-GPU-gebruikers die zullen profiteren van minder ruis en energieverbruik met AMD's nieuwe ZeroCore-compatibele grafische kaarten. Soortgelijke verbeteringen wachten op de gelukkige eigenaren van CrossFire-systemen op basis van twee, drie en zelfs vier GPU's. Het is logisch dat er bij het tekenen een tweedimensionale interface is besturingssysteem Zouden alle videokaarten behalve de hoofdkaart helemaal niet moeten werken? Maar dat is precies hoe ze nu werken!

Bij CrossFire-systemen op videokaarten met ZeroCore-ondersteuning in 2D-modus worden alle secundaire videokaarten met minimaal stroomverbruik in diepe slaap gebracht en wordt de koeler uitgeschakeld. Deze modus werkt voor verschillende videokaarten met één chip en voor dual-chip-oplossingen. Bovendien zal de primaire CrossFire-videokaart ook in deze modus gaan bij langdurige inactiviteit, geconfigureerd in Windows. Het verschil in werking ziet er als volgt uit:

De technologie is trouwens niet zo eenvoudig als het lijkt. AMD-ingenieurs moesten veel problemen oplossen die verband hielden met de werking van het besturingssysteem in de inactieve modus. Ze ontdekten bijvoorbeeld dat Windows de informatie op het scherm probeert bij te werken, zelfs als de monitor is uitgeschakeld. Wat je natuurlijk helemaal niet toestaat om de GPU uit te schakelen. Daarom moesten de programmeurs van het bedrijf een oplossing bedenken, waarbij ze alle schermtekencommando's negeerden wanneer de monitor in de slaapmodus werd uitgeschakeld.

AMD Eyefinity 2.0-technologie

Uiteraard was er in de nieuwe architectuur ook ruimte voor verbeteringen aan de beproefde technologie voor het weergeven van beelden op meerdere monitoren: AMD Eyefinity, nu in versie 2.0. Het kreeg nieuwe functies, hogere resoluties, ondersteuning voor meer beeldschermen en grotere flexibiliteit.

Deze technologie is best interessant, hoewel maar heel weinig gebruikers ruimte in de kamer zullen vinden en de moed zullen hebben om meer dan twee monitoren in het gezin te installeren. Maar het is beter om de mogelijkheid te hebben om er altijd gebruik van te kunnen maken, dan om er helemaal geen gebruik van te kunnen maken. Bovendien dalen de prijzen voor grote diagonale monitoren bijna niet, maar oplossingen uit het middensegment worden voortdurend goedkoper.

Het is nu zelfs winstgevender om drie monitoren met een schermdiagonaal van 24″ te kopen dan één 30-inch. AMD geeft precies zo'n voorbeeld, wanneer een 30″ monitor met een resolutie van 2560×1600 meer dan $1000 kost, en drie 24″ FullHD exemplaren voor de helft van die prijs kunnen worden gekocht:

Maar hoe u uw geld en ruimte in de kamer moet uitgeven, is een persoonlijke kwestie voor elke gebruiker. Het belangrijkste is dat een dergelijke mogelijkheid bestaat. Bovendien ondersteunt Eyefinity 2.0 nu beelduitvoer in HD3D-stereomodus - iets dat ontbrak in eerdere oplossingen, die in deze parameter inferieur waren aan concurrerende oplossingen. Door de combinatie van AMD Eyefinity- en HD3D-technologieën is de Radeon HD 7970 grafische kaart de eerste oplossing met één chip die drie monitoren ondersteunt die in stereomodus werken.

Stereoweergave met hoge resolutie vereist een zeer snelle data-interface. En bij eerdere versies van HDMI-uitgangen waren de mogelijkheden beperkt tot 24 Hz per oog, wat ruim voldoende is voor het bekijken van Blu-ray 3D-films, maar duidelijk te laag voor gamers.

Voor dergelijke taken begonnen ze het frame packing-formaat te gebruiken, waarbij de frames voor het linker- en rechteroog worden gecombineerd tot één, en de AMD Radeon HD 7970 het HDMI 1.4a frame packing-formaat ondersteunt voor stereobeelduitvoer. Dit is de eerste videokaart die 3 GHz HDMI met frame packing ondersteunt, waarbij elk oog een FullHD-beeld ontvangt met een frequentie van 60 Hz (120 Hz in totaal):

Een ander interessant nieuw product lijkt ons de Discrete Digital Multi-Point Audio (DDMA) meerkanaals audio-uitvoertechnologie, die samenwerkt met Eyefinity. Alle eerdere GPU's kunnen slechts één audiostream uitvoeren via HDMI en DisplayPort. Dat wil zeggen, zelfs als drie monitoren in verschillende kamers via HDMI op de pc zijn aangesloten audiokanaal er wordt er maar één verzonden. Maar de AMD Radeon HD 7900 kreeg ondersteuning voor gelijktijdige uitvoer van verschillende onafhankelijke audiokanalen, wat handig kan zijn in sommige configuraties met meerdere monitoren.

Dezelfde functie zal erg handig zijn voor gebruik bij videoconferenties met de weergave van meerdere gesprekspartners op afzonderlijke schermen, maar ook voor multitasking-toepassingen zoals spelen op drie monitoren met game-audio en het bekijken van nieuws op een apart scherm met een onafhankelijke audiostream. Vroeger was het voor dit alles nodig om meerdere afzonderlijke audiosystemen te gebruiken, maar nu werkt alles zo handig mogelijk.

Ook niet vergeten software-ondersteuning Eyefinity, de technologie wordt bijna elke maand bijgewerkt - er verschijnen nieuwe mogelijkheden. Dus in oktober verschenen ondersteuning voor resoluties tot 16384x16384 en nieuwe configuraties met meerdere monitoren: horizontaal en verticaal 5x1, evenals gebaseerd op zes monitoren in 3x2-modus.

De decemberupdate van de AMD Catalyst-videodriver maakte het mogelijk om samen te werken tussen Eyefinity en HD3D, en ondersteuning wordt beloofd in februari gebruikersrechten, het aanpassen van de plaatsing van de taakbalk en het verbeteren van het beheer van voorinstellingen.

Uitvoer naar zes monitoren kan worden bereikt met behulp van twee DisplayPort 1.2-poorten en twee MST-hubs (waar we eerder over schreven), terwijl voor drie of zelfs vier monitoren slechts één poort en de bijbehorende hub nodig zijn. Dergelijke hubs maken een flexibele configuratie van het beelduitvoersysteem mogelijk; ze ondersteunen maximaal vier FullHD-apparaten per DisplayPort 1.2-connector en zouden tegen de zomer van 2012 te koop moeten zijn.

Over resolutie gesproken. Hoge resolutie of zelfs ultrahoog - Ultra High Resolution. Huidige apparaten met een resolutie van 4000 pixels aan de grotere kant vereisen aansluiting met meerdere kabels tegelijk: twee DP 1.1 of vier DVI. Monitoren van de volgende generatie met deze resolutie zullen via slechts één kabel worden aangesloten: DP 1.2 HBR2 of HDMI 1.4a 3 GHz. En de nieuwe videokaart van AMD is al klaar voor dergelijke monitoren, opnieuw werd het de eerste ter wereld.

Videocodering en decodering

Het is heel normaal dat de AMD Radeon HD 7970 dezelfde UVD-eenheid bevat voor het decoderen van videogegevens, die verscheen in de vorige generatie videochips van het bedrijf. Er zijn eenvoudigweg geen aanpassingen nodig, het ondersteunt de multi-stream MVC-codec, het decoderen van MPEG-2/MPEG-4 (DivX), VC-1 en H.264-formaten, en het decoderen van twee FullHD-streams in alle ondersteunde formaten.

AMD-oplossingen bieden maximale kwaliteit bij het decoderen van videostreams, gebruiken enkele tientallen speciale en bieden maximale resultaten in kwaliteitstests zoals HQV. Onder de ondersteunde functies merken we op: kleur- en toonaanpassing, ruisonderdrukking, verscherping, hoogwaardige schaling, dynamisch contrast, geavanceerde de-interlacing en inverse telecine. Hier is een voorbeeld van het direct verbeteren van het contrast:

Maar de decodering op alle videochips is al lange tijd min of meer in orde. Alle nieuwe GPU's bieden behoorlijke kwaliteit en prestaties bij het bekijken van videogegevens. Maar videocodering op GPU staat nog in de kinderschoenen en de belangrijkste klachten van gebruikers zijn gericht lage kwaliteit het resulterende gecomprimeerde beeld.

Misschien, nieuwe serie De Radeon HD 7000 kan hierbij ook helpen, omdat alle GPU's in de serie een Video Codec Engine (VCE) videocoderingseenheid bevatten. Het Radeon HD 7970-model werd de eerste videokaart die hardwareversnelde videocodering en -compressie ondersteunde met behulp van een gespecialiseerde eenheid (voorheen namen streamprocessors deel aan de codering).

Kwaliteit en prestaties zouden duidelijk beter moeten zijn dan voorheen, met ondersteuning voor 1080p-codering met 60 frames per seconde, en zelfs sneller dan realtime. Het is moeilijk om iets over de kwaliteit te zeggen zonder tests, maar ons zijn verschillende niveaus van encoderoptimalisatie voor videogegevens en games beloofd, evenals variabele compressiekwaliteit (de mogelijkheid om te kiezen tussen het verhogen van de kwaliteit of de prestaties).

Er is momenteel geen plek om VCE uit te proberen - er zijn eenvoudigweg geen applicaties die dit ondersteunen, maar AMD werkt samen met partners zoals ArcSoft om ondersteuning te bieden voor VCE op relevante gebieden. softwareproducten. In de toekomst zijn we van plan een softwarebibliotheek uit te brengen om de videocodering te versnellen, waardoor het voor ontwikkelaars gemakkelijker wordt om AMD-producten van de volgende generatie te ondersteunen.

Codering kan in twee modi worden uitgevoerd: volledig en hybride (met behulp van de mogelijkheden van GPU-streamprocessors). De volledige modus is ontworpen voor taken die maximale energie-efficiëntie en consistente prestatieniveaus vereisen. Coderen in volledige modus op VCE is sneller dan realtime en biedt een lage latentie. Maar er is ook een hybride modus:

In deze modus werken de wiskundige GPU-blokken ook samen met VCE. Alle in hoge mate parallelliseerbare fasen, die in het diagram geel zijn omlijnd, kunnen de kracht van GCN-rekeneenheden benutten, terwijl een speciale VCE-eenheid voor efficiënte hardware-entropiecodering zorgt. Deze modus is zeer geschikt voor videokaarten met een groot wiskundig vermogen, zoals de Radeon HD 7970. Er blijven vragen bestaan ​​over de kwaliteit van deze twee modi, maar dit vereist een zorgvuldige analyse in een apart artikel.

AMD stabiele video

Naast het coderen en decoderen van videogegevens is er nog een ander gebied waar de stroom kan worden gebruikt nieuwe grafische afbeeldingen van AMD - verbetering van video's van slechte kwaliteit die uit de hand zijn gemaakt, zonder gebruik van een statief of andere soortgelijke beeldstabilisatieapparaten. De videostabilisatietechnologie heet AMD Steady Video en de tweede versie is al uitgebracht.

Het bedieningsalgoritme van de softwarestabilisator is vrij eenvoudig: op basis van de videostream worden statistieken over camerabewegingen (verschuiving, rotatie, zoom) verzameld en deze beweging wordt gecompenseerd in het huidige frame, ten opzichte van de vorige - het beeld wordt verschoven , geroteerd en geschaald zodat het beeld niet veel verspringt en stabiel blijft.

Hoe eenvoudig het ook klinkt, het is net zo moeilijk om te implementeren. Simpelweg omdat er twee miljoen pixels op het scherm staan, en tot 30 of zelfs 60 frames per seconde. Stel je voor hoeveel berekeningen er moeten worden gedaan om alle mogelijke frameverplaatsingen bij te houden. We hebben hierboven al geschreven over de QSAD-functie die wordt gebruikt bij videoverwerking; deze wordt ook gebruikt in Steady Video 2.0 om het bewegingsdetectie-algoritme te versnellen. De GPU moet dus willekeurige verschuivingen met een amplitude van maximaal 32 pixels in elke richting verwerken en dit vereist prestaties die overeenkomen met meer dan 500 miljard SAD-bewerkingen per seconde (voor 1920x1080 bij 60 FPS).

Dankzij de ondersteuning van nieuwe QSAD-instructies in de Radeon HD 7970 die vandaag is geïntroduceerd, is het voordeel ten opzichte van krachtige CPU's in het bewegingsdetectie-algoritme groter dan 10x! Dat wil zeggen, video van hoge kwaliteit we zullen er nu van worden voorzien, en niet alleen bij het verwerken van homevideo's in video-editors, maar ook bij het bekijken van de online video's van anderen, opgenomen met wie weet wat en wie weet hoe. Nou ja, nu zal alles tenminste niet meer zo trillen...

Software-ondersteuning

Lezers vragen ons al heel lang: wanneer zullen de voordelen van niet-grafisch computergebruik op GPU's eindelijk zichtbaar worden gewone gebruikers? Niet iedereen houdt zich immers bezig met videocodering, maar bijna iedereen komt compressie en archivering van elk type gegevens tegen, en vrij vaak. Welnu, we hebben niet alleen goed nieuws voor liefhebbers van 3D-graphics, maar ook voor normale mensen: ondersteuning voor AMD Fusion- en Radeon-chips is verschenen in de bekende WinZip 16.5-archiveringsprogramma.

Deze applicatie is al lang bekend, en hoewel de beste jaren achter ons liggen en er al krachtigere compressiemethoden zijn uitgevonden, ZIP-formaat blijft een van de meest voorkomende en snelste voor het archiveren en comprimeren van verschillende soorten gegevens. En nu wordt hij nog sneller!

In samenwerking met AMD konden de WinZip-ontwikkelaars de engine van het pakket versnellen met behulp van GPU-mogelijkheden met behulp van OpenCL. Uiteraard wordt nog niet alles versneld op de GPU, maar Deflate-compressie (een combinatie van LZ77- en Huffman-algoritmen), Inflate-decompressie en AES-encryptie zullen profiteren van uitvoering op GPU-streamprocessors. Interessant is dat je met OpenCL zelfs de belasting tussen de CPU en GPU kunt verdelen met behulp van beide apparaten.

Maar top videokaarten zoals Radeon HD 7970 zijn meer bedoeld voor gamingtoepassingen. De modernste en werkend op maximale instellingen. Het programmeerteam van AMD staat voortdurend in contact met een verscheidenheid aan game-ontwikkelaars en helpt hen bij de implementatie moderne technologieën, ondersteund door de GPU's van het bedrijf. AMD heeft de gaming-pc-industrie altijd gesteund, omdat zij een direct belang hebben bij de welvaart ervan. Zo werd er in 2010 16,2 miljard dollar uitgegeven aan games, en gaven consumenten 16,6 miljard dollar uit aan pc-gaminghardware (analisten schatten dat dit bedrag dit jaar zal stijgen tot 22 miljard dollar). Het is duidelijk dat AMD een deel van dit geld wil.

Er wordt verwacht dat het komende jaar een groot aantal interessante games op de pc zullen verschijnen. Onder de projecten waar AMD een hand bij heeft gehad en die in de eerste helft van het jaar zullen verschijnen, zijn: Blacklight: Retribution, Syndicate, Sniper Elite 2, Max Payne 3, Hitman: Absolution en anderen. Maar je hoeft niet te wachten tot volgend jaar; de eerste toevoeging aan de populairste game, Battlefield 3: Back to Karkand, is onlangs uitgebracht. De gebruikte engine is dezelfde Frostbite 2, maar de Back to Karkand-add-on biedt verbeterde vernietigbaarheid van niveaus en bevat vier opnieuw ontworpen multiplayer-kaarten uit Battlefield 2, nieuwe voertuigen, wapens, enz. De schermafbeeldingen zien er gewoon geweldig uit:

Om het artikel zo compleet mogelijk te maken, vermelden we ook de belangrijkste innovatie van AMD Catalyst 12.1 - gebruikersprofielen voor 3D-toepassingen, waardoor u kunt veranderen basisinstellingen kwaliteit en CrossFire-instellingen afzonderlijk voor elk programma (AMD heeft eindelijk zijn concurrenten ingehaald):

Om de kokende hersenen van onze lezers een pauze te geven van zo'n nauwgezette beschrijving van de mogelijkheden van AMD's nieuwe product, zullen we eindelijk iets vermakelijks laten zien: een screenshot van het demoprogramma gemaakt door het bedrijf voor de aankondiging van de eerste oplossingen van de familie van de Zuidelijke Eilanden. De demo heet “Leo” en toont een grappige sprookjesscène met behulp van moderne grafische technologieën:

Nadat we kennis hebben gemaakt met de theoretische aspecten van de nieuwe architectuur, evenals de kenmerken en functionaliteit van de Radeon HD 7970, is het tijd om naar de praktijk te gaan. Het volgende deel van het materiaal is gewijd aan een praktische studie van de weergavesnelheid van de nieuwe AMD-videokaart in puur synthetische tests. Hier zullen we bepalen hoe de prestaties van de eerste oplossing in de Southern Islands-familie zich verhouden tot de snelheid van eerdere oplossingen van AMD, evenals concurrerende grafische kaarten van Nvidia in de hogere prijsklasse.

AMD Radeon HD 7970 - Deel 2: videokaart en synthetische tests →