IPhone versus supercomputers uit het verleden. Wie wint? De krachtigste supercomputers. Moderne computers en spelconsoles

Sony Computer Entertainment Inc. kondigt met trots aan dat de deelname van het PLAYSTATION 3-entertainmentsysteem ervoor heeft gezorgd dat het Folding@home-project van Stanford University een cumulatieve capaciteit van meer dan 1 petaflop heeft bereikt.

Een petaflop is het vermogen van een computer of netwerk om 1 biljard (één gevolgd door 24 nullen) drijvende-kommaberekeningen per seconde (FLOPS) uit te voeren. Met andere woorden: als iedere persoon op aarde een eenvoudige wiskundige berekening zou uitvoeren (bijvoorbeeld het berekenen van een percentage van een bepaald bedrag), dan zou elke aardbewoner 75.000 eenvoudige wiskundige berekeningen per seconde moeten doen om de totale rekenkracht van de mensheid te vergroten. een petaflop bereiken.

Deze toename van de rekenkracht voor het Folding@home-project zal het onderzoek dat voorheen tientallen jaren duurde aanzienlijk versnellen. En dit alles wordt mogelijk gemaakt door de Cell Broadband Engine (Cell/B.E.) die wordt gebruikt in PLAYSTATION 3, die over een verwerkingskracht van meer dan 180 GFLOPS (miljarden drijvende-kommabewerkingen per seconde) beschikt. Cel/B.E. ongeveer 10 keer sneller dan een conventionele pc-processor, dus PLAYSTATION 3 kan zonder overdrijven een thuissupercomputer worden genoemd. De deelname van PLAYSTATION 3 aan het project helpt wetenschappers de oorzaken van ziekten zoals de ziekte van Parkinson, de ziekte van Alzheimer en kanker te identificeren.

Volgens Vijay Pande, universitair hoofddocent scheikunde aan Stanford University en projectleider van Folding@home, heeft de opname van PLAYSTATION 3 in het Folding@home-project wetenschappers meer macht gegeven dan ze zich ooit hadden kunnen voorstellen.

De president en CEO van de Amerikaanse divisie van SCEI, Jack Tretton, zei op zijn beurt dat de ingenieurs van het bedrijf zelfs in de ontwikkelingsfase wisten dat de kracht van PLAYSTATION 3 niet alleen voor entertainment zou worden gebruikt, maar ook ten behoeve van iedereen. mensheid. Voor het hele SCEI-team is het gebruik van haar geesteskind in projecten als Folding@home een bron van trots.

Eiwitonderzoek is een uiterst complex proces. Voor een gewone computer kan het oplossen van het eenvoudigste probleem wel 30 jaar duren. Folding@home distribueert computers over duizenden computers die op één netwerk zijn aangesloten. Tot voor kort gebruikte Folding@home uitsluitend personal computers. Ongeveer 200 duizend pc's namen deel aan het project, waarvan het totale vermogen ongeveer een kwart petaflop bedroeg. Dankzij een interne software-update op 15 maart 2007 “leerde” PLAYSTATION 3 met het project te werken. Sindsdien hebben meer dan 600.000 PLAYSTATION 3-gebruikers zich geregistreerd bij Folding@home, waarmee ze de mijlpaal van 1 petaflop hebben overschreden.

Om deel te nemen aan Folding@home hoef je alleen maar je PLAYSTATION 3 met internet te verbinden, de nieuwste versie van de interne systeemsoftware te downloaden en op het Folding@home-pictogram te klikken in de sectie Netwerk van het XMB-hoofdmenu (XrossMediaBar) . In de instellingen kun je de optie instellen om de Folding@home-applicatie automatisch te starten terwijl de PLAYSTATION 3 in de standby-modus staat. Om de applicatie automatisch te starten, moet je PLAYSTATION 3 zijn ingeschakeld en met internet zijn verbonden.

Het is vermeldenswaard dat Folding@home nog maar het begin is. SCEI is van plan ondersteuning aan PLAYSTATION 3 toe te voegen voor vele andere gedistribueerde computerprojecten op uiteenlopende wetenschappelijke gebieden, van geneeskunde tot sociaal en milieuonderzoek. Tegelijkertijd kunnen PLAYSTATION 3-bezitters zelf bepalen op welke doeleinden zij de kracht van hun entertainmentsysteem willen richten.

Bijna alle gebruikers die iets van SoC's begrijpen, krijgen bloedige discussies over wiens smartphone, processor of GPU cooler is. Eigenlijk wordt het GPU-vermogen gemeten in FLOPS, een speciale eenheid die laat zien hoeveel drijvende-kommabewerkingen de GPU (en niet alleen) per seconde kan uitvoeren. Iedereen die geïnteresseerd is, alstublieft ondergesneden!

Laten we beginnen met de meest populaire GPU: Mali-400. Deze GPU heeft grote bekendheid verworven vanwege zijn prestaties en energieverbruik. Tegelijkertijd is de chip, krachtig en batterij-efficiënt, in veel processors gebruikt, van NovaThor U8500 tot Exynos 4412. Er zijn veel varianten van deze GPU, die verschillen in het aantal cores. Hieronder staan ​​verschillende smartphones waarin deze GPU is ingebed en het aantal GFLOPS.

Samsung Galaxy Ace 2- Mali-400MP- 275MHz- 2.48Gflops
Samsung Galaxy S3- Mali-400MP4- 533MHz- 19,2Gflops

Een behoorlijk groot verschil, nietwaar?
Ik verspreidde ook de mythe dat hoe hoger de frequentie, hoe krachtiger de chip

Mali-450MP4-700MHz, die te vinden is in MT6592, en die volgens verschillende Trashbox-gebruikers zelfs de nog niet uitgebrachte Adreno 420 zou moeten verslaan. Het resultaat is 41,8Gflops. Een behoorlijk grote stap voorwaarts vergeleken met de Mali-400MP4, maar de Adreno 330-450MHz wint maar liefst 129,6 Gflops, wat onrealistisch hoog is. Bovendien is de frequentie lager dan die van de Mali-450MP4 op 250 MHz. Ter vergelijking: de topklasse PowerVR G6430-450MHz, die te vinden is in de IPhone 5S en iPad Air, haalt 115,2Gflops. De krachtigste Mali-628MP6-533MHz, die te vinden is in de Octa-versie van de Samsung Galaxy Note 3, wint 102,4Gflops.

Vergeet ook Tegra 4 en Tegra 4i niet. GeForce ULP x72, geïnstalleerd in Tegra 4, scoort 96,8 Gflops, en zijn LTE-broer met GeForce ULP x60 haalt 79,2

Maar hier gebeurt het meest interessante, omdat de Adreno 330 ook een 550MHz-versie heeft (die in de nabije toekomst kan worden verkregen met aangepaste cores) en deze meest overgeklokte versie maar liefst 158,4Gflops haalt! Dit is een record.

Laten we eens kijken naar oudere GPU's, zoals Adreno 320, Adreno 225, GeForce ULP x12 en PowerVR SGX544MP3 en SGX554MP4, en vergeet de eenvoudige SGX544MP niet, die te vinden is in de superpopulaire MT6589-chip.

Laten we ook eens kijken naar de videoprocessors Adreno 203, Adreno 205, Adreno 200, Adreno 220 en Adreno 305. De eerste 4 videoprocessors scoren het volgende: Adreno 200 - 3,92Gflops op een frequentie van 245MHz, Adreno 203 - 7,84Gflops op de dezelfde frequentie van 245 MHz. Zoals we kunnen zien: verdubbel het resultaat met dezelfde frequentie.
Adreno 205 is een voortzetting van de 203e. Hij krijgt 8,5 Gflops, wat niet veel is, maar de volgende GPU, genaamd Adreno 220, doorbreekt de stereotypen van niet de meest hoogwaardige GPU's: een ongelooflijke 18 Gflops - het niveau van de Mali-400MP4 533 MHz, die te vinden is in de topklasse Samsung Galaxy S3. Laten we nu eens kijken naar de Adreno 305, een vereenvoudigde versie van de Adreno 320. Deze GPU is te vinden in processors zoals Snapdragon S4 Plus en Snapdragon 400. Deze versneller haalt dus 21,6 Gflops op een frequentie van 450 MHz.

Adreno 320 is onderverdeeld in twee categorieën: die in de S4 Pro en die in de Snapdragon 600. Ze verschillen in het aantal blokken: als de S4 Pro-versie er 64 heeft, dan heeft de 600-versie er 96. De Adreno 320 S4 Pro haalt 57 Gflops en de S600-versie haalt maar liefst 97,2 op 450 MHz. Dit is zelfs meer dan de GeForce ULP x72, waardoor de Snapdragon 600 1,9GHz een krachtigere GPU heeft dan de Tegra 4. Een schokkend resultaat.

Laten we eens kijken naar de Adreno 225. Op een frequentie van 400 MHz haalt hij 25,6 Gflops. Ter vergelijking: de GeForce ULP x12, die in Tegra 3 is geïnstalleerd, haalt 12,5 Gflops op een frequentie van 520 MHz. Adreno 225 is krachtiger dan GeForce ULP x12... Hmm... Maar om eerlijk te zijn, GeForce ULP x12 heeft prestatieniveau... 4,5Gflops lager dan Adreno 220...

Laten we nu verder gaan met de PowerVR SGX544MP3, die te vinden is in de Exynos 5410 of, eenvoudiger gezegd, in de Samsung Galaxy S4. De prestatie is 51,1 Gflops. Niet de krachtigste. De duurdere SGX554MP4, die diende als gamingbasis voor de iPad 4, produceert 76,8 Gflops. Veel meer.

Maar zodra ik de prestaties ontdekte van de SGX544MP, die te vinden is in de MT6589 en MT6589T,... laat maar. MT6589 heeft een versie met een frequentie van 286MHz. Het produceert slechts 9,2 Gflops. Dit is heel weinig, maar nog steeds meer dan dat van zijn jongere broer MT6589M. Hij heeft een telling. De versneller werkt op een frequentie van slechts 156 MHz. Eerlijk gezegd wil ik niet over deze processor praten, maar het moet wel. Het produceert dus slechts 4,9 Gflops. Dit is iets beter dan de Adreno 200. De MT6589T met turbocompressor heeft een versneller geklokt op 357 MHz en levert daarmee 11,4 Gflops op.

En nu over consoles. De favoriete PSP van veel mensen produceert slechts 2,6 Gflops. Herinner je je de ongelooflijke graphics van PSP-games? En hoe soepel liepen ze erop? Adreno 330 is ruim 50 keer krachtiger dan PSP. Maar de 50-voudige toename wordt niet gevoeld. PSVita is een serieuze hardwareontwikkeling. Het heeft PowerVR SGX543MP4+ en dit levert een indrukwekkende 51,2Gflops op.

En nu over PS en Xbox. De PS3 heeft een prestatie van 228,8 Gflops en ik geloof dat de volgende generatie GPU's krachtiger zal zijn dan de geliefde console, maar op het niveau van de PS4, die nog steeds 1840 Gflops wint, zoals kanker voor China. Overigens haalt de superkrachtige Nvidia GeForce GTX Titan grafische kaart 4500Gflops, en de nieuwe GTX 780Ti ongeveer 4800Gflops. Voor de computer is als voor de maan: D

Oh, ik vergat de Vivante GC6400-videoversneller, die werkt op 800 MHz. Deze videoversneller is de enige concurrent van de helse Adreno 330: de prestatie is 128 Gflops, wat slechts 1,6 Gflops minder is dan de Adreno 330, maar we weten dat ontwikkelaars niet erg happig zijn op het optimaliseren van games voor deze zeldzame versneller. Ik ken bijvoorbeeld geen enkel apparaat met deze accelerator. Wie weet: schrijf het in de reacties

Sinds het moment dat de allereerste computer (de gelijkenis ervan) verscheen, begon het streven naar kracht en prestaties, en tegenwoordig is er in dit opzicht niets veranderd, omdat elke eigenaar van een personal computer wiens werk verband houdt met de belasting van de computer kracht van de pc dromen van nog productievere hardware.

Alle bestaande computers zijn onderverdeeld in verschillende categorieën, variërend van microchips tot supercomputers, die tientallen kilowatt elektriciteit verbruiken en van topklasse zijn qua computercapaciteiten. In dit materiaal leert u hoe u de prestaties van een personal computer kunt meten.

Om de prestaties van een bepaalde computer te meten, besloten ze vanaf het allereerste begin het aantal drijvende-kommabewerkingen te gebruiken dat per seconde werd uitgevoerd. In de praktijk bleek dit inderdaad een zeer significant resultaat te zijn. De meeteenheid voor bewerking 1 heette Flops. Computers zijn echter zeer productieve apparaten, dus vóór flops wordt het voorvoegsel kilo/mega/Giga/Peta/Exa, etc. gebruikt. Elke vermelde operatie is 1000 keer groter dan de vorige. Voor de eindevaluatie worden Flops/s-resultaten gegeven, d.w.z. flops per seconde. Als je meer wilt lezen over Flops, ga dan hierheen.

Persoonlijke pc-prestatiemeting

Er zijn veel tools om de flopprestaties van een pc of laptop te meten. Alle tools zijn echter gebaseerd op hetzelfde werkingsprincipe.

Mogelijke interfaces zijn onder meer prestatieanalyse via de opdrachtregel, via Fortran- en C++-compilers, enz. Maar we zullen een eenvoudiger route nemen en een reeds gecompileerd exe-bestand met programma's in Linpack gebruiken, dat het populairst is bij het meten van de prestaties van Windows-computers.

Hieronder presenteren we 2 versies van het Linpack-programma onder uw aandacht, waarmee u kunt bepalen hoeveel drijvende-kommabewerkingen uw computer per seconde uitvoert.

Hoe controleren?

Pak eerst het archief uit en voer het programma uit (bestand LinX.exe). De programma-interface is heel eenvoudig en u kunt er gemakkelijk achter komen. Ga eerst naar de instellingen en geef het programma de hoogste prioriteit. Probeer hierna hulpbronintensieve programma's uit te schakelen. In de LinX-interface kunt u kiezen hoeveel keer of minuten u de test wilt uitvoeren en hoeveel gegevens u tijdens de test wilt gebruiken. Wanneer alle instellingen zijn ingesteld, klikt u op Test. Eenmaal voltooid, ziet u het resultaat hoogstwaarschijnlijk in GFlops/s (Gigaflops per seconde).

Om een ​​idee te geven hoeveel het is: 1 Flops=1 Floating Point Operation; 1GFlops= 1.000.000.000 drijvende-kommabewerkingen.

− 10 21 yottaflops − 10 24 xeraflops − 10 27

FLOPS(of flopt of flop/s)(acroniem voor Engels. Fl oerend punt O peraties P eh S seconde , uitgesproken als flopt) is een hoeveelheid die wordt gebruikt om de computerprestaties te meten en die laat zien hoeveel drijvende-kommabewerkingen per seconde een bepaald computersysteem uitvoert.

Omdat moderne computers een hoog prestatieniveau hebben, komen derivaten van FLOPS vaker voor, gevormd door het gebruik van standaard SI-voorvoegsels.

Flops als prestatiemaatstaf

Net als de meeste andere prestatie-indicatoren wordt deze waarde bepaald door een testprogramma op de te testen computer uit te voeren, dat een probleem oplost met een bekend aantal bewerkingen en de tijd berekent waarin het probleem is opgelost. De populairste prestatietest van vandaag is het LINPACK-programma, dat onder meer wordt gebruikt bij het samenstellen van de TOP500-supercomputerbeoordeling.

Een van de belangrijkste voordelen van de flopindicator is dat deze tot op zekere hoogte kan worden geïnterpreteerd als een absolute waarde en theoretisch kan worden berekend, terwijl de meeste andere populaire maatstaven relatief zijn en het mogelijk maken het geteste systeem alleen te evalueren in vergelijking met een systeem dat wordt getest. aantal anderen. Deze functie maakt het mogelijk om de resultaten van verschillende algoritmen te gebruiken voor evaluatie, en om de prestaties te evalueren van computersystemen die nog niet bestaan ​​of in ontwikkeling zijn.

Beperkingen van toepasbaarheid

Ondanks de schijnbare ondubbelzinnigheid zijn flops in werkelijkheid een nogal slechte prestatiemaatstaf, omdat de definitie ervan dubbelzinnig is. Een “zwevende-kommabewerking” kan veel verschillende concepten verbergen, om nog maar te zwijgen van het feit dat de bitdiepte van de operanden een belangrijke rol speelt in deze berekeningen, die ook nergens gespecificeerd zijn. Bovendien wordt de flopwaarde beïnvloed door vele factoren die niet direct verband houden met de prestaties van de computermodule, zoals: de bandbreedte van communicatiekanalen met de processoromgeving, de prestaties van het hoofdgeheugen en de synchronisatie van cachegeheugen op verschillende niveaus.

Dit alles leidt er uiteindelijk toe dat de resultaten die op dezelfde computer worden verkregen met behulp van verschillende programma's aanzienlijk kunnen verschillen; bovendien kunnen bij elke nieuwe test verschillende resultaten worden verkregen met behulp van hetzelfde algoritme. Dit probleem wordt gedeeltelijk opgelost door een overeenkomst om uniforme testprogramma's (dezelfde LINPACK) te gebruiken met middelingsresultaten, maar na verloop van tijd 'ontgroeien' de mogelijkheden van computers de reikwijdte van de aangenomen test en begint deze kunstmatig lage resultaten op te leveren, omdat deze maakt geen gebruik van de nieuwste mogelijkheden van computerapparatuur. En voor sommige systemen kunnen algemeen aanvaarde tests helemaal niet worden toegepast, waardoor de vraag naar hun prestaties open blijft.

Redenen voor wijdverbreid gebruik

Ondanks een groot aantal significante tekortkomingen wordt de flops-indicator nog steeds met succes gebruikt om de prestaties te evalueren, op basis van de resultaten van de LINPACK-test. De redenen voor deze populariteit zijn in de eerste plaats te wijten aan het feit dat flops, zoals hierboven vermeld, een absolute waarde zijn. En ten tweede komen veel problemen in de technische en wetenschappelijke praktijk uiteindelijk neer op het oplossen van systemen van lineaire algebraïsche vergelijkingen, en de LINPACK-test is precies gebaseerd op het meten van de snelheid waarmee dergelijke systemen worden opgelost. Bovendien is de overgrote meerderheid van de computers (inclusief supercomputers) gebouwd op een klassieke architectuur met behulp van standaardprocessors, waardoor algemeen aanvaarde tests met grote betrouwbaarheid kunnen worden gebruikt. Zoals te zien is op de Intel Core 2 Quad Q9450 2,66GHz @3,5GHz en Intel Core 2 Duo E8400 3000MHz (2008) processors, lost LINPACK geen algebraïsche uitdrukkingen op, aangezien elke bewerking niet sneller kan gaan dan 1 processorcyclus. Voor Intel Core 2 Quad-processors vereist één cyclus dus één of twee hertz. Omdat drijvende-kommataken: delen/vermenigvuldigen, optellen/aftrekken veel meer dan één klokcyclus vereisen, is het duidelijk dat deze processors niet respectievelijk 48 Gigaflops en 18,5 Gigaflops konden produceren. Vaak worden, in plaats van een drijvende-kommaverdelingsoperatie, gegevens in DMA-modus van RAM naar de processorstack geladen. Dit is hoe het LINPACK-programma in sommige tests werkt, maar strikt genomen is het resultaat geen flopwaarde.

Opmerking: De opmerking over de onmogelijkheid om meer dan één bewerking per klokcyclus uit te voeren is absoluut onjuist, aangezien alle moderne processors in elk van hun kernen meerdere uitvoeringseenheden van elk type bevatten (inclusief voor drijvende-kommabewerkingen) die parallel werken en meer dan één kunnen uitvoeren. instructie per klokcyclus. Dit architecturale kenmerk wordt superscalariteit genoemd en verscheen voor het eerst in de allereerste processor.

Beoordeling van echte systeemprestaties

Vanwege de hoge spreiding van de LINPACK-testresultaten worden geschatte waarden gegeven, verkregen door het middelen van indicatoren op basis van informatie uit verschillende bronnen. De prestaties van gameconsoles en gedistribueerde systemen (die een beperkte specialisatie hebben en de LINPACK-test niet ondersteunen) worden ter referentie gegeven in overeenstemming met de cijfers die door hun ontwikkelaars zijn opgegeven. Nauwkeurigere resultaten die de parameters van specifieke systemen aangeven, kunnen bijvoorbeeld op de website worden verkregen.

Supercomputers

Persoonlijke computers

Verwerkers

  • Intel Core 2 Duo E8400 3,0GHz () - 18,6 Gflops Bij gebruik van de standaardversie van LINPACK 10
  • Intel Core 2 Duo E8400 3,0GHz @4,0GHz () - 25 Gflops (LINPACK Benchmark 10.0 64-bit) op Windows Vista x64 Ultimate SP1
  • Intel Core 2 Quad Q9450 2,66GHz @3,5GHz - 48 GFlops (LINPACK Benchmark 10.0 64-bit) op Windows 2003sp2 x64

Zakcomputers

Gedistribueerde systemen

Spelconsoles

Mens en rekenmachine

Opmerkingen

Zie ook

Koppelingen

  • TOP500 Supercomputerbeoordeling TOP500 (Engels)
  • De Performance Database Server Grote database met computerprestaties
  • Roy Longbottom's PC Benchmark Collection Een selectie van pc-benchmarkprogramma's (inclusief LINPACK) en testresultaten (Engels)
  • Linpack CPU Benchmark voor Pocket PC LINPACK-versie voor PDA's (Engels)

Wikimedia Stichting.

2010.

    Zie wat "Petaflops" is in andere woordenboeken:

    Screenshot van de Folding@home-client voor PlayStation 3, met een 3D-model van het eiwit dat wordt gesimuleerd Type Distributed computing ... Wikipedia