iPhone กับซูเปอร์คอมพิวเตอร์ในอดีต ใครจะชนะ? ซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุด คอมพิวเตอร์และเครื่องเล่นเกมสมัยใหม่

โซนี่ คอมพิวเตอร์ เอ็นเตอร์เทนเมนท์ อิงค์ มีความภูมิใจที่จะประกาศว่าการมีส่วนร่วมของระบบความบันเทิง PLAYSTATION 3 ช่วยให้โครงการ Folding@home ของมหาวิทยาลัยสแตนฟอร์ดมีความจุสะสมมากกว่า 1 petaflop

เพตาฟล็อปคือความสามารถของคอมพิวเตอร์หรือเครือข่ายในการคำนวณจุดลอยตัวต่อวินาที (FLOPS) 1,000 ล้านล้าน (หนึ่งตามด้วยศูนย์ 24 ตัว) กล่าวอีกนัยหนึ่ง หากทุกคนบนโลกคำนวณทางคณิตศาสตร์ง่ายๆ (เช่น คำนวณเปอร์เซ็นต์ของจำนวนหนึ่ง) มนุษย์โลกแต่ละคนจะต้องคำนวณทางคณิตศาสตร์อย่างง่าย 75,000 ครั้งต่อวินาที เพื่อให้พลังการคำนวณทั้งหมดของมนุษยชาติสามารถ ไปถึงระดับ petaflop

พลังการประมวลผลที่เพิ่มขึ้นสำหรับโปรเจ็กต์ Folding@home นี้จะช่วยเร่งการวิจัยที่ก่อนหน้านี้ใช้เวลาหลายทศวรรษได้เร็วขึ้น และทั้งหมดนี้เกิดขึ้นได้ด้วย Cell Broadband Engine (Cell/B.E.) ที่ใช้ใน PLAYSTATION 3 ซึ่งมีพลังการประมวลผลมากกว่า 180 GFLOPS (การดำเนินการจุดลอยตัวนับพันล้านต่อวินาที) เซลล์/พ.ศ. เร็วกว่าโปรเซสเซอร์พีซีทั่วไปประมาณ 10 เท่า ดังนั้น PLAYSTATION 3 จึงสามารถเรียกได้ว่าเป็นซูเปอร์คอมพิวเตอร์ในบ้านโดยไม่ต้องพูดเกินจริง การมีส่วนร่วมของ PLAYSTATION 3 ในโครงการนี้ช่วยให้นักวิทยาศาสตร์ระบุสาเหตุของโรคต่างๆ ได้ เช่น โรคพาร์กินสัน โรคอัลไซเมอร์ และมะเร็ง

Vijay Pande รองศาสตราจารย์ด้านเคมีที่มหาวิทยาลัยสแตนฟอร์ดและหัวหน้าโครงการ Folding@home กล่าวไว้ว่า การรวม PLAYSTATION 3 ไว้ในโครงการ Folding@home ทำให้นักวิทยาศาสตร์มีพลังมากกว่าที่พวกเขาจะจินตนาการได้

ในทางกลับกัน Jack Tretton ประธานและซีอีโอของแผนก SCEI ในอเมริกากล่าวว่าแม้ในขั้นตอนการพัฒนา วิศวกรของบริษัทก็รู้ดีว่าพลังของ PLAYSTATION 3 จะไม่เพียงแต่ใช้เพื่อความบันเทิงเท่านั้น แต่ยังเพื่อประโยชน์ของทุกคนด้วย มนุษยชาติ. สำหรับทีม SCEI ทั้งหมด การใช้ผลงานของเธอในโครงการอย่าง Folding@home ถือเป็นความภาคภูมิใจ

การวิจัยโปรตีนเป็นกระบวนการที่ซับซ้อนมาก สำหรับคอมพิวเตอร์ทั่วไป การแก้ปัญหาที่ง่ายที่สุดอาจใช้เวลาถึง 30 ปี Folding@home กระจายการประมวลผลไปยังคอมพิวเตอร์หลายพันเครื่องที่เชื่อมต่อกับเครือข่ายเดียว จนกระทั่งเมื่อไม่นานมานี้ Folding@home ใช้เฉพาะคอมพิวเตอร์ส่วนบุคคลเท่านั้น มีพีซีประมาณ 200,000 เครื่องเข้าร่วมในโครงการ ซึ่งมีกำลังรวมประมาณหนึ่งในสี่ของ petaflop ต้องขอบคุณการอัปเดตซอฟต์แวร์ภายในเมื่อวันที่ 15 มีนาคม 2550 ทำให้ PLAYSTATION 3 "เรียนรู้" ในการทำงานกับโปรเจ็กต์นี้ ตั้งแต่นั้นมา ผู้ใช้ PLAYSTATION 3 มากกว่า 600,000 รายได้ลงทะเบียนกับ Folding@home ซึ่งเกินกว่าระดับ 1 petaflop

หากต้องการเข้าร่วม Folding@home สิ่งที่คุณต้องทำคือเชื่อมต่อ PLAYSTATION 3 ของคุณกับอินเทอร์เน็ต ดาวน์โหลดซอฟต์แวร์ระบบภายในเวอร์ชันล่าสุด และคลิกไอคอน Folding@home ในส่วนเครือข่ายของเมนูหลัก XMB (XrossMediaBar) . ในการตั้งค่า คุณสามารถตั้งค่าตัวเลือกให้เปิดแอปพลิเคชัน Folding@home โดยอัตโนมัติในขณะที่ PLAYSTATION 3 อยู่ในโหมดสแตนด์บาย หากต้องการเปิดแอปพลิเคชันโดยอัตโนมัติ คุณต้องเปิด PLAYSTATION 3 และเชื่อมต่อกับอินเทอร์เน็ต

เป็นที่น่าสังเกตว่า Folding@home เป็นเพียงจุดเริ่มต้นเท่านั้น SCEI วางแผนที่จะเพิ่มการสนับสนุน PLAYSTATION 3 สำหรับโครงการคอมพิวเตอร์แบบกระจายอื่นๆ อีกมากมายในสาขาวิทยาศาสตร์ที่หลากหลาย ตั้งแต่การแพทย์ไปจนถึงการวิจัยทางสังคมและสิ่งแวดล้อม ในเวลาเดียวกัน เจ้าของ PLAYSTATION 3 จะสามารถตัดสินใจได้ด้วยตนเองว่าจุดประสงค์ใดในการควบคุมพลังของระบบความบันเทิงของตน

ผู้ใช้เกือบทั้งหมดที่เข้าใจบางสิ่งบางอย่างเกี่ยวกับ SoC มักถกเถียงกันอย่างดุเดือดว่าสมาร์ทโฟน โปรเซสเซอร์ หรือ GPU ของใครเจ๋งกว่ากัน จริงๆ แล้ว กำลังของ GPU นั้นวัดเป็น FLOPS ซึ่งเป็นหน่วยพิเศษที่แสดงจำนวนการทำงานของจุดลอยตัวที่ GPU (และไม่เพียงแต่) สามารถทำได้ต่อวินาที ท่านใดสนใจเชิญครับ อยู่ระหว่างการตัด!

เริ่มจาก GPU ยอดนิยมกันก่อน - Mali-400 GPU นี้ได้รับชื่อเสียงอย่างมากเนื่องจากประสิทธิภาพและการใช้พลังงาน ในเวลาเดียวกันชิปนี้มีประสิทธิภาพและประหยัดแบตเตอรี่ได้ถูกนำมาใช้ในโปรเซสเซอร์หลายตัวตั้งแต่ NovaThor U8500 ไปจนถึง Exynos 4412 GPU นี้มีหลายพันธุ์ซึ่งแตกต่างกันตามจำนวนคอร์ ด้านล่างนี้คือสมาร์ทโฟนหลายรุ่นที่มีการฝัง GPU นี้และจำนวน GFLOPS

Samsung Galaxy Ace 2- Mali-400MP- 275MHz- 2.48Gflops
Samsung Galaxy S3- Mali-400MP4- 533MHz- 19.2Gflops

ค่อนข้างแตกต่างกันมากใช่ไหม?
ฉันยังเผยแพร่ความเชื่อผิดๆ ว่ายิ่งความถี่สูง ชิปก็จะยิ่งมีประสิทธิภาพมากขึ้น

Mali-450MP4- 700MHz ซึ่งพบใน MT6592 และตามที่ผู้ใช้ถังขยะหลายคนระบุว่าควรเอาชนะแม้แต่ Adreno 420 ที่ยังไม่เปิดตัวก็ตาม ผลลัพธ์คือ 41.8Gflops ค่อนข้างก้าวไปข้างหน้ามากเมื่อเทียบกับ Mali-400MP4 แต่ Adreno 330-450MHz ได้รับมากถึง 129.6 Gflops ซึ่งสูงเกินจริง นอกจากนี้ความถี่ยังต่ำกว่า Mali-450MP4 ที่ 250MHz สำหรับการเปรียบเทียบ PowerVR G6430-450MHz ระดับบนสุดที่พบใน iPhone 5S และ iPad Air ได้คะแนน 115.2Gflops Mali-628MP6-533MHz ที่ทรงพลังที่สุดซึ่งพบได้ใน Samsung Galaxy Note 3 เวอร์ชัน Octa คะแนน 102.4Gflops

อย่าลืม Tegra 4 และ Tegra 4i ด้วย GeForce ULP x72 ซึ่งติดตั้งใน Tegra 4 ได้คะแนน 96.8Gflops และพี่น้อง LTE ที่มี GeForce ULP x60 ทำได้ 79.2

แต่สิ่งที่น่าสนใจที่สุดเกิดขึ้นที่นี่เพราะ Adreno 330 มีเวอร์ชัน 550MHz เช่นกัน (ซึ่งในอนาคตอันใกล้นี้สามารถรับได้โดยใช้คอร์ที่กำหนดเอง) และเวอร์ชันที่โอเวอร์คล็อกมากที่สุดนี้จะได้รับมากถึง 158.4Gflops! นี่คือบันทึก

ลองดู GPU รุ่นเก่าๆ เช่น Adreno 320, Adreno 225, GeForce ULP x12 และ PowerVR SGX544MP3 และ SGX554MP4 และอย่าลืม SGX544MP ธรรมดาๆ ซึ่งพบได้ในชิป MT6589 ยอดนิยม

ลองดูโปรเซสเซอร์วิดีโอ Adreno 203, Adreno 205, Adreno 200, Adreno 220 และ Adreno 305 โปรเซสเซอร์วิดีโอ 4 ตัวแรกมีคะแนนดังนี้: Adreno 200 - 3.92Gflops ที่ความถี่ 245MHz, Adreno 203 - 7.84Gflops ที่ ความถี่เดียวกันคือ 245MHz ดังที่เราเห็น: ผลลัพธ์เป็นสองเท่าที่ความถี่เดียวกัน
Adreno 205 เป็นรุ่นต่อเนื่องจาก 203 มันได้รับ 8.5Gflops ซึ่งไม่มากนัก แต่ GPU ถัดไปที่เรียกว่า Adreno 220 ทำลายแบบแผนของ GPU ระดับบนสุดที่ไม่ใช่ GPU ระดับบนสุด: 18Gflops ที่น่าทึ่ง - ระดับของ Mali-400MP4 533MHz ซึ่งพบใน Samsung Galaxy S3 ระดับบนสุด ตอนนี้เรามาดู Adreno 305 ซึ่งเป็น Adreno 320 เวอร์ชันที่เรียบง่าย GPU นี้พบได้ในโปรเซสเซอร์เช่น Snapdragon S4 Plus และ Snapdragon 400 ดังนั้น ตัวเร่งความเร็วนี้จะได้รับ 21.6Gflops ที่ความถี่ 450MHz

Adreno 320 แบ่งออกเป็นสองประเภท: ประเภทที่พบใน S4 Pro และประเภทที่พบใน Snapdragon 600 ซึ่งมีจำนวนบล็อกต่างกัน: หากรุ่น S4 Pro มี 64 บล็อก แสดงว่ารุ่น 600 จะมี 96 บล็อก Adreno 320 S4 Pro ได้รับ 57 Gflops และเวอร์ชัน S600 นั้นมีความเร็วสูงสุดถึง 97.2 ที่ 450MHz นี่เป็นมากกว่า GeForce ULP x72 ด้วยซ้ำ ดังนั้น Snapdragon 600 1.9GHz จึงมี GPU ที่ทรงพลังมากกว่า Tegra 4 ผลลัพธ์ที่น่าตกใจ

มาดู Adreno 225 กันดีกว่า ที่ความถี่ 400MHz จะได้รับ 25.6Gflops สำหรับการเปรียบเทียบ GeForce ULP x12 ซึ่งติดตั้งใน Tegra 3 จะได้รับ 12.5Gflops ที่ความถี่ 520MHz Adreno 225 นั้นทรงพลังกว่า GeForce ULP x12... อืม... แต่พูดตามตรง GeForce ULP x12 นั้นมีระดับประสิทธิภาพ... 4.5Gflops ต่ำกว่า Adreno 220...

ตอนนี้เรามาดู PowerVR SGX544MP3 กันดีกว่า ซึ่งพบได้ใน Exynos 5410 หรือพูดง่ายๆ ก็คือใน Samsung Galaxy S4 ประสิทธิภาพการทำงานของมันคือ 51.1Gflops ไม่ใช่ผู้ที่แข็งแกร่งที่สุด SGX554MP4 ระดับสูงซึ่งทำหน้าที่เป็นพื้นฐานการเล่นเกมสำหรับ iPad 4 ผลิต 76.8Gflops ใหญ่กว่ามาก

แต่ทันทีที่ฉันทราบประสิทธิภาพของ SGX544MP ซึ่งพบใน MT6589 และ MT6589T ฉัน... ไม่เป็นไร MT6589 มีเวอร์ชันที่มีความถี่ 286MHz ผลิตได้เพียง 9.2Gflops นี่เป็นเพียงเล็กน้อย แต่ก็ยังมากกว่าน้องชายของมัน MT6589M เขามีการนับ คันเร่งทำงานที่ความถี่เพียง 156MHz พูดตามตรงฉันไม่อยากพูดถึงโปรเซสเซอร์นี้ แต่ฉันต้องทำ ดังนั้นจึงผลิตได้เพียง 4.9 Gflops ซึ่งดีกว่า Adreno 200 เล็กน้อย MT6589T แบบเทอร์โบชาร์จมีตัวเร่งความเร็วโอเวอร์คล็อกที่ 357MHz และให้ 11.4Gflops

และตอนนี้เกี่ยวกับคอนโซล PSP ที่หลายๆ คนชื่นชอบผลิตเพียง 2.6Gflops คุณจำกราฟิกที่น่าทึ่งของเกม PSP ได้หรือไม่? และพวกเขาเดินบนมันได้อย่างราบรื่นแค่ไหน? Adreno 330 แรงกว่า PSP ถึง 50 เท่า แต่กลับไม่รู้สึกถึงการเพิ่มขึ้น 50 เท่า PSVita คือการพัฒนาฮาร์ดแวร์อย่างจริงจัง มี PowerVR SGX543MP4+ และให้ความเร็ว 51.2Gflops ที่น่าประทับใจ

และตอนนี้เกี่ยวกับ PS และ Xbox PS3 มีประสิทธิภาพ 228.8 Gflops และฉันเชื่อว่า GPU รุ่นต่อไปจะมีประสิทธิภาพมากกว่าคอนโซลอันเป็นที่รัก แต่ถึงระดับของ PS4 ซึ่งยังคงได้รับ 1840 Gflops เหมือนกับมะเร็งในจีน อย่างไรก็ตาม การ์ดกราฟิก Nvidia GeForce GTX Titan ที่ทรงพลังเป็นพิเศษมีความเร็วถึง 4500Gflops และ GTX 780Ti ใหม่มีความเร็วถึงประมาณ 4800Gflops ต่อคอมพิวเตอร์ก็เหมือนไปดวงจันทร์:D

โอ้ ฉันลืมเกี่ยวกับตัวเร่งความเร็ววิดีโอ Vivante GC6400 ซึ่งทำงานที่ 800MHz ตัวเร่งความเร็ววิดีโอนี้เป็นคู่แข่งเพียงรายเดียวของ Adreno 330 ที่ชั่วร้าย: ประสิทธิภาพของมันคือ 128!!! Gflops ซึ่งน้อยกว่า Adreno 330 เพียง 1.6 Gflops แต่เรารู้ว่านักพัฒนาไม่ค่อยกระตือรือร้นที่จะเพิ่มประสิทธิภาพเกมสำหรับตัวเร่งความเร็วที่หายากนี้ ตัวอย่างเช่น ฉันไม่รู้จักอุปกรณ์เครื่องเดียวที่มีคันเร่งนี้ ใครจะรู้: โปรดเขียนในความคิดเห็น

ตั้งแต่ครั้งแรกที่คอมพิวเตอร์เครื่องแรก (รูปลักษณ์ของมัน) ปรากฏขึ้นการแสวงหาพลังและประสิทธิภาพก็เริ่มขึ้นและทุกวันนี้ไม่มีอะไรเปลี่ยนแปลงในเรื่องนี้เพราะเจ้าของคอมพิวเตอร์ส่วนบุคคลทุกคนที่ทำงานเชื่อมต่อกับโหลดในคอมพิวเตอร์ พลังของพีซีฝันถึงฮาร์ดแวร์ที่มีประสิทธิผลมากยิ่งขึ้น

คอมพิวเตอร์ทุกเครื่องที่มีอยู่แบ่งออกเป็นหลายประเภท ตั้งแต่ไมโครชิปไปจนถึงซูเปอร์คอมพิวเตอร์ ซึ่งใช้พลังงานไฟฟ้าหลายสิบกิโลวัตต์ และมีความสามารถด้านการประมวลผลระดับแนวหน้า ในเนื้อหานี้คุณจะได้เรียนรู้วิธีวัดประสิทธิภาพของคอมพิวเตอร์ส่วนบุคคล

ตั้งแต่สมัยแรกสุด เพื่อวัดประสิทธิภาพของคอมพิวเตอร์เครื่องใดเครื่องหนึ่ง พวกเขาตัดสินใจใช้จำนวนการดำเนินการจุดลอยตัวที่ทำต่อ 1 วินาที ในทางปฏิบัติสิ่งนี้กลายเป็นผลลัพธ์ที่สำคัญมากอย่างแน่นอน หน่วยการวัดสำหรับการดำเนินการ 1 เรียกว่า Flops อย่างไรก็ตาม คอมพิวเตอร์เป็นอุปกรณ์ที่มีประสิทธิภาพมาก ดังนั้นจึงใช้คำนำหน้า kilo/mega/Giga/Peta/Exa ฯลฯ ก่อนการฟล็อป การดำเนินการแต่ละรายการมีขนาดใหญ่กว่าการดำเนินการครั้งก่อน 1,000 เท่า สำหรับการประเมินขั้นสุดท้าย จะมีการให้ผลลัพธ์ Flops/s เช่น ฟลอปต่อวินาที หากคุณต้องการอ่านเพิ่มเติมเกี่ยวกับ Flops ให้ไปที่นี่

การวัดประสิทธิภาพพีซีส่วนบุคคล

มีเครื่องมือมากมายในการวัดประสิทธิภาพฟล็อปของคอมพิวเตอร์ส่วนบุคคลหรือแล็ปท็อป อย่างไรก็ตาม เครื่องมือทั้งหมดใช้หลักการทำงานเดียวกัน

อินเทอร์เฟซที่เป็นไปได้ ได้แก่ การวิเคราะห์ประสิทธิภาพผ่านบรรทัดคำสั่ง ผ่านคอมไพเลอร์ Fortran และ C++ เป็นต้น แต่เราจะใช้เส้นทางที่ง่ายกว่าและใช้ไฟล์ exe ที่คอมไพล์แล้วของโปรแกรมใน Linpack ซึ่งเป็นไฟล์ที่ได้รับความนิยมมากที่สุดในการวัดประสิทธิภาพของคอมพิวเตอร์ Windows

ด้านล่างนี้เราขอนำเสนอโปรแกรม Linpack 2 เวอร์ชันซึ่งจะช่วยคุณกำหนดจำนวนการดำเนินการจุดลอยตัวที่คอมพิวเตอร์ของคุณดำเนินการต่อวินาที

วิธีการตรวจสอบ?

ขั้นแรก ให้แตกไฟล์เก็บถาวรแล้วรันโปรแกรม (ไฟล์ LinX.exe) อินเทอร์เฟซของโปรแกรมนั้นเรียบง่ายมากและคุณสามารถเข้าใจได้อย่างง่ายดาย ขั้นแรกไปที่การตั้งค่าและให้ความสำคัญกับโปรแกรมสูงสุด หลังจากนี้ ให้ลองปิดโปรแกรมที่ใช้ทรัพยากรมาก ในอินเทอร์เฟซ LinX คุณสามารถเลือกจำนวนครั้งหรือนาทีที่จะทำการทดสอบ และข้อมูลที่จะใช้ในระหว่างการทดสอบ เมื่อตั้งค่าทั้งหมดเรียบร้อยแล้ว คลิก ทดสอบ- เมื่อเสร็จสิ้นแล้ว คุณน่าจะเห็นผลลัพธ์เป็น GFlops/s (Gigaflops ต่อวินาที)

เพื่อให้เข้าใจว่ามีค่าเท่าใด: 1 Flops=1 การดำเนินการจุดลอยตัว; 1GFlops= การดำเนินการจุดลอยตัว 1,000,000,000

− 10 21 ยอตตาฟลอปส์ − 10 24 ซีราฟลอป − 10 27

ฟลอปส์(หรือ ล้มเหลวหรือ ล้มเหลว/วินาที)(ตัวย่อสำหรับภาษาอังกฤษ. ชั้นจุดทานข้าว โอการดำเนินการ เอ่อ ที่สอง , ออกเสียงเหมือน ล้มเหลว) คือปริมาณที่ใช้ในการวัดประสิทธิภาพของคอมพิวเตอร์ โดยแสดงจำนวนการดำเนินการจุดลอยตัวต่อวินาทีที่ระบบคอมพิวเตอร์กำหนดทำงาน

เนื่องจากคอมพิวเตอร์สมัยใหม่มีประสิทธิภาพในระดับสูง อนุพันธ์ของ FLOPS จึงเป็นเรื่องปกติมากขึ้น ซึ่งเกิดขึ้นจากการใช้คำนำหน้า SI มาตรฐาน

Flops เป็นการวัดประสิทธิภาพ

เช่นเดียวกับตัวบ่งชี้ประสิทธิภาพอื่นๆ ส่วนใหญ่ ค่านี้จะถูกกำหนดโดยการรันโปรแกรมทดสอบบนคอมพิวเตอร์ที่กำลังทดสอบ ซึ่งจะแก้ปัญหาด้วยจำนวนการดำเนินการที่ทราบ และคำนวณเวลาที่ได้รับการแก้ไข การทดสอบประสิทธิภาพที่ได้รับความนิยมมากที่สุดในปัจจุบันคือโปรแกรม LINPACK ซึ่งใช้ในการรวบรวมการจัดอันดับซูเปอร์คอมพิวเตอร์ TOP500 เหนือสิ่งอื่นใด

ข้อดีที่สำคัญที่สุดอย่างหนึ่งของตัวบ่งชี้ Flops คือ ในระดับหนึ่ง มันสามารถตีความได้ว่าเป็นค่าสัมบูรณ์และคำนวณตามทฤษฎี ในขณะที่การวัดยอดนิยมอื่น ๆ ส่วนใหญ่จะสัมพันธ์กันและอนุญาตให้ประเมินระบบภายใต้การทดสอบเท่านั้นเมื่อเปรียบเทียบกับ จำนวนอื่น ๆ คุณสมบัตินี้ทำให้สามารถใช้ผลลัพธ์ของอัลกอริธึมต่างๆ ในการประเมิน รวมถึงประเมินประสิทธิภาพของระบบคอมพิวเตอร์ที่ยังไม่มีหรืออยู่ระหว่างการพัฒนา

ข้อจำกัดของการบังคับใช้

แม้จะมีความชัดเจนชัดเจน แต่ในความเป็นจริงแล้ว flops เป็นตัววัดประสิทธิภาพที่ค่อนข้างต่ำ เนื่องจากคำจำกัดความของมันมีความคลุมเครือ “การดำเนินการจุดลอยตัว” สามารถซ่อนแนวคิดที่แตกต่างกันได้มากมาย ไม่ต้องพูดถึงข้อเท็จจริงที่ว่าความลึกบิตของตัวถูกดำเนินการมีบทบาทสำคัญในการคำนวณเหล่านี้ ซึ่งไม่ได้ระบุไว้ที่ใดเลย นอกจากนี้ ค่าฟล็อปส์ยังได้รับอิทธิพลจากปัจจัยหลายประการที่ไม่เกี่ยวข้องโดยตรงกับประสิทธิภาพของโมดูลการประมวลผล เช่น แบนด์วิดท์ของช่องทางการสื่อสารกับสภาพแวดล้อมของโปรเซสเซอร์ ประสิทธิภาพของหน่วยความจำหลัก และการซิงโครไนซ์หน่วยความจำแคชที่ต่างกัน ระดับ

ทั้งหมดนี้นำไปสู่ความจริงที่ว่าผลลัพธ์ที่ได้รับบนคอมพิวเตอร์เครื่องเดียวกันโดยใช้โปรแกรมที่แตกต่างกันอาจแตกต่างกันอย่างมีนัยสำคัญ ยิ่งไปกว่านั้นในการทดสอบใหม่แต่ละครั้ง ผลลัพธ์ที่แตกต่างกันสามารถรับได้โดยใช้อัลกอริธึมเดียวกัน ปัญหานี้ได้รับการแก้ไขบางส่วนโดยข้อตกลงในการใช้โปรแกรมทดสอบแบบสม่ำเสมอ (LINPACK เดียวกัน) พร้อมผลลัพธ์โดยเฉลี่ย แต่เมื่อเวลาผ่านไปความสามารถของคอมพิวเตอร์จะ "เกิน" ขอบเขตของการทดสอบที่นำมาใช้และเริ่มให้ผลลัพธ์ที่ต่ำเกินจริงเนื่องจาก ไม่ได้ใช้ความสามารถล่าสุดของอุปกรณ์คอมพิวเตอร์ และสำหรับบางระบบ การทดสอบที่เป็นที่ยอมรับโดยทั่วไปไม่สามารถใช้ได้เลย ทิ้งคำถามเกี่ยวกับประสิทธิภาพเอาไว้

เหตุผลในการใช้อย่างแพร่หลาย

แม้จะมีข้อบกพร่องที่สำคัญจำนวนมาก แต่ตัวบ่งชี้ flops ยังคงถูกนำมาใช้ในการประเมินประสิทธิภาพได้สำเร็จ โดยพิจารณาจากผลลัพธ์ของการทดสอบ LINPACK สาเหตุของความนิยมนี้เนื่องมาจาก ประการแรก ความจริงที่ว่าการล้มเหลวดังที่กล่าวไว้ข้างต้นเป็นมูลค่าที่แน่นอน และประการที่สอง ปัญหามากมายในการปฏิบัติงานด้านวิศวกรรมและวิทยาศาสตร์ในที่สุดก็มาถึงการแก้ระบบสมการพีชคณิตเชิงเส้น และการทดสอบ LINPACK นั้นขึ้นอยู่กับการวัดความเร็วของการแก้ระบบดังกล่าวอย่างแม่นยำ นอกจากนี้ คอมพิวเตอร์ส่วนใหญ่ (รวมถึงซูเปอร์คอมพิวเตอร์) ถูกสร้างขึ้นบนสถาปัตยกรรมคลาสสิกโดยใช้โปรเซสเซอร์มาตรฐาน ซึ่งช่วยให้สามารถใช้การทดสอบที่เป็นที่ยอมรับโดยทั่วไปและมีความน่าเชื่อถือสูง ดังที่แสดงบนโปรเซสเซอร์ Intel Core 2 Quad Q9450 2.66GHz @3.5GHz และ Intel Core 2 Duo E8400 3000MHz (2008) LINPACK ไม่สามารถแก้นิพจน์พีชคณิตได้ เนื่องจากการดำเนินการใดๆ ไม่สามารถดำเนินการได้เร็วกว่า 1 รอบของโปรเซสเซอร์ ดังนั้นสำหรับโปรเซสเซอร์ Intel Core 2 Quad หนึ่งรอบต้องใช้หนึ่งหรือสองเฮิร์ตซ์ เนื่องจากงานจุดลอยตัว: การหาร/การคูณ การบวก/การลบต้องใช้มากกว่าหนึ่งรอบสัญญาณนาฬิกา จึงเป็นที่ชัดเจนว่าโปรเซสเซอร์เหล่านี้ไม่สามารถผลิต 48 Gigaflops และ 18.5 Gigaflops ตามลำดับ บ่อยครั้ง แทนที่จะดำเนินการหารจุดทศนิยม ข้อมูลจะถูกโหลดในโหมด DMA จาก RAM ไปยังสแต็กตัวประมวลผล นี่คือวิธีการทำงานของโปรแกรม LINPACK ในการทดสอบบางอย่าง แต่หากพูดอย่างเคร่งครัด ผลลัพธ์ไม่ใช่ค่า flops

บันทึก:หมายเหตุเกี่ยวกับความเป็นไปไม่ได้ในการดำเนินการมากกว่าหนึ่งการดำเนินการต่อรอบสัญญาณนาฬิกานั้นไม่ถูกต้องอย่างแน่นอนเนื่องจากโปรเซสเซอร์ที่ทันสมัยทั้งหมดในแต่ละคอร์มีหน่วยการดำเนินการหลายหน่วยในแต่ละประเภท (รวมถึงการดำเนินการจุดลอยตัว) ที่ทำงานแบบขนานและสามารถดำเนินการได้มากกว่าหนึ่งรายการ คำสั่งต่อรอบสัญญาณนาฬิกา คุณลักษณะทางสถาปัตยกรรมนี้เรียกว่า superscalarity และปรากฏครั้งแรกในโปรเซสเซอร์ตัวแรก

รีวิวประสิทธิภาพของระบบจริง

เนื่องจากผลการทดสอบ LINPACK มีการกระจายสูง ค่าโดยประมาณจึงได้รับจากตัวบ่งชี้การหาค่าเฉลี่ยตามข้อมูลจากแหล่งต่างๆ ประสิทธิภาพของเกมคอนโซลและระบบแบบกระจาย (ที่มีความเชี่ยวชาญเฉพาะทางและไม่รองรับการทดสอบ LINPACK) นั้นมีไว้เพื่อวัตถุประสงค์ในการอ้างอิงตามตัวเลขที่ระบุโดยผู้พัฒนา ผลลัพธ์ที่แม่นยำยิ่งขึ้นซึ่งระบุพารามิเตอร์ของระบบเฉพาะสามารถรับได้บนเว็บไซต์

ซูเปอร์คอมพิวเตอร์

คอมพิวเตอร์ส่วนบุคคล

โปรเซสเซอร์

  • Intel Core 2 Duo E8400 3.0GHz () - 18.6 Gflops เมื่อใช้ LINPACK 10 เวอร์ชันมาตรฐาน
  • Intel Core 2 Duo E8400 3.0GHz @4.0GHz () - 25 Gflops (เกณฑ์มาตรฐาน LINPACK 10.0 64 บิต) บน Windows Vista x64 Ultimate SP1
  • Intel Core 2 Quad Q9450 2.66GHz @3.5GHz - 48 GFlops (เกณฑ์มาตรฐาน LINPACK 10.0 64 บิต) บน Windows 2003sp2 x64

พ็อกเก็ตคอมพิวเตอร์

ระบบแบบกระจาย

เครื่องเล่นเกมคอนโซล

มนุษย์และเครื่องคิดเลข

หมายเหตุ

ดูสิ่งนี้ด้วย

ลิงค์

  • ระดับซูเปอร์คอมพิวเตอร์ TOP500 TOP500 (ภาษาอังกฤษ)
  • เซิร์ฟเวอร์ฐานข้อมูลประสิทธิภาพ ฐานข้อมูลประสิทธิภาพของคอมพิวเตอร์ขนาดใหญ่
  • คอลเลกชันเกณฑ์มาตรฐาน PC ของ Roy Longbottom โปรแกรมเกณฑ์มาตรฐาน PC ที่ได้รับการคัดสรร (รวมถึง LINPACK) และผลการทดสอบ (ภาษาอังกฤษ)
  • Linpack CPU Benchmark สำหรับ Pocket PC เวอร์ชัน LINPACK สำหรับ PDA (ภาษาอังกฤษ)

มูลนิธิวิกิมีเดีย 2010.

ดูว่า "Petaflops" ในพจนานุกรมอื่น ๆ คืออะไร:

    สกรีนช็อตของไคลเอนต์ Folding@home สำหรับ PlayStation 3 ซึ่งแสดงโมเดล 3 มิติของโปรตีนที่กำลังจำลองการคำนวณแบบกระจาย ... Wikipedia

    หนึ่งในชั้นวาง BlueGene/L Blue Gene เป็นโครงการสถาปัตยกรรมคอมพิวเตอร์ที่ออกแบบมาเพื่อสร้างซูเปอร์คอมพิวเตอร์หลายเครื่องและมุ่งเป้าไปที่ความเร็วการประมวลผล ... Wikipedia