เรด 5 คืออะไร ประเภทของ RAID และลักษณะเฉพาะ

และสิ่งของ สิ่งของ สิ่งของ ดังนั้นวันนี้เราจะพูดถึง การโจมตีอาร์เรย์ขึ้นอยู่กับพวกเขา

อย่างที่คุณทราบสิ่งเหล่านี้ ฮาร์ดดิสก์นอกจากนี้ยังมีส่วนต่างของความปลอดภัยหลังจากที่ล้มเหลว เช่นเดียวกับลักษณะที่ส่งผลต่อประสิทธิภาพการทำงาน

แน่นอนว่าหลายท่านไม่ทางใดก็ทางหนึ่งเคยได้ยินเกี่ยวกับ Raid Array ที่สามารถทำจากธรรมดาได้ ฮาร์ดไดรฟ์เพื่อปรับปรุงการทำงานของดิสก์เหล่านี้และคอมพิวเตอร์โดยรวม หรือเพื่อเพิ่มความน่าเชื่อถือในการจัดเก็บข้อมูล

คุณอาจรู้เช่นกัน (และถ้าคุณไม่รู้ ก็ไม่สำคัญ) ว่าอาร์เรย์เหล่านี้มีความแตกต่างกัน หมายเลขลำดับ (0, 1, 2, 3, 4 ฯลฯ) และยังทำงานได้ดีทีเดียว ฟังก์ชั่นต่างๆ. ปรากฏการณ์นี้เกิดขึ้นจริงในธรรมชาติ และอย่างที่คุณคาดเดาได้เกี่ยวกับสิ่งเหล่านี้ การโจมตีอาร์เรย์ฉันต้องการบอกคุณในบทความนี้ ฉันพูดถึงมันแล้ว ;)

ไป.

RAID คืออะไรและทำไมจึงจำเป็น

การโจมตี- นี่คืออาร์เรย์ของดิสก์ (เช่น คอมเพล็กซ์ หรือถ้าคุณต้องการ เป็นกลุ่ม) ของอุปกรณ์ต่างๆ - ฮาร์ดดิสก์ ดังที่ฉันได้กล่าวไว้ข้างต้น อาร์เรย์นี้ทำหน้าที่เพิ่มความน่าเชื่อถือในการจัดเก็บข้อมูล และ/หรือ เพิ่มความเร็วในการอ่าน/เขียนข้อมูล (หรือทั้งสองอย่าง)

จริงๆ แล้วชุดของดิสก์นี้ทำอะไรกันแน่ เช่น การเร่งงานหรือเพิ่มความปลอดภัยของข้อมูลขึ้นอยู่กับคุณหรือขึ้นอยู่กับตัวเลือก การกำหนดค่าปัจจุบันการจู่โจม ประเภทต่างๆการกำหนดค่าเหล่านี้เป็นเพียงการทำเครื่องหมาย ตัวเลขที่แตกต่างกัน: 1, 2, 3, 4 และทำหน้าที่ต่างกัน

ยกตัวอย่างง่าย ๆ ในกรณีของการสร้าง 0 รุ่น -voi (คำอธิบายของรูปแบบต่างๆ 0, 1, 2, 3 ฯลฯ - อ่านด้านล่าง) คุณจะได้รับการเพิ่มประสิทธิภาพที่เห็นได้ชัดเจน และโดยทั่วไป ฮาร์ดดิสก์วันนี้ก็เช่นเดียวกัน ช่องแคบในความเร็วของระบบ

เหตุใดจึงเกิดขึ้นโดยทั่วไป

ในทางกลับกัน ฮาร์ดไดรฟ์จะมีปริมาณเพิ่มขึ้นเนื่องจากความเร็วในการหมุนของหัว (ยกเว้นรุ่นที่หายากเช่น แร็ปเตอร์"ov) แข็งตัวเป็นเวลานานที่เครื่องหมาย 7200 แคชยังไม่เติบโตสถาปัตยกรรมยังคงเหมือนเดิม

โดยทั่วไปแล้วในแง่ของประสิทธิภาพดิสก์จะหยุดนิ่ง (เฉพาะดิสก์ที่กำลังพัฒนาเท่านั้นที่สามารถบันทึกสถานการณ์ได้) แต่มีบทบาทสำคัญในการทำงานของระบบและในบางสถานที่แอปพลิเคชันเต็มรูปแบบ

ในกรณีของการสร้างหน่วย (ในความหมายของจำนวน 1 ) ของการจู่โจม คุณจะสูญเสียประสิทธิภาพไปเล็กน้อย แต่คุณจะได้รับการรับประกันความปลอดภัยของข้อมูลของคุณที่จับต้องได้ เนื่องจากข้อมูลเหล่านั้นจะถูกทำซ้ำอย่างสมบูรณ์ และในความเป็นจริง แม้ว่าดิสก์หนึ่งจะล้มเหลว ทุกอย่างก็จะอยู่ในตำแหน่งที่สมบูรณ์ คนที่สองโดยไม่มีการสูญเสียใด ๆ

โดยทั่วไปแล้วฉันทำซ้ำการจู่โจมจะเป็นประโยชน์กับทุกคน ฉันจะบอกว่าพวกเขาจำเป็น :)

RAID คืออะไรในความหมายทางกายภาพ

ทางร่างกาย การโจมตี-array แทนจาก สองก่อน จำนวนฮาร์ดไดรฟ์ที่เชื่อมต่อซึ่งรองรับความสามารถในการสร้าง การโจมตี(หรือไปยังคอนโทรลเลอร์ที่เกี่ยวข้องซึ่งพบได้น้อยกว่าเนื่องจากมีราคาแพงสำหรับผู้ใช้ทั่วไป (โดยปกติแล้วคอนโทรลเลอร์จะใช้บนเซิร์ฟเวอร์เนื่องจากความน่าเชื่อถือและประสิทธิภาพที่เพิ่มขึ้น)) เช่น ไม่มีอะไรเปลี่ยนแปลงภายในยูนิตระบบ มีเพียงไม่มีการเชื่อมต่อเพิ่มเติมหรือการเชื่อมต่อระหว่างดิสก์หรือกับอย่างอื่น

โดยทั่วไปแล้วในส่วนของฮาร์ดแวร์ทุกอย่างเกือบจะเหมือนเดิมและมีเพียงแนวทางของซอฟต์แวร์เท่านั้นที่เปลี่ยนไปซึ่งอันที่จริงแล้วกำหนดโดยการเลือกประเภทของการจู่โจมว่าไดรฟ์ที่เชื่อมต่อควรทำงานอย่างไร

โดยทางโปรแกรมแล้ว ในระบบหลังจากสร้างการจู่โจมแล้ว ก็ไม่มีนิสัยใจคอพิเศษเช่นกัน ในความเป็นจริงแล้ว ความแตกต่างทั้งหมดในการทำงานกับการโจมตีนั้นมีเพียงเท่านั้น การตั้งค่าขนาดเล็กซึ่งจัดการการจู่โจม (ดูด้านล่าง) และในการใช้งานของไดรเวอร์ มิฉะนั้นทุกอย่างจะเหมือนกันทุกประการ - ใน "My Computer" จะเหมือนกัน ซีดีและดิสก์อื่น ๆ โฟลเดอร์ไฟล์เดียวกันทั้งหมด .. โดยทั่วไปและโดยทางโปรแกรมด้วยตาตัวตนที่สมบูรณ์

การติดตั้งอาร์เรย์นั้นไม่มีอะไรซับซ้อน: เพียงแค่ใช้เมนบอร์ดที่รองรับเทคโนโลยีนี้ การโจมตีเราใช้สองสิ่งที่เหมือนกันอย่างสมบูรณ์ - มันเป็นสิ่งสำคัญ!, - ทั้งในแง่ของคุณสมบัติ (ขนาด, แคช, อินเทอร์เฟซ, ฯลฯ ) และผู้ผลิตและรุ่นของดิสก์และเชื่อมต่อกับเมนบอร์ดนี้ ถัดไปเพียงเปิดคอมพิวเตอร์ไปที่ ไบออสและตั้งค่าพารามิเตอร์ การกำหนดค่า SATA: การโจมตี.

หลังจากนั้น ในระหว่างขั้นตอนการบู๊ตเครื่องคอมพิวเตอร์ (โดยปกติก่อนการบู๊ต หน้าต่าง) แผงจะปรากฏขึ้นเพื่อแสดงข้อมูลเกี่ยวกับดิสก์ในการโจมตีและภายนอกซึ่งคุณต้องคลิก ซีทีอาร์-ไอเพื่อตั้งค่าการจู่โจม (เพิ่มดิสก์เข้าไป ลบออก ฯลฯ) ที่จริงนั่นคือทั้งหมด จากนั้นก็มีความสุขอื่น ๆ ในชีวิตนั่นคือทุกอย่างเช่นเคย

หมายเหตุสำคัญที่ต้องจำ

เมื่อสร้างหรือลบการโจมตี ( 1 การจู่โจมครั้งที่ - ดูเหมือนจะใช้ไม่ได้ แต่ไม่ใช่ข้อเท็จจริง) ข้อมูลทั้งหมดจะถูกลบออกจากดิสก์อย่างหลีกเลี่ยงไม่ได้ดังนั้นจึงไม่คุ้มค่าที่จะทำการทดสอบโดยการสร้างและลบการกำหนดค่าต่างๆ ดังนั้นก่อนที่จะสร้างการโจมตีให้บันทึกทั้งหมดก่อน ข้อมูลที่จำเป็น(ถ้ามี) แล้วทำการทดลอง

ส่วนคอนฟิก..ก็อย่างที่บอก.. การโจมตีมีอาร์เรย์หลายประเภท (อย่างน้อยจากพื้นฐานหลัก นี่คือ การโจมตี 1, การโจมตี 2, การโจมตี 3, การโจมตี 4, การโจมตี 5, การโจมตี 6). เริ่มต้นด้วยฉันจะพูดถึงสองสิ่งที่เข้าใจได้และเป็นที่นิยมมากที่สุดในหมู่ผู้ใช้ทั่วไป:

  • การโจมตี 0- ดิสก์อาร์เรย์เพื่อเพิ่มความเร็ว \ บันทึก
  • การโจมตี 1- อาร์เรย์ดิสก์มิเรอร์

และในตอนท้ายของบทความฉันจะพูดถึงบทความอื่น ๆ อย่างรวดเร็ว

RAID 0 - มันคืออะไรและกินกับอะไร?

ดังนั้น.. การโจมตี 0(aka, stripe ("Striping")) - ใช้ฮาร์ดไดรฟ์สองถึงสี่ตัว (มาก - น้อย) ที่ประมวลผลข้อมูลร่วมกันซึ่งจะเพิ่มประสิทธิภาพ เพื่อให้ชัดเจน คนๆ เดียวจะถือกระเป๋าได้นานกว่าและยากกว่าสี่ใบ (แม้ว่าคุณสมบัติทางกายภาพของกระเป๋าจะยังคงเหมือนเดิม โดยทางโปรแกรม ข้อมูลของการจู่โจมประเภทนี้จะถูกแบ่งออกเป็นบล็อกข้อมูลและเขียนไปยังทั้งสอง / หลายดิสก์ตามลำดับ

ข้อมูลหนึ่งบล็อกในดิสก์หนึ่ง บล็อกข้อมูลอีกบล็อกหนึ่ง และอื่นๆ ดังนั้นประสิทธิภาพจึงเพิ่มขึ้นอย่างมาก (หลายหลากของการเพิ่มประสิทธิภาพขึ้นอยู่กับจำนวนดิสก์ เช่น ดิสก์ที่ 4 จะทำงานเร็วกว่าสอง) แต่ความปลอดภัยของข้อมูลในอาร์เรย์ทั้งหมดลดลง ในกรณีที่มีข้อผิดพลาดใด ๆ ที่รวมอยู่ในดังกล่าว การโจมตีฮาร์ดไดรฟ์ (เช่น ฮาร์ดไดรฟ์) เกือบสมบูรณ์และสูญเสียข้อมูลทั้งหมดอย่างถาวร

ทำไม ความจริงก็คือแต่ละไฟล์ประกอบด้วยจำนวนไบต์จำนวนหนึ่ง .. ซึ่งแต่ละไฟล์มีข้อมูล แต่ใน การโจมตี 0อาร์เรย์ของไบต์ของไฟล์เดียวสามารถอยู่ในดิสก์หลายแผ่น ดังนั้นหากดิสก์ตัวใดตัวหนึ่ง "ตาย" จำนวนไบต์ของไฟล์โดยพลการจะหายไปและจะไม่สามารถกู้คืนได้ แต่ไฟล์ไม่ได้อยู่คนเดียว

โดยทั่วไป เมื่อใช้ Raid Array ดังกล่าว ขอแนะนำอย่างยิ่งให้สร้างข้อมูลที่มีค่าอย่างถาวร สื่อภายนอก. การจู่โจมให้ความเร็วที่จับต้องได้จริงๆ - ฉันจะบอกคุณในนี้ ประสบการณ์ของตัวเองเพราะความสุขนั้นตั้งอยู่ที่บ้านข้าพเจ้ามาหลายปีแล้ว

RAID 1 - มันคืออะไรและกินกับอะไร?

แล้ว RAID 1 ล่ะ(มิเรอร์ - "มิเรอร์").. ที่จริงฉันจะเริ่มต้นด้วยข้อเสียเปรียบ ไม่เหมือน การโจมตี 0ดูเหมือนว่าคุณกำลัง "สูญเสีย" ระดับเสียง ยากที่สองดิสก์ (ใช้เพื่อเขียนสำเนาเต็ม (ไบต์ต่อไบต์) ของสำเนาแรก ฮาร์ดไดรฟ์ในขณะที่ RAID 0 สามารถเข้าถึงได้อย่างสมบูรณ์)

ข้อได้เปรียบตามที่คุณเข้าใจแล้วคือมีความน่าเชื่อถือสูงเช่น ทุกอย่างทำงานได้ (และข้อมูลทั้งหมดมีอยู่ตามธรรมชาติและไม่หายไปจากความล้มเหลวของอุปกรณ์ตัวใดตัวหนึ่ง) ตราบใดที่ดิสก์อย่างน้อยหนึ่งตัวยังทำงานอยู่ เช่น แม้ว่าดิสก์หนึ่งจะถูกปิดใช้งานอย่างหยาบคาย แต่คุณจะไม่สูญเสียข้อมูลแม้แต่ไบต์เดียวเพราะ สำเนาที่สองคือสำเนาที่สะอาดของสำเนาแรกและแทนที่เมื่อล้มเหลว การโจมตีดังกล่าวมักใช้ในเซิร์ฟเวอร์เนื่องจากข้อมูลมีพลังงานสูงซึ่งเป็นสิ่งสำคัญ

ด้วยวิธีการนี้ ประสิทธิภาพการทำงานจึงลดลง และตามความรู้สึกส่วนตัว มันยังน้อยกว่าการใช้ดิสก์หนึ่งแผ่นโดยไม่มีการจู่โจมใดๆ อย่างไรก็ตาม สำหรับบางคน ความน่าเชื่อถือมีความสำคัญมากกว่าประสิทธิภาพ

RAID 2, 3, 4, 5, 6 - มันคืออะไรและกินกับอะไร?

คำอธิบายของอาร์เรย์เหล่านี้มีอยู่มากเท่ากับ สำหรับการอ้างอิงเท่านั้น และแม้กระทั่งในรูปแบบบีบอัด (อันที่จริง อธิบายเฉพาะส่วนที่สองเท่านั้น) ทำไมถึงเป็นเช่นนั้น? อย่างน้อยที่สุดเนื่องจากความนิยมต่ำของอาร์เรย์เหล่านี้ในหมู่ผู้ใช้โดยเฉลี่ย (และโดยทั่วไป อื่นๆ) และด้วยเหตุนี้ฉันจึงมีประสบการณ์ในการใช้งานเพียงเล็กน้อย

การโจมตี 2สงวนไว้สำหรับอาร์เรย์ที่ใช้รหัส Hamming (ฉันไม่สนใจว่ามันคืออะไร ดังนั้นฉันจะไม่บอก) หลักการทำงานเป็นดังนี้: ข้อมูลถูกเขียนไปยังอุปกรณ์ที่เกี่ยวข้องในลักษณะเดียวกับใน การโจมตี 0นั่นคือแบ่งออกเป็นบล็อกเล็ก ๆ ในดิสก์ทั้งหมดที่เกี่ยวข้องกับการจัดเก็บข้อมูล

ดิสก์ที่เหลือ (จัดสรรเป็นพิเศษ) จะจัดเก็บรหัสแก้ไขข้อผิดพลาดตามที่ข้อมูลสามารถกู้คืนได้ในกรณีที่ฮาร์ดไดรฟ์ล้มเหลว Tobish ในอาร์เรย์ประเภทนี้ ดิสก์จะถูกแบ่งออกเป็นสองกลุ่ม - สำหรับข้อมูลและสำหรับรหัสแก้ไขข้อผิดพลาด

ตัวอย่างเช่น คุณมีดิสก์สองแผ่นซึ่งเป็นที่สำหรับระบบและไฟล์ และอีกสองแผ่นจะถูกสงวนไว้อย่างสมบูรณ์สำหรับการแก้ไขข้อมูลในกรณีที่ดิสก์สองแผ่นแรกล้มเหลว ในความเป็นจริงนี่คือสิ่งที่เหมือนกับการจู่โจมเป็นศูนย์โดยมีความสามารถในการบันทึกข้อมูลในกรณีที่ฮาร์ดไดรฟ์ตัวใดตัวหนึ่งล้มเหลว ไม่ค่อยแพง - ดิสก์สี่แผ่นแทนที่จะเป็นสองแผ่นพร้อมความปลอดภัยที่เพิ่มขึ้นอย่างมาก

การโจมตี 3, 4, 5, 6.. เกี่ยวกับพวกเขาไม่ว่ามันจะฟังดูแปลกแค่ไหนในหน้าของไซต์นี้ลองอ่านบน Wikipedia ความจริงก็คือในชีวิตของฉันฉันเจออาร์เรย์เหล่านี้น้อยมาก (ยกเว้นว่าอันที่ห้ามาถึงมือบ่อยกว่าอันอื่น) และฉันไม่สามารถอธิบายหลักการทำงานของพวกมันด้วยคำพูดที่เข้าถึงได้ แต่ฉันไม่ต้องการอย่างยิ่ง พิมพ์ซ้ำบทความจากแหล่งข้อมูลที่เสนอข้างต้น อย่างน้อยก็ในความแข็งแกร่งของการปรากฏตัวในสูตรที่โกรธจัดเหล่านี้ ซึ่งแม้แต่ฉันก็เข้าใจด้วยเสียงเอี๊ยดอ๊าด

คุณควรเลือก RAID ใด

หากคุณเล่นเกม, คัดลอกเพลง, ภาพยนตร์, ติดตั้งโปรแกรมที่ใช้ทรัพยากรจำนวนมากเป็นประจำ คุณจะมีประโยชน์อย่างแน่นอน การโจมตี 0. แต่ระวังเมื่อ เลือกยากดิสก์ - ในกรณีนี้คุณภาพเป็นสิ่งสำคัญอย่างยิ่ง - หรือต้องแน่ใจว่าได้สำรองข้อมูลไปยังสื่อภายนอก

หากคุณกำลังทำงานร่วมกับ ข้อมูลที่มีค่าซึ่งการสูญเสียนั้นมีค่าเท่ากับความตาย ดังนั้นคุณจะต้องใช้อย่างแน่นอน การโจมตี 1- เป็นเรื่องยากมากที่จะสูญเสียข้อมูลกับเขา

ฉันพูดซ้ำ มากเป็นที่พึงปรารถนาที่จะติดตั้งดิสก์ใน การโจมตีอาร์เรย์มีเพศเหมือนกัน ขนาด, บริษัท, ซีรีส์, ขนาดแคช - ทุกอย่างควรจะเหมือนกัน

คำต่อท้าย

นี่คือสิ่งที่

ยังไงก็ตามฉันเขียนไว้ในบทความเกี่ยวกับวิธีรวบรวมปาฏิหาริย์นี้: " วิธีสร้างอาร์เรย์ RAID วิธีปกติ " แต่เกี่ยวกับพารามิเตอร์สองสามตัวในวัสดุ " RAID 0 ของ SSD สองตัว - การทดสอบจริงด้วย Read Ahead และ Read Cache". ใช้การค้นหา.

ฉันหวังเป็นอย่างยิ่งว่าบทความนี้จะเป็นประโยชน์กับคุณและคุณจะทำให้ตัวเองเป็นประเภทใดประเภทหนึ่งอย่างแน่นอน เชื่อฉันสิว่ามันคุ้มค่า

สำหรับคำถามเกี่ยวกับการสร้างและกำหนดค่าโดยทั่วไป คุณสามารถติดต่อฉันได้ในความคิดเห็น ฉันจะพยายามช่วย (หากมีคำแนะนำสำหรับเมนบอร์ดของคุณบนเครือข่าย) ฉันยินดีที่จะเพิ่มเติมความปรารถนาความคิดและทุกสิ่งอื่น ๆ

ไม่กี่ปีที่ผ่านมาฉันเตือนว่า RAID 5 จะหยุดทำงานในปี 2009 แน่นอนผู้ให้บริการ ที่เก็บข้อมูลเครือข่ายไม่แนะนำ RAID 5 ปัจจุบันแนะนำ RAID 6 ซึ่งป้องกันความล้มเหลวของไดรฟ์สองตัวในอาร์เรย์ แต่ในปี 2019 แม้แต่ RAID 6 ก็ยังไม่ปกป้องข้อมูลของคุณ นั่นเป็นเหตุผล

การโจมตี 6 = (การโจมตี 5) 2

ฉันเขียนว่า RAID 6 จะมีอายุการใช้งานที่จำกัดด้วย:

…RAID 6 จะไม่ให้การปกป้องคุณมากไปกว่า RAID 5 ในปัจจุบันในอีกไม่กี่ปีข้างหน้า นี่ไม่ใช่ความผิดของ RAID 6 ในทางกลับกัน เป็นเพราะความจุของดิสก์เพิ่มขึ้นและจำนวนข้อผิดพลาดในการอ่านที่ร้ายแรงคงที่

ย้อนกลับไปในเดือนธันวาคม 2009 Adam Leventhal วิศวกรของ SUN สถาปนิกแฟลช และ ZFS ได้ทำการวิเคราะห์อายุขัยของ RAID 6 ว่าเป็นกลยุทธ์การปกป้องข้อมูลที่ใช้การได้ เขาตีพิมพ์ในนิตยสาร ACM ในบทความ “RAID Triple Parity and Beyond” ซึ่งเป็นข้อความที่ตัดตอนมาจากบทความนี้

ข่าวดี: Leventhal พบว่าระดับการป้องกันของ RAID 6 จะดีพอๆ กับ RAID 5 ในปี 2019

ข่าวร้าย: Loewenthal สันนิษฐานว่าแผ่นดิสก์มีความน่าเชื่อถือมากกว่าที่เป็นจริง ดังนั้นเวลาอาจสั้นลงหากผู้ผลิตแผ่นดิสก์ไม่เข้าร่วม และอีกอันหนึ่ง ข่าวดี: หนึ่งใน บริษัท มีแผ่นดิสก์อยู่แล้ว - และฉันจะบอกคุณว่าใครเป็นใคร

สาระสำคัญของปัญหา

อาร์เรย์ RAID เป็นตัวควบคุม (หรือโปรแกรม) ที่รวมกลุ่มของดิสก์เป็นหนึ่งเดียว ดิสก์ขนาดใหญ่โดยใช้ สูตรทางคณิตศาสตร์. ตัวควบคุมเพิ่มไปยังไดรฟ์ บล็อกเพิ่มเติม เช็คซัมเพื่อไม่ให้ดิสก์หนึ่งหรือสองแผ่นสูญเสียข้อมูล (ต่อไปนี้เรากำลังพูดถึงอาร์เรย์ RAID 5 และ 6 ไม่ใช่ RAID 0, 1 หรือ 10) Checksums ช่วยให้คุณสามารถกู้คืนข้อมูลจากดิสก์ที่หลุดออกมาจากอาร์เรย์ และเมื่อเปลี่ยนดิสก์ ให้สร้างเนื้อหาใหม่

ปัญหาของ RAID 5 คือฮาร์ดไดรฟ์มีข้อผิดพลาดในการอ่าน ใน ไดรฟ์ SATAข้อกำหนดนี้อนุญาตให้มีอัตราข้อผิดพลาดในการอ่านที่ไม่สามารถแก้ไขได้ (URE) ที่ 10 14 ซึ่งหมายความว่าหนึ่งครั้งต่อ 10 14 บิตไดรฟ์จะไม่สามารถอ่านข้อมูลได้

10 14 บิต = 100000000000000/8/512 ภาค = 24414062500 ภาค

ขนาดจริงของดิสก์ 2TB = 3,907,029,168 เซกเตอร์

เมื่ออยู่ในอาร์เรย์ RAID 5 จาก 7 ไดรฟ์ SATAฮาร์ดไดรฟ์ 2TB หนึ่งตัวล้มเหลว เหลือไดรฟ์ 2TB 6 ตัว และในขณะที่คอนโทรลเลอร์ RAID กำลังสร้างใหม่ มีโอกาสสูงที่จะเกิดข้อผิดพลาดในการอ่าน (URE) หลังจากข้อผิดพลาดนี้ การสร้างอาร์เรย์ RAID ใหม่จะเป็นไปไม่ได้

ความน่าจะเป็นที่การสร้างใหม่จะสิ้นสุดสำเร็จ: (1 - 1 / (24,414,062,500)) ^ (6 * 3,907,029,168) ≈ 0.38

โดยรวมแล้วมีโอกาส 62% ที่ข้อมูลจะสูญหายเนื่องจากข้อผิดพลาดในการอ่านที่ร้ายแรงในอาร์เรย์ RAID5 ของไดรฟ์ SATA เจ็ดตัวโดยมีไดรฟ์ที่ล้มเหลวหนึ่งตัว

การโจมตี 6

RAID 6 แก้ปัญหานี้ด้วยการสร้างเช็คซัมที่สอง คุณสามารถทำไดรฟ์หายหนึ่งไดรฟ์ จับข้อผิดพลาดในการอ่าน URE และยังคงสร้างใหม่ได้สำเร็จ

ความน่าจะเป็นที่การสร้าง RAID6 ใหม่บนไดรฟ์ SATA 7 ตัวจะเสร็จสมบูรณ์: ((1 – 1 /(24 414 062 500)) ^ (6*3 907 029 168))+(1-(1 – 1 /(24 414 062 500 )) ^ (6*3 907 029 168))*((1 – 1 /(24 414 062 500)) ^ (5*3 907 029 168)) ≈ 0.66

อะไรคือปัญหา?

มีปัญหาหลายประการ:

  • เวลาในการสร้างอาร์เรย์ที่ยาวนาน. เมื่อความจุของฮาร์ดไดรฟ์เพิ่มขึ้น เวลาในการสร้างใหม่ก็เช่นกัน ไดรฟ์ข้อมูล 7200 RPM เฉลี่ยประมาณ 115MB/วินาที - และความเร็วในการเขียนจะลดลงเมื่อไดรฟ์เต็ม - ใช้เวลาประมาณ 5 ชั่วโมงขั้นต่ำในการกู้คืน ไดรฟ์ไม่ดี. แต่อาร์เรย์ส่วนใหญ่ไม่สามารถสร้างใหม่ด้วยอัตราการสร้างใหม่ที่เร็วที่สุดเท่าที่จะเป็นไปได้ ดังนั้นโดยปกติจะใช้เวลาสร้างใหม่นานกว่า 2-5 เท่า
  • ข้อบกพร่องที่ซ่อนอยู่เพิ่มเติมอาร์เรย์ขององค์กรใช้การขัดถูดิสก์ในเบื้องหลังเพื่อค้นหาและแก้ไข ข้อผิดพลาดที่เป็นไปได้ดิสก์ก่อนที่จะรู้สึกตัว แต่เมื่อพื้นที่ดิสก์เพิ่มขึ้น การขัดดิสก์จะใช้เวลานานขึ้น ใน อาร์เรย์ขนาดใหญ่ดิสก์อาจไม่ได้รับการตรวจสอบเป็นเวลาหลายเดือน ซึ่งหมายความว่า ข้อบกพร่องเพิ่มเติมเมื่อสร้างอาร์เรย์ใหม่
  • ความสัมพันธ์ระหว่างความล้มเหลวของดิสก์ผู้เสนอ RAID ถือว่าความล้มเหลวของไดรฟ์เป็นเหตุการณ์อิสระ แต่ประสบการณ์หลายปีได้แสดงให้เห็นว่านี่ไม่ใช่กรณี: ความล้มเหลวของไดรฟ์หนึ่งในอาร์เรย์ทำให้ไดรฟ์อื่นมีโอกาสล้มเหลวมากขึ้น

ลดความซับซ้อน: ไดรฟ์ขนาดใหญ่= สร้างใหม่นานขึ้น + บั๊กที่ซ่อนอยู่มากขึ้น -> มีโอกาสมากขึ้นที่ RAID 6 จะล้มเหลว

การคาดการณ์ของ Leventhal เกี่ยวกับความน่าเชื่อถือสัมพัทธ์ของ RAID ด้วยพาริตีเดี่ยวและคู่

ภายในปี 2562 RAID 6 จะไม่น่าเชื่อถือมากไปกว่า RAID 5 ในปัจจุบัน

ข้อสรุป

สำหรับผู้ใช้ในองค์กร ผลลัพธ์นี้จะเป็น ข้อมูลที่เป็นประโยชน์. แม้ว่าความเท่าเทียมกันสามเท่าในอาร์เรย์จะช่วยแก้ปัญหาความปลอดภัยของข้อมูลได้ แต่ก็มีการแลกเปลี่ยนที่สำคัญที่ต้องทำ

พิจารณาอาร์เรย์ 21 ดิสก์ การสร้างอาร์เรย์ใหม่ใช้เวลาหนึ่งสัปดาห์ ดังนั้นโดยเฉลี่ยแล้วอาร์เรย์จะทำงานได้เสมอ โหมดจำกัดการกู้คืน (โหมดการสร้างใหม่ที่ลดลง) การเปลี่ยนแปลงแบบเต็มบนขอบ 2.5″? ความล้าสมัยของการทำงานของอาร์เรย์ปัจจุบันที่มีมูลค่าหลายล้านดอลลาร์?

ผู้ใช้ทั่วไปสามารถผ่อนคลายได้ Home RAID เป็นความคิดที่ไม่ดีตั้งแต่แรก ทำบ่อยขึ้น การสำรองข้อมูลจากดิสก์ไปยังดิสก์และใช้บริการสำรองข้อมูลออนไลน์สำหรับข้อมูลที่มีค่า

และประเด็นสุดท้าย Leventhal ใช้อัตราความผิดพลาดของแผ่นดิสก์ในการคำนวณที่ 10 ^ 16 นี่เป็นเรื่องจริงสำหรับฮาร์ดไดรฟ์ระดับองค์กรขนาดเล็ก รวดเร็ว และมีราคาแพง แต่ไดรฟ์ SATA2 ทั่วไปส่วนใหญ่มี URE ซึ่งเป็นลำดับความสำคัญต่ำกว่าที่ 10^14 โดยมีข้อยกเว้นประการหนึ่ง: ล้อรุ่น WD20EADS Caviar Green จากบริษัท เวสเทิร์น ดิจิตอลตามข้อกำหนดจะมีค่าสัมประสิทธิ์ URE เท่ากับ 10^15

ชั้นที่ 5 เป็นอาร์เรย์ของดิสก์อิสระที่มีพื้นที่เก็บข้อมูลแบบตรวจสอบผลรวมแบบกระจาย

บล็อกข้อมูลและเช็คซัมถูกเขียนเป็นวงกลมไปยังดิสก์ทั้งหมดของอาร์เรย์ ดังนั้นจึงไม่มีความสมมาตรในการกำหนดค่าดิสก์ รูปแบบดังกล่าวไม่ต้องการดิสก์เฉพาะเพื่อเก็บข้อมูลการตรวจสอบ

ปริมาณ ดิสก์อาร์เรย์ RAID5 คำนวณโดยใช้สูตร (n-1)*V.hdd โดยที่ n คือจำนวนไดรฟ์ในอาร์เรย์และ V.hdd คือขนาดของไดรฟ์ที่เล็กที่สุด ดังนั้นในกรณีของการสร้าง RAID 5 ดิสก์ทั้งหมดในอาร์เรย์จะต้องมีขนาดเท่ากัน ในนั้น ความจุที่เกิดขึ้นระบบย่อยของดิสก์ที่เขียนได้จะลดลงหนึ่งดิสก์ ตัวอย่างเช่น ถ้าดิสก์ 5 แผ่นมีขนาด 10 GB ขนาดจริงของอาร์เรย์คือ 40 GB เนื่องจาก 10 GB ถูกจัดสรรไว้สำหรับข้อมูลพาริตี

RAID 5 เช่น RAID 4 มีสถาปัตยกรรมการเข้าถึงที่เป็นอิสระ เมื่อเทียบกับ RAID 3 จะให้ ขนาดใหญ่ลอจิคัลบล็อกสำหรับจัดเก็บข้อมูล ดังนั้น ในกรณีของ RAID 4 อาร์เรย์ดังกล่าวให้ประโยชน์หลักเมื่อประมวลผลคำขอหลายรายการพร้อมกัน โดยสรุปข้อดี เราสามารถพูดได้ดังต่อไปนี้ - ใน RAID 5 จะใช้ทรัพยากรการประมวลผลเพิ่มเติมในการบันทึกข้อมูลและทำให้ประสิทธิภาพลดลง แต่พออ่าน(เทียบกับภาคแยก ไดรฟ์ฮาร์ดดิสก์) มีประโยชน์ด้านประสิทธิภาพ เนื่องจากสตรีมข้อมูลจากดิสก์หลายตัวของอาร์เรย์ได้รับการประมวลผลแบบขนาน

จากข้อบกพร่องควรสังเกตว่า ประสิทธิภาพของ RAIDของระดับนี้จะลดลง 10-25% เมื่อเทียบกับ RAID 1 ในการดำเนินการเขียนแบบสุ่ม (เขียนตามลำดับแบบสุ่ม) เนื่องจากต้องใช้การดำเนินการกับดิสก์มากขึ้น เนื่องจากการดำเนินการเขียนของเซิร์ฟเวอร์แต่ละครั้งจะถูกแทนที่บนตัวควบคุม RAID โดยสาม - หนึ่งการอ่านและสอง เขียนการดำเนินการ

หากดิสก์ตัวใดตัวหนึ่งล้มเหลว ความน่าเชื่อถือของอาร์เรย์จะลดลงอย่างมากจนถึงระดับ RAID 0 (เมื่อข้อมูลถูกเขียนตามลำดับไปยังดิสก์หลายตัวโดยมีความซ้ำซ้อนเป็นศูนย์) ในขณะเดียวกัน ยิ่งจำนวนดิสก์ในอาร์เรย์มากขึ้น ความน่าเชื่อถือก็จะยิ่งลดลง ดิสก์ก็จะลดลงเป็นทวีคูณ ขณะนี้ระบบอยู่ในโหมดวิกฤต การดำเนินการอ่านและเขียนทั้งหมดจะมาพร้อมกับการจัดการเพิ่มเติม หากดิสก์ที่ 2 ล้มเหลวหรือ ข้อผิดพลาดง่ายๆการอ่าน - อาร์เรย์จะถูกทำลายและไม่สามารถกู้คืนข้อมูลด้วยวิธีดั้งเดิมได้

ควรคำนึงถึงด้วยว่ากระบวนการกู้คืนข้อมูลหลังจากความล้มเหลวของดิสก์ใดๆ ในอาร์เรย์ทำให้เกิดการอ่านอย่างเข้มข้นจากดิสก์เป็นเวลานาน ซึ่งอาจทำให้หนึ่งในไดรฟ์ทำงานล้มเหลวในช่วงเวลาที่มีความเสี่ยงมากที่สุดของการทำงานของ RAID รวมทั้งเผยให้เห็นความล้มเหลวในการอ่านที่ตรวจไม่พบก่อนหน้านี้ในอาร์เรย์ข้อมูลที่ซบเซา ซึ่งเพิ่มความเสี่ยงของความล้มเหลวระหว่างการกู้คืนความสมบูรณ์ของข้อมูล

จำนวนดิสก์ขั้นต่ำสำหรับการจัดระเบียบ RAID5 คือ 3


เราพบปัญหาดังกล่าวที่เซิร์ฟเวอร์ส่วนใหญ่ที่ผู้ใช้โปรแกรมของเราซื้อมาพร้อมกับดิสก์อาร์เรย์ที่กำหนดค่าใน RAID 5 ในเวลาต่อมา ผู้ดูแลระบบไม่ต้องการเสียเวลาในการกำหนดค่าใหม่หรือเพียงแค่กลัวที่จะเปลี่ยนแปลงบางอย่างในคอมพิวเตอร์ที่กำหนดค่าแล้วและใช้งานได้ เป็นผลให้ประสิทธิภาพการทำงานกับฐานข้อมูลที่ติดตั้งบนเซิร์ฟเวอร์ดังกล่าวกลายเป็นน้อยกว่าเดิมซึ่งทำงานในองค์กรเป็นเวลา 3-4 ปี อาจเป็นไปได้ว่าความปรารถนาของผู้ขายในการกำหนดค่าดิสก์อาร์เรย์ใน RAID ระดับที่ห้าสามารถอธิบายได้ด้วยความปรารถนาที่จะทำให้ลูกค้าประหลาดใจด้วยขนาดที่ใหญ่ พื้นที่ดิสก์. ในทางกลับกัน ผู้ดูแลระบบมักจะไม่มีความรู้เพียงพอว่าอาร์เรย์ RAID ในระดับใดระดับหนึ่งทำงานอย่างไร จุดประสงค์ของบทความนี้คือเพื่อตอบคำถามสองข้อ:

เหตุใดจึงใช้ RAID 5 สำหรับเซิร์ฟเวอร์ฐานข้อมูลไม่ได้

วิธีที่ดีที่สุดในการกำหนดค่าคอนโทรลเลอร์ RAID เพื่อโฮสต์ฐานข้อมูลเซิร์ฟเวอร์ Firebird คืออะไร

ขอจองทันทีว่าข้อสรุปในบทความนี้ใช้ไม่ได้กับกรณีที่หายากเหล่านั้นเมื่อใช้ฐานข้อมูลโดยเฉพาะ (หรือส่วนใหญ่) สำหรับการอ่าน

RAID 5 ทำงานอย่างไร

ลองพิจารณาไดอะแกรมแบบง่ายของการทำงานของอาร์เรย์ของดิสก์สี่แผ่น มีการจัดสรรหนึ่งในดิสก์เพื่อจัดเก็บเช็คซัม มีสามแบบสำหรับจัดวางข้อมูล ในรูปด้านล่าง ไดร์ฟเพย์โหลดมีชื่อว่า A, B และ C ไดร์ฟ D จะจัดเก็บเช็คซัม

จำนวนข้อมูลขั้นต่ำที่คอนโทรลเลอร์อ่านหรือเขียนไปยังดิสก์เดียวเรียกว่า แถบ(แถบ). พารามิเตอร์ของคอนโทรลเลอร์ส่วนใหญ่ที่เราพบไม่ได้ระบุขนาดของแถบ แต่เป็นขนาด แถบ(แถบ) - บล็อกข้อมูลที่แจกจ่ายไปยังดิสก์ทั้งหมดของอาร์เรย์ ในภาพด้านล่าง แถบหนึ่งเส้นจะถูกเน้นด้วยสีเข้มกว่า:


ขนาดแถบจะเท่ากับขนาดแถบคูณด้วยจำนวนดิสก์ในอาร์เรย์ เหล่านั้น. ในกรณีของดิสก์สี่แผ่นและแถบขนาด 64K จำนวนข้อมูลขั้นต่ำที่คอนโทรลเลอร์สามารถเขียนหรืออ่านจากดิสก์ได้คือ 64 / 4 = 16K

ผลรวมตรวจสอบที่ไปที่ไดรฟ์ D คำนวณโดยใช้สูตรต่อไปนี้:

D = Axor Bxor C

ขอบคุณการเปลี่ยนแปลง การดำเนินการ xorในกรณีที่ดิสก์ตัวใดตัวหนึ่งล้มเหลวพร้อมข้อมูลที่เป็นประโยชน์ สามารถกู้คืนได้โดยการ xoring ข้อมูลของดิสก์ที่เหลือ รวมถึงดิสก์ที่มีการตรวจสอบ ตัวอย่างเช่น ดิสก์ B ล้มเหลว


เมื่อร้องขอบล็อกข้อมูลจากดิสก์ B คอนโทรลเลอร์จะกู้คืนตามสูตร:

B = ซอร์ Cxor D

เซิร์ฟเวอร์ Firebird สื่อสารกับ ระบบย่อยของดิสก์หน้าข้อมูล ขนาดที่เหมาะสมที่สุดในกรณีส่วนใหญ่ขนาดหน้าคือ 8K ซึ่งเล็กกว่าขนาดแถบมาก และในกรณีส่วนใหญ่จะเล็กกว่าขนาดแถบด้วยซ้ำ สถานการณ์เมื่อเพจต่อเนื่องถูกเขียนลงดิสก์ก็ค่อนข้างหายากเช่นกัน ดังนั้น หากข้อมูลตัวอย่างของเราถูกเขียนลงในดิสก์ A คอนโทรลเลอร์จะต้องดำเนินการต่อไปนี้:

  1. อ่านข้อมูลสตริปจากไดรฟ์ B และ C การดำเนินการอ่านสองครั้ง
  2. คำนวณผลรวมตรวจสอบใหม่ การดำเนินการ xor สองรายการ
  3. เขียนข้อมูลไปยังไดรฟ์ A และตรวจสอบผลรวมไปยังไดรฟ์ D สองการดำเนินการเขียน

ผลรวม การอ่านสองครั้ง การเขียนสองครั้ง และการดำเนินการ xor สองครั้ง คงจะน่าแปลกใจหากพิจารณาจากงานจำนวนนี้ ประสิทธิภาพโดยรวมไม่ตก ตอนนี้เห็นได้ชัดว่าเหตุใด RAID 5 จึงไม่เหมาะสำหรับการโฮสต์ไฟล์ฐานข้อมูล

สำคัญ คุณสมบัติ RAID 5 คือ ประสิทธิภาพลดลงอย่างมากเมื่อหนึ่งในดิสก์ในอาร์เรย์ล้มเหลว ท้ายที่สุดแล้วในการกู้คืนข้อมูลจากดิสก์นี้จำเป็นต้องอ่านและกู้คืนข้อมูลจากดิสก์อื่นทั้งหมด

อย่างไรก็ตาม เช่นเดียวกับกฎอื่นๆ ของเราก็มีข้อยกเว้นเช่นกัน ประสิทธิภาพของดิสก์อาร์เรย์ RAID 5 จะไม่ลดลงหากขนาดของแคชที่ไม่ลบเลือนของคอนโทรลเลอร์เทียบได้กับขนาดของไฟล์ฐานข้อมูล ตัวอย่างเช่น ด้วยขนาดหน่วยความจำแคช 512 MB จึงค่อนข้างเป็นไปได้ที่จะใช้อาร์เรย์ RAID ระดับที่ 5 สำหรับฐานสูงสุด 1-1.5 GB โดยมีเงื่อนไขว่าเซิร์ฟเวอร์มีไว้เพื่อทำงานกับฐานข้อมูลเท่านั้นและไม่ได้ทำงานอื่น

เป็นที่น่าสังเกตว่าโครงร่างข้างต้นของการดำเนินการ RAID 5 ด้วยเหตุผลด้านระเบียบวิธี ทำให้ง่ายขึ้นอย่างจริงจัง. ในความเป็นจริง คอนโทรลเลอร์จะกระจายสไทรพ์แบบวนรอบดิสก์ทั้งหมดในอาร์เรย์ ดังนั้นจึงไม่มีดิสก์เฉพาะสำหรับจัดเก็บเช็คซัม ดิสก์ทั้งหมดเก็บทั้งข้อมูลและเช็คซัมของแถบต่างๆ ซึ่งช่วยให้คุณสามารถโหลดข้อมูลเหล่านั้นได้

เลือกระดับ RAID ใด

หาก RAID 5 ไม่เหมาะ ฉันควรเลือกโฮสต์ไฟล์ฐานข้อมูลในระดับใด หากจำนวนดิสก์น้อยกว่าสี่ตัวเลือกเดียวคือมิเรอร์ (มิเรอร์) - RAID 1 หากอาร์เรย์มีดิสก์ตั้งแต่สี่ดิสก์ขึ้นไป RAID 10 จะเหมาะสมที่สุดในแง่ของประสิทธิภาพและความน่าเชื่อถือ - การรวม (RAID 0) หลายรายการ กระจก (RAID 1) บางครั้งคุณอาจเห็นการสะกดเป็น RAID 1 + 0 รูปด้านล่างแสดง อาร์เรย์ RAID 10 จากสี่แผ่น ข้อมูลของแถบเดียวจะถูกเน้นด้วยโทนสีเข้ม การฟักไข่จะแสดงแถบนี้ซ้ำกัน

นอกจากนี้ เรายังทราบด้วยว่าหากอาร์เรย์ RAID 5 สามารถรอดจากการสูญเสียดิสก์เพียงตัวเดียว ดังนั้นมิเรอร์ RAID 10 ของ m ของดิสก์สองแผ่นจะรอดจากการสูญเสียดิสก์หนึ่งถึง m โดยมีเงื่อนไขว่าดิสก์ในแต่ละมิเรอร์จะล้มเหลวไม่เกินหนึ่งแผ่น

ลองเปรียบเทียบอาร์เรย์ RAID 5 และ RAID 10 ในเชิงปริมาณ ซึ่งแต่ละอาร์เรย์มีดิสก์ n ตัว n เป็นผลคูณของสอง ลองใช้ขนาดของบล็อกข้อมูลอ่าน/เขียนเท่ากับขนาดของแถบข้อมูล ตารางด้านล่างแสดงจำนวนการดำเนินการอ่าน/เขียนและการ xoring ข้อมูลที่ต้องการ


เห็นได้ชัดว่าอาร์เรย์ RAID 10 ไม่ได้มีมากขึ้นเท่านั้น ประสิทธิภาพสูงในระหว่างการเขียน แต่ไม่อนุญาตให้ลดประสิทธิภาพโดยทั่วไปเมื่อดิสก์เดียวล้มเหลว

จะตั้งค่าคอนโทรลเลอร์ RAID ได้อย่างไร?

ขนาดแคช

ใหญ่กว่าดีกว่า. สิ่งสำคัญคือคอนโทรลเลอร์มีแบตเตอรี่ (ตัวสะสม) เพื่อบันทึกเนื้อหาของหน่วยความจำในระหว่างที่ไฟฟ้าดับฉุกเฉิน ในคอนโทรลเลอร์หลายตัว แบตเตอรี่ไม่ได้รวมอยู่ในอุปกรณ์มาตรฐานและต้องสั่งซื้อแยกต่างหาก หากไม่มีแบตเตอรี่ แคชเขียนจะถูกปิดใช้งาน

ระดับการโจมตี

RAID 10. หากจำนวนดิสก์น้อยกว่าสี่ แสดงว่า RAID 1 (มิเรอร์) ทำไม อ่านบทความตั้งแต่ต้น

ขนาดลาย

ขนาดหน้าฐานข้อมูลคูณด้วยจำนวนมิเรอร์ในอาร์เรย์ ตัวอย่างเช่น หากมีดิสก์ 8 แผ่นในอาร์เรย์ รวมกันเป็นสี่มิเรอร์ จานละสองแผ่น และขนาดหน้าฐานข้อมูลคือ 8K ดังนั้นควรกำหนดขนาดแถบเป็น 8 * 4 = 32K

การอ่านล่วงหน้า

เนื่องจากการเข้าถึงหน้าฐานข้อมูลตามลำดับนั้นหายากมากและพวกมันเองก็สามารถเข้ามาได้เนื่องจากการแยกส่วน สถานที่ต่างๆควรปิดใช้งานดิสก์ อ่านล่วงหน้า หรือควรใช้โหมดอะแดปทีฟ (อ่านล่วงหน้าในกรณีที่เข้าถึงตามลำดับไปยังหน้าสองหน้าติดต่อกัน)

เขียนนโยบายแคช

เลือกโหมดเขียนกลับ ข้อมูลจะถูกแคชแล้วเขียนลงดิสก์ การดำเนินการเขียนจะถือว่าเสร็จสมบูรณ์ทันทีหลังจากที่ใส่ข้อมูลลงในแคช

ดิสก์สำรอง

หากความสามารถของคอนโทรลเลอร์อนุญาต ขอแนะนำให้รวมไว้ในอาร์เรย์ ดิสก์สำรอง. ดิสก์ดังกล่าว โหมดปกติงานอยู่ในสถานะสแตนด์บาย ในกรณีที่ฮาร์ดไดรฟ์ที่ใช้งานได้ตัวใดตัวหนึ่งล้มเหลว ดิสก์สำรองข้อมูลจะถูกเพิ่มลงในอาร์เรย์โดยอัตโนมัติ

© Andrey Egorov, 2005, 2006 กลุ่มบริษัท TIM

ผู้เยี่ยมชมฟอรัมถามเราว่า "ระดับ RAID ที่น่าเชื่อถือที่สุดคืออะไร" ทุกคนรู้ว่า RAID5 เป็นระดับที่พบได้บ่อยที่สุด แต่ก็ไม่ได้หมายความว่าจะไม่มีข้อบกพร่องร้ายแรงซึ่งไม่ชัดเจนสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญ

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 หรือระดับ RAID คืออะไร

ในบทความของฉัน ฉันจะพยายามระบุระดับ RAID ที่ได้รับความนิยมสูงสุด จากนั้นจึงกำหนดคำแนะนำสำหรับการใช้ระดับเหล่านี้ เพื่อแสดงบทความนี้ ฉันได้สร้างแผนภูมิที่วางระดับเหล่านี้ไว้ในพื้นที่สามมิติของความน่าเชื่อถือ ประสิทธิภาพ และความคุ้มทุน

เจบีโอดี(เพียงพวงของดิสก์) คือการขยายฮาร์ดไดรฟ์อย่างง่าย ซึ่งไม่ใช่ระดับ RAID อย่างเป็นทางการ วอลุ่ม JBOD สามารถเป็นอาร์เรย์ของดิสก์เดียวหรือหลายดิสก์รวมกันก็ได้ ตัวควบคุม RAIDไม่จำเป็นต้องมีการคำนวณเพื่อทำงานกับไดรฟ์ข้อมูลดังกล่าว ในไดอะแกรมของเรา JBOD ทำหน้าที่เป็น "ปกติ" หรือจุดเริ่มต้น - ความน่าเชื่อถือ ประสิทธิภาพ และมูลค่าต้นทุนจะเหมือนกับของฮาร์ดไดรฟ์ตัวเดียว

การโจมตี 0(“สตริป”) ไม่มีความซ้ำซ้อน และกระจายข้อมูลพร้อมกันในดิสก์ทั้งหมดที่รวมอยู่ในอาร์เรย์ในรูปแบบของบล็อกขนาดเล็ก (“สตริป”) สิ่งนี้ช่วยปรับปรุงประสิทธิภาพอย่างมาก แต่ขาดความน่าเชื่อถือ เช่นเดียวกับในกรณีของ JBOD เราได้รับเงิน 100% ของความจุดิสก์

ให้ฉันอธิบายว่าทำไมความน่าเชื่อถือของการจัดเก็บข้อมูลในไดรฟ์ข้อมูลแบบผสมใดๆ จึงลดลง เนื่องจากหากฮาร์ดไดรฟ์ที่รวมอยู่ในนั้นล้มเหลว ข้อมูลทั้งหมดจะสูญหายไปอย่างสมบูรณ์และไม่สามารถกู้คืนได้ ตามทฤษฎีความน่าจะเป็นในทางคณิตศาสตร์ ความน่าเชื่อถือของโวลุ่ม RAID0 เท่ากับผลคูณของความน่าเชื่อถือของดิสก์ที่เป็นส่วนประกอบ ซึ่งแต่ละดิสก์มีค่าน้อยกว่าหนึ่ง ดังนั้นความน่าเชื่อถือรวมจึงต่ำกว่าความน่าเชื่อถือของดิสก์ใดๆ อย่างเห็นได้ชัด .

ระดับดี - การโจมตี 1(“มิเรอร์”, “มิเรอร์”) มีการป้องกันความล้มเหลวของฮาร์ดแวร์ที่มีอยู่ครึ่งหนึ่ง (ในกรณีทั่วไป ฮาร์ดไดรฟ์หนึ่งในสองตัว) ให้ความเร็วในการเขียนที่ยอมรับได้และเพิ่มความเร็วในการอ่านเนื่องจากการสืบค้นแบบขนาน ข้อเสียคือคุณต้องจ่ายค่าฮาร์ดไดร์ฟสองตัวเพื่อให้ได้ความจุที่ใช้งานได้ของฮาร์ดไดร์ฟหนึ่งตัว

เริ่มแรกสันนิษฐานว่าฮาร์ดไดรฟ์เป็นสิ่งที่เชื่อถือได้ ดังนั้นความน่าจะเป็นของความล้มเหลวของดิสก์สองแผ่นพร้อมกันจึงเท่ากัน (ตามสูตร) ​​กับผลคูณของความน่าจะเป็น เช่น ลำดับความสำคัญลดลง! น่าเสียดาย, ชีวิตจริง- ไม่ใช่ทฤษฎี! ฮาร์ดไดรฟ์สองตัวถูกนำมาจากแบทช์เดียวกันและทำงานภายใต้เงื่อนไขเดียวกันและหากดิสก์ตัวใดตัวหนึ่งล้มเหลว ภาระในส่วนที่เหลือจะเพิ่มขึ้น ดังนั้นในทางปฏิบัติหากดิสก์ตัวใดตัวหนึ่งล้มเหลว ควรใช้มาตรการเร่งด่วน - เพื่อฟื้นฟูความซ้ำซ้อนอีกครั้ง ในการทำเช่นนี้กับระดับ RAID ใดๆ (ยกเว้นศูนย์) ขอแนะนำให้ใช้ดิสก์สำรองข้อมูลด่วน ฮอตสปาร์. ข้อดีของวิธีนี้คือการรักษา ความน่าเชื่อถือถาวร. ข้อเสียคือค่าใช้จ่ายที่มากขึ้น (เช่นค่าใช้จ่ายของฮาร์ดไดรฟ์ 3 ตัวเพื่อจัดเก็บไดรฟ์ข้อมูลของดิสก์เดียว)

มิเรอร์ในไดรฟ์จำนวนมากเป็นระดับ การโจมตี 10. เมื่อใช้ระดับนี้ ดิสก์คู่ที่ทำมิเรอร์จะเรียงกันเป็น "สายโซ่" ดังนั้นปริมาณของไดรฟ์ข้อมูลผลลัพธ์จึงอาจเกินความจุของฮาร์ดดิสก์ตัวเดียว ข้อดีและข้อเสียเหมือนกับระดับ RAID1 ในกรณีอื่นๆ ขอแนะนำให้รวมฮอตสแปร์ HotSpare ไว้ในอาร์เรย์ในอัตราหนึ่งอะไหล่ต่อผู้ปฏิบัติงานห้าคน

การโจมตี 5อันที่จริง ระดับที่ได้รับความนิยมมากที่สุด - สาเหตุหลักมาจากความประหยัดของมัน การเสียสละความจุของดิสก์เพียงตัวเดียวจากอาร์เรย์เพื่อความซ้ำซ้อน เราได้รับการปกป้องจากความล้มเหลวของฮาร์ดไดรฟ์ใดๆ ในวอลุ่ม ค่าใช้จ่ายในการเขียนข้อมูลลงในวอลุ่ม RAID5 คือ แหล่งข้อมูลเพิ่มเติมเนื่องจากจำเป็นต้องมีการคำนวณเพิ่มเติม แต่เมื่ออ่าน (เมื่อเทียบกับฮาร์ดไดรฟ์แยกต่างหาก) จะได้รับเนื่องจากสตรีมข้อมูลจากไดรฟ์อาร์เรย์หลายตัวถูกขนานกัน

ข้อเสียของ RAID5 ปรากฏขึ้นเมื่อดิสก์ตัวใดตัวหนึ่งทำงานล้มเหลว - โวลุ่มทั้งหมดเข้าสู่โหมดวิกฤต การดำเนินการเขียนและอ่านทั้งหมดจะมาพร้อมกับการจัดการเพิ่มเติม ประสิทธิภาพลดลงอย่างรวดเร็ว ดิสก์เริ่มร้อนขึ้น หากไม่ดำเนินการอย่างเร่งด่วน คุณอาจสูญเสียไดรฟ์ข้อมูลทั้งหมดได้ ดังนั้น (ดูด้านบน) ไดรฟ์ Hot Spare ต้องใช้กับโวลุ่ม RAID5

นอกเหนือจากพื้นฐาน ระดับ RAID 0 - RAID5 ที่อธิบายไว้ในมาตรฐาน มีระดับรวม RAID10, RAID30, RAID50, RAID15 ซึ่ง ผู้ผลิตต่างๆตีความในแบบของตัวเอง

สาระสำคัญของชุดค่าผสมดังกล่าวโดยสังเขปมีดังนี้ RAID10 คือการรวมกันของหนึ่งและศูนย์ (ดูด้านบน) RAID50 คือการจัดกลุ่มของโวลุ่ม "0" ระดับที่ 5 RAID15 เป็น "กระจก" ของ "ห้า" และอื่น ๆ

ดังนั้นระดับที่รวมกันจะสืบทอดข้อดี (และข้อเสีย) ของ "ผู้ปกครอง" ดังนั้นการปรากฏตัวของ "ศูนย์" ในระดับ การโจมตี 50ไม่ได้เพิ่มความน่าเชื่อถือใด ๆ แต่มีผลในเชิงบวกต่อประสิทธิภาพ ระดับ การโจมตี 15อาจเชื่อถือได้มาก แต่ก็ไม่เร็วที่สุดและยิ่งไปกว่านั้นไม่ประหยัดอย่างยิ่ง (ความจุที่ใช้งานได้ของวอลุ่มน้อยกว่าครึ่งหนึ่งของขนาดดิสก์อาร์เรย์ดั้งเดิม)

การโจมตี 6แตกต่างจาก RAID 5 ตรงที่ข้อมูลแต่ละแถว (ภาษาอังกฤษ ลาย) ไม่มีหนึ่ง แต่ สองบล็อกเช็คซัม Checksums เป็น "หลายมิติ" เช่น เป็นอิสระจากกัน ดังนั้นแม้ดิสก์สองแผ่นในอาร์เรย์จะล้มเหลว คุณก็สามารถบันทึกข้อมูลต้นฉบับได้ การคำนวณเช็คซัมของรีด-โซโลมอนต้องการการคำนวณที่เข้มข้นกว่าเมื่อเทียบกับ RAID5 ดังนั้นจึงไม่เคยใช้ระดับที่หกมาก่อน ขณะนี้ผลิตภัณฑ์จำนวนมากได้รับการสนับสนุนเนื่องจากพวกเขาเริ่มติดตั้งไมโครวงจรพิเศษที่ดำเนินการทางคณิตศาสตร์ที่จำเป็นทั้งหมด

จากการศึกษาบางส่วน การกู้คืนหลังจากความล้มเหลวของไดรฟ์เดียวบนโวลุ่ม RAID5 ที่ประกอบด้วยไดรฟ์ SATA ขนาดใหญ่ (400 และ 500 กิกะไบต์) สิ้นสุดใน 5% ของกรณีที่ข้อมูลสูญหาย กล่าวอีกนัยหนึ่ง ในกรณีหนึ่งจากยี่สิบ ในระหว่างการสร้างอาร์เรย์ RAID5 บนดิสก์ Hot Spare ดิสก์ที่สองอาจล้มเหลว ... ดังนั้นคำแนะนำของไดรเวอร์ RAID ที่ดีที่สุด: 1) เสมอทำการสำรองข้อมูล 2) ใช้ RAID6!

ระดับใหม่ RAID1E, RAID5E, RAID5EE เพิ่งปรากฏขึ้น ตัว "E" ในชื่อย่อมาจาก ปรับปรุง.

ปรับปรุง RAID ระดับ 1 (RAID ระดับ 1E)รวมการมิเรอร์และการสตริปข้อมูล ส่วนผสมของระดับ 0 และ 1 จัดเรียงดังนี้ ข้อมูลในแถวมีการกระจายเหมือนกับใน RAID 0 นั่นคือแถวของข้อมูลไม่มีความซ้ำซ้อน บล็อกข้อมูลแถวถัดไปคัดลอกบล็อกก่อนหน้าโดยเลื่อนหนึ่งบล็อก ดังนั้นใน โหมดมาตรฐาน RAID 1 แต่ละบล็อกของข้อมูลมีสำเนามิเรอร์บนหนึ่งในดิสก์ ดังนั้นขนาดที่ใช้งานได้ของอาร์เรย์จะเท่ากับครึ่งหนึ่งของจำนวนข้อมูลทั้งหมดที่รวมอยู่ใน อาร์เรย์อย่างหนักดิสก์ RAID 1E ต้องการการรวมไดรฟ์ตั้งแต่สามไดรฟ์ขึ้นไป

ฉันชอบระดับ RAID1E มาก สำหรับกราฟิกที่ทรงพลัง เวิร์กสเตชันหรือแม้แต่สำหรับ คอมพิวเตอร์ที่บ้านทางเลือกที่ดีที่สุด! มีข้อดีทั้งหมดของระดับศูนย์และระดับแรก - ความเร็วที่ยอดเยี่ยมและความน่าเชื่อถือสูง

ไปที่ระดับกันเถอะ ปรับปรุง RAID ระดับ 5 (RAID ระดับ 5E). ซึ่งเหมือนกับ RAID5 เพียงแต่มีไดรฟ์สำรองอยู่ในอาร์เรย์เท่านั้น ไดรฟ์สำรอง. การฝังนี้ดำเนินการดังต่อไปนี้: บนดิสก์ทั้งหมดของอาร์เรย์ พื้นที่ว่าง 1/N จะเหลือว่าง ซึ่งถ้าดิสก์ตัวใดตัวหนึ่งล้มเหลว จะใช้เป็นตัวสำรอง ด้วยเหตุนี้ RAID5E จึงแสดงให้เห็นพร้อมกับความน่าเชื่อถือ ประสิทธิภาพที่ดีขึ้นเนื่องจากการอ่าน/เขียนจะทำควบคู่ไปกับ มากกว่าไดรฟ์พร้อมกันและไดรฟ์สำรองไม่ได้ใช้งาน เช่นเดียวกับใน RAID5 เห็นได้ชัดว่า ดิสก์สำรองที่รวมอยู่ในวอลุ่มนั้นไม่สามารถแชร์กับวอลุ่มอื่นได้ (เฉพาะกับที่แชร์) โวลุ่ม RAID 5E สร้างขึ้นจากขั้นต่ำสี่ตัว ฟิสิคัลดิสก์. ขนาดที่ใช้ได้ของโลจิคัลวอลุ่มคำนวณโดยใช้สูตร N-2

ปรับปรุง RAID ระดับ 5E (RAID ระดับ 5EE)คล้ายกับ RAID ระดับ 5E แต่มีการจัดสรรไดรฟ์สำรองที่มีประสิทธิภาพมากกว่า และเป็นผลให้เวลาในการกู้คืนเร็วขึ้น เช่นเดียวกับระดับ RAID5E ระดับ RAID นี้จะกระจายบล็อกข้อมูลและผลรวมการตรวจสอบเป็นแถว แต่ยังจัดสรรบล็อกไดรฟ์สำรองฟรี และไม่ได้เหลือพื้นที่ดิสก์ไว้เพียงบางส่วนเพื่อวัตถุประสงค์เหล่านี้ ซึ่งช่วยลดเวลาที่จำเป็นในการสร้างความสมบูรณ์ของโวลุ่ม RAID5EE ใหม่ ดิสก์สำรองที่รวมอยู่ในวอลุ่มนั้นไม่สามารถแชร์กับโวลุ่มอื่นได้ - เช่นเดียวกับในกรณีก่อนหน้า โวลุ่ม RAID 5EE สร้างขึ้นบนฟิสิคัลดิสก์อย่างน้อยสี่ตัว ขนาดที่ใช้ได้ของโลจิคัลวอลุ่มคำนวณโดยใช้สูตร N-2

น่าแปลกที่ไม่มีการพูดถึงระดับ การโจมตี 6Eฉันไม่พบมันบนอินเทอร์เน็ต - จนถึงขณะนี้ยังไม่มีการเสนอระดับนี้หรือแม้แต่ประกาศโดยผู้ผลิตรายใด แต่สามารถเสนอระดับ RAID6E (หรือ RAID6EE?) บนหลักการเดียวกันกับระดับก่อนหน้า ดิสก์ ฮอตสปาร์ อย่างจำเป็นจะต้องมาพร้อมกับโวลุ่ม RAID รวมถึง RAID 6 แน่นอน เราจะไม่สูญเสียข้อมูลหากดิสก์หนึ่งหรือสองแผ่นล้มเหลว แต่เป็นสิ่งสำคัญอย่างยิ่งที่จะต้องเริ่มสร้างความสมบูรณ์ของอาร์เรย์ใหม่โดยเร็วที่สุดเพื่อนำระบบออกอย่างรวดเร็ว ของโหมด "วิกฤต" เนื่องจากความต้องการดิสก์ Hot Spare นั้นไม่ต้องสงสัยเลยสำหรับเรา จึงมีเหตุผลที่จะดำเนินการต่อไปและ "ละเลง" ในลักษณะที่ทำใน RAID 5EE เพื่อให้ได้รับประโยชน์จากการใช้งาน มากกว่าดิสก์ ( ความเร็วที่ดีที่สุดอ่าน-เขียน หรืออื่นๆ ฟื้นตัวอย่างรวดเร็วความซื่อสัตย์).

ระดับ RAID ใน "ตัวเลข"

ในตารางฉันได้รวบรวมบางส่วน พารามิเตอร์ที่สำคัญ RAID เกือบทุกระดับ เพื่อให้คุณสามารถเปรียบเทียบระหว่างกันและเข้าใจแก่นแท้ของพวกมันได้ดียิ่งขึ้น

ระดับ
~~~~~~~

กระท่อม-
toch-
เนส
~~~~~~~

ใช้-
พิกัดความจุของดิสก์
~~~~~~~

การผลิต
ditel-
เนส
การอ่าน

~~~~~~~

การผลิต
ditel-
เนส
บันทึก

~~~~~~~

ในตัว
แผ่นดิสก์
จอง

~~~~~~~

นาที. จำนวนดิสก์
~~~~~~~

สูงสุด จำนวนดิสก์

~~~~~~~

ไม่รวม

ไม่รวม

ไม่รวม

ไม่รวม

ระดับ "มิเรอร์" ทั้งหมดคือ RAID 1, 1+0, 10, 1E, 1E0

ลองทำความเข้าใจอย่างละเอียดอีกครั้งว่าระดับเหล่านี้แตกต่างกันอย่างไร

การโจมตี 1
นี่คือกระจกคลาสสิก สอง (และสองเท่านั้น!) ฮาร์ดไดรฟ์ทำงานเป็นหนึ่งเดียวเป็นสำเนาที่สมบูรณ์ของกันและกัน ความล้มเหลวของทั้งสองไดรฟ์นี้ไม่ได้ส่งผลให้ข้อมูลของคุณสูญหาย เนื่องจากคอนโทรลเลอร์ยังคงทำงานกับไดรฟ์ที่เหลือต่อไป RAID1 เป็นตัวเลข: ความซ้ำซ้อน 2 เท่า, ความน่าเชื่อถือ 2 เท่า, ต้นทุน 2 เท่า ประสิทธิภาพการเขียนเทียบเท่ากับฮาร์ดไดรฟ์ตัวเดียว ประสิทธิภาพการอ่านดีขึ้นเนื่องจากคอนโทรลเลอร์สามารถกระจายการอ่านไปยังไดรฟ์สองตัวได้

การโจมตี 10.
สาระสำคัญของระดับนี้คือดิสก์ของอาร์เรย์จะรวมกันเป็นคู่เป็น "มิเรอร์" (RAID 1) จากนั้นคู่มิเรอร์ทั้งหมดเหล่านี้จะรวมกันเป็นอาร์เรย์แบบแถบทั่วไป (RAID 0) นั่นคือเหตุผลที่บางครั้งเรียกว่า การโจมตี 1+0. จุดสำคัญ– ใน RAID 10 สามารถรวมดิสก์ได้เป็นจำนวนคู่เท่านั้น (ขั้นต่ำ - 4, สูงสุด - 16) ข้อดี: ความน่าเชื่อถือนั้นสืบทอดมาจาก "มิเรอร์" จาก "ศูนย์" - ทั้งประสิทธิภาพการอ่านและเขียน

การโจมตี 1E
ตัวอักษร "E" ในชื่อหมายถึง "ปรับปรุง" เช่น "ปรับปรุง". หลักการของการปรับปรุงนี้มีดังต่อไปนี้: ข้อมูลจะถูก "แถบ" ในบล็อกบนดิสก์ทั้งหมดของอาร์เรย์ จากนั้น "แทรกสลับ" อีกครั้งโดยเลื่อนดิสก์หนึ่งแผ่น ใน RAID 1E คุณสามารถรวมดิสก์ได้ตั้งแต่สามถึง 16 แผ่น ความน่าเชื่อถือสอดคล้องกับ "สิบ" และประสิทธิภาพเนื่องจาก "การสลับ" ที่มากขึ้นจะดีขึ้นเล็กน้อย

การโจมตี 1E0
ระดับนี้มีการใช้งานดังนี้: เราสร้างอาร์เรย์ "null" จากอาร์เรย์ RAID1E ดังนั้นจำนวนดิสก์ทั้งหมดจะต้องเป็นผลคูณของสาม: อย่างน้อยสามและสูงสุดหกสิบ! ในกรณีนี้ เราไม่น่าจะได้เปรียบในด้านความเร็ว และความซับซ้อนของการใช้งานอาจส่งผลเสียต่อความน่าเชื่อถือ ข้อได้เปรียบหลักคือความสามารถในการรวมดิสก์จำนวนมาก (มากถึง 60) ไว้ในอาร์เรย์เดียว

ความคล้ายคลึงกันของระดับ RAID 1X ทั้งหมดอยู่ที่ตัวบ่งชี้ความซ้ำซ้อน: 50% ของความจุดิสก์ทั้งหมดของอาร์เรย์ถูกเสียสละเพื่อความน่าเชื่อถือ