บริการระบบไฟล์แบบกระจาย dfs ผสานรวมเข้าด้วยกัน ระบบไฟล์แบบกระจาย (DFS): พื้นฐาน ปัญหาการบริหารระบบไฟล์แบบกระจาย

Pr0grammer 29 ตุลาคม 2552 เวลา 01:31 น

ระบบไฟล์แบบกระจาย GFS (ระบบไฟล์ Google)

  • การพัฒนาเว็บไซต์

ในปัจจุบัน ด้วยการเติบโตของข้อมูล ปัญหาจึงเกิดขึ้นในการจัดเก็บและประมวลผลข้อมูลจำนวนมหาศาล ดังนั้นข้อมูลนี้จึงถูกประมวลผลบนเซิร์ฟเวอร์หลายเครื่องพร้อมกันซึ่งก่อตัวเป็นคลัสเตอร์ เพื่อให้การทำงานกับข้อมูลบนคลัสเตอร์ง่ายขึ้น ระบบไฟล์แบบกระจายจึงกำลังได้รับการพัฒนา เราจะมาดูตัวอย่างของการกระจายอย่างละเอียดยิ่งขึ้น ระบบไฟล์ ระบบไฟล์ของ Googleใช้โดยบริษัท Google- (อันที่จริงบทความนี้เป็นการแปลบทความต้นฉบับโดยไม่มีค่าใช้จ่ายและย่อ)

สศคน่าจะเป็นระบบไฟล์แบบกระจายที่มีชื่อเสียงที่สุด พื้นที่จัดเก็บข้อมูลที่เชื่อถือได้และปรับขนาดได้ถือเป็นสิ่งสำคัญสำหรับแอปพลิเคชันใดๆ ที่ทำงานกับข้อมูลขนาดใหญ่เท่ากับเอกสารทั้งหมดบนอินเทอร์เน็ต สศคเป็นแพลตฟอร์มหลักในการจัดเก็บข้อมูล Google. สศค- ระบบไฟล์แบบกระจายขนาดใหญ่ที่สามารถจัดเก็บและประมวลผลข้อมูลจำนวนมหาศาล
สศคถูกสร้างขึ้นตามเกณฑ์ดังต่อไปนี้:

  • ระบบถูกสร้างขึ้นจาก ปริมาณมากอุปกรณ์ราคาไม่แพงธรรมดาที่มักจะล้มเหลว จะต้องมีการตรวจสอบความล้มเหลวและความสามารถในการฟื้นฟูการทำงานของระบบในกรณีที่อุปกรณ์ใด ๆ ล้มเหลว
  • ระบบจะต้องจัดเก็บไฟล์ขนาดใหญ่จำนวนมาก ตามกฎแล้ว ไฟล์หลายล้านไฟล์ แต่ละไฟล์มีขนาด 100 MB ขึ้นไป คุณมักจะต้องจัดการกับไฟล์หลายกิกะไบต์ซึ่งจำเป็นต้องจัดเก็บอย่างมีประสิทธิภาพด้วย ควรจัดเก็บไฟล์ขนาดเล็กด้วย แต่ระบบไม่ได้รับการปรับให้เหมาะสมสำหรับไฟล์เหล่านั้น
  • โดยทั่วไป การอ่านมีสองประเภท: การอ่านข้อมูลตามลำดับขนาดใหญ่ และการอ่านข้อมูลสุ่มจำนวนเล็กน้อย ขณะอ่าน การไหลขนาดใหญ่เป็นเรื่องปกติที่จะขอแฟรกเมนต์ขนาด 1 MB หรือมากกว่า การดำเนินการตามลำดับดังกล่าวจากไคลเอนต์เดียวกันมักจะอ่านไฟล์เดียวกันที่ต่อเนื่องกัน อ่านไม่เป็น ขนาดใหญ่ตามกฎแล้วข้อมูลจะมีปริมาตรหลายกิโลไบต์ แอปพลิเคชันที่มีเวลาวิกฤตจะต้องสะสมคำขอดังกล่าวตามจำนวนที่กำหนด และจัดเรียงตามออฟเซ็ตตั้งแต่จุดเริ่มต้นของไฟล์ วิธีนี้จะหลีกเลี่ยงการเดินไปมาเมื่ออ่าน
  • บ่อยครั้งมีการดำเนินการในการเขียนข้อมูลต่อเนื่องจำนวนมากซึ่งจำเป็นต้องผนวกเข้ากับไฟล์ โดยปกติแล้ว จำนวนข้อมูลที่จะเขียนจะอยู่ในลำดับเดียวกันกับการอ่าน การเขียนปริมาณน้อยแต่ไปยังตำแหน่งต่างๆ ในไฟล์ มักไม่ได้ดำเนินการอย่างมีประสิทธิภาพ
  • ระบบจะต้องใช้ความหมายที่กำหนดไว้อย่างเคร่งครัด งานคู่ขนานไคลเอนต์หลายตัว หากพวกเขาพยายามเพิ่มข้อมูลลงในไฟล์เดียวกันพร้อมกัน ในกรณีนี้ อาจเกิดขึ้นที่คำขอหลายร้อยรายการให้เขียนลงในไฟล์เดียวมาถึงพร้อมกัน เพื่อที่จะรับมือกับสิ่งนี้จึงมีการใช้อะตอมมิกของการดำเนินการในการเพิ่มข้อมูลลงในไฟล์พร้อมกับการซิงโครไนซ์บางอย่าง นั่นคือหากการดำเนินการอ่านมาถึง การดำเนินการดังกล่าวจะถูกดำเนินการก่อนการดำเนินการเขียนครั้งถัดไปหรือหลังจากนั้น
  • ปริมาณงานสูงจะดีกว่าเวลาแฝงต่ำ ดังนั้นแอปพลิเคชันส่วนใหญ่บน Google จึงให้ความสำคัญกับการทำงานด้วย ปริมาณมากข้อมูลด้วยความเร็วสูง และการดำเนินการอ่านและเขียนเพียงครั้งเดียว โดยทั่วไปสามารถขยายได้
ไฟล์ใน GFS ได้รับการจัดระเบียบตามลำดับชั้นโดยใช้ไดเร็กทอรี เช่นเดียวกับในระบบไฟล์อื่นๆ และระบุตามเส้นทาง คุณสามารถดำเนินการตามปกติกับไฟล์ใน GFS ได้: สร้าง ลบ เปิด ปิด อ่านและเขียน
นอกจากนี้ GFS ยังรองรับ การสำรองข้อมูลหรือสแนปชอต คุณสามารถสร้างการสำรองข้อมูลดังกล่าวสำหรับไฟล์หรือแผนผังไดเร็กทอรีได้ด้วยต้นทุนเพียงเล็กน้อย

สถาปัตยกรรมสศค

รูปนี้นำมาจากบทความต้นฉบับ

ในระบบมีเซิร์ฟเวอร์หลักและเซิร์ฟเวอร์แบบก้อนซึ่งเก็บข้อมูลจริง ตามกฎแล้ว สศคคลัสเตอร์ประกอบด้วยเครื่องหลักหลักหนึ่งเครื่อง (ต้นแบบ) และเครื่องหลายเครื่องที่จัดเก็บแฟรกเมนต์ของไฟล์ - เซิร์ฟเวอร์ก้อน (เซิร์ฟเวอร์ก้อน) ลูกค้าสามารถเข้าถึงเครื่องเหล่านี้ทั้งหมดได้ ไฟล์ใน GFS แบ่งออกเป็นชิ้น ๆ - ชิ้น (ชิ้นคุณสามารถพูดได้ว่าเป็นแฟรกเมนต์) ชิ้นมีขนาดคงที่ที่สามารถปรับเปลี่ยนได้ แต่ละชิ้นดังกล่าวมีคีย์ 64 บิตที่ไม่ซ้ำกันและทั่วโลก ซึ่งออกโดยต้นแบบเมื่อสร้างชิ้น เซิร์ฟเวอร์ Chunk จัดเก็บชิ้นส่วนเหมือนปกติ ไฟล์ลินุกซ์บนฮาร์ดไดรฟ์ในเครื่องของคุณ เพื่อความน่าเชื่อถือ แต่ละก้อนสามารถจำลองไปยังเซิร์ฟเวอร์ก้อนอื่นๆ ได้ โดยปกติแล้วจะใช้แบบจำลองสามแบบ
ต้นแบบมีหน้าที่รับผิดชอบในการทำงานกับข้อมูลเมตาของระบบไฟล์ทั้งหมด ข้อมูลเมตาประกอบด้วยเนมสเปซ ข้อมูลการควบคุมการเข้าถึงข้อมูล การแมปไฟล์เป็นชิ้นๆ และ สถานการณ์ปัจจุบันชิ้น เจ้านายยังควบคุมทั้งหมด กิจกรรมระดับโลกระบบต่างๆ เช่น การจัดการชิ้นส่วนที่ว่าง การรวบรวมขยะ (การรวบรวมชิ้นส่วนที่ไม่จำเป็นอีกต่อไป) และการย้ายชิ้นส่วนระหว่างเซิร์ฟเวอร์ชิ้นส่วน ต้นแบบแลกเปลี่ยนข้อความ (ข้อความ HeartBeat) กับเซิร์ฟเวอร์ก้อนอย่างต่อเนื่องเพื่อออกคำสั่งและระบุสถานะของพวกเขา (ค้นหาว่าพวกเขายังมีชีวิตอยู่หรือไม่)
ไคลเอ็นต์โต้ตอบกับต้นแบบเพื่อดำเนินการที่เกี่ยวข้องกับข้อมูลเมตาเท่านั้น การดำเนินการทั้งหมดกับข้อมูลนั้นจะดำเนินการโดยตรงกับเซิร์ฟเวอร์ก้อน สศค- ระบบไม่รองรับ POSIX API ดังนั้นนักพัฒนาจึงไม่ต้องยุ่งกับเลเยอร์ VNode ของ Linux
นักพัฒนาไม่ได้ใช้การแคชข้อมูล แม้ว่าไคลเอนต์จะทำแคชข้อมูลเมตาก็ตาม บนเซิร์ฟเวอร์แบบก้อน ระบบปฏิบัติการ Linux จะแคชบล็อกที่ใช้มากที่สุดในหน่วยความจำอยู่แล้ว โดยทั่วไป การปฏิเสธแคชช่วยให้คุณไม่ต้องคิดถึงปัญหาความถูกต้องของแคช (การเชื่อมโยงกันของแคช)

ผู้เชี่ยวชาญ

การใช้วิซาร์ดตัวเดียวทำให้สถาปัตยกรรมระบบง่ายขึ้นอย่างมาก ช่วยให้คุณดำเนินการเคลื่อนย้ายชิ้นส่วนที่ซับซ้อนและจัดระเบียบการจำลองโดยใช้ข้อมูลส่วนกลาง ดูเหมือนว่าการมีมาสเตอร์เพียงคนเดียวควรเป็นจุดคอขวดของระบบ แต่ไม่ได้เป็นเช่นนั้น ลูกค้าไม่เคยอ่านหรือเขียนข้อมูลผ่านต้นแบบ แต่พวกเขาถามมาสเตอร์ว่าควรติดต่อเซิร์ฟเวอร์ก้อนไหน จากนั้นพวกเขาจะพูดคุยกับเซิร์ฟเวอร์ก้อนโดยตรง
มาดูกันว่าไคลเอนต์อ่านข้อมูลอย่างไร ก่อนอื่นให้รู้ขนาดก้อน
ชื่อไฟล์และออฟเซ็ตสัมพันธ์กับจุดเริ่มต้นของไฟล์ ไคลเอนต์จะกำหนดหมายเลขชิ้นส่วนภายในไฟล์ จากนั้นจะส่งคำขอไปยังต้นแบบที่มีชื่อไฟล์และหมายเลขก้อนในไฟล์นี้ หลักจะออกเซิร์ฟเวอร์ก้อนหนึ่งเครื่องในแต่ละแบบจำลองซึ่งจัดเก็บก้อนที่เราต้องการ ต้นแบบยังออกตัวระบุก้อนให้กับลูกค้าด้วย
จากนั้นไคลเอ็นต์จะตัดสินใจว่าแบบจำลองใดที่ชอบที่สุด (โดยปกติจะเป็นแบบจำลองที่ใกล้เคียงที่สุด) และส่งคำขอที่ประกอบด้วยชิ้นส่วนและออฟเซ็ตที่สัมพันธ์กับจุดเริ่มต้นของชิ้นส่วน การอ่านข้อมูลเพิ่มเติมไม่จำเป็นต้องมีการแทรกแซงจากวิซาร์ด ในทางปฏิบัติ ตามกฎแล้ว ไคลเอนต์จะรวมหลายชิ้นไว้ในคำขออ่านเดียว และต้นแบบจะให้พิกัดของแต่ละชิ้นในการตอบกลับครั้งเดียว
ขนาดชิ้นเป็นลักษณะสำคัญของระบบ โดยทั่วไป จะถูกตั้งค่าเป็น 64 เมกะไบต์ ซึ่งใหญ่กว่าขนาดบล็อกในระบบไฟล์ปกติมาก เห็นได้ชัดว่าหากจำเป็นต้องจัดเก็บไฟล์จำนวนมาก ซึ่งมีขนาดเล็กกว่าขนาดก้อน ก็จะต้องใช้หน่วยความจำเพิ่มเติมจำนวนมาก แต่การเลือกขนาดชิ้นใหญ่นั้นเนื่องมาจากงานที่ Google ต้องแก้ไขบนคลัสเตอร์ ตามกฎแล้ว จะต้องคำนวณบางสิ่งสำหรับเอกสารทั้งหมดบนอินเทอร์เน็ต ดังนั้นไฟล์ในงานเหล่านี้จึงมีขนาดใหญ่มาก

ข้อมูลเมตา

ต้นแบบจัดเก็บเมตาดาต้าที่สำคัญสามประเภท: เนมสเปซของไฟล์และก้อน การแมปไฟล์ต่อก้อน และตำแหน่งของแบบจำลองก้อน ข้อมูลเมตาทั้งหมดจะถูกเก็บไว้ในหน่วยความจำของต้นแบบ เนื่องจากข้อมูลเมตาถูกจัดเก็บไว้ในหน่วยความจำ การทำงานของวิซาร์ดจึงรวดเร็ว อาจารย์สามารถค้นหาสถานะของกิจการในระบบได้อย่างง่ายดายและมีประสิทธิภาพ มันสแกนเซิร์ฟเวอร์ก้อนในพื้นหลัง การสแกนเป็นระยะเหล่านี้ใช้สำหรับการรวบรวมขยะ การจำลองแบบเพิ่มเติมหากตรวจพบเซิร์ฟเวอร์ก้อนที่ไม่พร้อมใช้งาน และการเคลื่อนย้ายก้อนข้อมูลเพื่อสร้างสมดุลระหว่างโหลดและพื้นที่ว่างบนฮาร์ดไดรฟ์ของเซิร์ฟเวอร์ก้อน
ต้นแบบติดตามตำแหน่งของชิ้นส่วน เมื่อเซิร์ฟเวอร์ก้อนเริ่มทำงาน ต้นแบบจะจดจำส่วนประกอบของมัน ในระหว่างการดำเนินการ ต้นแบบจะควบคุมการเคลื่อนไหวของก้อนข้อมูลและสถานะของเซิร์ฟเวอร์ก้อนทั้งหมด ดังนั้นเขาจึงมีข้อมูลทั้งหมดเกี่ยวกับตำแหน่งของแต่ละก้อน
ส่วนสำคัญของข้อมูลเมตาคือบันทึกธุรกรรม ต้นแบบจัดเก็บลำดับการดำเนินการเพื่อทำลายการเปลี่ยนแปลงข้อมูลเมตา ขึ้นอยู่กับเครื่องหมายเหล่านี้ในบันทึกการดำเนินการ เวลาตรรกะของระบบจะถูกกำหนด นี่เป็นเวลาตรรกะที่กำหนดเวอร์ชันของไฟล์และชิ้นส่วน
เนื่องจากบันทึกธุรกรรมเป็นส่วนสำคัญ จึงควรเก็บไว้อย่างปลอดภัย และการเปลี่ยนแปลงทั้งหมดจึงควรปรากฏให้ลูกค้าเห็นเฉพาะเมื่อข้อมูลเมตามีการเปลี่ยนแปลงเท่านั้น บันทึกการดำเนินการถูกจำลองแบบไปยังเครื่องระยะไกลหลายเครื่อง และระบบตอบสนองต่อการทำงานของไคลเอ็นต์หลังจากบันทึกบันทึกนี้ลงในดิสก์หลักและดิสก์ของเครื่องระยะไกลเท่านั้น
วิซาร์ดจะคืนค่าสถานะของระบบโดยดำเนินการบันทึกการดำเนินการ บันทึกการดำเนินการจะถูกบันทึกไว้โดยสัมพันธ์กับ ขนาดเล็กโดยบันทึกเฉพาะรายการล่าสุดเท่านั้น ในระหว่างการดำเนินการ ตัวช่วยสร้างจะสร้างจุดตรวจสอบเมื่อขนาดบันทึกเกินค่าที่กำหนด และระบบสามารถกู้คืนไปยังจุดตรวจสอบที่ใกล้ที่สุดเท่านั้น นอกจากนี้ เมื่อใช้บันทึก คุณสามารถเล่นซ้ำการดำเนินการบางอย่างได้ เพื่อให้ระบบสามารถย้อนกลับไปยังจุดที่อยู่ระหว่างจุดตรวจสุดท้ายและ เวลาปัจจุบัน.

ปฏิสัมพันธ์ภายในระบบ

สถาปัตยกรรมของระบบได้อธิบายไว้ข้างต้น ซึ่งช่วยลดการแทรกแซงของต้นแบบในการปฏิบัติงานให้เหลือน้อยที่สุด ตอนนี้เรามาดูกันว่าไคลเอ็นต์ เซิร์ฟเวอร์หลัก และเซิร์ฟเวอร์ก้อนโต้ตอบกันอย่างไรเพื่อย้ายข้อมูล ทำการเขียนแบบอะตอมมิก และสร้างสำเนาสำรอง (สแนปชอต)
การเปลี่ยนแปลงแต่ละส่วนจะต้องทำซ้ำในแบบจำลองทั้งหมดและเปลี่ยนข้อมูลเมตา ใน สศคเจ้านายให้ส่วนหนึ่ง การครอบครอง(เช่า) ไปยังหนึ่งในเซิร์ฟเวอร์ที่จัดเก็บส่วนนี้ เซิร์ฟเวอร์ดังกล่าวเรียกว่าแบบจำลองหลัก เรพลิกาที่เหลือจะถูกประกาศเป็นรอง แบบจำลองหลักรวบรวมการเปลี่ยนแปลงที่ต่อเนื่องกันเป็นก้อน และแบบจำลองทั้งหมดตามลำดับนี้เมื่อการเปลี่ยนแปลงเหล่านั้นเกิดขึ้น
กลไก ทรัพย์สินชิ้นส่วนได้รับการออกแบบในลักษณะที่จะลดภาระบนชิ้นส่วนหลักให้เหลือน้อยที่สุด เมื่อจัดสรรหน่วยความจำให้รอก่อน 60 วินาที จากนั้น หากจำเป็น แบบจำลองหลักสามารถขอให้ต้นแบบขยายช่วงเวลานี้ และตามกฎแล้ว จะได้รับการตอบสนองเชิงบวก ในระหว่างช่วงรอนี้ ตัวช่วยสร้างสามารถยกเลิกการเปลี่ยนแปลงได้
ให้เราพิจารณารายละเอียดเกี่ยวกับกระบวนการบันทึกข้อมูล โดยจะแสดงทีละขั้นตอนในภาพ โดยมีเส้นบางแสดงถึงโฟลว์การควบคุม และเส้นหนาแสดงถึงโฟลว์ข้อมูล


รูปนี้นำมาจากบทความต้นฉบับด้วย
  1. ไคลเอนต์ถามต้นแบบว่าเซิร์ฟเวอร์ก้อนใดเป็นเจ้าของก้อนนั้น และก้อนนี้อยู่ที่ใดในแบบจำลองอื่น หากจำเป็น นายจะมอบชิ้นส่วนนั้นให้คนอื่นเป็นเจ้าของ
  2. ต้นแบบตอบสนองด้วยแบบจำลองหลักและแบบจำลอง (รอง) ที่เหลือ ลูกค้าจัดเก็บข้อมูลนี้ไว้เพื่อดำเนินการต่อไป ขณะนี้ ไคลเอ็นต์อาจจำเป็นต้องสื่อสารกับต้นแบบเท่านั้นหากแบบจำลองหลักไม่พร้อมใช้งาน
  3. ถัดไป ไคลเอนต์ส่งข้อมูลไปยังเรพลิกาทั้งหมด เขาสามารถทำได้ในลำดับใดก็ได้ เซิร์ฟเวอร์แต่ละอันจะจัดเก็บพวกมันไว้ บัฟเฟอร์พิเศษจนกว่าจะมีความจำเป็นหรือล้าสมัย
  4. เมื่อแบบจำลองทั้งหมดยอมรับข้อมูลนี้แล้ว ไคลเอนต์จะส่งคำขอเขียนไปยังแบบจำลองหลัก คำขอนี้ประกอบด้วยการระบุข้อมูลที่ถูกส่งในขั้นตอนที่ 3 ขณะนี้แบบจำลองหลักตั้งค่าลำดับที่การเปลี่ยนแปลงทั้งหมดที่ได้รับควรถูกดำเนินการ อาจมาจากไคลเอนต์หลายตัวพร้อมกัน จากนั้นจะทำการเปลี่ยนแปลงเหล่านั้นภายในเครื่องตามลำดับเฉพาะนั้น
  5. แบบจำลองหลักส่งต่อคำขอเขียนไปยังแบบจำลองรองทั้งหมด แบบจำลองรองแต่ละรายการจะทำการเปลี่ยนแปลงตามลำดับที่ระบุโดยแบบจำลองหลัก
  6. เรพลิการองรายงานความสำเร็จของการดำเนินการเหล่านี้
  7. แบบจำลองหลักส่งการตอบกลับไปยังไคลเอนต์ ข้อผิดพลาดใดๆ ที่พบในแบบจำลองจะถูกส่งไปยังไคลเอนต์ด้วย หากมีข้อผิดพลาดเกิดขึ้นเมื่อเขียนไปยังเรพลิกาหลัก การเขียนไปยังเรพลิการองจะไม่เกิดขึ้น มิฉะนั้น การเขียนเกิดขึ้นในเรพลิกาหลักและชุดย่อยของเรพลิการอง ในกรณีนี้ ไคลเอนต์จะจัดการกับข้อผิดพลาดและตัดสินใจว่าจะทำอย่างไรต่อไป
จากตัวอย่างด้านบน คุณจะเห็นว่าผู้สร้างแยกโฟลว์ข้อมูลและโฟลว์ควบคุมออกจากกัน หากโฟลว์การควบคุมไปที่เรพลิกาหลักเท่านั้น โฟลว์ข้อมูลจะไปยังเรพลิกาทั้งหมด การทำเช่นนี้เพื่อหลีกเลี่ยงปัญหาคอขวดในเครือข่าย และในทางกลับกัน ให้ใช้แบนด์วิธของแต่ละเครื่องอย่างเต็มที่ นอกจากนี้ เพื่อหลีกเลี่ยงปัญหาคอขวดและการเชื่อมต่อที่แออัด จึงมีการใช้รูปแบบการถ่ายโอนไปยังเพื่อนบ้านที่ใกล้ที่สุดในโทโพโลยีเครือข่าย สมมติว่าไคลเอนต์ส่งข้อมูลไปยังเซิร์ฟเวอร์ก้อน S1,..., S4- ลูกค้าส่งข้อมูลไปยังเซิร์ฟเวอร์ที่ใกล้ที่สุดให้ S1- จากนั้นจะส่งต่อไปยังเซิร์ฟเวอร์ที่ใกล้ที่สุด ปล่อยให้มันเป็นไป เอส2- ต่อไป เอส2ส่งต่อไปยังที่ใกล้ที่สุด S3หรือ S4และอื่นๆ
นอกจากนี้ความล่าช้ายังลดลงโดยใช้การวางท่อแพ็คเก็ตของข้อมูลที่ส่งผ่าน TCP- นั่นคือทันทีที่เซิร์ฟเวอร์ก้อนได้รับข้อมูลบางส่วน ก็จะเริ่มส่งข้อมูลทันที ไม่มีความแออัดของเครือข่าย ช่วงเวลาที่เหมาะสำหรับการส่งข้อมูลปริมาณมาก บีไบต์ต่อ จะมีการจำลอง B/T + RL, ที่ไหน แบนด์วิธเครือข่าย และ - ความล่าช้าเมื่อส่งหนึ่งไบต์ระหว่างสองเครื่อง
สศครองรับการดำเนินการเช่นการผนวกข้อมูลลงในไฟล์แบบอะตอมมิก โดยปกติแล้ว เมื่อเขียนข้อมูลบางอย่างลงในไฟล์ เราจะระบุข้อมูลนี้และออฟเซ็ต หากไคลเอนต์หลายรายดำเนินการคล้ายกัน การดำเนินการเหล่านี้จะไม่สามารถแลกเปลี่ยนกันได้ (ซึ่งอาจนำไปสู่ การดำเนินการที่ไม่ถูกต้อง- หากเราเพียงต้องการเพิ่มข้อมูลลงในไฟล์ ในกรณีนี้ เราจะระบุเฉพาะข้อมูลเท่านั้น สศคจะเพิ่มพวกมันด้วยการดำเนินการแบบอะตอมมิก โดยทั่วไปแล้ว หากการดำเนินการล้มเหลวในเรพลิการองอันใดอันหนึ่ง สศคจะส่งกลับข้อผิดพลาด และข้อมูลจะแตกต่างกันในเรพลิกาที่ต่างกัน
อีกหนึ่ง สิ่งที่น่าสนใจวี สศค- เป็นสำเนาสำรอง (หรือที่เรียกว่าสแน็ปช็อต) ของไฟล์หรือแผนผังไดเร็กทอรีซึ่งสร้างขึ้นเกือบจะในทันทีโดยแทบไม่รบกวนการดำเนินการที่กำลังดำเนินอยู่ในระบบ ซึ่งสามารถทำได้ด้วยเทคโนโลยีที่คล้ายกับ คัดลอกเมื่อเขียน- ผู้ใช้ใช้คุณสมบัตินี้เพื่อสร้างทางแยกข้อมูลหรืออย่างไร จุดกึ่งกลางเพื่อเริ่มการทดลองบางอย่าง

การดำเนินการที่ดำเนินการโดยวิซาร์ด

ต้นแบบคือตัวเชื่อมโยงที่สำคัญในระบบ จัดการการจำลองแบบก้อน: ตัดสินใจในการวางตำแหน่ง สร้างก้อนใหม่ และประสานงานกิจกรรมต่างๆ ภายในระบบเพื่อให้การจำลองแบบก้อนเต็มรูปแบบ โหลดบาลานซ์ทั่วทั้งเซิร์ฟเวอร์ก้อน และรวบรวมทรัพยากรที่ไม่ได้ใช้
ไม่เหมือนกับระบบไฟล์ส่วนใหญ่ สศคไม่เก็บองค์ประกอบของไฟล์ไว้ในไดเร็กทอรี สศคแสดงถึงเนมสเปซอย่างมีตรรกะเป็นตารางที่แมปแต่ละเส้นทางไปยังข้อมูลเมตา ตารางดังกล่าวสามารถจัดเก็บได้อย่างมีประสิทธิภาพในหน่วยความจำในรูปแบบของ bur (พจนานุกรมของเส้นทางเดียวกันเหล่านี้) แต่ละจุดยอดในแผนภูมินี้ (สอดคล้องกับจุดยอดอย่างใดอย่างหนึ่ง เส้นทางที่แน่นอนไปยังไฟล์หรือไดเร็กทอรี) มีข้อมูลที่เกี่ยวข้องสำหรับการล็อคการอ่านและเขียน การดำเนินการของวิซาร์ดแต่ละครั้งจำเป็นต้องมีการล็อคบางอย่าง นี่คือจุดที่ระบบใช้การล็อกการอ่าน-เขียน โดยปกติแล้วหากการดำเนินการกำลังทำงานอยู่ด้วย /d1/d2/.../dn/leafจากนั้นจะตั้งค่าการล็อกการอ่าน /d1, /d1/d2, ..., d1/d2/.../dnและล็อคไว้ทั้งสำหรับอ่านหรือเขียน d1/d2/.../dn/leaf- ในเวลาเดียวกัน ใบไม้สามารถเป็นไดเร็กทอรีหรือไฟล์ก็ได้
มาดูตัวอย่างว่ากลไกการล็อคสามารถป้องกันการสร้างไฟล์ได้อย่างไร /home/user/fooในระหว่าง การสำรองข้อมูล /home/userวี /บันทึก/ผู้ใช้- การดำเนินการสำรองข้อมูลจะตั้งค่าการล็อกการอ่าน /บ้านและ /บันทึกเช่นเดียวกับการเขียนล็อค /home/userและ /บันทึก/ผู้ใช้- การดำเนินการสร้างไฟล์จำเป็นต้องมีการล็อกการอ่าน /บ้านและ /home/userเช่นเดียวกับการเขียนล็อค /home/user/foo- ดังนั้นการดำเนินการที่สองจะไม่เริ่มทำงานจนกว่าการดำเนินการแรกจะเสร็จสิ้น เนื่องจากมีการล็อกที่ขัดแย้งกัน /home/user- เมื่อสร้างไฟล์ ไม่จำเป็นต้องล็อกการเขียนในไดเร็กทอรีหลัก การล็อกการอ่านก็เพียงพอแล้ว ซึ่งจะป้องกันไม่ให้ไดเร็กทอรีถูกลบ
คลัสเตอร์ สศคมีการกระจายตัวสูงและหลายชั้น โดยทั่วไปแล้ว คลัสเตอร์ดังกล่าวจะมีเซิร์ฟเวอร์ chunk หลายร้อยเครื่องที่อยู่บนชั้นวางที่แตกต่างกัน โดยทั่วไปเซิร์ฟเวอร์เหล่านี้พร้อมใช้งานสำหรับไคลเอนต์จำนวนมากที่อยู่ในแร็คเดียวกันหรือคนละแร็ค การเชื่อมต่อระหว่างเครื่องสองเครื่องจากชั้นวางที่แตกต่างกันสามารถผ่านสวิตช์ตั้งแต่หนึ่งตัวขึ้นไป การแบ่งหลายระดับถือเป็นความท้าทายที่ยากมากในการกระจายข้อมูลที่เชื่อถือได้ ปรับขนาดได้ และราคาไม่แพง
นโยบายตำแหน่งแบบจำลองพยายามที่จะตอบสนองคุณสมบัติต่อไปนี้: เพิ่มความน่าเชื่อถือและความพร้อมใช้งานของข้อมูลให้สูงสุด และเพิ่มการใช้งานเครือข่ายให้สูงสุด แบนด์วิธ- แบบจำลองไม่ควรอยู่เฉพาะบนเท่านั้น ไดรฟ์ที่แตกต่างกันหรือเครื่องจักรที่แตกต่างกัน แต่ยิ่งไปกว่านั้น บนชั้นวางที่แตกต่างกัน สิ่งนี้ทำให้มั่นใจได้ว่าชิ้นส่วนจะพร้อมใช้งานแม้ว่าแร็คทั้งหมดจะเสียหายหรือถูกตัดการเชื่อมต่อจากเครือข่ายก็ตาม ด้วยการจัดเรียงนี้ การอ่านจะใช้เวลาประมาณเดียวกับแบนด์วิธเครือข่าย แต่กระแสข้อมูลเมื่อเขียนจะต้องผ่านชั้นวางต่างๆ
เมื่อปรมาจารย์สร้างชิ้นส่วนขึ้นมา เขาจะเลือกตำแหน่งที่จะวางแบบจำลอง มันมาจากหลายปัจจัย:
  • ขอแนะนำให้วางเรพลิกาใหม่บนเซิร์ฟเวอร์ก้อนที่มีโหลดดิสก์เฉลี่ยต่ำที่สุด ซึ่งจะทำให้โหลดดิสก์บนเซิร์ฟเวอร์ต่างๆ เท่ากันในที่สุด
  • ขอแนะนำให้จำกัดจำนวนชิ้นใหม่ที่สร้างขึ้นบนเซิร์ฟเวอร์แต่ละชิ้น แม้ว่าการสร้างก้อนข้อมูลจะเป็นการดำเนินการที่รวดเร็วในตัวมันเอง แต่ก็เกี่ยวข้องกับการเขียนข้อมูลในภายหลังไปยังก้อนนั้น ซึ่งเป็นการดำเนินการที่หนักหน่วงอยู่แล้ว และอาจนำไปสู่ความไม่สมดุลของปริมาณการรับส่งข้อมูลไปยังส่วนต่างๆ ของระบบ
  • ตามที่ระบุไว้ข้างต้น ขอแนะนำให้กระจายชิ้นส่วนไปตามชั้นวางต่างๆ
ทันทีที่จำนวนการจำลองลดลงต่ำกว่าค่าที่ผู้ใช้กำหนดได้ ต้นแบบจะจำลองชิ้นส่วนอีกครั้ง สิ่งนี้สามารถเกิดขึ้นได้จากหลายสาเหตุ: เซิร์ฟเวอร์ก้อนไม่พร้อมใช้งาน ดิสก์ตัวใดตัวหนึ่งล้มเหลว หรือค่าที่ระบุจำนวนแบบจำลองเพิ่มขึ้น แต่ละชิ้นที่ต้องจำลองแบบจะได้รับการจัดลำดับความสำคัญ ซึ่งยังขึ้นอยู่กับปัจจัยหลายประการด้วย ประการแรก ลำดับความสำคัญจะสูงกว่าสำหรับชิ้นส่วนที่มีจำนวนแบบจำลองน้อยที่สุด ประการที่สอง เพื่อเพิ่มความน่าเชื่อถือของการดำเนินการแอปพลิเคชัน ลำดับความสำคัญของชิ้นส่วนที่ขัดขวางความคืบหน้าในงานของลูกค้าจะเพิ่มขึ้น
ต้นแบบจะเลือกชิ้นที่มีลำดับความสำคัญสูงสุดแล้วคัดลอก โดยสั่งให้เซิร์ฟเวอร์ชิ้นใดชิ้นหนึ่งคัดลอกจากแบบจำลองที่มีอยู่ แบบจำลองใหม่ตั้งอยู่ด้วยเหตุผลเดียวกันกับตอนที่ถูกสร้างขึ้น
ในขณะที่ทำงาน ต้นแบบจะปรับสมดุลของแบบจำลองอย่างต่อเนื่อง ขึ้นอยู่กับการกระจายของเรพลิกาในระบบ จะย้ายเรพลิกาเพื่อปรับระดับโหลดบนดิสก์และทำให้โหลดสมดุล ต้นแบบยังต้องตัดสินใจว่าควรลบเรพลิกาใด โดยทั่วไปแล้ว แบบจำลองที่อยู่บนเซิร์ฟเวอร์ก้อนที่มีเนื้อที่ว่างบนฮาร์ดไดรฟ์น้อยที่สุดจะถูกลบออก
อีกหนึ่ง ฟังก์ชั่นที่สำคัญนอนอยู่บนนาย - นี่คือการเก็บขยะ เมื่อทำการลบไฟล์ สศคไม่ต้องการคืนพื้นที่ดิสก์ที่ว่างทันที โดยจะดำเนินการนี้ในระหว่างการรวบรวมขยะตามปกติ ซึ่งเกิดขึ้นทั้งในระดับก้อนและไฟล์ ผู้เขียนเชื่อว่าแนวทางนี้ทำให้ระบบง่ายขึ้นและเชื่อถือได้มากขึ้น
เมื่อแอปพลิเคชันลบไฟล์ ตัวช่วยสร้างจะจดจำข้อเท็จจริงนี้ในบันทึกเช่นเดียวกับอื่นๆ อย่างไรก็ตาม แทนที่จะต้องการให้กู้คืนทรัพยากรที่ว่างทันที ไฟล์จะถูกเปลี่ยนชื่อโดยเพิ่มเวลาในการลบเข้าไปในชื่อไฟล์ และผู้ใช้จะมองไม่เห็นไฟล์นั้น และระหว่างการสแกนเนมสเปซของระบบไฟล์ตามปกติ ตัวช่วยสร้างจะลบไฟล์ที่ซ่อนไว้ทั้งหมดที่ผู้ใช้ลบไปเกินสามวันที่ผ่านมาจริง ๆ (ช่วงเวลานี้สามารถกำหนดค่าได้) จนถึงขณะนี้ ไฟล์ยังคงอยู่ในระบบโดยถูกซ่อนไว้ และสามารถอ่านหรือเปลี่ยนชื่อกลับเพื่อการกู้คืนได้ เมื่อไร ไฟล์ที่ซ่อนอยู่ถูกลบโดยต้นแบบ จากนั้นข้อมูลเกี่ยวกับมันจะถูกลบออกจากเมตาดาต้าด้วย และส่วนทั้งหมดของไฟล์นี้จะถูกยกเลิกการเชื่อมโยงจากมัน
นอกจากการสแกนเนมสเปซของไฟล์เป็นประจำแล้ว ตัวช่วยสร้างยังสแกนเนมสเปซก้อนที่คล้ายกันอีกด้วย ต้นแบบจะระบุชิ้นส่วนที่แยกออกจากไฟล์ ลบออกจากข้อมูลเมตา และในระหว่างการสื่อสารกับเซิร์ฟเวอร์คลัสเตอร์ปกติ จะส่งสัญญาณให้พวกเขาทราบว่าแบบจำลองทั้งหมดที่มีชิ้นส่วนที่กำหนดสามารถลบได้ วิธีการรวบรวมขยะนี้มีข้อดีหลายประการ โดยมีข้อเสียเปรียบประการหนึ่ง: หากระบบไม่มีพื้นที่เหลือ และการลบออกล่าช้าจะเพิ่มพื้นที่ที่ไม่ได้ใช้จนกว่าการกำจัดทางกายภาพจะเกิดขึ้นเอง แต่มีความเป็นไปได้ในการกู้คืนข้อมูลที่ถูกลบ ความเป็นไปได้ของการปรับสมดุลโหลดที่ยืดหยุ่นระหว่างการลบ และความสามารถในการกู้คืนระบบในกรณีที่เกิดความล้มเหลว

ความทนทานต่อความล้มเหลวและการวินิจฉัยข้อผิดพลาด

ผู้เขียนระบบถือว่าเป็นหนึ่งในสิ่งที่สำคัญที่สุด ปัญหาที่ซับซ้อนความล้มเหลวบ่อยครั้งของส่วนประกอบของระบบ ปริมาณและคุณภาพของส่วนประกอบทำให้ความล้มเหลวเหล่านี้ไม่ใช่แค่ข้อยกเว้น แต่ยังเป็นเรื่องปกติอีกด้วย ความล้มเหลวของส่วนประกอบอาจมีสาเหตุมาจากส่วนประกอบไม่พร้อมใช้งานหรือที่แย่กว่านั้นเกิดจากการมีข้อมูลที่เสียหาย สศครักษาระบบให้อยู่ในสภาพการทำงานโดยใช้สอง กลยุทธ์ง่ายๆ: การกู้คืนและการจำลองแบบอย่างรวดเร็ว
การกู้คืนอย่างรวดเร็วคือการรีบูตเครื่องเป็นหลัก ในขณะเดียวกัน เวลาเริ่มต้นก็สั้นมาก ซึ่งทำให้เกิดปัญหาเล็กน้อย จากนั้นงานก็ดำเนินไปตามปกติ การจำลองแบบก้อนได้ถูกกล่าวถึงข้างต้นแล้ว ต้นแบบจำลองแบบก้อนถ้าแบบจำลองตัวใดตัวหนึ่งไม่พร้อมใช้งานหรือข้อมูลที่มีแบบจำลองก้อนเสียหาย ชิ้นส่วนที่เสียหายจะถูกกำหนดโดยการคำนวณเช็คซัม
การจำลองแบบอีกประเภทหนึ่งในระบบ ซึ่งไม่ค่อยมีใครพูดถึงก็คือการจำลองแบบหลัก บันทึกการปฏิบัติงานและจุดตรวจสอบจะถูกจำลองแบบ การเปลี่ยนแปลงไฟล์ในระบบแต่ละครั้งจะเกิดขึ้นหลังจากบันทึกการดำเนินการถูกเขียนลงดิสก์โดยต้นแบบและดิสก์ของเครื่องที่มีการจำลองแบบบันทึกเท่านั้น ในกรณีที่เกิดปัญหาเล็กน้อย ตัวช่วยสามารถรีบูตได้ ในกรณีที่เกิดปัญหากับฮาร์ดไดรฟ์หรือโครงสร้างพื้นฐานที่สำคัญอื่นๆ ของต้นแบบ GFS จะเริ่มต้นแบบใหม่บนเครื่องเครื่องใดเครื่องหนึ่งซึ่งมีการจำลองข้อมูลหลัก ลูกค้าติดต่อกับ DNS ต้นแบบ ซึ่งสามารถกำหนดใหม่ให้กับเครื่องใหม่ได้ อาจารย์คนใหม่เป็นเงาของเก่าไม่ใช่ สำเนาถูกต้อง- ดังนั้นจึงมีสิทธิ์เข้าถึงไฟล์แบบอ่านอย่างเดียว นั่นคือมันไม่ได้กลายเป็นต้นแบบที่เต็มเปี่ยม แต่เพียงรักษาบันทึกการดำเนินการและโครงสร้างอื่น ๆ ของต้นแบบเท่านั้น
ส่วนสำคัญของระบบคือความสามารถในการรักษาความสมบูรณ์ของข้อมูล สามัญ สศคคลัสเตอร์ประกอบด้วยเครื่องจักรหลายร้อยเครื่องซึ่งมีเครื่องนับพันเครื่อง ฮาร์ดไดรฟ์และดิสก์เหล่านี้เมื่อทำงานด้วยความสอดคล้องที่น่าอิจฉาจะล้มเหลวซึ่งทำให้ข้อมูลเสียหาย ระบบสามารถกู้คืนข้อมูลโดยใช้การจำลองแบบ แต่ในการดำเนินการนี้ จำเป็นต้องทำความเข้าใจว่าข้อมูลเสียหายหรือไม่ การเปรียบเทียบเรพลิกาที่แตกต่างกันบนเซิร์ฟเวอร์ chunk ที่แตกต่างกันจะไม่มีประสิทธิภาพ นอกจากนี้ ข้อมูลที่ไม่สอดคล้องกันอาจเกิดขึ้นระหว่างแบบจำลองที่แตกต่างกัน ซึ่งนำไปสู่ความแตกต่างของข้อมูล ดังนั้นแต่ละเซิร์ฟเวอร์ก้อนจะต้องกำหนดความสมบูรณ์ของข้อมูลอย่างอิสระ
แต่ละชิ้นแบ่งออกเป็นบล็อกความยาว 64 กิโลไบต์- แต่ละบล็อกดังกล่าวสอดคล้องกับ 32 -บิตเช็คซัม เช่นเดียวกับข้อมูลเมตาอื่นๆ จำนวนเหล่านี้จะถูกจัดเก็บไว้ในหน่วยความจำ และบันทึกไว้ในบันทึกเป็นประจำ โดยแยกจากข้อมูลผู้ใช้
ก่อนที่จะอ่านข้อมูล เซิร์ฟเวอร์ก้อนจะตรวจสอบ เช็คซัมบล็อกก้อนที่ตัดกับข้อมูลที่ร้องขอโดยผู้ใช้หรือเซิร์ฟเวอร์ก้อนอื่น นั่นคือเซิร์ฟเวอร์ก้อนไม่กระจายข้อมูลที่เสียหาย หากเช็คซัมไม่ตรงกัน เซิร์ฟเวอร์ก้อนจะส่งข้อผิดพลาดไปยังเครื่องที่ส่งคำขอและรายงานไปยังต้นแบบ ผู้ใช้สามารถอ่านข้อมูลจากแบบจำลองอื่นได้ และต้นแบบจะสร้างสำเนาอื่นจากข้อมูลจากแบบจำลองอื่น หลังจากนี้ ต้นแบบแนะนำให้เซิร์ฟเวอร์ก้อนนี้ลบแบบจำลองที่เสียหายนี้
เมื่อเพิ่มข้อมูลใหม่ การตรวจสอบความถูกต้องจะไม่เกิดขึ้น และการตรวจสอบความถูกต้องใหม่จะถูกเขียนสำหรับบล็อก หากดิสก์เสียหาย ระบบจะพิจารณาดิสก์เมื่อพยายามอ่านข้อมูลนี้ เมื่อเขียน เซิร์ฟเวอร์ก้อนจะเปรียบเทียบเฉพาะบล็อกแรกและบล็อกสุดท้ายที่ตัดกับขอบเขตที่ถูกเขียน เนื่องจากข้อมูลบางส่วนในบล็อกเหล่านี้จะไม่ถูกเขียนทับ และจะต้องตรวจสอบความสมบูรณ์ของบล็อกเหล่านั้น

องค์ประกอบสำคัญของระบบแบบกระจายคือระบบไฟล์ เช่นเดียวกับในระบบรวมศูนย์ ในระบบแบบกระจาย หน้าที่ของระบบไฟล์คือการจัดเก็บโปรแกรมและข้อมูล และจัดให้มีการเข้าถึงตามความจำเป็น ระบบไฟล์ได้รับการดูแลโดยเครื่องตั้งแต่หนึ่งเครื่องขึ้นไปที่เรียกว่าไฟล์เซิร์ฟเวอร์ เซิร์ฟเวอร์ไฟล์สกัดกั้นคำขออ่านหรือเขียนไฟล์จากเครื่องอื่น (ไม่ใช่เซิร์ฟเวอร์) เครื่องอื่นๆ เหล่านี้เรียกว่าไคลเอ็นต์ แต่ละคำขอที่ส่งไปได้รับการตรวจสอบและดำเนินการ และการตอบกลับจะถูกส่งกลับ โดยทั่วไปไฟล์เซิร์ฟเวอร์จะมีระบบไฟล์แบบลำดับชั้น โดยแต่ละระบบมีไดเร็กทอรีรากและไดเร็กทอรีเพิ่มเติม ระดับต่ำ- เวิร์กสเตชันสามารถแนบและเมานต์ระบบไฟล์เหล่านี้กับระบบไฟล์ในเครื่องได้ ในกรณีนี้ ระบบไฟล์ที่เมาท์ยังคงอยู่บนเซิร์ฟเวอร์

สิ่งสำคัญคือต้องเข้าใจความแตกต่างระหว่างบริการไฟล์และเซิร์ฟเวอร์ไฟล์ บริการไฟล์คือคำอธิบายฟังก์ชันที่ระบบไฟล์เสนอให้กับผู้ใช้ คำอธิบายนี้รวมถึงคุณสมบัติพื้นฐานที่มีอยู่ พารามิเตอร์ และฟังก์ชันที่พวกมันดำเนินการ จากมุมมองของผู้ใช้ บริการไฟล์จะกำหนดว่าผู้ใช้สามารถทำงานด้วยอะไรได้บ้าง แต่ไม่ได้บอกว่าจะใช้งานอย่างไร โดยพื้นฐานแล้ว บริการไฟล์จะกำหนดอินเทอร์เฟซของระบบไฟล์กับไคลเอนต์

ไฟล์เซิร์ฟเวอร์เป็นกระบวนการที่ทำงานบนเครื่องที่แยกจากกันและช่วยใช้บริการไฟล์ ระบบอาจมีไฟล์เซิร์ฟเวอร์ตั้งแต่หนึ่งไฟล์ขึ้นไป แต่ในระบบกระจายที่มีการจัดการอย่างดี ผู้ใช้จะไม่ทราบว่าระบบไฟล์ถูกนำไปใช้อย่างไร โดยเฉพาะอย่างยิ่ง พวกเขาไม่ทราบจำนวนไฟล์เซิร์ฟเวอร์ ตำแหน่ง และฟังก์ชันของพวกเขา พวกเขารู้เพียงว่าหากมีการกำหนดขั้นตอนในบริการไฟล์ งานที่จำเป็นจะถูกดำเนินการและผลลัพธ์ที่ต้องการจะถูกส่งกลับไปยังพวกเขา นอกจากนี้ ผู้ใช้ไม่จำเป็นต้องรู้ด้วยซ้ำว่ามีการกระจายบริการไฟล์ ตามหลักการแล้ว ควรมีลักษณะเหมือนกับในระบบไฟล์ส่วนกลาง

เนื่องจากไฟล์เซิร์ฟเวอร์โดยทั่วไปเป็นเพียงกระบวนการของผู้ใช้ (หรือบางครั้งเป็นกระบวนการเคอร์เนล) ที่ทำงานบนเครื่องบางเครื่อง จึงสามารถมีไฟล์เซิร์ฟเวอร์ได้หลายเครื่องในระบบ โดยแต่ละไฟล์เสนอบริการไฟล์ที่แตกต่างกัน ตัวอย่างเช่น ในระบบแบบกระจาย อาจมีเซิร์ฟเวอร์สองตัวที่ให้บริการไฟล์สำหรับระบบ UNIX และ MS-DOS ตามลำดับ และกระบวนการของผู้ใช้ใดๆ ก็ใช้บริการที่เกี่ยวข้อง

บริการไฟล์ในระบบไฟล์แบบกระจาย (เช่นเดียวกับแบบรวมศูนย์) มีสองส่วนที่แตกต่างกันตามหน้าที่: บริการไฟล์เองและบริการไดเร็กทอรี ข้อตกลงแรกกับการดำเนินงานเกี่ยวกับ แยกไฟล์เช่นการอ่าน การเขียน หรือการเพิ่ม และอย่างที่สอง - ด้วยการสร้างและจัดการไดเร็กทอรี การเพิ่มและลบไฟล์ออกจากไดเร็กทอรี เป็นต้น



สำหรับใครก็ตาม บริการไฟล์ไม่ว่าจะรวมศูนย์หรือกระจาย คำถามที่สำคัญที่สุดคือ ไฟล์คืออะไร? ในหลายระบบ เช่น UNIX และ MS DOS ไฟล์จะเป็นลำดับไบต์ที่ไม่ได้รับการตีความ ความหมายและโครงสร้างของข้อมูลในไฟล์เป็นเรื่องที่น่ากังวล แอพพลิเคชั่นระบบปฏิบัติการไม่สนใจเรื่องนี้

รองรับระบบปฏิบัติการเมนเฟรม ประเภทต่างๆการจัดระเบียบไฟล์แบบลอจิคัล โดยแต่ละไฟล์มีคุณสมบัติที่แตกต่างกัน ไฟล์สามารถจัดระเบียบเป็นลำดับของบันทึกได้ และระบบปฏิบัติการมีการเรียกที่อนุญาตให้ทำงานในระดับของบันทึกเหล่านั้น ระบบไฟล์แบบกระจายที่ทันสมัยส่วนใหญ่สนับสนุนการกำหนดไฟล์เป็นลำดับไบต์แทนที่จะเป็นลำดับของเรคคอร์ด ไฟล์มีลักษณะเฉพาะตามคุณลักษณะ: ชื่อ ขนาด วันที่สร้าง รหัสเจ้าของ ที่อยู่ และอื่นๆ

แง่มุมที่สำคัญโมเดลไฟล์คือความสามารถในการแก้ไขไฟล์หลังจากที่สร้างแล้ว โดยทั่วไปไฟล์สามารถแก้ไขได้ แต่ในระบบแบบกระจายบางระบบ การดำเนินการกับไฟล์เพียงอย่างเดียวคือ CREATE และ READ ไฟล์ดังกล่าวเรียกว่าไม่เปลี่ยนรูป สำหรับไฟล์ที่ไม่เปลี่ยนรูปแบบ จะง่ายกว่ามากในการแคชไฟล์และทำซ้ำ เนื่องจากปัญหาทั้งหมดที่เกี่ยวข้องกับการอัปเดตสำเนาทั้งหมดของไฟล์เมื่อมีการเปลี่ยนแปลงจะถูกกำจัด

บริการไฟล์สามารถแบ่งออกได้เป็น 2 ประเภท ขึ้นอยู่กับว่ารองรับรูปแบบการอัพโหลด-อัพโหลดหรือ การเข้าถึงระยะไกล- ในรูปแบบอัพโหลด-ดาวน์โหลด ผู้ใช้จะได้รับวิธีการอ่านหรือเขียนไฟล์ทั้งหมด โมเดลนี้ใช้รูปแบบการประมวลผลไฟล์ต่อไปนี้: การอ่านไฟล์จากเซิร์ฟเวอร์ไปยังเครื่องไคลเอนต์ ประมวลผลไฟล์บนเครื่องไคลเอนต์ และการเขียนไฟล์ที่อัพเดตไปยังเซิร์ฟเวอร์ ข้อดีของโมเดลนี้คือความเรียบง่ายทางแนวคิด นอกจากนี้การถ่ายโอนไฟล์ทั้งหมดยังมีประสิทธิภาพมากอีกด้วย ข้อเสียเปรียบหลักของรุ่นนี้ก็คือ ความต้องการสูงไปยังดิสก์ไคลเอนต์ นอกจากนี้ การย้ายไฟล์ทั้งหมดจะไม่มีประสิทธิภาพหากจำเป็นต้องใช้เพียงส่วนเล็กๆ เท่านั้น

บริการไฟล์อีกประเภทหนึ่งสอดคล้องกับโมเดลการเข้าถึงระยะไกล ซึ่งเกี่ยวข้องกับการรองรับการดำเนินการจำนวนมากกับไฟล์: การเปิดและปิดไฟล์ การอ่านและการเขียนส่วนของไฟล์ การวางตำแหน่งในไฟล์ การตรวจสอบและการเปลี่ยนแปลงคุณสมบัติของไฟล์ และอื่นๆ . ในขณะที่อยู่ในรูปแบบการอัพโหลดและดาวน์โหลด ไฟล์เซิร์ฟเวอร์จะให้เฉพาะการจัดเก็บไฟล์และการเคลื่อนย้ายไฟล์เท่านั้น ในกรณีนี้ระบบไฟล์ทั้งหมดทำงานบนเซิร์ฟเวอร์ ไม่ใช่เครื่องไคลเอนต์ ข้อดีของแนวทางนี้คือความต้องการพื้นที่ดิสก์เหลือน้อยบนเครื่องไคลเอนต์ พร้อมทั้งขจัดความจำเป็นในการถ่ายโอนไฟล์ทั้งหมดเมื่อต้องการเพียงบางส่วนเท่านั้น

ลักษณะของบริการไดเร็กทอรีไม่ขึ้นอยู่กับประเภทของโมเดลบริการไฟล์ที่ใช้ ระบบแบบกระจายใช้หลักการเดียวกันของการจัดระเบียบไดเร็กทอรีเป็นระบบรวมศูนย์ รวมถึงการจัดระเบียบไดเร็กทอรีหลายระดับ

ปัญหาพื้นฐานของวิธีการตั้งชื่อไฟล์คือความโปร่งใส ในบริบทนี้ ความโปร่งใสเป็นที่เข้าใจได้ในสองความรู้สึกที่แยกแยะได้ไม่ดี ประการแรก ความโปร่งใสของตำแหน่ง หมายความว่าชื่อไม่สามารถระบุตำแหน่งของไฟล์ได้ เช่น ชื่อ /server1/dir1/dir2/xบอกว่าไฟล์ x อยู่บนเซิร์ฟเวอร์ 1 แต่ไม่ได้ระบุว่าเซิร์ฟเวอร์นั้นอยู่ที่ใด เซิร์ฟเวอร์สามารถย้ายข้ามเครือข่ายได้ และชื่อไฟล์เต็มจะไม่เปลี่ยนแปลง ส่งผลให้ระบบดังกล่าวมีความโปร่งใสในด้านสถานที่ตั้ง

ในระบบที่ประกอบด้วยไคลเอนต์และเซิร์ฟเวอร์ อาจมีสี่ที่ที่แตกต่างกันในการจัดเก็บไฟล์และชิ้นส่วน: ดิสก์เซิร์ฟเวอร์ หน่วยความจำเซิร์ฟเวอร์ ดิสก์ไคลเอนต์ (ถ้ามี) และหน่วยความจำไคลเอนต์ ตำแหน่งที่เหมาะสมที่สุดในการจัดเก็บไฟล์ทั้งหมดคือดิสก์เซิร์ฟเวอร์ โดยปกติจะมีความจุขนาดใหญ่และไฟล์ต่างๆ จะพร้อมให้แก่ลูกค้าทุกคน นอกจากนี้ เนื่องจากในกรณีนี้แต่ละไฟล์จะมีสำเนาเพียงสำเนาเดียว จึงไม่มีปัญหาในการกระทบยอดสถานะของสำเนา

ความท้าทายเมื่อใช้ดิสก์เซิร์ฟเวอร์คือประสิทธิภาพ ก่อนที่ไคลเอ็นต์จะสามารถอ่านไฟล์ได้ ไฟล์จะต้องถูกเขียนจากดิสก์ของเซิร์ฟเวอร์ไปยังไฟล์ก่อน แรมแล้วส่งผ่านเครือข่ายไปยังหน่วยความจำของลูกค้า การโอนทั้งสองต้องใช้เวลา

การปรับปรุงประสิทธิภาพที่สำคัญสามารถทำได้โดยการแคชไฟล์ในหน่วยความจำเซิร์ฟเวอร์ จำเป็นต้องใช้อัลกอริทึมเพื่อพิจารณาว่าไฟล์หรือส่วนใดควรเก็บไว้ในแคช

เมื่อเลือกอัลกอริธึมจะต้องแก้ไขปัญหาสองประการ ก่อนอื่นแคชทำงานบนหน่วยใด หน่วยเหล่านี้อาจเป็นบล็อกดิสก์หรือทั้งไฟล์ก็ได้ หากไฟล์เหล่านี้เป็นไฟล์ทั้งหมดก็สามารถจัดเก็บไว้ในดิสก์ในพื้นที่ต่อเนื่องได้ (โดย อย่างน้อยในรูปแบบของส่วนขนาดใหญ่) ในขณะที่จำนวนการแลกเปลี่ยนระหว่างหน่วยความจำและดิสก์ลดลง ดังนั้นจึงมั่นใจได้ถึงประสิทธิภาพสูง การแคชบล็อกดิสก์ช่วยให้คุณใช้หน่วยความจำแคชและพื้นที่ดิสก์ได้อย่างมีประสิทธิภาพมากขึ้น

ประการที่สอง จำเป็นต้องกำหนดกฎสำหรับการแทนที่ข้อมูลเมื่อหน่วยความจำแคชเต็ม ที่นี่คุณสามารถใช้อัลกอริธึมการแคชมาตรฐาน เช่น อัลกอริธึม LRU (ใช้ล่าสุดน้อยที่สุด) ซึ่งบล็อกที่ไม่ได้เข้าถึงเป็นเวลานานที่สุดจะถูกไล่ออก

หน่วยความจำแคชบนเซิร์ฟเวอร์นั้นใช้งานง่ายและโปร่งใสต่อไคลเอนต์โดยสมบูรณ์ เนื่องจากเซิร์ฟเวอร์สามารถซิงโครไนซ์หน่วยความจำและดิสก์ได้ จากมุมมองของไคลเอ็นต์ แต่ละไฟล์จะมีสำเนาเพียงชุดเดียว ดังนั้นจึงไม่มีปัญหาเรื่องความสอดคล้องกัน

เนื่องจากไฟล์ที่แชร์แพร่หลายไปทั่วเครือข่าย ผู้ดูแลระบบจึงเผชิญกับความท้าทายมากขึ้นในการให้ผู้ใช้สามารถเข้าถึงข้อมูลที่ต้องการได้ ในห้องผ่าตัด ระบบวินโดวส์ 2000 Distributed File System (DFS) จัดเตรียมกลไกสำหรับผู้ดูแลระบบในการสร้าง การแสดงเชิงตรรกะไดเร็กทอรีและไฟล์ ไม่ว่าไฟล์เหล่านั้นจะอยู่ที่ใดบนเครือข่ายก็ตาม นอกจากนี้ ผ่านการใช้ DFS รับประกันความทนทานต่อความเสียหายของทรัพยากรการจัดเก็บข้อมูลเครือข่าย

บนหน้านี้

การแนะนำ

เนื่องจากไฟล์ที่แชร์แพร่หลายไปทั่วเครือข่าย ผู้ดูแลระบบจึงเผชิญกับความท้าทายมากขึ้นในการให้ผู้ใช้สามารถเข้าถึงข้อมูลที่ต้องการได้ ในระบบปฏิบัติการ Windows 2000 ระบบไฟล์แบบกระจายจัดเตรียมกลไกสำหรับผู้ดูแลระบบเพื่อสร้างมุมมองแบบลอจิคัลของไดเร็กทอรีและไฟล์ โดยไม่คำนึงว่าไฟล์นั้นอยู่ที่ใดบนเครือข่าย นอกจากนี้ ผ่านการใช้ DFS รับประกันความทนทานต่อความเสียหายของทรัพยากรการจัดเก็บข้อมูลเครือข่าย คู่มือนี้จะอธิบายวิธีใช้ New DFS Root Wizard รวมถึงเครื่องมืออื่นๆ สำหรับการทำงานกับ DFS

ข้อกำหนดเบื้องต้น

ตัวอย่างในเอกสารนี้ถือว่า Active Directory ได้รับการกำหนดค่าและใช้งานอยู่ และคุณมีสิทธิ์ของผู้ดูแลระบบสำหรับโดเมนและเซิร์ฟเวอร์ที่จะกำหนดค่า DFS เพื่อจุดประสงค์นี้ คุณสามารถใช้โครงสร้างพื้นฐานพื้นฐานที่อธิบายไว้ในนั้น คำแนะนำทีละขั้นตอนสำหรับการปรับใช้ขั้นพื้นฐาน โครงสร้างพื้นฐานของวินโดวส์เซิร์ฟเวอร์ 2000 (คำแนะนำทีละขั้นตอนเกี่ยวกับโครงสร้างพื้นฐานทั่วไป) สำหรับวินโดวส์การปรับใช้เซิร์ฟเวอร์ 2000) http://www.microsoft.com/windows2000/techinfo/planning/server/serversteps.asp (ภาษาอังกฤษ)

การใช้สแน็ปอิน DFS

คำแนะนำทีละขั้นตอนนี้อธิบายวิธีใช้ . แม้ว่า DFS จะถูกติดตั้งโดยอัตโนมัติเมื่อคุณติดตั้ง Windows 2000 Server คุณต้องกำหนดค่า DFS เพื่ออนุญาตให้ไคลเอ็นต์เข้าถึงเครือข่ายที่ใช้ร่วมกัน เพื่อให้ขั้นตอนเหล่านี้เสร็จสมบูรณ์ คุณต้องเข้าสู่ระบบตัวควบคุมโดเมนในฐานะผู้ดูแลโดเมน

ในระบบปฏิบัติการ Windows 2000 ระบบไฟล์แบบกระจายสามารถรวมเข้ากับบริการไดเร็กทอรี Active Directory เพื่อให้ความทนทานต่อข้อผิดพลาดกับราก DFS ที่อยู่บนตัวควบคุมโดเมน Windows 2000 และเซิร์ฟเวอร์สมาชิก หากคุณมีเซิร์ฟเวอร์หลายเครื่องในโดเมน Windows 2000 ของคุณ จำนวนเท่าใดก็ได้ของเซิร์ฟเวอร์เหล่านั้นสามารถใช้เป็นโฮสต์เพื่อให้การยอมรับข้อบกพร่องกับราก DFS ที่ระบุ บริการไดเรกทอรี Active Directory ใช้เพื่อเปิดใช้งานการใช้ตัวควบคุมโดเมนร่วมกัน โทโพโลยีทั่วไป DFS จึงให้ความซ้ำซ้อนและความทนทานต่อข้อผิดพลาด

คุณยังสามารถสร้างเซิร์ฟเวอร์ DFS แบบสแตนด์อโลนได้ อย่างไรก็ตาม คุณจะไม่ได้รับประโยชน์จาก Active Directory และจะไม่มีความทนทานต่อข้อบกพร่องระดับรูท ตัวควบคุมโดเมนสามารถโฮสต์รูท DFS ได้เพียงรูทเดียวเท่านั้น แต่จริงๆ แล้วไม่มีการจำกัดจำนวนรูท DFS ในแต่ละโดเมน ราก DFS แต่ละตัวสามารถรองรับตัวควบคุมโดเมนได้สูงสุด 32 ตัว โดเมนสามารถรองรับไดรฟ์ข้อมูลราก DFS ได้หลายรายการ เครื่องจักรเพิ่มเติมที่รองรับโหนดรูทหรือโหนดย่อย (ลิงก์) ช่วยให้มีการปรับสมดุลโหลด ความทนทานต่อข้อผิดพลาด และความสามารถในการให้บริการได้ดีขึ้น ลูกค้าเครือข่ายขึ้นอยู่กับความเกี่ยวข้องกับบางไซต์บนเครือข่าย ลิงก์ DFS ที่ระบุที่รูทจะถูกระบุโดยใช้เส้นทาง UNC ที่เซิร์ฟเวอร์และไคลเอ็นต์ DFS สามารถเข้าถึงได้

คู่มือนี้จะขอให้คุณสร้างรูท DFS ที่ทนต่อข้อผิดพลาด

เริ่มต้นใช้งาน DFS

คลิกปุ่ม เริ่ม, เลือก โปรแกรมไปที่ส่วน การบริหาร (เครื่องมือการบริหาร)และเลือก ไฟล์ที่แจกจ่าย ระบบดีเอฟเอส(ระบบไฟล์แบบกระจาย).

คลิกขวาที่องค์ประกอบรูท DFS (ระบบไฟล์แบบกระจาย)อยู่ที่แผงด้านซ้ายแล้วคลิก สร้างรูท DFS (รูท DFS ใหม่)- แสดงแล้ว ตัวช่วยสร้างรูท DFS ใหม่- หากต้องการดำเนินการต่อ ให้คลิกปุ่ม ต่อไป.

ตรวจสอบให้แน่ใจว่าสวิตช์อยู่ในตำแหน่งแล้ว สร้างรูท DFS ของโดเมนและกดปุ่ม ต่อไปเพื่อดำเนินการต่อ

เลือกโดเมนโฮสต์สำหรับรูท DFS (ในตัวอย่างของเรา นี่คือโดเมน reskit.com)และกดปุ่ม ต่อไปเพื่อดำเนินการต่อ

รูปที่ 1 – การเลือกโดเมนผู้ให้บริการสำหรับรูท DFS

เลือกโฮสต์เซิร์ฟเวอร์สำหรับรูท DFS นี้ ในตัวอย่างของเรา นี่คือเซิร์ฟเวอร์ HQ-RES-DC-01.Reskit.com- คลิกปุ่ม ต่อไปเพื่อดำเนินการต่อ

ระบุการแบ่งใช้ที่จะใช้เป็นเป้าหมายสำหรับรูท DFS นี้ ตั้งสวิตช์ไปที่ตำแหน่ง สร้างการแชร์ใหม่ให้ป้อนเส้นทางไปยังโฟลเดอร์ที่แชร์นี้ (ในกรณีของเราคือ c:\dfsbooks)และระบุชื่อของโฟลเดอร์ที่แชร์นี้ – หนังสือ- อุปกรณ์ DFS (ระบบไฟล์แบบกระจาย)จะช่วยให้คุณสร้าง แค็ตตาล็อกใหม่และกำหนดค่าให้ การเข้าถึงทั่วไปหากยังไม่เคยทำมาก่อน

รูปที่ 2 – การเลือกโฟลเดอร์แชร์สำหรับโวลุ่มรูท DFS

คลิกปุ่ม ต่อไป- หากไม่มีโฟลเดอร์ที่ระบุ คุณจะถูกถามว่าจะสร้างหรือไม่ คลิกปุ่ม ใช่ (ใช่)เพื่อดำเนินการต่อ หากต้องการคุณสามารถป้อนความคิดเห็นที่อธิบายรูทนี้ได้ หากต้องการดำเนินการต่อ ให้คลิกปุ่ม ต่อไป.

คลิกปุ่ม เสร็จเพื่อสร้างรูท DFS หลังจากสร้างตัวช่วยสร้างรูท DFS ใหม่เสร็จแล้ว คุณสามารถเริ่มจัดการรูท DFS ของคุณได้

ถ้าคุณมีตัวควบคุมโดเมนหลายตัวที่ให้ความทนทานต่อข้อบกพร่องของ DFS โปรดจำไว้ว่าความทนทานต่อข้อบกพร่องของ DFS ใช้บริการไดเรกทอรี Active Directory เพื่อเก็บข้อมูลโทโพโลยี ดังนั้นจึงจำเป็นที่ข้อมูลโทโพโลยีถูกจำลองแบบระหว่างตัวควบคุมโดเมน เริ่มแรกดำเนินการอัปเดตการกำหนดค่า DFS บนเซิร์ฟเวอร์โดเมน Windows 2000 ตัวใดตัวหนึ่งที่ประกอบด้วยรูท DFS ตัวควบคุมโดเมนที่แตกต่างกันอาจมีข้อมูลที่แตกต่างกันเกี่ยวกับสถานะปัจจุบันของการกำหนดค่า DFS จนกว่าตัวช่วยสร้างการจำลองแบบจะจำลองการเปลี่ยนแปลงการกำหนดค่า DFS ระหว่างตัวควบคุมโดเมนทั้งหมด รูท DFS และลิงก์ทั้งหมดจะถูกจัดเก็บเป็นองค์ประกอบประเภทเดียว – Binary Large Object (BLOB) เมื่อทำการเปลี่ยนแปลงกับวัตถุไบนารีขนาดใหญ่นี้ วัตถุไบนารีทั้งหมดจำเป็นต้องถูกจำลองแบบเพื่อให้การเปลี่ยนแปลงสะท้อนให้เห็นในตัวควบคุมโดเมนทั้งหมดในโดเมน

การจำลองข้อมูลระหว่างตัวควบคุมโดเมนสองตัวที่อยู่ในไซต์เดียวกันใช้เวลาประมาณห้านาที และอย่างน้อย 15 นาทีสำหรับตัวควบคุมโดเมนที่อยู่ในไซต์ที่แตกต่างกัน จนกว่าการจำลองแบบจะเสร็จสมบูรณ์ การกำหนดค่า DFS ที่แสดงโดยสแน็ปอิน DFS อาจแตกต่างกันระหว่างไคลเอนต์ คุณสามารถใช้ปุ่ม รีเฟรชเพื่ออัปเดตข้อมูลที่แสดงเกี่ยวกับสถานะปัจจุบันของโฮสต์ DFS

หากคุณทำตามขั้นตอนข้างต้น ขณะนี้เครือข่ายของคุณมีราก DFS ที่ว่างเปล่าในบริการไดเรกทอรี Active Directory เพื่อให้โฟลเดอร์สาธารณะนี้เป็นที่สนใจของผู้ใช้ คุณต้องเผยแพร่โฟลเดอร์สาธารณะที่ไม่ใช่ภายในเครื่องในเนมสเปซ DFS ไปยังโฟลเดอร์นั้น

หากต้องการเผยแพร่โฟลเดอร์แชร์ที่ไม่ใช่ในเครื่อง

คลิกขวาที่วัตถุราก DFS ที่คุณสร้างขึ้น และจากนั้น คลิก สร้างลิงก์ DFS (ลิงก์ DFS ใหม่).

คลิกขวาที่วัตถุ \\Reskit.com\Books.

ระบุไดเร็กทอรีสำหรับลิงก์นี้ ในตัวอย่างของเรา ชื่อลิงก์จะเป็น ศิลปะ- โปรดระบุที่อยู่ UNC ที่ถูกต้องสำหรับการแชร์ โฟลเดอร์วินโดวส์ 2000 อยู่ในเครือข่ายของคุณในสนาม ส่งผู้ใช้ไปยังเส้นทางเครือข่ายนี้- เพื่อจุดประสงค์เหล่านี้ คุณสามารถใช้ปุ่มนี้ได้ เรียกดู- ตัวอย่างของเราใช้โฟลเดอร์ที่ใช้ร่วมกัน สถาปัตยกรรมตั้งอยู่บนเซิร์ฟเวอร์ BR3-VAN-SRV-01ซึ่งเป็นส่วนหนึ่งของโดเมน แวนคูเวอร์.

บันทึก.โฟลเดอร์ที่ใช้ร่วมกันนี้ถูกสร้างขึ้นก่อนหน้านี้สำหรับแบบฝึกหัดนี้

รูปที่ 3 – การเลือกโฟลเดอร์แชร์

คลิกปุ่ม ตกลง- คุณสามารถเลือกระบุความคิดเห็นและค่าการหมดเวลาได้ ค่าการหมดเวลาจะกำหนดจำนวนวินาทีที่ไคลเอนต์แคชตัวชี้ก่อนที่จะต้องรีเฟรชตัวชี้จากเซิร์ฟเวอร์ผู้ให้บริการ DFS ตัวใดตัวหนึ่ง

หากคุณมีเซิร์ฟเวอร์หลายเครื่องที่ต้องกำหนดค่า (เช่น สองเซิร์ฟเวอร์ หนึ่งเซิร์ฟเวอร์ในฮาร์ตฟอร์ดและอีกหนึ่งเซิร์ฟเวอร์ในซีแอตเทิล มีข้อมูลที่เหมือนกัน) คุณสามารถเพิ่มเซิร์ฟเวอร์เหล่านั้นสำหรับชุดแบบจำลองนี้ได้ ในการดำเนินการนี้บนไอคอนของโฟลเดอร์แชร์ที่เผยแพร่ไปยังรูท DFS ให้คลิกขวาแล้วคลิก สร้างแบบจำลอง (แบบจำลองใหม่).

เลือกโฟลเดอร์ที่ใช้ร่วมกัน \\Reskit\BR2-RES-SRV-01\ไดอะแกรมวิศวกรรมและกดปุ่ม ตกลง.

คลิก ตกลงอีกครั้ง.

คลิกขวาที่ลิงค์ที่เชื่อมต่อแล้วคลิก นโยบายการจำลองแบบ- เลือกแต่ละโฟลเดอร์ที่ใช้ร่วมกันแล้วคลิกปุ่ม เปิดใช้งานจากนั้นคลิกปุ่ม ตกลง.

บันทึก- เมื่อต้องการใช้การจำลองแบบ รูทหรือการใช้ลิงก์ DFS ร่วมกันต้องอยู่บนไดรฟ์ข้อมูล NTFS 5.0 ที่อยู่บนตัวควบคุมโดเมน Windows 2000 หรือเซิร์ฟเวอร์สมาชิก ธง หลักไฟล์และโฟลเดอร์เฉพาะของเซิร์ฟเวอร์จะถูกทำเครื่องหมาย ระบุไว้สำหรับการบังคับให้จำลองแบบเริ่มต้น หลังจากนั้นจะดำเนินการจำลองแบบตามปกติ

รูปที่ 5 – นโยบายการจำลองแบบ
รูปด้านล่างแสดงสแน็ปอิน DFS หลังจากเสร็จสิ้นขั้นตอนที่อธิบายไว้

รูปที่ 6 – รูท DFS

การตรวจสอบเครื่องยนต์ DFS

ผู้ใช้คนใดเข้าสู่ระบบ โดเมนวินโดวส์ปี 2000 จะสามารถเข้าถึงระบบไฟล์แบบกระจายที่ทนทานต่อข้อผิดพลาดได้ สมมติว่าเขามีสิทธิ์ที่เหมาะสม เขาสามารถตั้งค่าการเชื่อมต่อแต่ละรายการได้โดยการเรียกใช้ ขั้นตอนต่อไปนี้:

ในสภาพแวดล้อมการใช้งานจริง ไดรฟ์เครือข่ายนี้อาจอยู่บนเซิร์ฟเวอร์อื่นหรือ เวิร์กสเตชัน- ผู้ใช้ใดๆ ที่สามารถเข้าถึงโฟลเดอร์ที่ใช้ร่วมกันที่ทนต่อข้อผิดพลาดสามารถทำงานได้ต่อไปโดยไม่มีการหยุดชะงัก กิจกรรมเซิร์ฟเวอร์ตามกำหนดการ เช่น การอัปเดตซอฟต์แวร์และงานอื่นๆ ที่ปกติจะต้องปิดเซิร์ฟเวอร์ สามารถดำเนินการให้เสร็จสิ้นได้โดยไม่กระทบต่อประสบการณ์ของผู้ใช้

ในการเข้าถึงรูท DFS โดยใช้ Explorer (Windows Explorer)

คลิก เริ่ม, กด วิ่งและเข้า \\reskit.com\bookในช่องข้อความ เปิดและกด ตกลง.

โดยคลิกขวาที่ลิงค์ที่แสดงในแผงเบราว์เซอร์เลือก คุณสมบัติคุณสามารถไปที่แท็บ ดีเอฟเอสกล่องโต้ตอบ คุณสมบัติเพื่อดูข้อมูลต่อไปนี้:

ในกรณีที่มีการปิดระบบทางกายภาพของหนึ่งในสองเซิร์ฟเวอร์ คุณจะยังคงสามารถเข้าถึงทรัพยากรผ่านเส้นทาง DFS เดียวกัน อย่างไรก็ตาม หากเซิร์ฟเวอร์เนมสเปซ DFS ตัวใดตัวหนึ่งที่รองรับรูทหรือลิงก์ DFS ไม่พร้อมใช้งาน การเชื่อมต่อจะเฟลโอเวอร์ไปยังเครือข่ายอื่นที่มีอยู่โดยอัตโนมัติ โปรดทราบว่าสิ่งนี้เป็นไปได้เฉพาะสำหรับโหนดรูทและโหนดย่อยที่ทนต่อข้อผิดพลาดซึ่งมีเนื้อหาซ้ำกันบนเซิร์ฟเวอร์หลายเครื่อง

บันทึก- ปัจจุบัน DFS รองรับ Microsoft Cluster Service โดยใช้ DFS เท่านั้น คอมพิวเตอร์แต่ละเครื่องดังนั้นคุณจึงไม่สามารถสร้างโทโพโลยี DFS ที่ทนต่อข้อผิดพลาดที่ทำงานในคลัสเตอร์ได้เนื่องจากคลัสเตอร์ทำหน้าที่เป็นคอมพิวเตอร์เครื่องเดียว

การจำลองแบบ

หากคุณกำลังใช้ระบบไฟล์แบบกระจายที่ทนต่อข้อบกพร่องในสภาพแวดล้อมที่มีตัวควบคุมโดเมนจำนวนมาก สิ่งสำคัญคือต้องกำหนดเวลาที่ใช้ในการจำลองข้อมูลระหว่างตัวควบคุมโดเมนตามที่จำเป็นสำหรับการกำหนดค่า DFS เฉพาะของคุณ คุณจะต้องมีเครื่องมือสำหรับการจำลองแบบทันที REPLMonซึ่งคุณสามารถติดตั้งได้จากโฟลเดอร์ การสนับสนุน \ เครื่องมืออยู่บนซีดี Windows 2000 Server

ลูกค้าที่ยังคงใช้ระบบปฏิบัติการเวอร์ชันก่อนหน้า (เช่น Windows NT 4.0) และจำเป็นต้องใช้ประโยชน์จากความสามารถของ DFS จะไม่สามารถใช้ประโยชน์จากการยอมรับข้อบกพร่องของรูท DFS ได้ อย่างไรก็ตาม ไคลเอ็นต์ดังกล่าวสามารถเชื่อมต่อโดยตรงกับราก DFS เฉพาะที่เป็นส่วนหนึ่งของระบบไฟล์แบบกระจายที่มีความยืดหยุ่น ในกรณีนี้เมื่อใช้คำสั่ง ใช้งานเน็ตคุณต้องเปลี่ยนชื่อโดเมนด้วยชื่อของคอมพิวเตอร์เครื่องใดเครื่องหนึ่ง

เวิร์กสเตชัน Windows NT ที่ใช้ DFS ยังสามารถระบุโฟลเดอร์ที่ใช้ร่วมกันที่พวกเขากำลังใช้อยู่ได้ ในการทำเช่นนี้คุณต้องใช้แท็บ ดีเอฟเอสที่อยู่ในกล่องโต้ตอบ คุณสมบัติแชร์โฟลเดอร์ใน Explorer (Windows Explorer)

บันทึก.ฟังก์ชันการดูแลระบบส่วนใหญ่สามารถทำได้จากบรรทัดคำสั่งหรือจากไฟล์สคริปต์โดยใช้ยูทิลิตี้ DFSCMD.EXE เข้ามา บรรทัดคำสั่ง DFSCMD/?ที่จะได้รับ ข้อมูลโดยย่อตามคำสั่ง

รูปที่ 7 – การดูคุณสมบัติ DFS
หากจำเป็น คุณสามารถเปลี่ยนคุณสมบัติของออบเจ็กต์นี้ได้เสมอ

คุณยังสามารถเผยแพร่ Failsafe ของคุณได้ ราก DFSเป็นโฟลเดอร์แชร์ใน Active Directory และเข้าถึงได้โดยใช้ Directory Service Browser เปิดสแนป ผู้ใช้ Active Directory และคอมพิวเตอร์คลิกขวาที่วัตถุโดเมนของคุณ คลิก สร้าง (ใหม่)เลือกตัวเลือก โฟลเดอร์ที่ใช้ร่วมกันและป้อนข้อมูลที่เหมาะสม

ระบบไฟล์ที่มีรูปแบบการบันทึกไฟล์ที่ไม่สามารถแยกส่วนได้ ใช้บน คอมพิวเตอร์ส่วนบุคคล BC ในระบบปฏิบัติการ MKDOS, AO-DOS, NORD, MicroDOS, NORTON-BC, PascalDOS ฯลฯ รองรับอ่านอย่างเดียวใน ANDOS ระบบปฏิบัติการที่แตกต่างกันมักจะรองรับการแก้ไขที่แตกต่างกันซึ่งไม่สามารถเข้ากันได้อย่างสมบูรณ์เสมอไป
  1. ระบบไฟล์การทำเจอร์นัลขั้นสูงสำหรับระบบปฏิบัติการตระกูล AmigaOS รวมถึง MorphOS และ AROS หนึ่งในคุณสมบัติของระบบนี้คือความสามารถในการจัดเรียงข้อมูลแม้ในขณะที่ทำงานกับไฟล์หมายเหตุ - มาร์ติน มาร์แชล.<…>Bill Brothers ผู้จัดการผลิตภัณฑ์ SCO Xenix กล่าวไว้ว่าประสิทธิภาพของ Acer Fast File System สามารถสูงถึง 600 ถึง 800 กิโลไบต์ต่อวินาที เทียบกับประมาณ 100 กิโลไบต์ต่อวินาทีสำหรับรูปแบบไฟล์ Unix มาตรฐาน”
  2. 1.3 ยืนยันการเผยแพร่เมื่อวันที่ 16 กันยายน 2531 โดย Carolyn Scheppner จาก CATS ใน amiga.dev ในรูปแบบ . สำเนาประกาศ BIX จาก USENET
  3. (ไม่ได้กำหนด) .
  4. เปิดตัวครั้งแรกใน NTFS 3.0
  5. ร็อบ ราเดซ. 2.4.15-รอบชิงชนะเลิศ (ไม่ได้กำหนด) . รายชื่อผู้รับจดหมายเคอร์เนล Linux(23 พฤศจิกายน 2544). สืบค้นเมื่อ 30 พฤศจิกายน 2010 สืบค้นเมื่อ 26 สิงหาคม 2011
  6. ฝ่ายค้านของ Microsoft ต่อคำร้องของ Datel สำหรับการตัดสินโดยสรุปบางส่วน (ไฟล์ PDF บนเว็บไซต์ Electronic Frontier Foundation) - " FatX เป็นรูปแบบกรรมสิทธิ์ที่ไม่ได้เผยแพร่ ซึ่งไม่สามารถอ่านได้โดยใช้เครื่องมือมาตรฐานที่มีอยู่ในคอมพิวเตอร์ Macintosh, Windows หรือ Linux " ข้อความจำนวนมากถูกทาสีทับ
  7. เซอร์เกย์ ปทาชนิค. “โค้ดสำหรับ Next3 เปิดอยู่ - ระบบไฟล์สำหรับ Linux ที่รองรับ FS snapshot” (ไม่ได้กำหนด) - (09 มิถุนายน 2553). สืบค้นเมื่อ 17 กุมภาพันธ์ 2554 สืบค้นเมื่อ 26 สิงหาคม 2554
  8. ระบบไฟล์ ReFS จากภายในเผยแพร่แล้ว (ไม่ได้กำหนด) - อาร์.แล็บ (16 มีนาคม 2555). เก็บถาวรจากต้นฉบับเมื่อวันที่ 31 พฤษภาคม 2012
  9. "Btrfs และ Squashfs รวมเข้ากับเคอร์เนล Linux"(อังกฤษ) (10 มกราคม 2552). สืบค้นเมื่อ 4 มกราคม 2554 สืบค้นเมื่อ 26 สิงหาคม 2554
  10. วิธีใช้ - คอมไพเลอร์ IBM AIX
  11. VERITAS Foundation Suite และ Foundation Suite HA 3.5 (ไม่ได้กำหนด) (ลิงก์ใช้ไม่ได้)- เวอริทัส สืบค้นเมื่อ 21 พฤศจิกายน 2550 สืบค้นเมื่อ 25 ตุลาคม 2546

ระบบไฟล์สำหรับแฟลชไดรฟ์/สื่อโซลิดสเตต[ | ]

สื่อโซลิดสเตต เช่น แฟลชไดรฟ์ มีส่วนติดต่อข้อมูลคล้ายกับฮาร์ดไดรฟ์ทั่วไป แต่มีปัญหาและข้อเสียในตัวเอง แม้ว่าเวลาในการดึงข้อมูลจะลดลงเหลือศูนย์ในทางปฏิบัติ แต่จำเป็นต้องใช้อัลกอริธึมพิเศษเพื่อเพิ่มประสิทธิภาพการบันทึกและการลบข้อมูล เป็นต้น

ระบบไฟล์เชิงการเขียน[ | ]

ไฟล์จะถูกจัดเก็บเป็นชุดของบันทึก (แทนที่จะเป็นชุดของไบต์ที่ไม่มีโครงสร้าง) ระบบไฟล์ดังกล่าวมีความเกี่ยวข้องเป็นหลักกับเมนเฟรมรุ่นเก่าและ ระบบปฏิบัติการสำหรับมินิคอมพิวเตอร์ โปรแกรมอ่านและเขียนบันทึกทั้งหมด แทนที่จะเขียนเป็นไบต์ ตามลำดับเฉพาะ วิธีการทำงานกับไฟล์นี้จะปรากฏในคำสั่ง I/O ในภาษา FORTRAN เวอร์ชันเก่า

ระบบไฟล์สำหรับการจัดเก็บข้อมูลเครือข่าย[ | ]

ระบบไฟล์สำหรับ ไดรฟ์ที่แชร์(หรือเรียกอีกอย่างว่า Storage Network File Systems (ระบบไฟล์ SAN) หรือ ระบบไฟล์แบบคลัสเตอร์) ถูกใช้เป็นหลักในการจัดเก็บข้อมูลที่เชื่อมต่อกับเครือข่าย โดยที่โหนดทั้งหมดบนเครือข่ายสามารถเข้าถึงโดยตรงไปยังอุปกรณ์จัดเก็บข้อมูลบล็อกที่ระบบไฟล์ตั้งอยู่ ระบบไฟล์ดังกล่าวทำงานได้แม้ว่าโหนดใดโหนดหนึ่งจะล้มเหลวก็ตาม โดยทั่วไประบบไฟล์เหล่านี้จะใช้ในคลัสเตอร์ที่มีความพร้อมใช้งานสูงพร้อมกับฮาร์ดแวร์ RAID โดยทั่วไประบบไฟล์จัดเก็บข้อมูลที่เชื่อมต่อกับเครือข่ายจะไม่ขยายเกิน 64 หรือ 128 โหนด

สิ่งเหล่านี้สามารถเป็นแบบสมมาตรได้เมื่อมีการกระจายข้อมูลเมตาระหว่างโหนด หรือไม่สมมาตรโดยมีที่เก็บข้อมูลเมตาแบบรวมศูนย์

  • (XFS for Cluster) คือระบบไฟล์ที่ขยาย XFS เพื่อใช้งานบนเครือข่ายที่มีเซิร์ฟเวอร์ SGI ขอบเขตของแอปพลิเคชันเป็นเรื่องปกติสำหรับโซลูชัน Silicon Graphics - การตัดต่อวิดีโอ การประมวลผลอาร์เรย์วิดีโอ
  • จากอีเอ็มซี พร้อมใช้งานสำหรับระบบปฏิบัติการ AIX, HP-UX, IRIX, Solaris และ Windows อสมมาตร.
  • (ภาษาอังกฤษ)- ระบบไฟล์แบบกระจายที่พัฒนาโดย IBM
  • Files-11 เป็นระบบไฟล์สำหรับคลัสเตอร์ VMS ซึ่งเปิดตัวโดย DEC ในปี 1983 ปัจจุบัน . สมมาตร.
  • (GFS) เป็นบริษัทในเครือเรดแฮท เผยแพร่บน Linux ภายใต้ลิขสิทธิ์ GNU GPL สมมาตร () และไม่สมมาตร ()
  • (CFS) (TruCluster) - บริษัท ใช้ได้กับ Tru64 UNIX
  • - บริษัท. ใช้ได้กับวินโดวส์ สมมาตร.
  • - ระบบไฟล์จากบริษัท พร้อมใช้งานบน Linux และ Solaris อสมมาตร.
  • OCFS - Oracle Cluster File System ซึ่งเป็นระบบไฟล์คลัสเตอร์จาก Oracle ใบอนุญาต GNU GPL สมมาตร
  • (PSFS) - บริษัท - ใช้ในซึ่งเน้นการส่งออกไปยังไคลเอนต์ผ่าน CIFS หรือ NFS เช่นเดียวกับ Microsoft เซิร์ฟเวอร์ SQLและ Oracle 9i RAC และ 10g พร้อมใช้งานบน Linux และ Windows สมมาตร.
  • (ภาษาอังกฤษ)จาก. อสมมาตร. พร้อมใช้งานบน AIX, HP-UX, IRIX, Linux, Mac OS, Solaris และ Windows เข้ากันได้กับ Xsan
  • QFS สร้างโดย Sun Microsystems ใช้งานได้บน Linux (เท่านั้น ส่วนลูกค้า) และ Solaris (สมบูรณ์) อสมมาตร.
  • (CFS) - พัฒนาโดยไซแมนเทค พร้อมใช้งานบน AIX, HP-UX, Linux และ Solaris อสมมาตร.
  • Xsan เป็นระบบไฟล์แบบคลัสเตอร์ที่สร้างโดย Apple Computer, Inc. ไม่สมมาตร พร้อมใช้งานบน Mac OS เข้ากันได้กับ.
  • - พัฒนาโดย VMware/EMC Corporation มีอยู่ในเซิร์ฟเวอร์ VMware ESX สมมาตร.

ระบบไฟล์แบบกระจาย[ | ]

ระบบไฟล์แบบกระจายเรียกอีกอย่างว่าระบบไฟล์เครือข่าย

  • Andrew File System (AFS) สามารถปรับขนาดได้และไม่ขึ้นกับตำแหน่ง มีไคลเอ็นต์แคชที่แข็งแกร่ง และใช้ Kerberos ในการอนุญาต การใช้งานที่หลากหลายใช้ชิ้นส่วนดั้งเดิมจาก IBM (เดิม), Arla และ OpenAFS
  • - เซิร์ฟเวอร์และไคลเอนต์ที่ใช้งานได้อย่างอิสระพร้อมการสนับสนุน AFS
  • Apple Filing Protocol (AFP) - FS จาก Apple Computer AFP สามารถใช้โปรโตคอล Kerberos สำหรับการตรวจสอบสิทธิ์ได้
  • CIFS คือระบบไฟล์แบบกระจายที่ใช้ SMB ที่รองรับสิทธิ์และการล็อค UNIX ในขณะที่ใช้ชื่อเครื่อง DNS ไม่ใช่ NetBIOS ซึ่งแตกต่างจาก SMB
  • (/DFS) - FS ของ IBM (เดิมเรียกว่า AFS) และสอดคล้องกับ POSIX และมาตรฐานระบบโดยสมบูรณ์ ความพร้อมใช้งานสูง- พร้อมใช้งานสำหรับ AIX และ Solaris OS ภายใต้ไลเซนส์ที่เป็นกรรมสิทธิ์
  • NetWare Core Protocol (NCP) - FS จาก Novell ใช้กับเครือข่ายที่ใช้ NetWare
  • Network File System (NFS) ซึ่งมีพื้นเพมาจาก Sun Microsystems ปัจจุบันเป็นมาตรฐานบนเครือข่ายที่คล้ายกับ UNIX NFS สามารถใช้โปรโตคอล Kerberos สำหรับการตรวจสอบสิทธิ์และแคชไคลเอ็นต์
  • (การแชร์ไฟล์ระยะไกล - การแบ่งปัน ไฟล์ที่ถูกลบ) - ระบบไฟล์เครือข่ายสำหรับ UNIX System V เท่านั้น โดยเริ่มต้นด้วย Release 3 ใช้โปรโตคอลอินเทอร์เฟซเลเยอร์การขนส่ง TLI
  • (ภาษาอังกฤษ)- One File System ซึ่งเป็นระบบไฟล์แบบกระจายเจอร์นัลแบบเต็มรูปแบบที่พัฒนาโดย ช่วยให้คุณจัดเก็บข้อมูลได้มากกว่า 150 TB
  • - การใช้งานแบบเปิดของระบบไฟล์แบบกระจาย AFS
  • (SFS) ซึ่งเป็นระบบไฟล์เครือข่ายระดับโลกที่ออกแบบมาสำหรับ การเข้าถึงที่ปลอดภัยไปยังไฟล์ข้ามโดเมนการดูแลระบบที่แตกต่างกัน
  • Server Message Block (SMB) - พัฒนาโดย IBM (เวอร์ชันทั่วไปส่วนใหญ่ได้รับการแก้ไขอย่างหนักโดย Microsoft) - เป็นมาตรฐานในเครือข่ายที่ใช้ Windows SMB มีอีกชื่อหนึ่งว่า ระบบไฟล์อินเทอร์เน็ตทั่วไป (CIFS)- ระบบไฟล์ทั่วไปบนอินเทอร์เน็ต SMB สามารถใช้โปรโตคอล Kerberos สำหรับการตรวจสอบสิทธิ์ได้
  • - ระบบไฟล์แบบกระจายสำหรับ OS Plan 9 และ Inferno

ระบบไฟล์แบบขนานแบบกระจายที่ป้องกันความล้มเหลว[ | ]

ระบบไฟล์แบบกระจายซึ่งทำงานแบบขนานและปลอดภัยเมื่อเกิดข้อผิดพลาด แบ่งปันและจำลองข้อมูลบนเซิร์ฟเวอร์หลายเครื่อง ประสิทธิภาพสูงและรับประกันความสมบูรณ์ของข้อมูล แม้ว่าเซิร์ฟเวอร์จะล้มเหลว ข้อมูลก็ไม่สูญหาย ระบบไฟล์เหล่านี้ใช้ในการประมวลผลความเร็วสูงและคลัสเตอร์ที่มีความพร้อมใช้งานสูง

ระบบไฟล์ทั้งหมดที่แสดงไว้ที่นี่มุ่งเน้นไปที่ความพร้อมใช้งานสูง ความสามารถในการปรับขนาด และประสิทธิภาพสูง เว้นแต่จะระบุไว้เป็นอย่างอื่น

  • Ceph คือระบบไฟล์แบบแจกจ่ายฟรีที่สามารถใช้กับระบบที่ประกอบด้วยเครื่องหลายเครื่องหรือโหนดนับพัน ไม่ต้องการการสนับสนุนพิเศษใดๆ จากเคอร์เนล สามารถทำงานบนอุปกรณ์บล็อก ภายในไฟล์เดียว หรือใช้ระบบไฟล์ที่มีอยู่
  • Coda เป็นระบบไฟล์ที่สร้างขึ้นที่ Carnegie Mellon University และมุ่งเป้าไปที่การดำเนินการที่ปรับให้เข้ากับแบนด์วิดท์ของช่องสัญญาณ (รวมถึงการทำงานของโหมด) ใช้แคชฝั่งไคลเอ็นต์สำหรับ คอมพิวเตอร์พกพา- FS นี้เป็นรุ่นต่อของ AFS-2 และพร้อมใช้งานสำหรับ Linux ภายใต้ใบอนุญาต GNU GPL
  • - FS จากบริษัท Fermilab และ DESY เป็นซอฟต์แวร์เสรี (แต่ไม่ใช่ซอฟต์แวร์เสรี) ซอฟต์แวร์เนื่องจากข้อจำกัดด้านใบอนุญาต)
  • - กระจาย FS จาก มาเป็นส่วนหนึ่งของโซลูชัน NAS บน Linux ที่ทำงานบนฮาร์ดแวร์ของ Intel โดยให้บริการ NFS v2/v3, SMB/CIFS และ AFP สำหรับ Microsoft Windows, Mac Os, Linux และไคลเอนต์ UNIX อื่นๆ มีจำหน่ายภายใต้ใบอนุญาตที่เป็นกรรมสิทธิ์
  • - FS ใช้

Distributed File System (DFS) ช่วยให้คุณจัดการได้อย่างง่ายดายและโปร่งใส ไดรฟ์เครือข่าย- แทนที่จะใช้ ที่ตั้งทางกายภาพทรัพยากรเครือข่าย (ตามชื่อเซิร์ฟเวอร์) ผู้ใช้สามารถเชื่อมต่อกับรูทของระบบไฟล์แบบกระจายได้

รูทของระบบไฟล์แบบกระจายทำหน้าที่เป็นจุดแจกจ่ายแบบลอจิคัลสำหรับไดรฟ์เครือข่าย ซึ่งหมายความว่าผู้ใช้สามารถนำทางไปยังรูทของระบบไฟล์แบบกระจายและดูรายการโฟลเดอร์ที่ติดตั้งบนรูทนั้นได้ เมื่อคลิกที่โฟลเดอร์ ผู้ใช้สามารถดูเนื้อหาได้ แต่ผู้ใช้อาจไม่สงสัยด้วยซ้ำว่าเนื้อหาของโฟลเดอร์นั้นอยู่บนเซิร์ฟเวอร์อื่น

ทั้งหมดนี้หมายความว่าระบบไฟล์แบบกระจายช่วยเพิ่มระดับความโปร่งใสเมื่อเข้าถึงเนื้อหาของทรัพยากรเครือข่าย หลายๆ คนเรียกแนวคิดนี้ว่า Storage Virtualization เมื่อใช้ระบบไฟล์แบบกระจาย ผู้ใช้ไม่จำเป็นต้องทราบว่าข้อมูลอยู่ที่ใด การจดจำตำแหน่งของรูทระบบไฟล์ก็เพียงพอแล้ว

ด้วยการจัดการตำแหน่งของไดรฟ์เครือข่ายอย่างมีเหตุผล คุณสามารถย้ายข้อมูลระหว่างเซิร์ฟเวอร์บนเครือข่ายไปยังผู้ใช้ได้อย่างโปร่งใส จากมุมมองของผู้ใช้ ข้อมูลจะยังคงอยู่ที่รากของระบบไฟล์แบบกระจาย สิ่งที่คุณต้องทำก็แค่คัดลอกข้อมูลไปยังตำแหน่งอื่นและอัพเดตลิงก์ระบบไฟล์แบบกระจายไปยังออบเจ็กต์ที่ใช้ร่วมกันเพื่อให้สะท้อนถึงตำแหน่งใหม่

นอกจากการให้ การเข้าถึงที่โปร่งใสไปยังที่เก็บข้อมูล โฟลเดอร์ที่ใช้ร่วมกันที่จัดการโดยระบบไฟล์แบบกระจายสามารถกำหนดค่าเป็นพันธมิตรการจำลองได้ ซึ่งช่วยให้คุณกำหนดระดับของความทนทานต่อข้อผิดพลาดและการปรับสมดุลโหลด (ดำเนินการโดยอัตโนมัติโดยใช้ระบบไฟล์แบบกระจาย)

อยู่ระหว่างการจำลองข้อมูล บริการการจำลองแบบไฟล์ (FRS)ซึ่งจำลองโฟลเดอร์ SYSVOL ด้วยอ็อบเจ็กต์ด้วย นโยบายกลุ่มไดเรกทอรีที่ใช้งานอยู่

เมื่อคุณตั้งค่าระบบไฟล์แบบกระจายเป็นครั้งแรก คุณต้องระบุจุดเริ่มต้นสำหรับแผนผังระบบไฟล์แบบกระจาย เป็นที่รู้จักในนามรูทระบบไฟล์แบบกระจาย รูทของระบบไฟล์แบบกระจายมีสองประเภท:

  • รากที่แยกได้ (สแตนด์อโลน)- การกำหนดค่าเนมสเปซของระบบไฟล์แบบกระจายและสถาปัตยกรรมจะถูกจัดเก็บไว้ในเครื่อง เซิร์ฟเวอร์รูท- เส้นทางการเข้าถึง (เส้นทาง UNC) ไปยังรูทเริ่มต้นด้วยชื่อเซิร์ฟเวอร์ รูทแบบแยกอนุญาตให้มีรูทระบบไฟล์แบบกระจายเพียงอันเดียวต่อเนมสเปซของระบบไฟล์แบบกระจาย ซึ่งหมายความว่ารูทไม่ได้ให้ความทนทานต่อข้อผิดพลาดและแสดงถึงความล้มเหลวเพียงจุดเดียวเมื่อเข้าถึงข้อมูล
  • โดเมน- เนมสเปซของระบบไฟล์แบบกระจายจะถูกจัดเก็บไว้ใน Active Directory ด้วยการใช้โดเมนระบบไฟล์แบบกระจาย คุณสามารถสร้างรากของระบบไฟล์แบบกระจายที่ทนต่อข้อบกพร่องได้หลายแบบ และไคลเอนต์จะเข้าถึงระบบไฟล์แบบกระจายตามชื่อโดเมน การใช้การรวม Active Directory ช่วยให้ไคลเอ็นต์สามารถเปลี่ยนเส้นทางไปยังรูทของระบบไฟล์แบบกระจายในไซต์ Active Directory ภายในเครื่องได้โดยอัตโนมัติ ซึ่งมีข้อดีบางประการในเครือข่ายขนาดใหญ่ที่โครงสร้างพื้นฐานของระบบไฟล์แบบกระจายอาจขยายไปยังหลายไซต์

อีกคำที่คุณต้องรู้ก็คือ ลิงก์ระบบไฟล์แบบกระจาย (ลิงก์ DFS)- รูทเป็นจุดเริ่มต้นของระบบไฟล์แบบกระจาย เมื่อคุณเพิ่มลิงค์ ชื่อไดรฟ์เครือข่ายและตำแหน่งข้อมูลเครือข่ายจะถูกกำหนด เมื่อผู้ใช้เข้าถึงรูทของระบบไฟล์แบบกระจาย ความสัมพันธ์จะปรากฏเป็นโฟลเดอร์ย่อยโลจิคัลของรูท