pcm. รูปแบบเสียงคืออะไร ไฟล์นามสกุล PCM. คำอธิบายแผนผังของ DSD

เราหวังว่าเราจะช่วยคุณแก้ไขปัญหาไฟล์ PCM ของคุณ หากคุณไม่ทราบว่าคุณสามารถดาวน์โหลดแอปพลิเคชันจากรายการของเราได้ที่ไหน ให้คลิกที่ลิงก์ (นี่คือชื่อของโปรแกรม) - คุณจะพบข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับตำแหน่งที่จะดาวน์โหลดเวอร์ชันการติดตั้งที่ปลอดภัยของแอปพลิเคชันที่จำเป็น

มีอะไรอีกที่อาจทำให้เกิดปัญหา?

อาจมีสาเหตุหลายประการที่ทำให้คุณไม่สามารถเปิดไฟล์ PCM ได้ (ไม่ใช่แค่ขาดแอปพลิเคชันที่เหมาะสม)
ประการแรก- ไฟล์ PCM อาจเชื่อมโยงอย่างไม่ถูกต้อง (เข้ากันไม่ได้) กับแอปพลิเคชันที่ติดตั้งเพื่อรองรับ ในกรณีนี้ คุณต้องเปลี่ยนการเชื่อมต่อนี้ด้วยตนเอง โดยคลิกขวาที่ไฟล์ PCM ที่คุณต้องการแก้ไข คลิกตัวเลือก "เปิดด้วย"จากนั้นเลือกโปรแกรมที่คุณติดตั้งจากรายการ หลังจากดำเนินการนี้ ปัญหาในการเปิดไฟล์ PCM ควรจะหายไปโดยสิ้นเชิง
ประการที่สอง- ไฟล์ที่คุณต้องการเปิดอาจเสียหายได้ ในกรณีนี้ ควรค้นหาเวอร์ชันใหม่หรือดาวน์โหลดอีกครั้งจากแหล่งเดียวกัน (อาจด้วยเหตุผลบางประการในเซสชันก่อนหน้า การดาวน์โหลดไฟล์ PCM ไม่เสร็จสิ้นและไม่สามารถเปิดได้อย่างถูกต้อง) .

คุณต้องการที่จะช่วย?

หากคุณมีข้อมูลเพิ่มเติมเกี่ยวกับนามสกุลไฟล์ PCM เราจะยินดีอย่างยิ่งหากคุณแบ่งปันกับผู้ใช้เว็บไซต์ของเรา ใช้แบบฟอร์มที่พบและส่งข้อมูลของคุณเกี่ยวกับไฟล์ PCM ให้เรา

หลายๆ คนเข้าใจว่า "วิดีโอความละเอียดสูง" คืออะไร แต่ประเด็นของการพูดคุยเกี่ยวกับเสียง HD ที่ศูนย์นันทนาการคืออะไร? คำนี้หมายถึงรูปแบบเสียงหลายช่องสัญญาณที่บันทึกลงในแผ่นดิสก์ Blu-ray มีหลายวิธีที่ใช้ในการจัดเก็บเสียงดิจิทัล แต่ทั้งหมดมีเป้าหมายเดียวกัน นั่นคือ เสียงที่ดีที่สุดสำหรับโฮมเธียเตอร์ของคุณ

ดีที่สุด? ดีขึ้นขนาดไหน?

เมื่อสั่งซื้อ เสียง HD ปรับปรุงคุณภาพได้อย่างมาก และคุณไม่จำเป็นต้องเป็นผู้เชี่ยวชาญจึงจะได้ยิน ทุกแง่มุมของเสียงได้รับการปรับปรุง ตั้งแต่ช่วงไดนามิกไปจนถึงความสมจริง Andy Dowell ผู้จัดการฝ่ายขายของ Dolby กล่าวว่า "คุณจะได้ยินสิ่งที่วิศวกรมิกซ์ได้ยินระหว่างมิกซ์อย่างแน่นอน - ไปจนถึงจังหวะ" Anthony Wilkins ผู้อำนวยการฝ่ายการตลาดของ DTS กล่าวว่า "เมื่อเราพูดถึงการบีบอัดข้อมูลสำหรับเสียง DVD คำที่ถูกต้องน่าจะเป็น 'การตัดทอน' เนื่องจากสัญญาณต้นฉบับบางส่วนหายไปอย่างถาวรในระหว่างขั้นตอนการเข้ารหัส สิ่งนี้จะไม่เกิดขึ้นกับตัวแปลงสัญญาณเสียง HD สำหรับ Blu-ray; ผลลัพธ์ก็เหมือนเดิม"

เหมือนเดิมมั้ย? เต็มที่?

ถูกต้องแล้ว ทุกวันนี้ แทร็กเสียงภาพยนตร์ต้นฉบับจะถูกบันทึกในรูปแบบ PCM ที่ไม่มีการบีบอัดที่ 24 บิต/48 kHz (ดีกว่าซีดี) หลังจากมิกซ์ เพลงประกอบจะถูกบีบอัดอย่างมากสำหรับการเล่นในโรงภาพยนตร์หรือที่บ้าน คล้ายกับการสร้าง MP3 จากซีดี ในระบบ Dolby Digital ซึ่งส่วนใหญ่มักใช้ในการสร้างดีวีดี บิตเรตจะสอดคล้องกับไฟล์ MP3 ที่ดี - ตั้งแต่ 384 ถึง 448 kbps การบีบอัดเป็นสิ่งที่ไม่พึงประสงค์มาโดยตลอด แต่จำเป็นเพื่อให้สามารถ "บีบ" เสียงแบบหลายช่องสัญญาณของภาพยนตร์ทั้งเรื่องลงบนม้วนหรือดิสก์ที่มีจำกัด อย่างไรก็ตาม แผ่นดิสก์ Blu-ray มีความจุสูงสุด 50 GB ดังนั้นจึงไม่จำเป็นต้องบีบอัด แผ่นดิสก์ดังกล่าวสามารถจัดเก็บเพลงประกอบที่สมบูรณ์ในรูปแบบ PCM 7.1 พร้อมพารามิเตอร์ 24 บิต/48 kHz แม้แต่แผ่นดิสก์ขนาด 25GB แบบชั้นเดียวก็สามารถรองรับแทร็กเสียง PCM 5.1 ที่ไม่มีการบีบอัดได้อย่างง่ายดาย

เหตุใดทุกแผ่นดิสก์จึงไม่มีเสียง PCM

ใช้พื้นที่ไม่น้อยโดยเฉพาะกับไดรฟ์ขนาด 25GB ที่ราคาถูกกว่า เพื่อเว้นพื้นที่สำหรับสิ่งพิเศษ เพลงภาษาต่างประเทศ คำวิจารณ์ และองค์ประกอบวิดีโอจริงของภาพยนตร์ สตูดิโอจึงใช้วิธีใดวิธีหนึ่งจากสองแนวทางนี้ วิธีหนึ่งคือการลดขนาดเสียง PCM 24 บิตเป็น 16 บิต/48kHz อย่างไรก็ตาม นิยมใช้ระบบบันทึกเสียงแบบไม่สูญเสียข้อมูลสองระบบ ได้แก่ DTS-HD Master Audio และ Dolby TrueHD

"การไม่สูญเสียคุณภาพ" หมายความว่าอย่างไร

ระบบเหล่านี้คล้ายกับระบบจัดเก็บไฟล์: โดยบรรจุ PCM 24 บิต/48 kHz ไว้ในหน่วยความจำจำนวนน้อยกว่า การเล่นจำเป็นต้อง "คลายซิป" ไฟล์ที่บันทึกกลับเข้าไปใน PCM ทั้งเครื่องเล่น Blu-ray และ AV รีซีฟเวอร์ส่วนใหญ่ก็สามารถทำได้ เทคโนโลยี Dolby TrueHD สร้างเสียง PCM 24 บิต/48 kHz แต่ต้องใช้พื้นที่จัดเก็บข้อมูลเกือบครึ่งหนึ่ง ตามทฤษฎีแล้ว มันควรจะเหมือนกันกับต้นฉบับ Dolby และ DTS พูดอย่างนั้น นั่นเป็นสาเหตุที่เทคโนโลยีทั้งสองนี้ได้รับความนิยมอย่างมากในฮอลลีวูด โดยให้เสียงคุณภาพสูงมาก แต่ต้องการพื้นที่ดิสก์ในปริมาณที่พอเหมาะมากกว่าเมื่อเทียบกับ PCM ซึ่งจะช่วยลดต้นทุนของดิสก์ (ทำให้คุณสามารถจำกัดสื่อของตัวเองไว้ที่ 25 GB) และทำให้มีพื้นที่ว่างมากขึ้นสำหรับวัสดุเพิ่มเติม

ตัวเลขบอกอะไร.

หากต้องการจัดเก็บเพลงประกอบภาพยนตร์ความยาวสองชั่วโมงใน PCM 5.1 (24 บิต/48 kHz) ต้องใช้หน่วยความจำ 6.2 GB Dolby TrueHD ลดตัวเลขนี้เป็น 3 GB; ยิ่งช่องเสียงที่ภาพยนตร์มีช่องสัญญาณแตกต่างกันมากและยิ่งยาวเท่าไร การบีบอัดก็จะยิ่งมีประโยชน์มากขึ้นเท่านั้น สำหรับการเปรียบเทียบทั้งสองระบบนั้น DTS-HD Master Audio มีบิตเรตที่สูงกว่า Dolby TrueHD (24.5 Mbps และ 18 Mbps) แต่ในทางปฏิบัติค่าเหล่านี้แทบไม่เคยได้รับเลย แผ่นดิสก์บางแผ่นมีแทร็กทั้งสองรูปแบบ โดยรวมแล้วก็ค่อนข้างดีทั้งคู่

รูปแบบเสียง HD หลักสามรูปแบบ

PCM ที่ไม่มีการบีบอัด

ข้อดี: คุณภาพเยี่ยมมาก เช่น 3:10 ถึง Yuma ไม่จำเป็นต้อง "คลายซิป"; มีให้สำหรับเครื่องเล่น Blu-ray หรือเครื่องรับ AV รุ่นเก่าด้วย

ข้อเสีย: ใช้พื้นที่มาก: Yuma ในรูปแบบ 7.1 ต้องการมากกว่า 8 GB

ดอลบี้ ทรูเอชดี

ข้อดี: คุณภาพเสียงที่น่าทึ่ง; ใช้พื้นที่ดิสก์น้อยกว่า PCM มาก เพลงประกอบภาพยนตร์ Dark Knight ใน TrueHD เป็นหนึ่งในเพลงที่น่าทึ่งที่สุด

ข้อเสีย: ตามทฤษฎีแล้ว บิตเรตที่ 18 Mbps ให้น้อยกว่า 24.5 ของ DTS-HD MA เล็กน้อย

ระบบเสียงมาสเตอร์ DTS-HD

ข้อดี: ตัวแปลงสัญญาณแบบไม่สูญเสียที่พบมากที่สุดบนแผ่นดิสก์ Blu-ray; ฟังดูยอดเยี่ยมมาก - เพลงประกอบ Avatar พิสูจน์ให้เห็นแล้ว

ข้อเสีย: บางคนแย้งว่าจริงๆ แล้วดีกว่า Dolby TrueHD; เราไม่แน่ใจเกี่ยวกับเรื่องนั้น

ในฐานะผู้ที่เกี่ยวข้องโดยตรงในสาขา AV เรามักพูดถึงการเข้ารหัสเสียงและตัวแปลงสัญญาณเสียงอยู่ตลอดเวลา แต่สิ่งเหล่านี้คืออะไร ตัวแปลงสัญญาณเสียงโดยพื้นฐานแล้วคืออุปกรณ์หรืออัลกอริทึมที่สามารถเข้ารหัสและถอดรหัสสัญญาณเสียงดิจิทัลได้

ในทางปฏิบัติ คลื่นเสียงที่เคลื่อนที่ผ่านอากาศถือเป็นสัญญาณอะนาล็อกที่มีอายุการใช้งานยาวนาน สัญญาณจะถูกแปลงเป็นรูปแบบดิจิทัลโดยอุปกรณ์ที่เรียกว่าตัวแปลงแอนะล็อกเป็นดิจิทัล (ADC) และอุปกรณ์แปลงย้อนกลับเรียกว่าตัวแปลงดิจิทัลเป็นแอนะล็อก (DAC) ตัวแปลงสัญญาณตั้งอยู่ระหว่างฟังก์ชันทั้งสองนี้ และช่วยให้คุณสามารถปรับพารามิเตอร์ที่สำคัญบางประการสำหรับการจับ บันทึก และออกอากาศสัญญาณเสียงได้สำเร็จ: อัลกอริธึมตัวแปลงสัญญาณ ความถี่ในการสุ่มตัวอย่าง ความลึกของบิต และอัตราการถ่ายโอนข้อมูล

ตัวแปลงสัญญาณเสียงที่ได้รับความนิยมสูงสุดสามตัว ได้แก่ Pulse-Code Modulation (PCM), MP3 และ Advanced Audio Coding (AAC) ตัวเลือกตัวแปลงสัญญาณจะกำหนดอัตราส่วนการบีบอัดและคุณภาพการบันทึก PCM เป็นตัวแปลงสัญญาณที่ใช้โดยคอมพิวเตอร์ ซีดี โทรศัพท์ดิจิทัล และบางครั้ง SACD แหล่งสัญญาณสำหรับ PCM จะถูกสุ่มตัวอย่างในช่วงเวลาที่เท่ากัน และแต่ละตัวอย่างจะแสดงแทนความกว้างของสัญญาณอะนาล็อกในค่าดิจิตอล PCM เป็นตัวเลือกที่ง่ายที่สุดในการแปลงสัญญาณอนาล็อกเป็นดิจิทัล

ด้วยพารามิเตอร์ที่ถูกต้อง สัญญาณดิจิทัลนี้จึงสามารถสร้างกลับเป็นอนาล็อกได้อย่างสมบูรณ์โดยไม่สูญเสียใดๆ แต่ตัวแปลงสัญญาณนี้ซึ่งมอบเอกลักษณ์ให้กับเสียงต้นฉบับเกือบทั้งหมดนั้น น่าเสียดาย ที่ไม่ประหยัดมากนัก ซึ่งส่งผลให้มีไฟล์จำนวนมาก และไฟล์ดังกล่าวไม่เหมาะสำหรับการสตรีม เราขอแนะนำให้ใช้ PCM เพื่อบันทึกภาพดิจิทัลสำหรับแหล่งที่มาของคุณหรือเมื่อคุณดำเนินการหลังการผลิตเสียง

โชคดีที่เรามีตัวเลือกในการเลือกตัวแปลงสัญญาณอื่นที่สามารถบีบอัดข้อมูลดิจิทัลได้ (เทียบกับ PCM) โดยอาศัยการสังเกตที่เป็นประโยชน์บางประการเกี่ยวกับพฤติกรรมของคลื่นเสียง แต่ในกรณีนี้ คุณต้องประนีประนอม: อัลกอริธึมทางเลือกทั้งหมดเกี่ยวข้องกับ "การสูญเสีย" เนื่องจากเป็นไปไม่ได้ที่จะกู้คืนสัญญาณดั้งเดิมได้อย่างสมบูรณ์ แต่อย่างไรก็ตาม ผลลัพธ์ก็ยังดีจนผู้ใช้ส่วนใหญ่ไม่สามารถบอกได้ ความแตกต่าง

MP3 เป็นรูปแบบการเข้ารหัสเสียงที่ใช้อัลกอริธึมการบีบอัดข้อมูลดิจิทัลที่ช่วยให้คุณสามารถบันทึกเสียงเป็นไฟล์ขนาดเล็กลงได้ ผู้ใช้ส่วนใหญ่มักใช้ตัวแปลงสัญญาณ MP3 เพื่อบันทึกและจัดเก็บไฟล์เพลง เราขอแนะนำให้ใช้ MP3 ในการแพร่ภาพเนื้อหาเสียง เนื่องจากต้องใช้แบนด์วิธเครือข่ายน้อยกว่า

AAC เป็นอัลกอริธึมการเข้ารหัสเสียงรุ่นใหม่ที่กลายมาเป็น "ผู้สืบทอด" ของ MP3 AAC กลายเป็นมาตรฐานสำหรับรูปแบบ MPEG-2 และ MPEG-4 โดยพื้นฐานแล้ว นี่เป็นตัวแปลงสัญญาณการบีบอัดข้อมูลดิจิทัลด้วย แต่จะสูญเสียคุณภาพน้อยกว่า MP3 เมื่อเข้ารหัสด้วยบิตเรตเดียวกัน เราขอแนะนำให้ใช้ตัวแปลงสัญญาณนี้สำหรับการออกอากาศออนไลน์

ความถี่สุ่มตัวอย่าง (kHz, kHz)

ความถี่ในการสุ่มตัวอย่าง (หรือความถี่ในการสุ่มตัวอย่าง) คือความถี่ที่สัญญาณถูกแปลงเป็นดิจิทัล จัดเก็บ ประมวลผล หรือแปลงจากแอนะล็อกเป็นดิจิทัล การสุ่มตัวอย่างเวลาหมายความว่าสัญญาณจะถูกแสดงโดยชุดตัวอย่าง (ตัวอย่าง) ซึ่งถ่ายในช่วงเวลาที่เท่ากัน

วัดเป็นเฮิรตซ์ (Hz, Hz) หรือกิโลเฮิรตซ์ (kHz, kHz) 1 kHz เท่ากับ 1,000 Hz ตัวอย่างเช่น 44,100 ตัวอย่างต่อวินาทีอาจเรียกว่า 44,100 Hz หรือ 44.1 kHz อัตราการสุ่มตัวอย่างที่เลือกจะกำหนดความถี่ในการเล่นสูงสุด และตามทฤษฎีบทของ Kotelnikov เพื่อที่จะกู้คืนสัญญาณดั้งเดิมได้อย่างสมบูรณ์ ความถี่ในการสุ่มตัวอย่างจะต้องเป็นสองเท่าของความถี่สูงสุดในสเปกตรัมสัญญาณ

ดังที่ทราบ หูของมนุษย์สามารถตรวจจับความถี่ระหว่าง 20 Hz ถึง 20 kHz เมื่อพิจารณาพารามิเตอร์เหล่านี้และค่าที่แสดงในตารางด้านล่าง คุณจะเข้าใจได้ว่าเหตุใดจึงเลือก 44.1 kHz เป็นความถี่สุ่มตัวอย่างสำหรับซีดีและยังถือว่าเป็นความถี่ที่ดีมากสำหรับการบันทึก

มีเหตุผลหลายประการในการเลือกอัตราตัวอย่างที่สูงขึ้น แม้ว่าอาจดูเหมือนเป็นการสิ้นเปลืองความพยายามและเวลาในการสร้างเสียงที่อยู่นอกขอบเขตการได้ยินของมนุษย์ก็ตาม ในเวลาเดียวกัน 44.1 – 48 kHz จะเพียงพอสำหรับผู้ฟังทั่วไปในการแก้ปัญหาส่วนใหญ่ได้อย่างมีประสิทธิภาพ

ความลึกบิต

นอกจากความถี่ในการสุ่มตัวอย่างแล้ว ยังมีความลึกของบิตหรือความลึกของเสียงด้วย ความลึกของบิตคือจำนวนบิตของข้อมูลดิจิทัลที่จะเข้ารหัสแต่ละตัวอย่าง พูดง่ายๆ ก็คือ ความลึกของบิตจะเป็นตัวกำหนด "ความแม่นยำ" ของการวัดสัญญาณอินพุต ยิ่งความลึกของบิตมากเท่าใด ข้อผิดพลาดในการแปลงขนาดของสัญญาณไฟฟ้าเป็นตัวเลขแต่ละครั้งก็จะยิ่งน้อยลงเท่านั้น และในทางกลับกัน ด้วยความลึกของบิตขั้นต่ำที่เป็นไปได้ มีเพียงสองตัวเลือกในการวัดความแม่นยำของเสียง: 0 สำหรับความเงียบสนิท และ 1 สำหรับเสียงเต็มรูปแบบ หากความลึกบิตคือ 8 (16) ดังนั้นเมื่อทำการวัดสัญญาณอินพุต 2 8 = 256 (2 16 = 65,536) สามารถรับค่าที่แตกต่างกันได้

ความลึกของบิตได้รับการแก้ไขในตัวแปลงสัญญาณ PCM แต่สำหรับตัวแปลงสัญญาณที่ต้องมีการบีบอัด (เช่น MP3 และ AAC) พารามิเตอร์นี้จะถูกคำนวณระหว่างการเข้ารหัสและอาจแตกต่างกันไปในแต่ละตัวอย่าง

บิตเรต

บิตเรตเป็นตัวบ่งชี้ปริมาณข้อมูลที่เข้ารหัสเสียงหนึ่งวินาที ยิ่งค่าสูง ความบิดเบี้ยวก็จะน้อยลง และองค์ประกอบที่เข้ารหัสก็จะยิ่งใกล้เคียงกับต้นฉบับมากขึ้นเท่านั้น สำหรับ PCM เชิงเส้น อัตราบิตจะคำนวณอย่างง่ายดาย

บิตเรต = อัตราตัวอย่าง × ความลึกบิต × ช่อง

สำหรับระบบเช่น Epiphan Pearl ที่เข้ารหัส PCM เชิงเส้น 16 บิต การคำนวณนี้สามารถใช้เพื่อกำหนดว่าอาจต้องใช้แบนด์วิดท์เพิ่มเติมเท่าใดสำหรับเสียง PCM ตัวอย่างเช่น สำหรับสเตอริโอ (สองช่องสัญญาณ) สัญญาณจะถูกแปลงเป็นดิจิทัลที่ความถี่ 44.1 kHz ให้เป็น 16 บิต และบิตเรตจะถูกคำนวณดังนี้:

44.1 กิโลเฮิรตซ์ × 16 บิต × 2 = 1,411.2 กิโลบิตต่อวินาที

ในขณะเดียวกัน อัลกอริธึมการบีบอัดเสียง เช่น AAC และ MP3 มีบิตในการส่งสัญญาณน้อยกว่า (นั่นคือจุดประสงค์) ดังนั้นจึงใช้บิตเรตต่ำ โดยทั่วไปค่าจะอยู่ในช่วงตั้งแต่ 96 kbps ถึง 320 kbps สำหรับตัวแปลงสัญญาณเหล่านี้ ยิ่งคุณเลือกบิตเรตสูง บิตของเสียงที่คุณได้รับต่อตัวอย่างก็จะยิ่งมากขึ้น และคุณภาพเสียงก็จะยิ่งสูงขึ้นตามไปด้วย

ความถี่ในการสุ่มตัวอย่าง ความลึกของบิต และอัตราบิตในชีวิตจริง

ซีดีเพลง หนึ่งในสิ่งประดิษฐ์แรกๆ และได้รับความนิยมมากที่สุดในการจัดเก็บข้อมูลเสียงดิจิทัลสำหรับผู้ใช้ทั่วไป ใช้ความถี่ 44.1 kHz (20 Hz - 20 kHz ซึ่งเป็นช่วงของหูมนุษย์) และความลึกบิตที่ 16 บิต ค่าเหล่านี้ถูกเลือกเพื่อให้มีคุณภาพเสียงที่ดีจึงสามารถบันทึกเสียงบนดิสก์ได้มากที่สุดเท่าที่จะเป็นไปได้

เมื่อมีการเพิ่มวิดีโอลงในเสียงและดีวีดีและดิสก์ Blu-Ray ในภายหลังปรากฏขึ้น มาตรฐานใหม่ก็ถูกสร้างขึ้น โดยทั่วไปการบันทึกสำหรับ DVD และ Blu-Ray จะใช้ PCM เชิงเส้นที่ 48 kHz (สเตอริโอ) หรือ 96 kHz (เสียงเซอร์ราวด์ 5.1) และความลึก 24 บิต ค่าเหล่านี้ถูกเลือกให้เป็นตัวเลือกที่เหมาะสมที่สุดในการซิงค์เสียงกับวิดีโอและยังคงได้รับ คุณภาพสูงสุดที่เป็นไปได้โดยใช้พื้นที่ดิสก์เพิ่มเติมที่มีอยู่

ซีดี ดีวีดี และบลูเรย์มีเป้าหมายเดียวคือการมอบกลไกการเล่นคุณภาพสูงแก่ผู้บริโภค เป้าหมายของการพัฒนาทั้งหมดคือการมอบเสียงและวิดีโอคุณภาพสูงโดยไม่ต้องกังวลกับขนาดของไฟล์ (ตราบใดที่มีขนาดพอดีกับดิสก์) คุณภาพนี้สามารถหาได้จาก PCM เชิงเส้น

ในทางตรงกันข้าม สื่อมือถือและสื่อสตรีมมิ่งมีเป้าหมายที่แตกต่างไปจากเดิมอย่างสิ้นเชิง นั่นคือการใช้บิตเรตที่ต่ำที่สุดเท่าที่จะเป็นไปได้ ขณะเดียวกันก็เพียงพอที่จะรักษาคุณภาพที่ยอมรับได้สำหรับผู้ฟัง อัลกอริธึมการบีบอัดเหมาะที่สุดสำหรับงานนี้ คุณสามารถใช้หลักการเดียวกันนี้กับบันทึกย่อของคุณได้

เมื่อบันทึกเสียงจากวิดีโอ...

ในกรณีที่ หากจะใช้บันทึกเพื่อการประมวลผลในภายหลังให้เลือกตัวแปลงสัญญาณ PCM ที่มีความถี่ 48 kHz และความลึกบิตสูงสุด (16 หรือ 24) เพื่อให้ได้คุณภาพเสียงที่ดีที่สุด เราขอแนะนำการตั้งค่าเหล่านี้สำหรับ Epiphan Pearl

เมื่อสตรีมมิ่งเสียงจากวิดีโอ...

เมื่อสตรีมมิ่งหรือบันทึกเพื่อออกอากาศในภายหลังคุณสามารถรับเสียงที่มีคุณภาพดีโดยมีแบนด์วิธน้อยลงได้โดยใช้ตัวแปลงสัญญาณ AAC หรือ MP3 ที่ 44.1 kHz และบิตเรต 128 kbps หรือสูงกว่า พารามิเตอร์ดังกล่าวรับประกันว่าเสียงจะดีเพียงพอและจะไม่ส่งผลกระทบต่อคุณภาพการออกอากาศ

ดีเอสดี (โดยตรง ลำธาร ดิจิตอล) เป็นรูปแบบการบันทึกเสียงที่มีความละเอียดสูง อ่านเกี่ยวกับการเปรียบเทียบคุณภาพเสียง DSD และ PCM, เครื่องเล่น DAC/DAC, ตัวแปลง, รูปแบบไฟล์, การแก้ไข และปัญหาอื่นๆ...

1. พารามิเตอร์ DSD

Direct Stream Digital เป็นรูปแบบเสียงที่มีความละเอียดสูงสำหรับออดิโอไฟล์ มันถูกสร้างขึ้นเพื่อปรับปรุงช่วงไดนามิกของเสียงซีดีในโดเมนความถี่เสียงของเสียง

2. 1 บิตและสัญญาณรบกวน

โดยทั่วไป รูปแบบนี้มีความลึกบิต 1 บิต ดังนั้นระดับเสียงจึงมีนัยสำคัญเนื่องจากข้อผิดพลาดในการวัดปริมาณ

เพื่อลดระดับเสียงรบกวนในพื้นที่การได้ยินความถี่ต่ำ จึงมีการใช้การสร้างเสียงรบกวน การสร้างเสียงรบกวน (การสร้างเสียงรบกวน การควบคุมรูปร่างของสเปกตรัมเสียง) คือการถ่ายโอนพลังงานเสียงจากบริเวณความถี่ที่ได้ยินไปยังบริเวณอัลตราซาวนด์

การสร้างสัญญาณรบกวน (NS) ของสเปกตรัมของสัญญาณ 1 บิต
การปรับซิกมาเดลต้า

ทางด้านซ้ายของภาพ สเปกตรัมสัญญาณรบกวนมีระดับที่เทียบได้กับระดับสัญญาณเพลง 1 บิต อุปกรณ์ (หรือการประมวลผลแบบดิจิทัล) ที่เรียกว่าโมดูเลเตอร์ซิกมาเดลต้าจะ "บีบ" พลังงานเสียงจากย่านความถี่ที่ได้ยินได้ 0 ... 20 kHz ลงสู่บริเวณอัลตราโซนิก

เมื่อมีการเล่นการบันทึกแบบ 1 บิต ตัวกรองความถี่ต่ำผ่านจะตัดสัญญาณรบกวนความถี่สูงที่ "ขยายสัญญาณ" ออก

ดังนั้น ระดับเสียงรบกวนของสัญญาณ 1 บิตหลังการสร้างเสียงรบกวน (การปรับซิกมา-เดลต้า) จึงเทียบได้กับระดับเสียงของสัญญาณ PCM แบบหลายบิต (การปรับรหัสพัลส์)

นั่นคือการปรับซิกมาเดลต้า 1 บิตสามารถมีความละเอียดเสียงเดียวกันกับสัญญาณมัลติบิต อ่านรายละเอียดและชมวิดีโอ

3. อัตราการสุ่มตัวอย่าง

5. DSD เป็นตัวเลข

โมดูเลเตอร์เสียงระดับมืออาชีพมีระดับเสียงรบกวนในช่วงเสียงที่ได้ยินได้สำหรับการสุ่มตัวอย่างความถี่:

DSD64 ประมาณ -125 ... -145 dB (เทียบได้กับ PCM 24 บิต)
DSD128 ประมาณ -165 dB (ดีกว่า PCM 24 บิต)
DSD256 และสูงกว่าประมาณ -170 ... -200 dB (เทียบได้กับ PCM 32 บิต)

ระดับเสียงในช่วงที่สามารถได้ยินได้เกือบจะเป็นอิสระจากดีโมดูเลเตอร์ แต่ควรลดระดับเสียงภายนอกย่านความถี่นี้ให้มากที่สุด เนื่องจากสัญญาณรบกวนอัลตราโซนิกสามารถนำไปสู่การบิดเบือนระหว่างการปรับสัญญาณได้

6. DSD กับ PCM

Direct Stream Digital (การมอดูเลตซิกมา-เดลต้า) คล้ายกับการมอดูเลตรหัสพัลส์ (PCM) มาก แต่สเปกตรัมสัญญาณรบกวนเชิงปริมาณได้รับการออกแบบเพื่อลดเสียงรบกวนในช่วงเสียง

ไฟล์เสียง 1 บิต (DSF, DFF, SACD ISO) และแผ่นดิสก์สามารถบีบอัดให้ได้ขนาดโดยใช้วิธี DST (Direct Stream Transfer)

DoP เป็นโปรโตคอลแบบเปิดที่อนุญาตให้บรรจุเสียง 1 บิตเป็นรูปแบบมัลติบิตเพื่อให้เข้ากันได้กับซอฟต์แวร์และฮาร์ดแวร์ DoP ไม่สามารถทำซ้ำได้เหมือนกับ PCM ทั่วไป

นอกจากนี้ยังสามารถถ่ายทอดเสียง 1 บิตผ่านเครือข่ายได้

DSD64 ที่ไม่มีการบีบอัดต้องใช้แบนด์วิดท์ 2.7 Mbps = 44100 Hz * 64/1024/1024

นอกจากนี้ การรวมกันของไฟล์ดัชนี CUE และไฟล์เสียง DSF/DFF สามารถมีอัลบั้มขนาด 1 บิตได้

8. ผู้เล่นดีเอสดี

หากต้องการเล่น DSD บนคอมพิวเตอร์ ต้องใช้ซอฟต์แวร์เครื่องเล่นเสียง พวกเขาสามารถเล่นรูปแบบไฟล์ 1 บิตอย่างน้อยหนึ่งรูปแบบ เครื่องเล่น DSD แบบฮาร์ดแวร์สามารถเล่นได้ทั้งดิสก์ SACD แบบออปติคัลและไฟล์ DSF, DFF

ไฟล์ 1 บิตสามารถเล่นได้โดยตรงผ่าน DSD DAC/เครื่องเล่น หรือแปลงเป็น PCM ได้ทันทีเพื่อเล่นโดยใช้ PCM DAC อ่านเกี่ยวกับการแปลง SACD

การเล่นแบบ 1 บิตสามารถทำได้ผ่านไดรเวอร์ ASIO พิเศษสำหรับ Windows รวมถึงรูปแบบแพ็คเกจเสียง DoP (DSD บน PCM) (ตัวอย่าง)

สามารถเล่นแผ่นดิสก์ SACD แบบออปติคัลบนเครื่องเล่นฮาร์ดแวร์ได้ ผู้เขียนไม่มีข้อมูลเกี่ยวกับไดรฟ์ SACD สำหรับคอมพิวเตอร์ทั่วไปในการเล่นแผ่นออปติคัล SACD

เครื่องเล่นสเตอริโอสามารถแปลง (ดาวน์มิกซ์) เสียงหลายช่องสัญญาณให้เป็นสเตอริโอได้ทันที อีกทางหนึ่งคือสามารถแปลงไฟล์หลายช่องสัญญาณเป็นสเตอริโอล่วงหน้าได้ สิ่งนี้ช่วยให้คุณประหยัดพื้นที่ฮาร์ดไดรฟ์ที่จำกัดในเครื่องเล่นเสียงแบบพกพา (DAP) ของคุณ Downmix คือการประมวลผลที่สูญเสียไป คุณภาพของมันขึ้นอยู่กับการใช้งานเฉพาะ

9. ตัวแปลง DSD

ตัวแปลง DSD ได้รับการออกแบบมาสำหรับ:

การแปลง DSD เป็น PCM
การแปลง PCM เป็น DSD
การแปลง SACD ISO เป็น DSD
การแปลง SACD ISO เป็น PCM
การสุ่มตัวอย่างเสียง 1 บิต
การเปลี่ยนระดับเสียง

เสียงดิจิตอล มีตำนานกี่เรื่องที่เกี่ยวข้องกับวลีนี้ มีข้อพิพาทเกิดขึ้นระหว่างผู้ชื่นชอบความสะดวกสบายและคุณภาพดิจิทัลและผู้ชื่นชอบเสียงไวนิลที่ "โปร่งสบาย" คูณด้วยเสียง "ท่ออุ่น" นอกจากนี้ ยังมีข้อโต้แย้งมากมายในหมู่คนรักดิจิทัล: 16x44.1 เพียงพอหรือ 24x192 จำเป็นหรือไม่ อันไหนดีกว่า: มัลติบิตหรือเดลต้าซิกมา CDDA หรือ SACD? PCM หรือ DSD? ในบทความนี้ ฉันจะพยายามอธิบายพื้นฐานของเสียงดิจิทัลแบบง่ายๆ และจะกล่าวถึงรายละเอียดเพิ่มเติมเกี่ยวกับการเปรียบเทียบการเข้ารหัสสัญญาณอะนาล็อกกับดิจิทัลสองประเภท: DSD และ PCM

ก่อนอื่น เรามาตอบคำถามกันก่อนว่า เสียงดิจิทัลคืออะไร? แตกต่างจากอนาล็อกอย่างไร? กล่าวโดยย่อ ในภาษาคณิตศาสตร์ สัญญาณเสียงแอนะล็อกเป็นฟังก์ชันต่อเนื่อง สัญญาณเสียงดิจิทัลเป็นฟังก์ชันแยกกัน มันหมายความว่าอะไร?

สัญญาณอนาล็อก

หากเราวาดกราฟของไซนัสอยด์ในจินตนาการของเรา (นี่คือวิธีการแสดงคลื่นเสียงบ่อยที่สุด): ไม่ว่าเราจะขยายมันอย่างไร พยายามพิจารณารายละเอียดทั้งหมด เราจะเห็นเส้นเรียบเรียบเสมอ: นี่คือ สัญญาณเสียงอะนาล็อก (รูปที่ 1)

ข้าว. 1. สัญญาณอนาล็อก

เสียงอะนาล็อก (การบันทึก) มีพารามิเตอร์มากมายที่คุณสามารถประเมินคุณภาพได้ ลองดูสิ่งที่สำคัญที่สุดสามประการ: ช่วงความถี่, ช่วงไดนามิก, การบิดเบือน

ช่วงความถี่คือชุดความถี่ที่มีอยู่ในเสียง เป็นที่ยอมรับกันโดยทั่วไปว่าช่วงความถี่ของการได้ยินของมนุษย์คือ 20... 20,000 Hz (บางครั้งอาจระบุเป็น 16 - 22,000 Hz) ในตัวมันเอง ช่วงความถี่ของดนตรีนั้นไม่สนใจในแง่ของการประเมินคุณภาพ (ตัวอย่างเช่น ช่วงความถี่ของการบินในระนาบเดียวกันจะกว้างมาก แต่ส่วนของเสียงร้องของเทเนอร์จะแคบกว่ามาก) พารามิเตอร์เชิงคุณภาพของหูฟังคือช่วงความถี่ที่เป็นไปได้ และประมาณโดยใช้การตอบสนองความถี่แอมพลิจูด (AFC) การตอบสนองความถี่ในอุดมคติ - เส้นตรงตลอดช่วงความถี่การได้ยินทั้งหมด - หมายความว่าแหล่งกำเนิดเสียงไม่ได้เพิ่มหรือลดทอนความถี่ใดๆ ของแต่ละบุคคล ซึ่งหมายความว่าเสียงที่แยกออกมาจะสอดคล้องกับเสียงต้นฉบับ

ข้าว. 2. การตอบสนองความถี่ของไฟล์ MP3 256 kbps

ช่วงไดนามิก (DD) คือความแตกต่างระหว่างเสียงที่เงียบที่สุดและดังที่สุด ความดังวัดเป็นเดซิเบล (dB) เป็นที่ยอมรับกันโดยทั่วไปว่าระดับเสียงสูงสุดที่ไม่ก่อให้เกิดการบาดเจ็บต่อบุคคลคือ 130 เดซิเบล - เสียงเครื่องบินขึ้นและระดับเสียงต่ำสุดที่ได้ยินคือ 5 ... 10 เดซิเบล - ที่ระดับใบไม้ที่ส่งเสียงกรอบแกรบในลมแรงต่ำ สภาพอากาศ. โดยธรรมชาติแล้วมันเป็นไปไม่ได้เลยที่จะแยกแยะเสียงใบไม้ที่ส่งเสียงกรอบแกรบกับพื้นหลังของเครื่องบินที่กำลังบินขึ้นและการฟังเพลงที่ระดับ 130 เดซิเบลนั้นไม่เป็นที่พอใจอย่างยิ่ง ดังนั้นจึงเป็นที่ยอมรับกันโดยทั่วไปว่า DD ที่สะดวกสบายสำหรับการฟังเพลงคือ 80... 100 dB

การบิดเบือนไม่มีอะไรมากไปกว่าการเบี่ยงเบนของสัญญาณไปจากต้นฉบับ

หลักการแสดงเสียงดิจิทัล

จะเกิดอะไรขึ้นเมื่อเสียงอนาล็อกถูกแปลงเป็นดิจิทัล? เราจะไม่เจาะลึกด้านเทคนิค แต่มาวิเคราะห์ทุกอย่างตามที่พวกเขาพูดบนกระดาษกันดีกว่า เมื่อต้องการทำสิ่งนี้ ให้วาดไซนัสอยด์ที่ "เหมาะ" ในจินตนาการของเราแล้ววัดค่าสัญญาณตามช่วงเวลาที่สม่ำเสมอ (กระบวนการนี้เรียกว่าการสุ่มตัวอย่างหรือการหาปริมาณ) : เราจะได้รับชุดค่าตามลำดับ - นี่จะเป็นสัญญาณดิจิตอลของเราที่ได้รับจากการมอดูเลตรหัสพัลส์ (PCM) (รูปที่ 3)

ข้าว. 3. แปลงสัญญาณอะนาล็อกเป็น PCM

พารามิเตอร์หลักสองตัวของคุณภาพสัญญาณ PCM คือความถี่และความลึกของบิต ความถี่คือจำนวนการวัดต่อวินาที ยิ่งมีมาก สัญญาณก็ยิ่งส่งได้แม่นยำมากขึ้น ความถี่วัดเป็นเฮิรตซ์: 44100 Hz, 192000 Hz เป็นต้น ความลึกของบิต - จำนวนค่าขนาดสัญญาณที่เป็นไปได้ (ความแม่นยำในการส่งขนาด) ยิ่งมีตัวเลือกมากเท่าใด ความแม่นยำของสัญญาณก็จะยิ่งมากขึ้นเท่านั้น ความลึกของบิตวัดเป็นบิต: 16 บิต (ค่าที่เป็นไปได้ 65,536 ค่า DD 96 dB) 24 บิต (ค่า 16,777,216 ค่า DD 144 dB) ฯลฯ

แต่นี่ไม่ใช่ทางเลือกเดียวในการแสดงคลื่นเสียงในรูปแบบดิจิทัล มีวิธีกำจัดพารามิเตอร์เช่นความลึกของบิต โดยเหลือเพียงสองระดับแอมพลิจูด: -100% และ +100% (0 หรือ 1) เพื่อให้บรรลุสิ่งนี้โดยไม่สูญเสียคุณภาพ คุณจะต้องเพิ่มความถี่ในการอ่านค่าสัญญาณซ้ำ ๆ (รูปที่ 4)

ข้าว. 4. แปลงสัญญาณอะนาล็อกเป็น DSD

การแสดงเสียงดิจิทัลประเภทนี้เรียกว่าการมอดูเลตความหนาแน่นของพัลส์ ซึ่งส่วนใหญ่มักใช้ตัวย่อ DSD ในความเป็นจริงพารามิเตอร์เชิงคุณภาพเพียงอย่างเดียวของสัญญาณดังกล่าวคือความถี่ แต่เนื่องจากความถี่ที่ใช้สูงมาก (จาก 2,822,400 Hz) ตัวเลขดังกล่าวจึงจำได้ยาก จึงเป็นเรื่องปกติที่จะแบ่งความถี่ของสัญญาณ DSD ด้วย 44,100 Hz หมายเลขผลลัพธ์เป็นตัวบ่งชี้คุณภาพ: DSD64 (DD 120 dB), DSD128, DSD256 เป็นต้น

การกู้คืนสัญญาณอนาล็อกจาก “ดิจิตอล”

แต่การแปลงสัญญาณอนาล็อกเป็นดิจิทัลนั้นมีชัยไปกว่าครึ่ง หากต้องการฟังเพลงดิจิทัล คุณต้องแปลงกลับด้าน ขั้นแรก มาดูวิธีเปลี่ยนสตรีม DSD แบบดิจิทัลให้เป็นเสียง ดังที่เราทราบแล้วว่าสตรีมนี้เป็นสัญญาณสองระดับความถี่สูง (2.8 MHz หรือมากกว่า) ค่าเฉลี่ยของสัญญาณนี้จะเปลี่ยนไปตามความถี่เสียง นั่นคือ หากคุณแก้ไขปัญหาอย่างง่ายดายที่สุดเท่าที่จะเป็นไปได้ คุณจะต้องกรองส่วนประกอบความถี่สูงทั้งหมดของสตรีม DSD ออก เหลือเพียงสัญญาณเสียงที่มีประโยชน์ (ความถี่สูงถึง 20...22 kHz) ทำได้โดยใช้ตัวกรองสัญญาณความถี่ต่ำแบบอะนาล็อก (LPF) ตัวกรองความถี่ต่ำผ่านที่ง่ายที่สุดคือโซ่ RC สัญญาณที่ได้รับหลังจากผ่านสายโซ่นี้จะแสดงดังรูปที่ 1 5.

ข้าว. 5. การกู้คืนสัญญาณอะนาล็อกจาก DSD

อย่างที่คุณเห็น กราฟที่ได้นั้นมีความคล้ายคลึงกับไซนัสอยด์ดั้งเดิมเพียงคลุมเครือเท่านั้น แต่อย่าลืมว่าเรา "ใช้" ฟิลเตอร์ธรรมดาโดยการปรับปรุงวงจรฟิลเตอร์ทำให้เราสามารถปราศจากสัญญาณรบกวนความถี่สูงได้เกือบทั้งหมดและรับเสียงอะนาล็อกพร้อมตัวบ่งชี้คุณภาพดี

หากต้องการกู้คืนสัญญาณแอนะล็อกจาก PCM แบบดิจิทัล แค่ตัวกรองความถี่ต่ำแบบแอนะล็อกไม่เพียงพอ คุณต้องถอดรหัสข้อมูลดิจิทัลก่อน สำหรับสิ่งนี้ ต้องใช้ตัวแปลงดิจิทัลเป็นแอนะล็อก (DAC) มีหลายประเภท แต่ไม่ใช่ขอบเขตของบทความนี้ที่จะอธิบายทั้งหมด มาดูเทคโนโลยีเสียงที่พบบ่อยที่สุด 2 ประเภทกัน ประการแรกนี่คือสิ่งที่เรียกว่าแลดเดอร์ DAC (หรือที่เรียกว่ามัลติบิต) ดังที่คุณคงเดาได้ DAC ดังกล่าวจะแปลงสตรีมข้อมูลดิจิทัล PCM ให้เป็นสตรีมค่าสัญญาณเสียง ซึ่งดูเหมือนบันไดบนกราฟ (รูปที่ 6) เช่นเดียวกับ DSD จำเป็นต้องใช้ฟิลเตอร์อะนาล็อกเพื่อทำให้ "หยก" เรียบเนียนขึ้น

ข้าว. 6. การกู้คืนสัญญาณอะนาล็อกจาก PCM

บ่อยครั้งที่ตัวแปลงดังกล่าวใช้การสุ่มตัวอย่างระดับกลางของสัญญาณ PCM ดิจิทัลเป็นค่าความถี่ที่สูงขึ้น (เช่น 192 kHz): ซึ่งจะลด "ขั้นตอน" ซึ่งช่วยให้วงจรตัวกรองแอนะล็อกง่ายขึ้น

DAC ประเภทที่สอง - delta-sigma - ใช้การสุ่มตัวอย่างใหม่เพื่อให้ได้ความถี่ที่สูงขึ้น ในขณะเดียวกันก็ลดความลึกของบิตลงเหลือหนึ่งบิตไปพร้อมๆ กัน ไม่เตือนคุณถึงอะไรเลยเหรอ? นี่คือสัญญาณ DSD ที่คุ้นเคย! เราได้กล่าวไปแล้วข้างต้นว่าจะประมวลผลสัญญาณดังกล่าวต่อไปได้อย่างไรและเปลี่ยนเป็นอนาล็อก

การใช้ PCM และ DSD ข้อดี/ข้อเสีย

เราจะหาวิธีการเข้ารหัสแต่ละวิธีได้ที่ไหน? รูปแบบ PCM เป็นเรื่องธรรมดามาก: แผ่น CDDA, เสียง DVD, ไฟล์ MP3, FLAC, ALAC, AAC, เสียงในภาพยนตร์ และอื่นๆ จะพูดได้ง่ายกว่าเมื่อไม่ใช่ PCM Super Audio CD, แผ่น DSD, ไฟล์ DSF, DFF เป็นรูปแบบ DSD อะไรจะดีกว่ากันล่ะ? เมื่อเล่นรูปแบบไหนเราจะได้เสียงที่ดีกว่า?

บทความที่เกี่ยวข้องกับรูปแบบ DSD อธิบายข้อดีหลายประการเหนือ PCM แต่ข้อดีที่อธิบายไว้ทั้งหมดเป็นจริงหรือเป็นตำนานที่ประดิษฐ์ขึ้นสำหรับคนทั่วไปที่ไม่เข้าใจองค์ประกอบทางเทคนิคเพื่อที่จะชนะตลาดซึ่งถูกครอบครองโดยรูปแบบ PCM อย่างหนัก มาดูรายการสั้น ๆ กัน

ข้อสรุป

คุณควรเลือก DSD หรือ PCM? ไม่มีและไม่สามารถให้คำตอบที่แน่นอนได้: ตัวอย่างเช่น PCM 24 บิต 92 kHz และ DSD128 มีลักษณะด้านคุณภาพที่คล้ายกันมากและลักษณะเหล่านี้ดีกว่าอุปกรณ์ที่จะเล่นรูปแบบเหล่านี้ซึ่งหมายถึงการเพิ่มขึ้นอีก คุณภาพของรูปแบบดิจิทัลสำหรับการเล่นในขั้นตอนนี้ไม่เหมาะสม เมื่อประเมินคุณภาพเสียงของรูปแบบความละเอียดสูงต่างๆ ความรู้สึกส่วนตัวจะเกิดขึ้นก่อน เนื่องจากสมองของมนุษย์ไม่ได้ถูกป้อนด้วยคุณภาพเพียงอย่างเดียว: การออกแบบอุปกรณ์ ต้นทุน และที่สำคัญที่สุดคือความเป็นอยู่ที่ดี และอารมณ์ของผู้ฟังส่งผลต่อประสบการณ์การฟังเพลงมากยิ่งขึ้น นี่หมายถึงเลือกสิ่งที่คุณชอบเป็นการส่วนตัวและไม่ยัดเยียดความคิดเห็นของคุณกับผู้อื่น มีความสุขในการฟังทุกคน!