Beberapa perkara yang anda perlu tahu tentang format bunyi sekeliling. Prinsip simulasi bunyi sekeliling

Istilah "bunyi 3D" telah digunakan begitu kerap dalam pelbagai teknologi sehingga kini sukar untuk memahami maksud sebenarnya. Ini boleh menjadi algoritma mudah untuk mengembangkan asas stereo, atau, sebagai contoh, rakaman binaural untuk fon kepala. Oleh itu, Auro menekankan bahawa dalam pemahamannya, bunyi 3D adalah bunyi dalam tiga dimensi, apabila susunan pembesar suara dijalankan di sepanjang tiga paksi serenjang (x, y, z), dan rakaman dan pencampuran dilakukan berdasarkan susunan sistem ini. Kami akan bercakap tentang perkara yang berlaku di dalam trek Auro dan sebab syarikat Belgium memutuskan untuk mengambil alih pasaran daripada Dolby Atmos dan DTS:X.

cerita

Semuanya bermula dengan panggilan telefon pada Mac 2005. Penerbit Jerman Tom Hapke telah diilhamkan oleh idea untuk membuat campuran dalam format audio 2+2+2 dan mencadangkan agar Wilfried Van Baelen, ketua studio Belgium Galaxy, melakukannya. Wilfried pada mulanya ragu-ragu tentang idea itu: konfigurasi ini menganggap litar kuadrafonik dengan dua saluran tambahan dipasang di atas saluran hadapan, dan kelihatan wajar dalam alih suara filem, tetapi dia tidak memahami bagaimana muzik akan mendapat manfaat daripada dua saluran hadapan tambahan. Saya belum lagi mendengar lagu klasik dalam format ini.

Bunyi itu ternyata lebih dalam, lebih telus, lebih besar daripada dalam konfigurasi "planar" 5.1, dan mendorong Wilfried untuk mencuba. Memandangkan album itu perlu dirakam dalam format 2+2+2, 5.1 dan 2.0, dia mengambil skema 5.1 sebagai titik permulaan dan menambah sepasang saluran hadapan padanya, tetapi kemudian dia merasakan ketidakseimbangan: 6 saluran bertanggungjawab untuk hemisfera hadapan, manakala belakang - hanya 2. Penyelesaiannya adalah mudah - tambah lebih banyak saluran, dan bahagian belakang juga memperoleh sepasang pembesar suara tambahan yang terletak lebih tinggi sedikit. Konfigurasi telah berkembang kepada format 9.1, tetapi tidak kehilangan keserasian ke belakang dengan format 5.1.

Menurut Wilfried, apa yang dia alami adalah setanding dengan pertemuan pertamanya dengan bunyi kuadrafonik. Pembesar suara benar-benar hilang, dan ada perasaan berada di tempat rakaman itu dibuat.

Percubaan ini menandakan permulaan sejarah lima tahun pembangunan format Auro 3D.

Dari telinga ke otak

Wilfried mula mengkaji prinsip alat bantuan pendengaran untuk memahami mengapa penambahan dimensi bunyi tambahan mengubah persepsinya terhadap bunyi dan dari mana datangnya perasaan rendaman ini. Akibatnya, dia mengetahui bahawa kesan yang menyeluruh itu dicipta oleh medan yang tersebar di belakangnya.

Seperti yang anda ketahui, apabila mencampurkan dalam stereo, teknik peralihan bunyi dari satu saluran ke saluran lain sangat kerap digunakan, mewujudkan ilusi sumber bergerak dalam satah mendatar. Wilfried, meneruskan eksperimennya, ingin mencapai kesan yang sama dalam satah menegak, tetapi tidak berjaya. Pada mulanya dia percaya bahawa masalahnya adalah pada peralatan, tetapi semuanya ternyata lebih menarik: dia mendengar kesan yang diingini dengan memiringkan kepalanya ke tepi dan bergerak lebih dekat ke pembesar suara.

Intinya ialah corak arah pendengaran manusia lebih condong ke arah satah mendatar, dan oleh kerana orang tidak mempunyai telinga di belakang kepala mereka, kita tidak boleh memproses komponen menegak dengan sewajarnya. Dalam penyetempatan bunyi, seseorang dibantu oleh perbezaan tahap isyarat, perbezaan masa persepsi isyarat oleh telinga kiri dan kanan, dan isyarat yang dipantulkan. Malah, 90% daripada bunyi yang dirasakan oleh telinga manusia adalah pantulan tiga dimensi isyarat asal. Dan pembesar suara yang terletak di paras kepala mengeluarkan semula dengan tepat isyarat tersebut yang kemudiannya dipantulkan dari lantai.

Dengan saluran, dengan objek

Format Auro-3D, tidak seperti Dolby Atmos dan DTS:X yang bersaing, tidak berorientasikan objek, tetapi setiap saluran. Untuk mencapai "bunyi menyelubungi" kepada dua lapisan pembesar suara - satu klasik dan satu kedua terletak pada sudut 30 darjah ke ufuk - Wilfried menambah yang ketiga dipasang terus di atas pendengar. Lapisan ketiga akustik ini dipanggil "suara Tuhan" dan menambah dimensi ketiga kepada bunyi - pic. Jika dalam konfigurasi pawagam standard, walaupun dalam Dolby Atmos dan DTS:X, pendengar dikelilingi oleh lapisan bunyi sfera, maka dalam Auro-3D ia seolah-olah diselubungi oleh hemisfera sepenuhnya.

Dalam teknologi rakaman bunyi berasaskan objek, setiap sumber bunyi dirakam secara berasingan, tetapi dalam teknologi saluran demi saluran, bunyi diedarkan antara saluran yang berbeza, dan kemudian dijumlahkan bersama dalam pembesar suara. Sebagai contoh, apabila merakam bunyi jalan raya yang sibuk dalam format berorientasikan objek, objek bergerak itu sendiri tidak akan dapat diasingkan - kereta, basikal, orang - untuk kegunaan selanjutnya; ia tidak akan mungkin untuk mendapatkan tiga dimensi. bunyi yang dipantulkan daripada objek ini, serta bunyi langsung. Dalam sistem setiap saluran, masalah ini diselesaikan dengan memudahkannya, dan di sinilah komponen menegak dimainkan.

Lapisan ketiga pembesar suara dalam Auro 3D mencipta "medan stereo menegak" di sekeliling pendengar, tanpa mengira reka letak akustik dalam Auro 3D. Lapisan ketiga itu sendiri tidak membantu dengan penyetempatan - ia membantu dalam menghasilkan semula helikopter, kapal luar angkasa dan kesan cuaca yang terbang di atas kepala, tetapi pendengaran manusia sedikit terdedah kepada bunyi yang datang terus dari atas, dan secara umum, sedikit maklumat bunyi datang dari sana, dari siling . Evolusi harus dipersalahkan untuk ini: selalunya pada fajar manusia, bahaya datang dari kira-kira tahap yang sama di mana seseorang berada, dan bukan dari atas, dan itulah sebabnya otak memproses bunyi secara intensif yang dipantulkan dari tanah.

Format Auro 3D, walaupun dalam konfigurasi yang dikurangkan dengan lapisan audio yang lebih sedikit, mampu menghasilkan semula kedudukan menegak sumber bunyi, dan oleh itu menyesuaikan dengan sempurna kepada pelbagai jenis bilik dan sistem. Selain itu, Auro 3D ialah satu-satunya format audio 3D di pasaran yang menyokong proses penguasaan berdasarkan pencampuran semua saluran, sesuatu yang tidak boleh dilakukan oleh format rakaman berasaskan objek. Malah, Auro 3D adalah satu-satunya format di pasaran untuk muzik 3D. Lebih-lebih lagi, dalam zaman format termampat - MP3, AAC dan lain-lain - Auro 3D mempunyai kualiti 24 bit/96 kHz.

Pada setiap peranti

Teknologi Enjin Auro-3D termasuk penyahkod Auro-Codec dan pengadun Auro-Matic. Dengan bantuan kedua-dua algoritma ini, kesejagatan sistem dicapai. Penyahkod mengecam dan menyahkod audio asli dalam format Auro-3D, manakala pengadun menggunakan algoritma untuk mengedarkan audio daripada mono, stereo, 5.1 dan 7.1 kepada Auro-3D, dengan syarat, sudah tentu, bilangan saluran yang diperlukan tersedia. Iaitu, filem yang telah dirakam pada Blu-ray atau malah DVD, dan muzik yang dipasang dalam stereo, boleh dihargai dalam format tiga dimensi maksimum yang baharu.

Secara tradisinya, teknologi upmix menggunakan perubahan dalam penyamaan spektrum dan menambah algoritma pantulan. Semasa membangunkan Auro-Matic, jurutera tidak mahu mendengar bergema yang tidak perlu atau ketidaktepatan fasa, tetapi mahu menyampaikan bunyi sedekat mungkin dengan cara pengarang mendengar dan memaksudkannya. Dan mereka membangunkan algoritma yang dikaitkan dengan HRTF (Fungsi Pemindahan Berkaitan Kepala) - teknologi yang mengambil kira cara telinga manusia melihat bunyi dalam keadaan semula jadi. Pemilik iPhone dan iPad boleh menilai prestasi algoritma dengan menyemak aplikasi Beautifer (sayangnya, tidak tersedia di Rusia).

Pada satu masa, Auro-Technologies menghadapi masalah yang menarik: pembangun peralatan tidak bersemangat untuk melaksanakan teknologi Auro-3D kerana fakta bahawa tiada kandungan yang sepadan, dan pencipta kandungan tidak menggunakan format Auro-3D kerana fakta bahawa tiada apa-apa untuk menyokongnya. adalah untuk menghasilkan semula. Oleh itu, syarikat itu memutuskan untuk mengeluarkan penerima yang menyokong Auro-3D secara bebas, dan dari masa ke masa, yang lain mengikutinya. Kini, sebagai tambahan kepada barisan produk StormAudio, semakin banyak pengeluar telah melaksanakan Auro-3D ke dalam peralatan AV mereka, termasuk Denon, Marantz, Steinway Lyngdorf, Macintosh, Trinnov, Theta Digital, StormAudio, ATI dan Datasat.

Antara muka tetapan pemasangan Auro-3D dalam pemproses Trinnov Altitude 32

Selain teater rumah dan bukan rumah serta sistem audio, Auro-3D juga mendapat tempat dalam industri automotif. Bersama-sama dengan Continental, pembangun telah mencipta sistem bunyi 3D terbina dalam yang unik di dalam kereta, dan kereta pertama yang dilengkapi dengan sistem Auro-3D akan dikeluarkan pada 2017. Medan bunyi seperti ini mengubah suasana untuk pemandu, membolehkannya berehat dan berasa lebih selesa, malah, menurut sesetengah orang, nampaknya mengembangkan ruang dalaman. Menurut Wilfried, apabila mendengar muzik dalam 3D, otak kita kurang tegang berbanding semasa memproses runut bunyi stereo - oleh itu keselesaan tambahan.

Kereta Porsche Panamera dengan sistem yang dipasang daripada Burmester, yang boleh berfungsi dengan bunyi Auro-3D

Sudah terdapat kira-kira 200 album yang dirakam dalam format Auro 9.1, dan sangat sedikit dalam format 10.1, menggunakan saluran tertinggi. Kawasan penggunaan saluran ini agak khusus - ia diperlukan untuk menghasilkan semula bunyi yang datang terus dari atas, dan dalam muzik biasanya tiada objek yang terletak di atas pendengar. Malah rakaman konsert langsung tidak memerlukan "suara Tuhan" kerana pada umumnya terdapat lebih sedikit renungan di dewan konsert. Di antara dua ratus album dalam format 9.1, terdapat bukan sahaja komposisi klasik, tetapi juga jazz, rock, penghibur popular, dan juga muzik menari.

Format ini juga akan meliputi peranti mudah alih. Dalam kombinasi dengan teknologi binaural, Auro-3D untuk peranti mudah alih akan dapat mencipta bunyi imersif tiga dimensi terus dalam telefon pintar dan menghantarnya ke fon kepala: sistem ini mampu menyahkod kandungan Auro-3D asal dan memainkan semula keseluruhan stereo perpustakaan, filem dan fail media lain dalam format audio Auro-3D. 3D menggunakan upmix.

Antara muka program Wwise dengan pilihan untuk bekerja dengan audio Auro-3D

Permainan video berdiri berasingan. Teknologi Auro-3D akan membolehkan anda mencipta skap bunyi yang akan memberikan pemain pengalaman yang sama sekali berbeza. Syarikat itu bekerjasama dengan Audio-Kinetics dan memasukkan format ke dalam Wwise, program perisian untuk mencipta audio untuk permainan komputer. Versi AuroWwise menyokong audio 3D untuk media interaktif dan permainan sambil mengekalkan semua fungsi. Permainan pertama dalam format Auro-3D ialah Get Even, yang akan dikeluarkan pada musim bunga 2017. Bagaimanapun, menurut Wilfried, bunyi sebegitu masih tidak boleh dibandingkan dengan pembesar suara.

Berapa banyak lajur yang anda perlukan?

Untuk teater rumah, konfigurasi minimum yang disyorkan ialah 9.1, penyelesaian optimum ialah 11.1, dan terutamanya dalam dewan yang besar, anda harus menggunakan Auro 13.1. Ruang yang diperlukan adalah sama seperti untuk penempatan optimum sistem 5.1 dan 7.1. Pembangun menguji Auro-3D dalam pelbagai persekitaran - siling tinggi, siling rendah, persekitaran kering dan basah - dan mendapati sistem itu benar-benar fleksibel.

Kini terdapat format AuroMax baharu - ia adalah format hibrid, saluran dan berorientasikan objek yang menggunakan konfigurasi daripada 20.1 hingga 26.1. Format AuroMax ialah pembangunan bersama Auro-Technologies, Barco dan Iosono, dan digunakan di pawagam sepenuhnya. Di teater rumah, menurut pemaju, tidak ada keperluan untuk konfigurasi maksimum sedemikian, tetapi perkataan pelanggan adalah undang-undang. Benar, anda memerlukan lebih banyak ruang daripada versi 13.1 saluran.

Menurut Wilfried, walaupun sejuta pembesar suara tidak dapat menghasilkan semula dunia di sekeliling kita secara semula jadi - telinga kita terlalu pintar untuk ditipu sedemikian. Oleh itu, matlamat Auro-3D bukan untuk menggunakan seberapa banyak saluran yang mungkin, tetapi untuk mencapai bunyi yang paling menyelubungi dengan bilangan pembesar suara yang paling sedikit. Itulah sebabnya anda tidak sepatutnya cuba memasukkan konfigurasi 26.1 saluran ke dalam pawagam kecil - ia tidak masuk akal, kesan saluran tambahan tidak akan meliputi usaha, saraf dan wang yang dibelanjakan untuk pemasangan. Lebih baik bertahan dengan versi 11.1 saluran.

Untuk pawagam format besar dan studio filem

Pada 2011, Wilfried memulakan perkongsian dengan pengeluar peralatan video Belgium Barco. Syarikat ini mula menggunakan sistem Auro-3D dalam peralatannya untuk pawagam, dan pada tahun yang sama ia memasang sistem Auro 11.1 buat kali pertama. Filem pertama dalam format ini ialah Red Tails, diarahkan oleh George Lucas. Pada masa ini, lebih daripada 550 pawagam dilengkapi dengan sistem Auro 11.1 oleh Barco dan AuroMax di seluruh dunia.

Di Rusia hari ini, dewan pawagam utama "Oktober" dan 27 pawagam di Moscow dan bandar-bandar lain dilengkapi dengan bunyi sedemikian. Peralatan Auro-3D telah pun dipasang di dua studio - Pythagoras dan Neva-Film. Secara keseluruhan, lebih daripada 100 studio di seluruh dunia mencipta dan mengalih suara filem dalam format Auro-11.1 by Barco.

Pertama sekali, perkara yang baik tentang format ialah ia lebih murah untuk studio dan pawagam. Laman web rasmi Auro-3D menunjukkan kelebihan berikut:

Tiada bayaran lesen

Usaha Agihan Minimum

Keupayaan untuk menggunakan kandungan yang dicipta dalam format ini pada Auro-11.1 oleh sistem Barco

Peralihan dengan mudah daripada DCP kepada kualiti yang setara pada Blu-ray

Mudah untuk ditukar kemudian

Keupayaan untuk merakam dalam format Auro-11.1 oleh Barco terus pada set

Tidak memerlukan penguasaan dan kunci DCP tambahan

Saluran tambahan dikodkan terus ke dalam induk 5.1 (7.1).

Serasi sepenuhnya dengan campuran 5.1 (7.1).

Tidak perlu membuang masa untuk menulis semula tambahan dalam format yang berbeza

Keupayaan untuk menggunakan fungsi "campuran atas" untuk filem siap dalam format stereo, 5.1, 7.1 untuk main balik dalam Auro-11.1 oleh Barco

Di manakah kandungannya?

Pada mulanya, apabila format baru muncul, terdapat sedikit kandungan. Tetapi kini keadaan telah berubah: kedua-dua muzik dan filem tersedia dalam format Auro-3D. Senarai filem dan muzik, serta keluaran teater masa hadapan, diterbitkan di laman web Auro-3D.

Apakah bunyi sekeliling dan bagaimana ia berfungsi?

Kebanyakan peranti pembiakan bunyi yang murah dan tidak begitu moden, termasuk kad bunyi untuk komputer multimedia peribadi, membolehkan anda mengeluarkan semula bunyi dalam mod "Bunyi 3D" atau "Suround", yang boleh diterjemahkan sebagai "bunyi sekeliling". Apa itu dan untuk apa?

Sistem pembiakan bunyi sekeliling telah dibangunkan kerana kualiti bunyi yang disediakan oleh sistem stereo konvensional atau fon kepala tidak lagi memuaskan untuk pendengar yang arif. Walaupun sistem stereo dan mencipta kesan bunyi spatial dengan mensintesis panorama sumber bunyi khayalan (ISS) antara dua pembesar suara (Rajah 1), namun bunyi stereo mempunyai kelemahan yang ketara. Panorama stereo adalah rata dan dihadkan oleh sudut antara arah ke pembesar suara.

Rajah 1. Panorama stereo

Bunyi sedemikian sebahagian besarnya tidak mempunyai sifat semula jadi yang wujud dalam apa yang dicapai dalam medan bunyi sebenar, apabila seseorang dapat melihat sumber sebenar dari hampir semua arah, kedua-dua mendatar dan menegak, dan menganggarkan, walaupun kadang-kadang dengan kesilapan, jarak ke bunyi. sumber. Adalah dipercayai bahawa persepsi bunyi dari arah dan jarak yang berbeza mempunyai penting bukan sahaja sebagai fakta lokasi spatial mereka. Ia mewujudkan dalam pendengar perasaan kelantangan bunyi (medan bunyi tiga dimensi), dengan ketara memperkayakan timbres alat muzik dan suara, memulihkan ciri proses gema bilik utama (dewan konsert). Stereofoni konvensional mencipta kesan bunyi spatial di kawasan yang sangat terhad di hadapan pendengar, tidak membenarkan ciri persepsi bunyi yang dinyatakan di atas didedahkan sepenuhnya dalam medan bunyi sebenar dan, oleh itu, mengurangkan kualiti bunyi.

Sistem kuadrafonik juga tidak menyediakan simulasi lengkap medan bunyi sebenar. Pertama, dengan kuadrafoni, panorama stereo bulat tidak diperoleh - pendengar merasakan panorama stereo biasa di hadapannya dan panorama stereo belakang di belakangnya. Kedua, semua sumber bunyi khayalan terletak dalam satah yang sama dan pada garisan antara pembesar suara, i.e. tiada kedalaman dan sebenarnya, tiada bunyi keliling dimensi ke-3 dan tiga dimensi (Rajah 2).

Rajah 2. Panorama empat

Fon kepala stereo juga tidak membenarkan anda mendapatkan bunyi semula jadi daripada fonogram yang dihasilkan semula. Hakikatnya ialah kesan yang terhasil daripada lebar stereo yang tidak terhingga dan penyetempatan imej bunyi yang jelas di dalam kepala pendengar tidak dapat memuaskan pencinta muzik yang menuntut. Untuk menghapuskan kesan penyetempatan bunyi di dalam kepala, litar yang serupa dengan yang ditunjukkan dalam Rajah digunakan. 3.

Rajah 3. Gambar rajah blok peranti untuk mencipta bunyi sekeliling untuk telefon stereo

Di sini, isyarat saluran kiri dan kanan melalui peranti input A1 dan A2 masing-masing dibekalkan kepada pembahagi voltan A3 dan A6 dan kepada input saluran silang yang terdiri daripada talian tunda (LZ) A4, A5, peranti sepadan A8, A9 dan rendah -penapis lulus (LPF) Z1 ,Z2. Dari pembahagi A3, A6, isyarat disalurkan kepada pembetulan tindak balas frekuensi A7 dan A10 dan kemudian ke salah satu input penambah, dan daripadanya kepada input penguat kuasa untuk telefon stereo. Oleh itu, pada output setiap saluran, isyarat dihasilkan yang terdiri daripada isyarat yang lemah dan diperbetulkan bagi salurannya dan isyarat tertunda dan diperbetulkan dengan sewajarnya bagi saluran lain.

Peranti serupa, dibuat dalam bentuk kotak atas set atau peranti terbina dalam, kini dilengkapi dalam banyak pusat muzik. Menariknya, peranti sedemikian juga boleh dilaksanakan menggunakan kaedah perisian semata-mata menggunakan pemprosesan digital isyarat dalam masa nyata. Pembaca yang telah Komputer peribadi dengan kad bunyi dupleks penuh (malangnya, program ini tidak berfungsi dengan baik dengan kad yang dihasilkan oleh syarikat Singapura Creative Labs.), mereka boleh memuat turun salah satu daripada program yang serupa Di sini. Program ini, sebagai tambahan, membolehkan anda menambah kesan reverb untuk bilik kecil, sederhana dan besar, gema, korus, flanger dan mempunyai penyamaan yang cukup baik yang meningkatkan dengan ketara pembiakan frekuensi rendah (20...60 Hz) melalui pertengahan- telefon stereo berkualiti. Semua kesan berfungsi dalam masa nyata walaupun pada kad bunyi yang sangat murah tanpa pemproses DSP, contohnya OPTi-931 atau Acer S23.

Kaedah paling maju untuk mensimulasikan medan bunyi tiga dimensi sebenar ialah penghantaran bunyi binaural. Kaedah binaural terdiri daripada fakta bahawa maklumat bunyi dilihat oleh mikrofon yang diletakkan di telinga seseorang atau kepala tiruan. - model yang mensimulasikan persepsi pendengaran manusia. Isyarat yang datang dari setiap mikrofon dikuatkan oleh penguat frekuensi rendah yang berasingan dan dihasilkan semula oleh telefon stereo. Sebaik-baiknya, sistem sedemikian membolehkan anda mencipta ilusi lengkap bunyi semula jadi.

Ia seolah-olah mengangkut pendengar dari bilik mendengar ke bilik dari mana penghantaran dijalankan. Walau bagaimanapun, anda hanya boleh mendengarnya sepenuhnya menggunakan telefon stereo dan dengan syarat kepala anda digunakan sebagai sampel untuk mencipta kepala tiruan. Pembaca boleh mendengar fail WAV audio demo binaural dengan memuat turunnya melalui Internet daripada pelayan

www.geocities.com/SiliconValley/Pines/7899

Apabila memainkan isyarat binaural melalui pembesar suara bunyi Disebabkan oleh isyarat saluran kanan yang memasuki telinga kiri pendengar dan sebaliknya, herotan silang berlaku, akhirnya menafikan semua faedah pembiakan bunyi binaural. Kelemahan ini sebahagian besarnya boleh dihapuskan dengan bantuan peranti pemprosesan isyarat bunyi khas, yang memungkinkan untuk mendapatkan kesan binaural apabila mendengar rakaman binaural melalui pembesar suara. Peranti sedemikian dipanggil pemproses bifonik. Rakaman dibuat daripada mikrofon yang terletak di kepala tiruan, dan dimainkan semula selepas diproses oleh pemproses bifonik, di mana jumlah isyarat saluran kiri berperingkat, tertunda dan diperbetulkan frekuensi yang dikira dengan tepat ditolak daripada isyarat saluran kanan dan sebaliknya. . Gambar rajah blok pemproses bifonik, pertama kali dibangunkan oleh JVC, ditunjukkan dalam Rajah. 4.

Rajah 4. Gambar rajah blok pemproses binaural

Ia terdiri daripada penguat isyarat saluran kiri dan kanan A1, A2, isyarat menguatkan daripada mikrofon yang dipasang di kepala tiruan A0, talian tunda D1, D2, pengalih fasa U1, U2 dan penambah E1, E2. Selepas diproses oleh pemproses bifonik, isyarat yang datang dari pembesar suara ke telinga pendengar disimpulkan supaya telinga kiri hanya mendengar isyarat dari saluran kiri, dan telinga kanan hanya mendengar isyarat dari saluran kanan. Oleh itu, kita boleh mengatakan bahawa kesan bifonik adalah serupa dengan kesan binaural dan berbeza daripadanya hanya dalam cara rakaman binaural dihasilkan semula.

Dan walaupun kawasan di mana ia jelas kelihatan kecil, berada dalam hadnya, pendengar boleh mempunyai idea tentang jarak ke sumber bunyi dan lokasi relatifnya di angkasa pada masa rakaman, yang tidak boleh dicapai dengan bunyi stereofonik pembiakan, yang memberikan idea hanya tentang sumber bunyi lokasi pada baris antara pembesar suara. Satu lagi sifat menarik pemproses bifonik ialah keupayaan untuk mengembangkan asas stereo rakaman stereo konvensional dengan bantuannya. Inilah yang biasanya dimaksudkan dengan "3DSound". Dan jika sistem membenarkan anda meningkatkan sudut khayalan antara arah ke pembesar suara bunyi (Gamb. 1) kepada 180 darjah, maka sistem sedemikian dipanggil "Suround" dan panorama bunyi yang dicipta untuknya akan sama seperti semasa mendengar kepada telefon stereo, tetapi tanpa penumpuan sumber bunyi khayalan di dalam kepala pendengar. Sudah tentu, pemproses bifonik boleh dilaksanakan semata-mata dalam perisian menggunakan teknik pemprosesan isyarat digital masa nyata.

Baru-baru ini, seseorang dapat melihat bagaimana pawagam stereo muncul ke dunia pawagam komersial dan rumah, dan kini video adalah dalam barisan seterusnya resolusi ultra tinggi 4K. Bunyi tidak ketinggalan di belakang imej: Audio 3D telah datang ke teater rumah, persekitaran bunyi yang lengkap untuk penonton - bukan sahaja dalam satah mendatar, tetapi juga dalam dimensi ketiga. DALAM Bahasa Inggeris Istilah immersive digunakan untuk ini.

Suara Tuhan dan saluran audio lain

Format Auro-3D telah diperkenalkan pada Mei 2006 oleh syarikat Belgium Galaxy Studios. Filem arus perdana pertama dirakam dalam format ini, menjadi filem Red Tails, difilemkan pada 2012 oleh George Lucas. Perbezaan asas antara Auro-3D dan format Dolby Surround EX dan DTS yang lazim pada masa itu ialah, sebagai tambahan kepada saluran 7.1 tradisional yang terletak dalam satah yang sama, pembangun mencadangkan menggunakan dimensi ketiga - iaitu, meletakkan sistem pembesar suara (AS) bukan sahaja di sekeliling pendengar, tetapi juga di atas, sebagai "lapisan" kedua, pada sudut 30 darjah ke sistem pembesar suara hadapan dan saluran bunyi sekeliling.

Penambahbaikan lebih lanjut dalam format membawa kepada kemunculan "lapisan" lain - di atas kepala pendengar, yang secara simbolik dipanggil suara tuhan. Bilangan maksimum saluran (tidak boleh dikelirukan dengan bilangan sistem pembesar suara) mencapai 13.1, iaitu, ia sebenarnya menjadi dua kali ganda lebih banyak daripada dalam format 7.1 dan 6.1 yang digunakan ketika itu. Pengenalan saluran atas memungkinkan untuk menyampaikan beberapa peristiwa dalam runut bunyi filem dengan lebih tepat, seperti objek yang terbang di atas penonton (bunyi helikopter atau jet pejuang), kesan atmosfera (angin melolong, bunyi guruh).

Jika siling terlalu rendah, akustik akan terlalu dekat dengan penonton. Dalam kes ini, Dolby mengesyorkan menggunakan sistem pembesar suara khas yang berfungsi "melalui refleksi" dari siling - menurut syarikat itu, hasilnya akan lebih berkualiti.

Pendekatan objek

Pemain tertua dalam pasaran audio pawagam, Dolby Laboratories, menggunakan dua "lapisan" sistem pembesar suara dalam format Dolby Atmos baharunya. Yang pertama terletak di sekeliling pendengar mengikut skema klasik, dan yang kedua di siling - berpasangan di kiri dan kanan. Tetapi perkara yang paling penting adalah asasnya pendekatan baru untuk mencampurkan runut bunyi. Daripada pencampuran saluran demi saluran biasa, studio menggunakan kaedah rakaman "objek". Pengarah berfungsi dengan fail bunyi, menentukan lokasi dalam ruang tiga dimensi dari mana bunyi ini harus dimainkan, bila dan pada volum berapa. Sebagai contoh, jika perlu untuk mengeluarkan semula bunyi kereta yang bergerak, maka pengarah menunjukkan masa penampilan, tahap kelantangan, trajektori pergerakan, tempat dan masa penamatan bunyi "objek".

Selain itu, bunyi datang dari studio ke dewan pawagam bukan dalam bentuk trek yang dirakam, tetapi sebagai satu set fail bunyi. Maklumat ini diproses oleh pemproses, yang mengira runut bunyi filem setiap kali dalam masa nyata, dengan mengambil kira bilangan pembesar suara di dalam dewan, jenis dan lokasinya. Terima kasih kepada penentukuran yang tepat, tidak ada rujukan kepada mana-mana bilangan saluran "biasa", dan anda boleh menggunakan bilangan pembesar suara yang berbeza di dewan yang berbeza (setiap dewan ditentukur dan dikonfigurasikan secara individu) - pemproses itu sendiri akan mengira bagaimana dan ke mana untuk menghantar bunyi untuk mendapatkan panorama bunyi yang optimum. Bilangan maksimum "objek" bunyi yang diproses serentak ialah 128, dan bilangan pembesar suara bebas yang disokong serentak adalah sehingga 64.

Dolby Atmos tidak terikat dengan bilangan saluran audio tertentu. Gambar bunyi dibentuk oleh pemproses dalam masa nyata daripada "objek" dan mengikut "program" yang disusun oleh jurutera bunyi filem itu. Dalam kes ini, pemproses mengambil kira lokasi tepat sistem pembesar suara, jenis dan kuantitinya - semua ini telah ditetapkan dalam tetapan semasa menentukur setiap dewan tertentu. Benar, bagaimana untuk melaksanakan pendekatan sedemikian dalam teater rumah masih belum jelas sepenuhnya.

Profesional dan amatur

Berikutan pengenalan mereka ke pawagam komersial, kedua-dua format audio 3D mula menakluki pasaran tempatan. Auro-3D bermula sedikit lebih awal; beberapa pengeluar elektronik rumah memperkenalkan pemproses dan penerima pertama dengan sokongan untuk format itu pada awal 2014. Dolby Laboratories tidak mengambil masa yang lama untuk menunggu, dan pada pertengahan September tahun lalu membentangkan penyelesaian yang sangat berpatutan berdasarkan penerima yang murah. Di samping itu, pada awal tahun 2015 yang lain pemain besar, syarikat Amerika DTS, mengumumkan format bunyi tiga dimensi - DTS: X (yang kami hanya tahu, seperti Dolby Atmos, ia berorientasikan objek dan akan disokong oleh banyak pengeluar elektronik pengguna).

Sementara itu, pawagam komersial dan rumah mempunyai perbezaan yang ketara dalam beberapa aspek. Kekili filem adalah perkara yang sudah berlalu, dan salinan digital filem kini hampir digunakan secara universal dalam pengedaran filem. Runut bunyi filem "muncul" daripada pelayan sebagai aliran audio digital kadar bit tinggi dengan hampir tiada pemampatan. Pelayan di mana filem disimpan boleh menghantar sehingga 16 saluran digital data sedemikian secara selari.

Media filem rumah yang paling popular ialah cakera Blu-ray. Biasanya, ia mengandungi runut bunyi yang dirakam dalam salah satu daripada dua format paling popular - DTS HD Master Audio atau Dolby True HD. Terdapat juga cakera yang dirakam menggunakan codec DTS dan Dolby Digital lama dengan bunyi 2.1 (kiri-kanan dan LFE). Jika trek untuk filem itu pada asalnya dirakam dalam studio dalam format 5.1 atau 7.1, memindahkannya ke cakera agak mudah, satu-satunya perbezaan ialah pemampatan data tambahan yang dikaitkan dengan kapasiti terhad media digital. Bagaimanakah format Auro-3D dan Dolby Atmos baharu akan menyesuaikan diri apabila ia dipindahkan daripada pawagam profesional ke pawagam rumah?

Jalan pulang

Untuk Auro-3D, pemindahan akan menjadi hampir lancar. Jika filem pada asalnya dirakam dalam studio dalam format 13.1 atau 11.1, ia akan dipindahkan ke cakera Blu-ray dengan bilangan saluran yang sama. Untuk keserasian ke belakang, Auro-3D menggunakan algoritma khas yang boleh "menambah" saluran atas ke codec DTS HD MA, yang secara rasmi menyokong maksimum 7.1 saluran - contohnya, maklumat untuk saluran kiri atas terkandung dalam saluran kiri , maklumat untuk saluran tengah atas dikapsulkan dalam saluran tengah, dsb. dsb. Jika penerima atau pemproses mempunyai sokongan untuk menyahkod codec Auro-3D, maka ia akan "mengeluarkan" maklumat terbenam dan menyalurkannya ke saluran yang sesuai . Jika tidak, ia hanya menyahkod data sebagai runut 7.1 biasa, melangkau maklumat "tambahan". Oleh itu, cakera dengan filem dalam format Auro-3D akan dalam apa jua keadaan dibaca dengan betul oleh mana-mana pemain moden dan diiktiraf oleh mana-mana pemproses atau penerima yang menyokong DTS HD MA. Dan jika pemproses atau penerima mempunyai penyahkod Auro-3D terbina dalam, maka output boleh menjadi runut bunyi 9.1, 11.1 atau bahkan 13.1 saluran. Terdapat juga kemungkinan "pencampuran" - pemproses yang boleh berfungsi dengan Auro-3D boleh menukar walaupun rakaman stereo dua saluran biasa kepada, katakan, 13.1.

Auro-3D menggunakan reka letak pembesar suara tiga lapisan dan pendekatan rakaman audio berbilang saluran yang lebih tradisional. Ini memastikan keserasian ke belakang yang sangat baik bagi standard dengan format semasa dan mudah alih ke sistem rumah.

Situasi dengan Dolby Atmos dalam teater rumah adalah lebih rumit: pemproses mengira aliran data yang agak besar dalam masa nyata dan mengeluarkan bunyi ke saluran akustik yang sesuai (dengan mengambil kira jumlah yang terdapat dalam pemasangan tertentu). Pada masa ini, spesifikasi Dolby Atmos untuk kegunaan rumah mencadangkan menggunakan konfigurasi pembesar suara dari 5.1.2 hingga 7.1.4, di mana nombor pertama ialah bilangan saluran "biasa": kiri-tengah-kanan-belakang, yang kedua adalah rendah -saluran kesan frekuensi, dan yang ketiga - saluran yang dipanggil "atas" (overhed). Pada masa yang sama, satu-satunya pemproses untuk kegunaan komersial (Dolby CP850) berharga lebih daripada satu juta rubel, dan kos penerima rumah dengan sokongan Atmos bermula dari hanya 30-40 ribu. Walau bagaimanapun, walaupun untuk penerima rumah yang paling berpatutan, kedua-dua penyahkodan dan sokongan untuk "pencampuran" diumumkan, walaupun cara tepat ini dilakukan tidak sepenuhnya jelas.

Satu lagi perkara yang tidak begitu jelas ialah untuk mengira medan bunyi dengan betul, adalah perlu untuk mengetahui lokasi sebenar semua sistem pembesar suara. Dalam pawagam komersial, isu ini diselesaikan dengan menentukur peralatan, tetapi dalam penerima rumah, sejauh yang diketahui, kemungkinan ini tidak disediakan. Bagaimana, dalam kes ini, isu mendapatkan bunyi Atmos sepenuhnya "seperti dalam filem" di rumah diselesaikan masih tidak jelas. Benar, format masih belum memperoleh ciri terakhirnya. Beberapa pengeluar pemproses premium malah telah menangguhkan pengeluaran kemas kini dengan sokongan Dolby Atmos kerana perubahan dalam algoritma pemprosesan isyarat, yang mereka katakan sedang dibuat oleh pemaju Dolby. Jadi boleh diandaikan bahawa dalam kemas kini berikutnya, Dolby boleh membuat pelarasan pada proses pemprosesan bunyi dan/atau penentukuran sistem untuk lokasi tertentu sistem pembesar suara.

Isu keserasian

Memandangkan Auro-3D menggunakan kaedah tradisional pencampuran saluran demi saluran, dan Dolby dan DTS menggunakan penyuntingan audio berorientasikan objek, adalah tidak mungkin untuk menukar satu format kepada format yang lain. Di samping itu, membina teater rumah yang boleh berfungsi dengan betul dengan semua format juga tidak mudah. Masalah keserasian terletak pada keperluan pemasangan yang berbeza untuk sistem pembesar suara. Dolby Atmos menggunakan dua "lapisan" akustik, manakala Auro-3D menggunakan tiga. Seseorang mungkin membayangkan bahawa runut bunyi Dolby Atmos boleh dimainkan melalui bahagian Auro-3D pembesar suara, tetapi ini tidak mungkin betul. Keperluan peletakan pembesar suara agak ketat untuk kedua-dua format dan memandangkan kepekaan terhadap kedudukan yang tepat untuk mencapai peralihan yang lancar, ini mungkin menimbulkan cabaran bagi pereka dan pemasang teater rumah (maklumat tentang peletakan pembesar suara untuk DTS:X belum tersedia).

Prospek

Walaupun terdapat semua kekaburan dalam perihalan Dolby Atmos, kita mesti mengakui bahawa format ini mempunyai potensi yang lebih besar daripada Auro-3D. Pertama, pendekatan berorientasikan objek untuk rakaman jelas lebih menjanjikan daripada pendekatan saluran demi saluran tradisional. Kedua, sokongan untuk Dolby Atmos dalam model besar penerima AV daripada syarikat seperti Yamaha, Pioneer, Onkyo, Integra, Denon tersedia "di pangkalan", manakala lesen untuk Auro3D perlu dibeli sebagai kemas kini perisian pilihan untuk $199 , yang ketara untuk model bajet.

Dalam segmen pemproses yang lebih mahal untuk membina pawagam rumah, pengeluar seperti Trinnov Audio dan Datasat Digital, juga beroperasi dalam pasaran filem komersial, telah mengumumkan sokongan untuk semua format Audio 3D. Pengalaman mereka boleh memberi kesan yang sangat bermanfaat ke atas pelaksanaan Dolby Atmos untuk teater rumah: sebagai contoh, Trinnov menggunakan mikrofon tiga dimensi yang unik untuk menentukur pemprosesnya, membolehkannya menentukan lokasi setiap pembesar suara di angkasa dengan tepat dan menggunakan data ini untuk pembetulan tambahan medan bunyi.

Para editor mengucapkan terima kasih kepada majalah avreport.ru atas bantuan mereka dalam menyediakan artikel.

Surround - bunyi sekeliling

Selagi rakaman bunyi telah wujud, kedua-dua pendengar dan pereka peralatan mempunyai keinginan yang tidak dapat dipadamkan untuk membuat bunyi dirakam dan kemudian diterbitkan semula sebagai serupa dengan yang asal yang mungkin. Perkara yang tidak dilakukan oleh pembangun peralatan audio untuk mendekati yang ideal: melawan bunyi, meminimumkan herotan, mengembangkan frekuensi dan julat dinamik elemen laluan rakaman-transmisi-main balik isyarat audio. Dan antara lain, mereka berusaha untuk memaksa medan bunyi yang dicipta oleh sistem akustik untuk menghantar kepada pendengar maklumat tentang arah sumber bunyi dan tentang sifat akustik bilik di mana rakaman itu dibuat.

Pada peringkat pertama perkembangannya, rakaman bunyi dan penyiaran radio adalah monofonik. Bunyi yang datang dari pembesar suara tidak dapat dikenali berbeza daripada bunyi langsung dewan konsert: keseimbangan yang herot antara pelbagai alat muzik, timbre yang herot dan, yang paling penting, ruang yang hilang sepenuhnya. Ini adalah kecacatan yang sangat serius. Lagipun, penganalisis pendengaran manusia mempunyai keupayaan untuk mencari sumber bunyi, yang membantu kita menavigasi di angkasa. Jika semua bunyi datang dari satu titik, ia kelihatan tidak wajar.

Sedikit sejarah

Eksperimen pertama untuk mendapatkan bunyi sekeliling (menggunakan tiga hingga tujuh saluran) telah dijalankan pada 30-an abad yang lalu. Ujian perbandingan sistem berbilang saluran dan mono membuahkan hasil yang mengejutkan. Didapati bahawa apabila memainkan walaupun 2 saluran berasingan, kualiti bunyi subjektif meningkat secara mendadak. Dan perkara yang paling menarik ialah pakar lebih suka bunyi stereo walaupun dalam kes apabila ia disampaikan dengan fonogram yang lebih baik secara objektif, tetapi monofonik. Kelebihan yang menentukan ialah kemungkinan penyetempatan spatial sumber bunyi yang jelas (Rajah 1.33).

nasi. 1.33. Taburan sumber bunyi yang jelas dalam panorama stereo:

Pada peringkat awal, pemaju memutuskan untuk mengehadkan diri mereka kepada dua saluran. Ini, tentu saja, terutamanya disebabkan oleh keupayaan terhad peralatan pada masa itu: rekod gramofon sebenarnya memungkinkan untuk meletakkan hanya dua saluran penuh.

Bunyi stereo memberikan sedikit kejelasan kepada bunyi: bahagian instrumen individu menjadi lebih dibezakan dengan latar belakang orkestra. Di samping itu, sistem stereo boleh menghasilkan semula rupa suasana bunyi bilik di mana rakaman itu dibuat. Era sistem stereofonik 2 saluran telah bermula. Secara beransur-ansur, rekod stereofonik dan pemain stereo, perakam pita stereo, dan penyiaran radio stereo muncul.

Sebaliknya, bunyi stereo mempunyai kelemahan yang ketara. Panorama stereo dihadkan oleh sudut antara arah ke pembesar suara dan ternyata rata. Bunyi sedemikian tidak mempunyai keaslian medan bunyi sebenar, apabila seseorang dapat melihat sumber sebenar dari hampir semua arah dan menganggarkan jarak ke sumber bunyi. Perasaan bunyi sekeliling yang dicipta dalam pendengar dapat memperkayakan timbres alat muzik dan suara penyanyi dengan ketara. Dalam kes ini, adalah mungkin untuk mensimulasikan ciri proses gema bilik di mana rakaman dibuat.

Salah satu percubaan pertama untuk mengatasi kelemahan yang wujud dalam sistem stereofonik ialah kuadrafoni. Untuk menghasilkan semula fonogram kuadrafonik, 4 sistem akustik digunakan (Rajah 1.34).

Sistem quad isi rumah pertama muncul pada awal 70-an abad yang lalu. Nampaknya masa depan yang gemilang menanti mereka. Walau bagaimanapun, ini tidak berlaku. Terdapat beberapa sebab untuk ini. Salah satu daripadanya adalah tradisional untuk banyak teknologi baharu dan ialah pengeluar peralatan kuadrafonik tidak dapat mencapai piawaian yang bersatu untuk rakaman dan main balik bunyi 4 saluran. Ketidaksempurnaan dan kos tinggi peranti rakaman dan main balik empat saluran memainkan peranan. Tetapi perkara utama adalah berbeza: dengan peralihan dari "stereo" kepada "quad" pada masa itu, kualiti bunyi baru tidak timbul. Sistem kuadrofonik, seperti stereofonik, tidak memberikan penghantaran penuh sifat medan bunyi sebenar. Terdapat hanya dua kelemahan, tetapi mereka ketara:

dengan kuadrafoni pada tahun 70-an abad yang lalu, panorama stereo bulat tidak diperoleh - pendengar merasakan panorama stereo biasa di hadapannya dan panorama stereo lain di belakangnya;
semua sumber bunyi khayalan terletak dalam satah yang sama pada garisan antara pembesar suara, jadi masih tiada bunyi keliling tiga dimensi.

Perlu diingatkan bahawa kekurangan ini disebabkan tidak begitu banyak kurang upaya pembiakan bunyi empat saluran, terdapat banyak kesukaran dalam melaksanakan penyorotan sumber bunyi jelas semasa rakaman. Apabila menyediakan fonogram untuk sistem berbilang saluran moden, faktor ini diambil kira. Peranan penting dalam kes ini dimainkan oleh komputer, yang mampu mengatasi pemodelan proses gema volumetrik dan menyediakan jurutera bunyi dengan kawalan yang mudah untuk menggerakkan sumber bunyi merentasi panorama bulat.

nasi. 1.34. Taburan sumber bunyi jelas pada panorama quad:

Tetapi pada masa yang jauh itu, kuadrafoni berundur, dan stereofoni menang dan mula berkembang mengikut garis pengecilan peralatan, peningkatan kualiti teknikal dan penggunanya, dan peralihan kepada media baharu - kaset dan CD padat. Syarikat rakaman dan pengeluar peralatan audio masih mempunyai pelbagai kerja yang perlu dilakukan dan pasaran jualan yang luas. Sekali lagi mereka menawarkan pendengar perubahan perpustakaan muzik. Bahan muzik yang terkumpul pada rekod gramofon sepanjang dekad sebelumnya, dikemas kini dan disesuaikan dahulu untuk perakam pita kekili-ke-kekili monofonik, kemudian dilaksanakan pada kaset kompak dalam format stereo, sekali lagi ditawarkan kepada pencinta muzik, tetapi kini pada cakera laser.

Walau bagaimanapun, pada penghujung abad ke-20, stereofoni, nampaknya, mula kehilangan tempat. Teknologi digital rakaman bunyi, serta media yang luas, mudah dan murah, menghapuskan masalah yang sedia ada sebelum ini untuk menyimpan fonogram berbilang saluran dalam tempoh yang lama. Di samping itu, terdapat keperluan mendesak untuk bunyi yang menyampaikan sifat akustik ruang sekeliling. Dunia grafik maya permainan komputer menjadi lebih kompleks dan serupa dengan realiti, dan oleh itu memerlukan reka bentuk bunyi yang mencukupi. Pawagam, yang mengalami krisis dalam persaingan dengan televisyen, dihidupkan semula dalam bentuk teater rumah dan dewan pawagam dalam format baru, perbezaan utama dari pendahulunya bukan terletak pada imej, tetapi pada bunyi yang pada asasnya baru (walaupun kualiti imej juga telah bertambah baik, terima kasih kepada DVD dan cara unjuran moden).

Era baharu dalam rakaman bunyi bermula hasil penyelidikan yang dijalankan oleh jurutera di Dolby Laboratories (http://dolby.com). Ini adalah pendekatan asas baru untuk penghantaran audio berbilang saluran. Berbeza dengan cara tradisional terdiri, pertama sekali, dalam fakta bahawa pengekodan matriks digunakan untuk menyimpan isyarat audio dua saluran tambahan, iaitu, mencampurkannya dengan dua saluran utama. Kaedah meletakkan sistem pembesar suara juga telah berubah - sebagai tambahan kepada susunan kuadraponik tradisional sistem pembesar suara di sudut bilik, saluran tengah telah ditambah, terletak di antara saluran hadapan kanan dan kiri untuk mengekalkan asas stereo yang luas untuk penonton yang duduk di tempat duduk sisi, dan saluran kesan (Surround) terletak di belakang belakang ). Ini adalah bagaimana sistem bunyi pawagam baharu Dolby ® Stereo dilahirkan.

Seperti yang anda sedia maklum, format empat saluran ini ialah format matriks di mana audio yang ditujukan untuk setiap empat saluran dikodkan dan direkodkan ke dalam dua saluran, dan apabila dimainkan semula, dinyahkod semula kepada empat saluran: kiri, tengah, kanan dan belakang. Isyarat saluran belakang biasanya dihantar ke dua pembesar suara belakang secara serentak. Buat pertama kali format Dolby ® Stereo digunakan dalam filem " Perang Bintang"pada tahun 1975.

Teknologi pengekodan yang digunakan tidak membenarkan pemisahan antara saluran lebih daripada 8 dB. Ini kemudiannya ditukar untuk menjadikan pemisahan antara saluran kepada 15 dB, tetapi tindak balas frekuensi saluran belakang kekal terhad kepada 100 Hz - 7 kHz.

nasi. 1.35. Peletakan pemancar bunyi dalam sistem Stereo Dolby ®:

Sistem pembiakan kualiti yang benar-benar baharu, serasi dengan piawaian rakaman bunyi lama, ialah sistem Dolby® Pro Logic®. Ia menggunakan penyahkod yang melaksanakan pemfokusan spatial imej bunyi - teknologi yang digunakan untuk mengurangkan penembusan bersama isyarat dari satu saluran ke saluran yang lain. Dolby ® Pro Logic ® juga memperkenalkan keupayaan untuk menangguhkan isyarat audio di saluran belakang. Ini memastikan penyelarasan ciri geometri dan akustik bilik tertentu dengan ciri-ciri "dewan pawagam rujukan", di mana bunyi berbilang trek dicampur semasa pengeluaran. Adalah sangat penting bahawa sehingga kini sejumlah besar muzik, filem dan program televisyen telah terkumpul, dirakam pada pelbagai media moden dengan bunyi dalam format Dolby ® Pro Logic ®. Kemudian datanglah era pengekodan digital dan rakaman digital bunyi sekeliling berbilang saluran, dan Dolby ® Digital dilahirkan. Untuk pengekodan audio digital ia menggunakan algoritma yang dipanggil AC-3 (algoritma pengekodan audio generasi ketiga Dolby). AC-3 ialah algoritma pemampatan audio berbilang saluran lossy (bilangan saluran bebas daripada 1 hingga 6). Pencapaian dalam bidang psikoakustik yang mengambil kira ciri-ciri alat bantuan pendengaran manusia digunakan di dalamnya untuk menentukan berapa banyak maklumat dalam isyarat audio boleh dibuang supaya ia tidak begitu ketara kepada telinga manusia. Apabila pengekodan dengan algoritma AC-3, kadar bit daripada 32 Kbps boleh digunakan (untuk satu saluran mono dengan kualiti minimum) sehingga 640 Kbps (untuk 5.1 saluran dengan kehilangan kualiti yang minimum) Kadar bit biasa untuk 5.1 rakaman ialah 385 Kbps.

Pengekod Digital Dolby® menyokong kadar pensampelan data digital 32 kHz, 44.1 kHz dan 48 kHz pada 16, 18 atau 20 bit. Ia adalah mungkin untuk meningkatkan kedalaman bit kepada 24 bit. Mampatan data lossy digunakan, tetapi kualiti bunyi masih lebih tinggi daripada sistem analog sebelumnya. Dolby® Digital boleh mengekod sehingga 6 saluran dalam format 5.1, di mana 5 adalah saluran julat penuh (2020,000 Hz) dan 1 ialah saluran kesan frekuensi rendah (kurang daripada 120 Hz).

Kelantangan adegan akustik, perincian yang lebih jelas, pergerakan semula jadi sumber bunyi dari hadapan ke belakang, bunyi stereofonik di belakang - semua ini memastikan kejayaan sistem.

Langkah seterusnya dalam evolusi sistem bunyi sekeliling ialah sistem Dolby ® Digital EX, yang boleh dianggap sebagai tambahan kepada Dolby ® Digital. Dalam Dolby ® Digital EX, seperti dalam Dolby ® Digital, sehingga 6 saluran bebas (5.1) boleh dikodkan secara fizikal, bagaimanapun, disebabkan penggunaan pengekodan matriks, maklumat daripada satu atau dua lagi saluran sekeliling dicampur ke kiri dan kanan saluran belakang. Terima kasih kepada penyelesaian ini, keserasian dengan peralatan Digital Dolby ® dikekalkan, dan pada masa yang sama, disebabkan pengenalan saluran sekeliling tambahan (6.1, 7.1) pada peralatan Dolby ® Digital EX, malah lebih banyak lagi. ketepatan yang tinggi penyetempatan sumber bunyi di angkasa.

Sudah tentu, bukan hanya Dolby Lab yang terlibat dalam audio berbilang saluran. Sebagai contoh, RSP Technologies telah mencipta sistem matriks Circle Surround, yang mempunyai saluran belakang dengan julat frekuensi penuh dan dengan itu ternyata menjadi cara yang paling baik disesuaikan untuk main balik muzik. Versi baharu Circle Surround juga boleh beroperasi dalam mod enam saluran dengan saluran belakang dan subwufer yang berasingan.

Pada masa ini, kita boleh bercakap tentang penyebaran format pengguna baharu: DVD-audio. Data audio pada media ini boleh disimpan menggunakan pelbagai algoritma pengekodan, termasuk Dolby ® Digital. Namun, disebabkan kapasiti yang besar media DVD(4.7 GB pada cakera satu lapisan), tidak ada keperluan untuk pemampatan kehilangan maklumat audio. DVD-audio boleh menyimpan rakaman berbilang saluran dalam format sehingga 24 bit/96 kHz tanpa sebarang pemampatan dan, sewajarnya, tanpa sebarang kerugian.

Format 5.1

Penamaan "5.1" menunjukkan bilangan saluran, tetapi tidak menyampaikan maklumat tentang sebarang kaedah khusus pengekodan audio berbilang saluran. Lima saluran dengan julat frekuensi penuh digunakan (kiri depan, tengah, kanan depan, kiri belakang dan kanan belakang), serta satu saluran frekuensi rendah (dengan julat dari 3 hingga 120 Hz), disambungkan ke subwufer (Rajah 1.36).

Dalam sistem 5.1 ini, panorama stereo bulat terbentuk. Oleh kerana pada frekuensi ultra-rendah pendengaran kita boleh dikatakan tidak dapat menentukan arah sumber bunyi, lokasi subwufer tidaklah penting.

Subwufer juga digunakan dalam sistem stereo konvensional. Bahagian frekuensi rendah spektrum jumlah isyarat saluran stereo dibekalkan kepada salurannya, menghasilkan pembiakan bunyi bes yang dijamin. Walau bagaimanapun, dalam sistem 5.1, saluran kesan frekuensi rendah memainkan peranan khas. Ia harus dianggap bukan sebagai komponen frekuensi rendah sistem pembesar suara berbilang jalur, sebaliknya sebagai saluran bebas kesan frekuensi rendah.

Apabila merakam ke perakam pita, kebanyakan sistem 5.1 mempunyai susunan saluran berikut (bermula dengan trek pertama): kiri hadapan, tengah, kanan depan, kiri belakang, kanan belakang dan saluran frekuensi rendah. Dalam sesetengah kes (contohnya, dalam kad bunyi berbilang saluran), susunan berbeza disediakan: kiri depan, kanan depan, kiri belakang, kanan belakang, tengah, frekuensi rendah.

Menurut pakar, format 5.1 adalah yang paling menjanjikan, kerana ia disokong oleh pembangun utama. Adalah penting bahawa media (DVD) yang sesuai tersedia.

nasi. 1.36. Penempatan pemancar bunyi dalam sistem 5.1:

Dan walaupun satu standard belum diterima pakai dan terdapat beberapa sistem pengekodan untuk 5.1 pada masa yang sama, kegagalan kuadrafoni "primitif" tidak mungkin berulang, walaupun tidak satu, tetapi beberapa sistem pengekodan yang berbeza "bertahan". Perbezaan asas antara format 5.1 dan kuadrafoni tiga puluh tahun yang lalu ialah dalam kes ini isyarat audio adalah dalam bentuk digital, jadi penciptaan penyahkod universal yang mampu berfungsi dengan audio yang dikodkan pelbagai sistem, tidak akan menyebabkan sebarang kesulitan tertentu dan tidak akan membawa kepada peningkatan ketara dalam kos peralatan.

Pengeluar peralatan audio dan video, komputer, komponen komputer dan program berminat untuk menjayakan format 5.1. Pengguna berminat dengannya: penonton, pendengar, pemain. Jurutera bunyi dan pemuzik mencari cara ekspresif baharu dalam format ini untuk merealisasikan idea kreatif dan meningkatkan kesan pada emosi kita. Format ini benar-benar memberikan kualiti baharu kepada bunyi yang dihasilkan semula: pendengar dikelilingi olehnya. Benar, dunia bunyi maya dalam kes ini tidak sesuai dengan yang sebenar. Dalam ruang bunyi yang disintesis, sumber bunyi boleh berada di sebelah kanan, kiri, depan, belakang, bergerak dalam "koordinat" ini. Dan dalam ruang bunyi sebenar, sebagai tambahan, terdapat juga "atas" dan "bawah".

Ciri-ciri peralatan studio 5.1

Sekarang kita hanya akan bercakap tentang elemen asas studio bunyi, yang pertama sekali termasuk:

pengadun;
peranti rakaman berbilang saluran;
peranti pemprosesan dan kesan;
monitor untuk mendengar runut bunyi.

Alat utama untuk mencampurkan audio berbilang saluran ialah pengadun yang dilengkapi dengan alat panning.

Dalam stereo, kawalan kuali digunakan untuk meletakkan sumber bunyi yang jelas di lokasi tertentu. Dengan itu anda menetapkan tahap relatif isyarat bunyi yang dimasukkan ke dalam setiap dua saluran, dan dengan itu menentukan kedudukan sumber bunyi antara dua sistem pembesar suara. Apabila bekerja dengan audio berbilang saluran, anda perlu mengawal proses yang sama dalam 5 saluran, di samping itu, sudah tentu, anda juga perlu melaraskan saluran subwufer. Oleh itu, apabila menggunakan pengadun tradisional, berbilang kawalan mesti dimanipulasi untuk meletakkan satu sumber bunyi. Ambil perhatian bahawa keadaan fader yang mengawal tahap isyarat dan kawalan panorama dalam setiap saluran adalah sukar untuk dibandingkan dengan kedudukan sumber bunyi jelas dalam panorama bulat. Lebih sukar untuk membuat pergerakan bunyi di sepanjang laluan tertentu. Ini hanya boleh dilakukan dalam pengadun dengan automasi. Kayu bedik akan sangat sesuai sebagai kawalan kuali bulat dalam pengadun yang direka untuk berfungsi dengan audio berbilang saluran.

Di samping itu, pengadun yang mampu berfungsi dengan bunyi sekeliling mestilah tidak mempunyai satu, tetapi beberapa output (mengikut bilangan saluran). Sebagai contoh, dalam sistem 5.1, pengadun mesti mempunyai sekurang-kurangnya 6 output. Peralatan untuk studio rakaman stereo tidak murah, dan anda tidak boleh memikirkan harga studio 5.1!

Peranti rakaman audio berbilang saluran juga agak mahal. Mereka mesti mempunyai 6 atau lebih saluran. Lebih-lebih lagi, adalah sangat wajar bahawa bunyi di dalamnya diwakili dalam sekurang-kurangnya 24 bit.

Pembancuh dan perakam pita digital ialah peranti yang bersifat berbilang saluran. Oleh itu, beberapa model yang direka untuk bekerja dengan bunyi stereo boleh digunakan dengan lebih mudah atau lebih kecil dalam studio format 5.1. Tetapi dengan penyamaan, peranti pemprosesan dinamik, dan terutamanya kesan, keadaan menjadi lebih rumit. Sudah tentu, anda boleh menyediakan 6 saluran dengan memasang "bateri" 3 peranti dua saluran. Walau bagaimanapun, tidak perlu bercakap tentang pelarasan parameter yang bermakna dalam kes ini. Bayangkan, sebagai contoh, kesukaran mencipta reverb realistik dalam sistem berbilang saluran.

Pengganti yang layak perakam pita digital dan pengadun perkakasan boleh disediakan oleh studio berbilang trek perisian dan pengadun maya yang disertakan dalam beberapa daripadanya, yang membolehkan anda mengawal panning menggunakan tetikus biasa. Pengadun surround yang mudah digunakan yang memaparkan dengan jelas kedudukan sumber bunyi dalam panorama bulat tersedia dalam Cubase SX (lihat Bab 5).

Bukan setiap pemilik studio rumah format stereofonik mampu mempunyai sistem stereo akustik monitor. Walau bagaimanapun, dalam kes pencampuran stereo, fon kepala monitor yang agak murah adalah penyelesaian yang boleh diterima. Dan dalam format 5.1, fon kepala stereo tidak akan menyelamatkan anda. Anda tidak boleh melakukannya tanpa lima sistem pembesar suara jarak penuh (serta subwufer).

Apabila bekerja dengan bunyi stereo, keperluan utama untuk monitor ialah: keseragaman tindak balas frekuensinya, tahap herotan yang rendah dan identiti lengkap kedua-dua sistem pembesar suara.

Keperluan yang sama boleh dibuat untuk lima monitor jalur lebar 5.1. Nampaknya mereka juga sepatutnya sama. Tetapi dalam kes ini, anda akan bercampur menjadi panorama bulat dalam keadaan yang berbeza daripada keadaan di mana ramai pendengar gubahan anda akan berada. Hakikatnya ialah kebanyakan pemilik teater rumah mempunyai sistem pembesar suara belakang yang bukan sahaja lebih lemah dalam kuasa daripada yang hadapan, tetapi, sebagai tambahan, mereka mungkin mempunyai reka bentuk jenis lain. Sebaliknya, sistem pembesar suara pusat selalunya berbeza daripada yang paling luar. Ternyata tanggapan pendengar mungkin tidak bertepatan dengan yang anda maksudkan.

Ambil perhatian bahawa masalah yang sama wujud apabila bekerja dengan bunyi stereo: pencampuran dijalankan pada monitor studio, dan main semula dijalankan pada pelbagai jenis akustik, mulai dari pembesar suara berkualiti tinggi dan berakhir dengan pembesar suara mudah alih perakam kaset. Benar, semasa proses penguasaan, fonogram mesti menjalani ujian untuk keserasian dengan peralatan berkualiti rendah, dan salah satu tugas utama peringkat ini ialah menyesuaikan rakaman ke jenis media tertentu.

Bagi saluran kesan frekuensi rendah sistem 5.1, apabila mencampurkan gubahan muzik subwufer tidak boleh digunakan sama sekali jika, mengikut reka bentuk artistik, komposisi muzik tidak mengandungi kesan seperti letupan, tembakan, dsb.

Tetapi pengalaman tahun lalu, apabila format CD-audio memerintah, menunjukkan bahawa sebarang cadangan rasmi untuk menggunakan format itu hanya diikuti pada mulanya. Secara beransur-ansur, jurutera dan pengeluar yang mantap menjadi lebih berani dalam rancangan kreatif mereka dan melintasi garis yang dipanggil "cadangan rasmi." Seperti yang diberitahu oleh intuisi kita, akhirnya saluran frekuensi rendah sistem 5.1 akan digunakan "sepenuhnya": di mana ia diperlukan dan di mana ia tidak diperlukan. Sebagai contoh, idea yang jelas ialah menggunakan saluran frekuensi rendah untuk meningkatkan rentak drum bes dalam muzik tarian.

Bagaimana untuk mengatur pemantauan apabila mencampurkan audio berbilang saluran? Terdapat beberapa perdebatan mengenai perkara ini. Walau bagaimanapun, kebanyakan pakar mengesyorkan menggunakan akustik yang sama, tanpa membuat elaun untuk ketidaksempurnaan sistem rumah. Monitor harus diletakkan pada jarak yang sama dari pendengar, khususnya, tiga monitor hadapan harus membentuk lengkok dan bukannya garis lurus. Jika ini tidak mungkin, rendahkan kelantangan monitor tengah dengan sewajarnya.

Bagaimanakah kedudukan monitor untuk sistem 5.1 sebaiknya diletakkan? Bayangkan berada di tengah-tengah sistem 5.1. Monitor pusat harus terletak di hadapan anda. Garis khayalan antara anda dan monitor pusat ialah paksi relatif kepada lokasi monitor yang tinggal akan ditentukan. Saluran hadapan kiri dan kanan terletak pada sudut -30° dan 30° berbanding paksi ini. Jadi sudut monitor kiri-anda-kanan ialah 60°. Jika perlu, sudut ini boleh dikurangkan kepada 50° - 45°. Subwufer juga harus terletak di suatu tempat di hadapan anda. Monitor belakang hendaklah diletakkan pada sudut -110° (kiri belakang) dan 110° (belakang kanan). Sebaik-baiknya, semua monitor harus berada pada jarak yang sama daripada anda dan ditentukur supaya apabila tahap isyarat yang sama digunakan pada setiap monitor yang berbeza anda mendengarnya pada kelantangan yang sama. Ketinggian monitor adalah pada paras kepala anda atau lebih tinggi sedikit.

Ciri-ciri pencampuran ke dalam panorama bulat

Oleh kerana terlibat secara serius dalam masalah pemprosesan bunyi, kami telah mengikuti dengan teliti penerbitan yang berkaitan dengan topik ini selama bertahun-tahun. Oleh itu, kami dengan yakin boleh menyatakan bahawa tidak begitu banyak karya yang dikhaskan untuk isu teknologi pencampuran stereo. Tetapi hampir tidak ada artikel yang mengandungi cadangan khusus untuk membuat rakaman berbilang saluran. Nampaknya, ini boleh dijelaskan oleh fakta bahawa masalah itu baru, tidak ada pengalaman yang diperlukan, dan tidak ada tradisi yang mantap. Walau apa pun, karya muzik bebas yang digabungkan menjadi panorama bulat belum lagi menjadi fenomena massa. Audio berbilang saluran terutamanya wujud sebagai pelengkap kepada imej video. Jelas sekali bahawa pendekatan untuk menyorot bunyi untuk runut bunyi filem dan bunyi gubahan muzik mestilah berbeza. Apabila mengiringi video, adalah perlu untuk meletakkan bunyi utama di hadapan, kerana ia adalah pada skrin di hadapan penonton bahawa tindakan itu berlaku. Saluran belakang digunakan untuk menambah kelantangan pada bunyi dan melaksanakan kesan khas. Sudah tentu, apabila bekerja dengan muzik sekeliling, anda boleh memberi tumpuan kepada perkembangan yang ada dalam bidang penciptaan bunyi untuk penerbitan filem moden. Iaitu, anda boleh meletakkan bunyi utama di hadapan, mengelilingi sedikit pendengar, dan menggunakan saluran belakang untuk mencipta semula akustik persekitaran dan pergerakan sumber bunyi sekunder. Namun, jika kita bercakap tentang sekeping muzik yang dicipta tanpa mengharapkan untuk menghubungkannya dengan plot video, maka pengarang boleh menikmati kebebasan sepenuhnya dalam penggunaan cara ekspresif baharu yang wujud dalam panorama bulat itu sendiri. Contohnya, anda boleh "menempatkan" pendengar di kalangan pemain, mengalihkan seluruh medan bunyi atau sumber bunyi individu di sekelilingnya dan mengalihkannya ke dalam "kedalaman" panorama.

Benar, kesan khas menyorot paling baik digunakan secara sederhana. Contohnya, tidak masuk akal untuk mereka bentuk piano maya yang papan kekuncinya, berdasarkan bunyinya, kelihatan seperti bulatan yang menyelubungi pendengar. Bunyi gendang yang diletakkan di saluran belakang, dan terutamanya bunyi kuat yang tiba-tiba datang dari belakang, boleh menjadi sebab mengapa lagu anda tidak akan menjadi hit. Segelintir orang akan menyukainya jika mereka perlu berpaling secara refleks sekali-sekala atau melompat kerana ketakutan.

Semasa menyediakan rakaman stereo, kami terpaksa mengehadkan diri dengan sengaja dalam menggunakan keupayaan panorama stereo berhubung dengan beberapa alat muzik. Selain itu, sekatan ditentukan bukan sahaja oleh artistik, tetapi juga oleh pertimbangan teknikal. Sebagai contoh, tiada gunanya mengalihkan bass dari tengah panorama stereo. Pertama, kerana kesan stereo masih sangat lemah di kawasan frekuensi rendah. Kedua, jika bass dipan ke kiri atau kanan, kuasa salah satu pembesar suara tidak akan digunakan sepenuhnya. Dan ini sudah menjadi kelemahan yang serius, kerana rantau frekuensi rendah spektrum sentiasa menyumbang bahagian ketara daripada jumlah kuasa isyarat bunyi.

Masalah yang sama wujud dalam sistem 5.1, walaupun subwufer menyelesaikan masalah menjana bunyi frekuensi rendah di sini. Salah satu masalah tersebut ialah penggunaan saluran tengah. Dalam filem, ia direka bentuk untuk menambat bunyi dominan dalam imej supaya penonton di luar pusat menganggap bunyi tersebut datang dari skrin. Dalam muzik, bunyi-bunyi yang dalam stereo biasanya dihantar sama rata ke saluran kiri dan kanan (vokal utama, bes, bahagian dram) lebih baik diedarkan antara saluran tengah dan hadapan. Ini akan mengelakkan lebihan beban saluran pusat. Di samping itu, kebolehdengaran bunyi meningkat jika sebahagian daripadanya diarahkan lebih ke saluran tengah, dan yang lain - serentak ke saluran hadapan kiri dan kanan.

Format 5.1 menyediakan satu tan kemungkinan baharu untuk menggunakan kesan seperti kelewatan dan reverb. Isyarat reverb boleh terletak dalam arah yang sama dengan isyarat langsung. Pada masa yang sama, sama seperti dalam rakaman stereo arah silang dengung membawa kepada pengembangan jelas asas stereo, kesan meningkatkan kelantangan bilik maya boleh diperoleh jika denungan bunyi hadapan dibuat sedikit di belakang, dan yang belakang - sedikit di hadapan. Bukan sahaja sumber bunyi yang jelas itu sendiri, malah gema yang dijana olehnya boleh dialihkan secara dinamik dalam panorama 360 darjah.

Apabila mencampurkan ke dalam panorama bulat, tanda tambahan muncul di mana telinga dapat membezakan bahagian individu: arah ke sumber bunyi dalam 360° dan, sedikit sebanyak, jarak kepadanya (kedalaman panorama). Oleh itu, tiada keperluan khusus untuk melakukan penapisan frekuensi untuk mengasingkan beberapa bunyi daripada yang lain, atau untuk menukar volum instrumen semasa lagu atau untuk memampatkan isyarat audio individu.

Berkenaan pemprosesan tambahan pemampat komposisi yang sudah bercampur, maka operasi sedemikian nampaknya tidak boleh diterima. Ia boleh menyebabkan anjakan kedudukan sumber bunyi ketara yang sebelumnya diletakkan pada titik tertentu. Dan sumber tersebut yang tahap isyarat semasanya pada satu ketika melebihi ambang tindak balas pemampat juga akan "bergerak" secara huru-hara di sepanjang trajektori rawak. Nampaknya keadaan akan berubah hanya dengan kemunculan kesan dan pemprosesan maya berbilang saluran yang tersedia secara meluas yang melaksanakan algoritma pemprosesan yang mengambil kira spesifik panning bunyi sekeliling dan faktor psikoakustik. Pada masa ini, permulaan algoritma sedemikian boleh didapati dalam codec perisian yang menukar, sebagai contoh, fail WAV yang terletak pada 6 trek berasingan kepada satu aliran digital AC-3. Malangnya, intipati algoritma sedemikian tersembunyi daripada pengguna, dan bilangan parameter yang tersedia untuk pelarasan adalah sangat kecil.

Nampaknya memastikan keserasian mono rakaman bercampur dalam format 5.1 adalah tidak realistik. Memastikan keserasian stereo bagi runut bunyi yang telah siap juga bermasalah. Nampaknya, satu-satunya penyelesaian yang betul ialah mencampurkan komposisi secara sengaja dan berasingan ke dalam format mono, stereo dan 5.1.

Intipati, tugas dan peringkat penguasaan berhubung dengan fonogram stereofonik - terus terang bercakap, masalah ini sangat sukar. Dan dengan menguasai dalam format berbilang saluran, keadaan menjadi lebih rumit. Masih banyak yang tidak jelas. Jangan tapis, jangan mampatkan, jangan kawal keserasian mono, jangan sediakan untuk keluaran album pelbagai media. Apa yang perlu dilakukan dengan rakaman 5.1 pada peringkat penguasaan?

Dan saya ingin mengatakan satu perkara lagi. Anda boleh mendengar radio FM atau CD sambil melakukan perkara anda sendiri, seperti membaca buku ini. Pada masa yang sama, adalah penting bahawa bunyi itu selesa: tidak sepatutnya ada perubahan dalam kelantangan dan timbre yang mengalihkan perhatian daripada aktiviti utama. Tetapi mendengar lagu dalam format 5.1 "di luar jangkauan pendengaran" hampir mustahil. Format 5.1 itu sendiri membayangkan membenamkan pendengar dalam muzik. Jadi pendekatan lain mungkin tidak melakukan apa-apa pada peringkat penguasaan 5.1 kecuali mungkin menormalkan. Iaitu, semua tanggungjawab untuk kualiti subjektif fonogram akhir dipindahkan ke peringkat pencampuran, dan penguasaan dijalankan berdasarkan prinsip "apa itu, adalah." Tetapi jika pendengar masih memerlukan bunyi yang lebih selesa tanpa perubahan kelantangan, maka dia boleh mendayakan pilihan yang sepadan pada sistemnya (seperti Dayakan Mampatan Julat Dinamik).

Artikel ini adalah berdasarkan saya kerja diploma mengenai topik "Pembangunan prinsip untuk simulasi bunyi sekeliling dalam sektor hiburan", Jabatan Teknologi Maklumat, MAI 2011. Untuk menyesuaikan teks, statistik kering telah dipotong, bahasa dibuat lebih rancak, dan rujukan kepada buku dan artikel yang boleh saya cadangkan telah dimasukkan. Isu yang dibangkitkan akan menarik minat mereka yang masih mengkaji mekanisme penyetempatan yang kukuh. Bahagian perisian tidak dibincangkan dalam artikel. Untuk minat tambahan, bahagian praktikal mencipta mikrofon tiruan binaural tidak dipotong daripada artikel.

Saya ingin mengucapkan terima kasih kepada Boris Klimov kerana mencipta ilustrasi eksklusif, serta Nadezhda Gurskaya untuk menganalisis dan mengedit teks.

pengenalan

tujuan utama realiti maya"menenggelamkan" seseorang dalam ruang permainan, aksi pada skrin (filem, kartun, pawagam 5D) sehinggakan dia lupa tentang realiti dunia di sekelilingnya untuk seketika.

Anda boleh membaca tentang konsep "Immersion", serta "Suspension of Disbelief" berhubung dengan bunyi dan muzik, dalam buku Winifred Phillips - A Composer's Guide to Game Music.

Bunyi sekeliling adalah kunci kepada seseorang dapat merasakan kesan "kehadiran". Persepsi ruang bunyi, jelas, telah lama diminta sebelum kemunculan rakaman bunyi bermakna: selama berabad-abad, premis seperti gereja, teater, dan dewan konsert telah dicipta, di mana pendengar "direndam" dalam ruang bunyi dengan mencipta kesan akustik semulajadi - bergema. Kajian saintifik Tingkah laku akustik di dewan konsert oleh Bose menunjukkan bahawa kira-kira 11% sampai kepada pendengar secara langsung, baki peratusan bunyi datang dalam bentuk pantulan dari dinding, lantai dan siling dan objek lain di sekeliling pendengar, dengan itu menghasilkan kelantangan bunyi. Dari sudut maklumat, 25% maklumat yang diterima seseorang tentang dunia di sekelilingnya datang daripada bunyi.

Pendekatan kepada bunyi di pawagam moden membiasakan pendengar kepada fakta bahawa bunyi boleh dan harus berkualiti tinggi dan realistik. Pembangun profesional moden aplikasi permainan Sehingga 40 peratus daripada bajet dan sumber manusia sementara diperuntukkan untuk bekerja dengan baik. Sebaliknya, sesetengah pembangun permainan dan aplikasi masih perlu diyakinkan untuk menghabiskan masa dan wang untuk melaksanakan bunyi berkualiti tinggi.

Mengenai topik pendekatan yang berbeza, adalah menarik untuk membaca artikel "Skor permainan komputer", bahagian 1 dan 2 dari Christopher (dicari secara bebas di Internet).

Persepsi manusia terhadap bunyi

Pendengaran manusia mampu menangkap bunyi dalam julat dari 16-20 Hz hingga 15-20 kHz. Bunyi dengan frekuensi di bawah 20-30 Hz (infrasound) tidak dirasakan oleh organ pendengaran, tetapi melalui sentuhan, sebagai contoh, melalui getaran permukaan. Kekerapan nilai had bawah spektrum boleh didengar boleh dilihat melalui resonans organ dalaman seseorang. Pada intensiti rendah, bunyi frekuensi rendah mempunyai kesan emosi tambahan (contohnya, kesan subdrop yang popular).

Penurunan dalam julat frekuensi boleh didengar dikaitkan dengan perubahan dalam telinga dalam dan dengan perkembangan kehilangan pendengaran sensorineural yang berkaitan dengan usia. Menjelang umur 60 tahun, julat boleh didengar pada had atas menjadi tidak lebih tinggi daripada 10-12 kHz. Memandangkan kontinjen utama sektor hiburan adalah golongan muda, julat yang dirasakan melalui pendengaran mesti diambil kira sepenuhnya. Tetapi pakar bunyi juga mesti mempunyai pendengaran penuh, dapat mendengar bunyi yang tidak semulajadi dan tidak lengkap, dan dapat mengenal pasti resonans. Dan apa yang tidak penting adalah untuk melindungi pendengaran anda daripada beban berlebihan. Ramai orang dalam industri muzik dan bunyi mengalami tekanan berterusan daripada peralatan tetulang bunyi dan instrumen akustik yang kuat (seperti saya, selepas lebih daripada 12 tahun bermain alat perkusi). Lelaki moden terdedah kepada kesan negatif bunyi ambien, yang mengurangkan sensitivitinya dan membosankan had atas frekuensi sebelum kehilangan pendengaran semula jadi. Tidak perlu mengabaikan perlindungan pendengaran seperti penyumbat telinga. Bunyi frekuensi rendah juga boleh memberi kesan negatif.

Butiran lanjut tentang kesan negatif bunyi (termasuk teknikal) boleh didapati dalam buku oleh Chadd G. - Sound.

Persepsi bunyi adalah individu, ia bergantung kepada konfigurasi (bentuk) auricle, ciri fisiologi, umur dan mood psikologi pada masa tertentu. Di kawasan yang sedang dipertimbangkan, persepsi yang baik juga bergantung kepada:
- peranti pembiakan (pembesar suara peranti main balik, fon kepala, pembesar suara, sistem berbilang saluran),
- bilik di mana pendengaran dijalankan,
- kualiti alat transformasi (contohnya, pelaksanaan pemproses bunyi, enjin),
- pematuhan kepada prinsip mencipta gambar bunyi yang betul apabila ia datang kepada reka bentuk bunyi.

Mekanisme penyetempatan sumber bunyi oleh pendengaran manusia

Keupayaan seseorang untuk menyetempatkan sumber bunyi di angkasa adalah berdasarkan prinsip pendengaran binaural. Binaural (dari bahasa Latin bini - "dua" dan auricula - "telinga") struktur sistem pendengaran terletak pada persepsi berbeza isyarat bunyi yang datang ke telinga kanan dan kiri. Algoritma penyetempatan sumber bunyi:
- isyarat bunyi yang terpancar dari sumber bunyi dan pantulan bilik memasuki bahagian luar sistem pendengaran, di mana konfigurasi auricle memungkinkan untuk menghantar isyarat yang diproses frekuensi ke saluran pendengaran luaran,
- isyarat masuk ke dalam gegendang telinga manusia, mekanisme telinga dalam mula berkuat kuasa,
- dari telinga dalam, maklumat memasuki bahagian otak, di mana, berdasarkan analisis perbandingan isyarat yang diterima dari setiap saluran pendengaran, kesimpulan dibuat tentang lokasi sumber bunyi.

Otak manusia membandingkan maklumat yang datang dari gegendang telinga dengan maklumat yang sudah disimpan dalam ingatan.

nasi. 1. Struktur bahagian luar sistem pendengaran manusia

Anda boleh membaca secara terperinci tentang struktur pendengaran luaran dan dalaman dan banyak lagi dalam buku oleh Irina Aldoshina dan Roy Pritts - Musical Acoustics, bab "Persepsi Bunyi. Asas psikoakustik"

Untuk menentukan lokasi sumber bunyi dalam ruang, sistem pendengaran menggunakan mekanisme penyetempatan asas: mengikut perbezaan masa, dengan perbezaan keamatan, dengan perbezaan dalam spektrum frekuensi amplitud. Mekanisme tambahan termasuk pantulan bunyi dari badan dan bahu manusia, bergema, oklusi (bunyi yang melalui halangan), halangan (bunyi ditapis oleh halangan), kesan Doppler, kesan Haas (kesan keutamaan). Jangan lupa tentang kesan persepsi psikologi: jika sumber dalam ruang yang kelihatan tidak sepadan dengan bunyi atau sinkronisitas terganggu, kualiti penyetempatan menurun dengan mendadak.

Ia adalah perlu untuk menentukan kedudukan spatial sumber bunyi dengan kehadiran gangguan bunyi. Terdapat mekanisme semula jadi imuniti bunyi sistem pendengaran. Salah satu daripadanya ditunjukkan dalam pelepasan binaural daripada penyamaran. Fenomena ini adalah lebih mudah untuk menyetempatkan isyarat audio pada latar belakang bunyi statik (contohnya, bunyi persekitaran).

Beberapa perkataan tentang ketelusan bunyi. Saya akan bawa awak contoh terkenal. Mari kita bayangkan beberapa lukisan kontur haiwan bertindih antara satu sama lain. Pengecaman corak yang digabungkan dalam ruang adalah lebih sukar, lebih dekat bentuk haiwan yang digambarkan (istilah bentuk mempunyai makna yang sama seperti dalam isyarat bunyi). Jika lukisan ini tersebar di angkasa, maka tugas mengenal pasti haiwan mengikut bentuk menjadi lebih mudah.

Penyetempatan mengikut perbezaan masa (fasa penyetempatan)

Mekanisme ini beroperasi pada frekuensi dari 300 Hz hingga 1.5 kHz. Disebabkan perbezaan kedudukan telinga kiri dan kanan, bunyi yang datang dari sumber yang terletak pada sudut ke arah hadapan mengambil masa yang berbeza untuk sampai ke gegendang telinga.

nasi. 2. Contoh skematik penyetempatan fasa

Memandangkan masa yang sama diambil untuk mencapai isyarat dari telinga kiri dan kanan, mekanisme ini akan menyetempatkan sumber pada azimut 0 dan 180 darjah. Masa yang berbeza untuk mencapai gegendang telinga mengakibatkan peralihan fasa. Sistem pendengaran membezakan peralihan fasa sehingga 10-15 darjah. Dengan peningkatan kekerapan, dan sewajarnya, dengan pengurangan panjang gelombang bunyi, peralihan fasa isyarat yang datang dari sumber yang sama ke telinga yang berbeza meningkat. Sebaik sahaja anjakan mencapai nilai hampir separuh panjang gelombang bunyi, mekanisme berhenti berfungsi. Otak manusia tidak dapat dengan jelas menentukan sama ada isyarat bunyi dalam salah satu saluran pendengaran ketinggalan di belakang yang lain atau, sebaliknya, memajukannya.

Perbezaan masa maksimum yang sepadan dengan anjakan lengkap sumber bunyi ke kanan atau kiri tidak boleh melebihi 630 μs.

Jarak antara telinga kanan dan kiri orang dewasa ialah 0.15 m-0.20 m, jika kita mengambil nilai purata mengikut jantina. Dengan sumber yang memancarkan gelombang bunyi dengan frekuensi 20 Hz dan kelajuan bunyi 340 m/s, panjang gelombang akan menjadi 17 m. Oleh itu, jika seseorang membelok satu sisi ke sumber, maka peralihan fasa isyarat tiba dalam satu telinga dan kemudian di telinga yang lain , akan menjadi kira-kira 1.1% daripada keseluruhan tempoh gelombang 20 Hz (penyetempatan pada frekuensi rendah sedemikian adalah mustahil). Secara fisiologi, ketepatan penyetempatan bergantung pada saiz kepala, iaitu jarak antara telinga. Semakin jauh jarak ini, semakin besar perbezaan isyarat bunyi yang tiba di setiap telinga.

Apabila bunyi dikeluarkan oleh sumber yang terletak pada sudut tertentu ke arah hadapan, tahap tekanan bunyi pada gegendang telinga dalam telinga yang berbeza akan berbeza. Ini disebabkan oleh fakta bahawa satu telinga akan "dalam bayang-bayang" yang dicipta oleh kepala, dan juga disebabkan oleh fakta bahawa gelombang bunyi di atas 1000 Hz melemahkan dengan cepat di angkasa.

nasi. 3. Contoh skematik penyetempatan mengikut tahap keamatan

Mekanisme ini agak berkesan, tetapi dalam julat frekuensi audio daripada 1600 Hz. Apabila panjang gelombang bunyi adalah setanding dengan diameter kepala manusia, telinga yang paling jauh dari sumber tidak lagi berada dalam "bayangan akustik", yang disebabkan oleh fenomena pembelauan gelombang bunyi pada permukaan kepala. Pada masa yang sama, secara eksperimen telah didedahkan bahawa keupayaan telinga manusia untuk menentukan sudut antara dua sumber dalam satah mendatar dalam julat frekuensi 1500-2000 Hz berkurangan secara mendadak.

Mekanisme ini membantu menentukan jarak ke sumber bunyi. Walau bagaimanapun, tahap bunyi daripada sumber yang lemah, tetapi dekat boleh sama dengan dari sumber yang kuat, tetapi jauh. Di bawah keadaan sedemikian, penyetempatan difasilitasi oleh mekanisme berikut.

Penyetempatan mengikut perbezaan dalam spektrum frekuensi amplitud

Mekanisme ini berdasarkan keupayaan otak untuk menganalisis penurunan frekuensi dan kenaikan frekuensi tertentu dalam isyarat kompleks. Bunyi yang tiba pada sudut 90° mengandungi kedua-dua komponen frekuensi rendah dan frekuensi tinggi, dan dalam spektrum bunyi yang bertindak pada telinga jauh, akan terdapat lebih sedikit komponen frekuensi tinggi - kesan pelindung kepala. Di samping itu, isyarat bunyi dipantulkan secara berbeza daripada bahagian auricle, dan bahagian spektrum bunyi yang berbeza diperkukuh dan lemah.

Mekanisme ini bertanggungjawab untuk penyetempatan depan ke belakang dan satah menegak. Kajian kesan penapisan kepala dan telinga pendengar memungkinkan untuk memperkenalkan konsep jalur bearing. Apabila menyetempatkan, seseorang tidak menganalisis keseluruhan spektrum bunyi masuk, tetapi hanya berubah dalam beberapa frekuensi. Jalur sedemikian telah terbentuk secara evolusi; pendengaran telah membangunkan sistemnya sendiri untuk menjejak dan memberi amaran bahaya, menyetempatkan dengan tepat dari mana ancaman itu datang.

Perubahan dalam jalur dari 16 hingga 500 Hz dan dari 2 hingga 6 kHz bertanggungjawab untuk penyetempatan sumber bunyi hadapan. Jalur dari 0.7 hingga 2 kHz - menukar timbre sumber yang mungkin terletak di belakang.

Isyarat dengan komposisi spektrum kompleks disetempatkan dengan lebih baik, dan deria arah "depan-ke-belakang" dibentuk terutamanya oleh jalur arah di mana kebanyakan kuasa isyarat tertumpu. Nada tulen, yang boleh dikatakan tidak pernah ditemui dalam alam semula jadi, disetempatkan lebih teruk daripada isyarat kompleks. Oleh itu, nada tulen melebihi 8000 Hz sukar untuk disetempatkan. Ia juga mustahil untuk menentukan lokasi sumber bunyi frekuensi rendah - kurang daripada 150 Hz.

Penyetempatan dalam satah menegak adalah lebih teruk daripada satah mendatar. Tanpa pengaruh psikologi, visual, hampir mustahil untuk mencipta tiruan objek yang sepatutnya terletak, contohnya, di atas. Bunyi ini mestilah sekurang-kurangnya biasa dan dijangka.

Gibson D., dalam buku dan videonya, mengemukakan konsep susunan menegak instrumen dalam campuran muzik mengikut pic (tessitura) atau forman (kawasan nada separa yang diperkuatkan), kerana dalam satah menegak, bunyi -peralatan pembiakan dibina atas prinsip yang sama. Disebabkan oleh silang akustik dengan sempadan yang ditentukan, isyarat kompleks dibahagikan kepada jalur frekuensi. Dalam sistem tiga hala, terdapat woffer di bahagian bawah untuk menghantar frekuensi rendah, di bahagian tengah terdapat pemacu pertengahan untuk midrange dan tweeter di bahagian atas sistem untuk menghantar frekuensi tinggi. Dan sub-woffer menghantar beberapa maklumat melalui lantai. Pendekatan ini menarik, tetapi tidak sesuai untuk banyak sistem, contohnya, apabila menggunakan fon kepala atau mana-mana sistem lain tanpa jalur.

Butiran lanjut mengenai prinsip yang diterangkan boleh didapati dalam buku Gibson D. - A Visual Guide to Recording and Producing.

Namun begitu, mengurangkan keamatan frekuensi rendah secara psikoakustik membantu "menaikkan" objek, menjadikannya lebih ringan.

Menggerakkan sumber bunyi

Sehingga tahun 1960-an, kajian tentang keupayaan manusia untuk menyetempatkan sumber bunyi di angkasa terutamanya tertumpu kepada sumber bunyi pegun. Selepas itu, kajian persepsi manusia dan sumber bunyi bergerak bermula: ciri-ciri utama persepsi ditentukan.

Dalam perjalanan penyelidikan, ternyata bahawa untuk seseorang mempunyai sensasi pergerakan bunyi, masa tertentu diperlukan - tetingkap masa. Ia berkisar antara 0.08 hingga 0.12 s. Menyetempatkan bunyi pendek dan pegun (contohnya, klik yang berlangsung kira-kira 0.001 s) agak mudah.

Seseorang juga boleh membezakan kelajuan pergerakan sumber bunyi: semakin tinggi (dalam had tertentu), semakin halus keupayaan ini. Jika sumber bunyi bergerak pada kelajuan 90°/s (pergerakan sepanjang separuh perimeter di hadapan kepala subjek), seseorang membezakan perubahan kelajuan sebanyak 15%; dan pada kelajuan pergerakan 360°/s - sebanyak 5.5%.

Sekiranya sumbernya tidak bergerak, maka untuk menyetempatkannya, seseorang secara tidak sedar membuat pergerakan mikro kepala, yang meningkatkan ketepatan menentukan kedudukan sumber di angkasa dengan susunan magnitud.

Kesan

Untuk menyampaikan bunyi secara munasabah daripada sumber yang bergerak, adalah perlu untuk mengambil kira (kesan perubahan dalam kekerapan bunyi dari sumber apabila ia bergerak secara bukan jejari berbanding pendengar). Mengikut perasaan subjektif kesannya, bunyi berubah secara mendadak dalam nada - ia menjadi lebih tinggi apabila objek mendekati dan lebih rendah apabila ia bergerak menjauh. Dalam bidang permainan, kesan Doppler memainkan peranan penting. Terutama apabila ia datang kepada simulator kereta dan aplikasi lain yang berkaitan dengan pergerakan pantas objek. Kesan Doppler ialah pemalam biasa untuk penjujukan, dan, setakat yang saya tahu, wujud dalam banyak enjin bunyi.

Salah satu kesan utama mencipta ruang ialah kesan gema (proses pantulan berulang isyarat bunyi dari pelbagai permukaan dengan penurunan beransur-ansur dalam keamatannya). Getaran simulasi mempunyai beberapa parameter - masa pantulan awal, masa pantulan lewat, kadar pereputan, peratusan isyarat "kering" dengan isyarat yang diproses. Parameter ini menunjukkan saiz bilik dan lokasi sumber bunyi di dalamnya berbanding dengan pendengar. Dalam kerja saya, saya menggunakan reverberator konvolusi secara eksklusif, menggunakan impuls dari bilik sebenar kepada mereka. Tanpa pergi ke perincian teknologi, impuls itu sendiri adalah bunyi "cast" dari bilik ( fail wav), yang memodulasi fail audio asal, dengan itu meletakkannya dalam ruang simulasi. Dalam bidang muzik, teknologi konvolusi telah digunakan untuk masa yang lama, jadi dalam cangkerang Kontakt (4,5) dari NI, reverb konvolusi dengan set denyutan dimasukkan dalam senarai kesan standard.

Sistem bunyi. Sistem binaural

Terdapat dua pendekatan utama untuk mengatur sistem bunyi moden dalam bilik: sistem berbilang saluran dan sistem dua saluran (termasuk fon kepala). Dalam sistem berbilang saluran, bunyi dihantar daripada monitor yang diletakkan di hadapan dan di belakang (atau di sekeliling) pendengar.

Butiran lanjut tentang sistem monaural, binaural, stereofonik dan berbilang saluran serta selok-beloknya boleh didapati dalam buku oleh Yu. Kovalgin - Penyiaran stereofonik dan rakaman bunyi.

Untuk meningkatkan kesan spatial, pengeluar cuba mempromosikan konsep sistem yang bukan lagi lima, tetapi enam, tujuh dan malah sembilan saluran. Menambah bilangan saluran memerlukan merumitkan kerja jurutera bunyi, menambah bilangan sistem pembesar suara, menampal wayar, dan penggunaan penguat yang lebih kompleks, dan, oleh itu, membolehkan peningkatan hasil jualan.
Tidak semua pengguna memerlukan sistem audio berbilang saluran. Bagi sesetengah orang, ini tidak boleh diterima atas sebab ekonomi; yang lain tidak boleh memperuntukkan ruang di ruang kediaman mereka untuk sistem hiburan rumah. Sesetengah orang, atas sebab yang jelas, lebih suka menggunakan fon kepala (pada waktu malam, apabila bergerak dalam pengangkutan awam, dll.).

Hanya dua telinga memberikan seseorang semua maklumat yang diperlukan tentang objek, yang bermaksud bahawa hanya dua pembesar suara cukup untuk menghantarnya. Apabila menggunakan rakaman binaural, sumber bunyi yang jelas, apabila fon kepala digunakan, diletakkan di luar kepala pendengar ke tempat di mana sumber bunyi sebenar berada. Sebaliknya, apabila mendengar isyarat stereofonik konvensional melalui fon kepala, sumber bunyi yang jelas dirasakan berada di dalam kepala pendengar.

Kemunculan gema menyukarkan untuk menganggarkan azimut sumber bunyi jelas di kawasan belakang, di mana pendengar sering menunjukkan arah hadapan cermin yang sepadan dan bukannya arah sebenar. Fenomena ini berlaku terutamanya apabila masa dengung standard dalam bilik mendengar melebihi 0.3 s.

Penghantaran yang betul maklumat spatial apabila dihasilkan semula menggunakan dua monitor adalah mungkin, tetapi walaupun sedikit (kira-kira 9-15 cm) anjakan pusat kepala pendengar ke kiri atau kanan dari titik ini membawa kepada fakta bahawa penyetempatan sumber bunyi yang jelas adalah mustahil di luar. tumpuan paksi monitor.

Pada titik pendengaran yang optimum, sistem binaural memberikan bunyi yang lebih yakin daripada stereo konvensional. Walau bagaimanapun, aplikasinya sangat terhad: main balik menggunakan fon kepala, penyiaran radio mudah alih dan peralatan pembiakan bunyi, pemodelan komputer. Binaural sistem bunyi Tidak begitu sesuai untuk keadaan mendengar kumpulan.

Apabila memainkan isyarat binaural melalui sistem pembesar suara, herotan silang berlaku disebabkan oleh isyarat saluran kanan memasuki telinga kiri pendengar dan sebaliknya.

Dalam realiti reka bentuk bunyi permainan, fail audio binaural yang direkodkan tidak digunakan, kerana mustahil untuk mengubah kedudukan mereka di ruang angkasa, tidak ada sumber maya dan pendengar maya, ini bukan pemodelan.

Algoritma

Algoritma utama, yang menggunakan mekanisme asas penyetempatan bunyi manusia, dilaksanakan dalam HRTF (Fungsi Pemindahan Berkaitan Kepala - fungsi bunyi bergerak relatif kepada pendengar. HRTF ditentukan secara kuantitatif oleh pekali transformasi Fourier integral songsang yang dipanggil HRIR (Head Related). Tindak Balas Impuls), yang dalam anggaran pertama ditentukan oleh nisbah tekanan pada gegendang telinga telinga gelombang bunyi dalam ruang bebas (medan bebas) dan dalam ruang sebenar, dengan mengambil kira kepala, telinga, badan dan halangan lain seseorang. .

HRTF mewakili fungsi kompleks dengan empat pembolehubah: tiga koordinat spatial dan kekerapan. Apabila menggunakan koordinat sfera untuk menentukan jarak ke sumber bunyi yang lebih besar daripada satu meter, sumber bunyi diandaikan berada dalam medan jauh, dan nilai HRTF menurun secara songsang dengan jarak. Kebanyakan pengukuran HRTF dibuat dalam medan jauh, dan bilangan pembolehubah dikurangkan kepada tiga: azimut, ketinggian dan kekerapan. Kesan HRTF bergantung pada julat frekuensi isyarat yang sedang diproses: hanya bunyi dengan nilai komponen frekuensi antara 3000 Hz dan 10000 Hz boleh berjaya ditafsirkan menggunakan fungsi HRTF. Jika isyarat daripada sumber bunyi tidak mengandungi frekuensi khas yang menjejaskan perbezaan antara fungsi HRTF hadapan dan belakang, maka isyarat sedemikian tidak akan disetempatkan dalam arah depan ke belakang.

HRTF telah disimulasikan menggunakan mannequin KEMAR (Manikin Elektronik Tanpa Pengetahuan untuk Penyelidikan Auditori) dan "telinga digital" khas yang dibangunkan oleh Sensaura. Mikrofon diletakkan di telinga peragawati, dan pembesar suara diletakkan di sekeliling peragawati, menghasilkan rakaman apa yang didengari oleh setiap telinga. Hasil yang diperoleh daripada pemodelan tersebut digunakan untuk mengembangkan pangkalan data HRTF, yang kemudiannya boleh digunakan untuk memilih parameter secara interaktif apabila memainkan audio 3D yang diposisikan (Sensaura mempunyai lebih daripada 1,100 HRTF dalam pangkalan datanya). Keperluan untuk pangkalan data sedemikian dijelaskan, pertama, oleh perbezaan dalam saiz dan bentuk kepala dan telinga peragawati dan pendengar yang berpotensi dan, kedua, zon titik manis yang dipanggil ditentukan oleh parameter ini, di mana kesan bunyi dalam satah menegak dicipta semula dengan betul dan dijamin definisi yang betul lokasi sumber bunyi di angkasa. Lebih besar kawasan sweet spot, lebih banyak kebebasan bertindak pendengar. Oleh itu, pemaju sentiasa mencari cara untuk meningkatkan kawasan kesan sweet spot.

Apabila melaksanakan teknologi dengan HRTF, QSound bukan sahaja bergantung pada kaedah matematik, tetapi juga pada ujian oleh pendengar (kira-kira 550 ribu sesi mendengar sedemikian telah dijalankan). Pakar Sensaura, selepas beberapa siri eksperimen, menentukan bahawa HRTF masuk bentuk tulen"berfungsi" hanya apabila dimainkan melalui fon kepala. Pemodelan bunyi dalam kes ini adalah tugas remeh: setiap pembesar suara mengawal telinga yang sepadan. Walau bagaimanapun, apabila bunyi yang sama dimainkan melalui pembesar suara, telinga kanan juga mendengar bunyi yang direka untuk "menipu" telinga kiri dari sudut pandangan tiga dimensi, dan sebaliknya. Untuk menghapuskan fenomena ini, pengiraan pampasan tambahan mesti ditambah pada bunyi. Algoritma pampasan yang berjaya telah dibangunkan dan dipanggil Transaural Cross-talk Cancellation (TCC). Masalah itu diselesaikan menggunakan idea lain daripada jurutera Sensaura. Ia terletak pada hakikat bahawa fungsi HRTF hanya berfungsi untuk telinga biasa, kerana ia diperoleh menggunakan patung tunggal atau bacaan purata sekumpulan besar orang. Sensaura telah membangunkan model telinga digital di mana anda boleh menetapkan parameter auricle. Dengan model digital ini, gabungan parameter yang berbeza Anda boleh menghasilkan semula bentuk hampir mana-mana telinga. Pemacu telinga digital yang terhasil berfungsi seperti ini: Apabila dipasang, seseorang mendengar satu siri bunyi ujian dan melaraskan tetapan pemacu untuk mengalami tiga dimensi bunyi yang terbaik. Parameter individu pendengar direkodkan dalam "profil" khas, yang kemudiannya digunakan oleh aplikasi.