І знову про динамічний діапазон. Що таке динамічний діапазон (DR) та його вплив на якість звучання

Слухаючи музику, часто можна зіткнутися із засиллям «басів» у записаній фонограмі. Таке становище склалося під час еволюційного розвитку , коли прагнули розширити спектр музичного твори як і бік високих частот, і у бік низьких.

Для відтворення низькочастотних складових спектру звукових частот нерідко використовують спеціальні гучномовці сабвуфери. Жителям багатоквартирних будинків часом не дають спокою ритмічні удари, що приходять по стінах та перекриттях: це «працюють барабани» ударних музичних інструментів.

Ми сприймаємо звуки завдяки органам слуху (вухам), а області низьких частот ще й усім тілом (за рахунок так званої « кісткової провідності»). З віком діапазон сприйманих верхніх частот звужується, а в області низьких спостерігається підйом, оскільки кістки стають спітнілішими і краще проводять НЧ-коливання. У результаті літній чеповек сприймає звукочастотний спектр музичного твору зовсім по-іншому, ніж молодь. «Барабани» починають дратувати.

Що ж робити? Як знову зробити музику нормальною та «душевною». Для цього можна використовувати підсилювач зі спеціальною приставкою експандером (розширювачем динамічного діапазону), яка, не зменшуючи значення низьких частот у фонограмі, дозволяє підняти рівень середніх та високих.

На відміну від темброблока, підйом рівня цих частот відбувається в динамічному режимі: чим гучніший звук, тим більше посилення УМЗЧ. На якість звуку впливає динамічний діапазон тракту звукопередачі (відношення найбільшої звукової потужності до найменшої). Динамічний діапазон звуку 96 дБ, що заявляється для найбільш поширених зараз носіїв (CD, DVD тощо), не зовсім такий.

Тобто якщо розглядати ставлення найгучнішого сигналу до рівня шумів у паузі цифра, безумовно, правильна. Однак це справедливо лише для сигналів максимальної амплітуди.
Реальні ж звукові сигнали мають досить великий пік-фактор, так що від 96 дБ необхідно відібрати приблизно 15...20 дБ. Ось уже залишилося менше 80 дБ. Потім необхідно врахувати, що в цифрових трактах якість сигналів сильно погіршується при зменшенні їхньої амплітуди.

І сигнал з рівнем -60 дБ передається лише 6 розрядами цифрового коду, а при цьому говорити про скільки-небудь пристойне звучання вже не доводиться. Таким чином, динамічний діапазон CD реально становить величину, значно меншу, ніж 96 дБ. А динамічний діапазон реальних сигналів може бути набагато більшим. Наприклад, для симфонічного оркестру може доходити до 120 дБ.

І як його «впхнути» в обмежений діапазон тракту? Таким чином, під час передачі або під час запису стиснення динамічного діапазону необхідно. Воно здійснюється автоматично за допомогою спеціального пристрою компресора або вручну оператором-тонмейстером. Відновлення природного динамічного діапазону на стороні, що відтворює, можна здійснити, якщо взяти пристрій з характеристикою, зворотною компресору. Такий пристрій називається «експандером».

Для невикривленої роботи експандера необхідно, щоб розширення динамічного діапазону здійснювалося згідно із законом, зворотним компресуванням. Зберегти цю закономірність важко, враховуючи, що компресування часто здійснюється вручну. Через це експандери широкого застосування не знайшли.

Тим не менш, вони дозволяють розширити динамічний діапазон підсилювача на 10...14 дБ при малому рівні спотворень, особливо якщо вибрати криву регулювання з урахуванням оптимального сприйняття слуху. Такі експандери навіть при ручному компресуванні помітно покращують якість відтворення.

Структурна схема розширювача динамічного діапазону (експандер)

Принцип дії експандера пояснює структурну схему на рис.1. Між першим (У 1) і другим (У2) каскадами підсилювача включається дільник, що складається з постійного резистора Rc і Ri, функції якого виконує лампа або транзистор (опір конденсатора Ск на середніх і високих частотах можна знехтувати).

При такому включенні дільника коефіцієнт посилення підсилювача залежить від опору Ri, що визначає коефіцієнт передачі напруги першого каскаду на другий. Зміна опору Ri здійснюється схемою керування. Сигнал з виходу У1 через диференціюючий ланцюжок ДЦ надходить на регулятор ширини динамічного діапазону Rд, з нього на каскад посилення УЗ експандера.

Диференціюючий ланцюжок запобігає спрацьовування експандера при піках напруги в області басів, що мають яскраво виражений ударний характер (барабан, контрабас і т.д.). З виходу УЗ сигнал подається на детектор Д, що виділяє постійну напругу, що управляє, яке через інтегруючу ланцюжок ІЦ подається на керуючий елемент Ri.

Коли напруга звукової частоти на вході підсилювача УЗ незначно, керуюча напруга близько до нуля, опір Ri мало, і на вхід другого каскаду У2 сигнал практично не надходить, оскільки коефіцієнт передачі дільника Rc-Ri дуже малий. У міру зростання вхідного сигналу керуюча напруга та опір Ri збільшуються, що призводить до збільшення коефіцієнта передачі дільника Rc-Ri та коефіцієнта посилення підсилювача.

При максимальних рівнях вхідних сигналів Ri=max, коефіцієнт посилення підсилювача досягає граничного значення, що відповідає максимальному розширенню динамічного діапазону. Регулятор гучності РГ часто встановлюється перед другим каскадом підсилення, щоб регулювання гучності не викликало зміни заданого динамічного діапазону.

Конденсатор Ск забезпечує тон-корекцію в області низьких частот при малих рівнях низькочастотного сигналу. Його дія аналогічна дії конденсаторів у тонкомпенсованих регуляторах гучності, тому частотна характеристика експандера в області низьких частот збігається з кривою чутливості вуха.

АЧХ розширювача динамічного діапазону (експандер)

Постійна часу наростання керуючого напруги на виході інтегруючого ланцюжка становить 0,2 ... 0,3 с, часу спаду - 0,5 ... 0.6. Амплітудно-частотні характеристики експандера, що показують розширення динамічного діапазону, наведено на рис.2.

На низьких частотах є підйом частотної характеристики, що відповідає особливостям звукового сприйняття. Звичайно, при зростанні гучності в процесі розширення динамічного діапазону рівень вже піднятих басів не повинен підніматися такою ж мірою, як рівень середніх та високих частот.

Фізіологічно правильне розширеннядинамічного діапазону зі збільшенням частоти досягається за рахунок конденсатора Ск, ємнісний опірякого на низьких частотах велике. Завдяки тому, що величина максимального розширення динамічного діапазону залежить від частоти та швидко зменшується на частотах нижче 300 Гц, при порівняно невеликому запасі вихідної потужності підсилювача виходить розширення динамічного діапазону близько 10...12 дБ.

Підсилювач з експандером, описаний я випробував у кількох конструкціях (у стереоваріанті, в єдиній конструкції з приймачем та ін.). У процесі експериментів народився модернізований варіант лампового УМЗЧ з експандером (рис.3). Зміни схеми підсилювача торкнулися темброблоку, кінцевого каскаду та ланцюгів живлення.

Параметри підсилювача по відношенню до змінилися на краще, хоча коефіцієнт посилення УМЗЧ трохи знизився за рахунок ультралінійного включення ламп в кінцевому каскаді і темброблока, що працює в ланцюзі посилення сигналу. Частотний діапазон УМЗЧ розширено і становить 20...20000 Гц з нерівномірністю близько 1,5...2 дБ. Глибина регулювання тембру в області НЧ та ВЧ ±20 дБ.

Лампи кінцевого каскаду слід вибирати із однієї партії. Якщо є можливість, краще забрати ідентичні за параметрами екземпляри, використовуючи вимірювач параметрів радіоламп. Вихідний трансформатор має бути з симетричними секціями первинної обмотки. Вони намотуються на вузьких каркасах (кожна), які потім одягаються на сердечник. Вторинні обмотки аналогічні.

Можна застосувати і готовий трансформатор, наприклад, від магнітофона "Дмпро-І" або іншої лампової техніки, що має двотактний вихідний каскад, побудований за ультралінійною схемою. Такий трансформатор забезпечить задовільна якість звучання, хоч і з трохи підвищеним коефіцієнтом спотворень через неповну симетрію вихідного каскаду.

Вторинну обмотку зворотного зв'язку з великою кількістю витків (у трансформаторі від магнітофона «Днтро-1Г») можна використовувати, наприклад, для роботи з трансляційною лінією. Вихідні каскади на тріодах мають низьку вихідний опір(імпеданс), що спрощує вихідні трансформатори та сприяє гарному демпфуванню акустичних систем.

Це тягне у себе збільшення межвитковой ємності у яких і. як наслідок, завал частотної характеристики у сфері високих частот. Через велику різницю в кількостях витків ефект демпфування навантаження в таких підсилювачах ослаблений. Спроба поєднати позитивні якості УМЗЧ із виходом на тріодах та пентодах призвела до ультралінійної схеми включення ламп.

Дійсно, якщо з'єднати екранні сітки ламп VL4 та VL5 з їх анодами, отримаємо тріоди, а з джерелом анодного живлення пентоди. Підключаючи екранні сітки до частини витків первинної обмотки вихідного трансформатора Т2, отримуємо компромісний варіант з усіма наслідками.

Сигнали від різних джерел (мікрофона, телевізора, радіо або трансляційної лінії) вибираються перемикачем SA1 і через розділовий конденсатор С1 надходять в ланцюг сітки лівого (за схемою) тріода лампи VL1. Резистори R1 і R2 служать дільником напруги, що надходить з трансляційної лінії, R3 зменшує клацання при комутації SA1, R4 забезпечує виток для керуючої сітки тріода.

Резистор R8 визначає режим тріода по постійному струмуі одночасно є ланкою негативного зворотного зв'язку струму 34, що зменшує шуми і спотворення каскаду. Резистори R5, R6 і R9 в анодному ланцюзі лівого тріода лампи VL1 служать для узгодження входів експандера та наступного каскаду. Конденсатори С2 та С6 розділові по постійному струму.

Конденсатор С12 та резистор R22 здійснюють частотну корекцію сигналу, необхідну для нормальної роботи експандера. Для зменшення шарудіння, трісків і наведень регулятор гучності перенесений зі входу підсилювача на вхід другого каскаду: переміщенням движка потенціометра R10 проводиться регулювання гучності.

З двигуна цього потенціометра сигнал надходить на сітку керуючого другого тріода VL1, посилюється ним і з анодного навантаження (R12) через розділовий конденсатор С7 подається на темброблок для корекції. Резистор R11 забезпечує автоматичне зміщення робочої точки цього тріода, а конденсатор С5 усуває негативний зворотний зв'язок струму в області високих частот.

Змінні резистори R47 і R50 здійснюють зміну АЧХ в області високих та низьких звукових частот відповідно. З темброблоку скоригований 34-сигнал надходить на сітку керування тріода VL2a. Витік сітки здійснюється через резистори R48, R50, R51. Резистор R20 забезпечує негативне зміщення на сітці цього тріода і негативний зворотний зв'язок по струму 34.

Посилений цим тріодом сигнал із резистора анодного навантаження R21 через конденсатор С17 подається в ланцюг сітки, що управляє, тріода VL3. Резистор R30 забезпечує витік сітки цього тріода. R32 і R33 автоматичне зміщення на сітці цього тріода, а також зворотний зв'язок струму 34 і узгодження негативного зворотного зв'язку з виходу УЗЧ (через R44 з вторинної обмотки вихідного трансформатора Т2).

Тріод VL26 служить фазообертачем: сигнали на навантаженнях R35 і R37 рівні та протилежні по фазі для забезпечення послідовної роботи ламп кінцевого каскаду, виконаного за так званою «пушпульною» (англ. Push-pull) двотактної схемина пентодах VL4 та VL5. Протифазні сигнали подаються в ланцюги сіток пентодів, що управляють, через розділові конденсатори С19 і С20. Конденсатори С21 і С22 усувають негативний зворотний зв'язок струму 34 в кінцевому каскаді.

Ланцюжки R42-C23 і R43-C24 вирівнюють опору секцій первинної обмотки вихідного трансформатора Т2 для струмів 34 різних частот(за їх відсутності можливий навіть міжвитковий пробій в обмотках Т2). Ультралінійна схема включення вихідних ламп проміжна між тріодним та пентодним включенням. Симетричним переміщенням відводів секціям первинної обмотки можна встановити найбільш бажаний режим роботи каскаду.

Чим ближче відведення до анодів ламп, тим якісніший звук, але нижча вихідна потужність. При самостійне виготовленнявихідного трансформатора можна зробити ряд симетричних висновків від первинної обмотки Т2 і при налаштуванні їх перемикати. Вихідний трансформатор виконаний на сердечнику Ш 19×33. Обмотка 1-2 містить 72 витка дроту ПЕЛ 00,69 мм, обмотка 3-4 - 800 витків ПЕЛ 00,15 мм, обмотка 5-6-7 800+600 витків ПЕЛ 00,15 мм. обмотка 7-8-9 - 600+800 витків ПЕЛ 00,15 мм. Дросель фільтра живлення розрахований на струм 150 мА (сердечник Ш 19×28, містить 3000 витків ПЕЛ 00,2 мм).

Експандер працює так. У режимі мовчання, при замкнутих контактах SA2 між ланцюгом проходження сигналу і загальним проводом включена послідовна ланцюжок C4-VL7. Епектронно-оптичний індикатор VL7 (лампа 6Е1П) виступає тут у ролі змінного резистора, керованого амплітудою напруги сигналу, що посилюється. Характеристика експандеру частотнозалежна.

У сфері високих і середніх звукових частот збільшення гучності звуку призводить до збільшення динамічного опору лампи VL7, що викликає збільшення рівня сигналу, що посилюється, тобто. чим гучніший сигнал, тим більший коефіцієнт посилення УЗЧ. Максимальне розширенняскладає 10 ... 14 дБ (VL7 практично закрита).

На низьких частотах експандер фактично не працює за рахунок вибору параметрів коригувального ланцюжка C12-R22, який пропускає на сітку лівого (за схемою) тріода VL6 тільки ВЧ і частково СЧ-складові (через С12), нижні частоти ослаблені великим опором R22.
Змінним резистором R46 регулюється глибина розширення динамічного діапазону.

Конденсатор С13 розділовий, порівняно невеликий ємності, щоб знизити рівень НЧ-складових. Катод лампи з'єднаний безпосередньо із загальним дротом, і зміщення робочої точки здійснюється тільки за рахунок струму сітки. Правий тріод VL6 працює як діод, здійснюючи випрямлення змінної напруги 34.

Далі йде інтегруючий ланцюжок для згладжування пульсацій випрямленої напруги та забезпечення управління лампою VL7 з відповідною динамікою. Резистором R29 проводиться початкова установка режиму індикації лампи VL7 «вузький» сектор без сигналу і нижньому за схемою положенні движка R46.

Живлення підсилювача від мережі змінного струму здійснюється через трансформатор Т1 (від старих радіол класу I). Напруги вказані на схемі, допустима їхня відмінність до ±10%. Точніше лише слід підібрати напругу розжарення (6,3 В), особливо при самостійному намотуванні силового трансформатора. Лампа попередніх каскадів VL1 живиться від окремої обмотки розжарення, між проводами якої включений балансувальний підстроювальний резистор R52.

У повністю зібраному підсилювачіз підключеною акустичною системою та відключеному експандері встановлюють максимальну гучність, регулятори тембру в положення максимальної смуги (підйом низьких та високих частот). Обертанням двигуна R52 на виході встановлюється мінімальний рівень фону змінного струму і шумів.

Напруження до інших ламп підводиться скрученими між собою проводами (від іншої обмотки 6,3 В). З'єднання одного з проводів розжарювання із загальним проводом здійснюється безпосередньо біля однієї з ламп (експериментально, по мінімуму фону). УЗЧ виконаний на такому ж шасі, як в оригіналі, з тією ж розстановкою ламп. Він дозволяє відчути всю красу «м'якого лампового» звуку.

Дуже приємно звучать жіночі соло та дуети, класична музика, естрадні пісні. Слід враховувати, що розширення динамічного діапазону на 10 дБ означає збільшення в 10 разів. Цей підсилювач має вихідну потужність близько 12 Вт, тому не варто намагатися «видавити» з УЗЧ більше, ніж може дати. Крім зростання спотворень, нічого «путнього» не вийде.

Увага! Радіоаматорам, які звикли до низьковольтних транзисторних пристроїв, слід бути особливо обережними при налагодженні цього підсилювача, оскільки ланцюги його високовольтні. Перепаювання деталей можна здійснювати тільки при відключеному напрузі живлення і через 20 ... 30 с, щоб встигли розрядитися електролітичні конденсатори.

(від грец. ἀκούω (аку́о) - чую) - наука про звук, що вивчає фізичну природу звуку та проблеми, пов'язані з його виникненням, поширенням, сприйняттям та впливом.

Акустична система– це електричний пристрій (рис. 2), призначений для перетворення струму змінної частоти на звукові коливання за допомогою електро-акустичного перетворення.

Гучномовець, динамік, динамічна головка(Мал. 3) – основний елемент акустичної системи, який, власне, і перетворює струм змінної (звуковий) частоти в звукові коливання або, просто, в звук.

Звуковий сигналможна уявити, як сукупність різних синусоїдальних складових. Кожна складова характеризується низкою параметрів (рис. 4):

Звуковий діапазонвід 20 до 20 000 Гц (приблизно) – це звук, який ми чуємо. Звичайно, це усереднений інтервал, і у кожної людини він індивідуальний.

Гучність звукувизначається амплітудою сигналу (рис. 5). Чим вище амплітуда звукової хвилі, тим більша гучність.

Звуковий тиск– це змінний надлишковий тиск, що виникає в пружному середовищі під час проходження через неї звукової хвилі.

Висота звукувизначається частотою звукової хвилі(або періодом хвилі). Чим вища частота, тим вище звучання і, відповідно, навпаки (рис. 6).

Тембр звуку- Це «забарвлення звуку». Справа в тому, що звуки різних джерел (музичні інструменти, голоси людей) є сукупність гармонійних коливань різних частот Яка становить найбільшого періоду (найменшої частоти) називається основним тоном. Висота складного звуку визначається саме заввишки його основного тону. Інші складові складного звуку називають обертонами (у них висота більша, ніж у основного) – рис. 7. Набір цих складових і створює фарбу, тембр звуку.

Динамічний діапазон звуку- Це діапазон між самим тихим рівнем, і найгучнішим.

Інфразвук(Від лат. infra- Нижче, під) - Пружні хвилі, аналогічні звуковим, але мають частоту нижче сприймається людським вухом. За верхню межу частотного діапазону інфразвуку зазвичай беруть 16-25 Гц. Нижня межа інфразвукового діапазону умовно визначена як 0,001 Гц. Практичний інтерес можуть становити коливання від десятих і навіть сотих часток герц, тобто з періодами в десяток секунд.

Ультразвук– це пружні коливання та хвилі з частотами приблизно від 1,5-2×104 Гц (15-20 кГц) та до 109Гц(1 ГГц) . Ультразвукову область частот поділяють на три підобласті: ультразвукнизьких частот (1,5×104-105 Гц) - УЗНЧ, ультразвуксередніх частот (105 – 107 Гц) - УзСЧ, ультразвук високих частот (107-109 Гц) - УЗВЧ. Кожна з цих підобластей характеризується своїми специфічними особливостями генерації, прийому, поширення та застосування.

Гіперзвук– це пружні хвилі із частотою від 109 до 1012-1013 Гц. За фізичною природою гіперзвукнічим не відрізняється від ультразвуку.

2. Відтворення звуку
Щоб у повітрі виникла звукова хвиля, необхідне джерело звукових коливань – якесь тіло чи система тіл, які здійснюють механічні коливання з частотою від 20 Гц до 20 кГц. Таким джерелом є, наприклад, динамічний динамік - рис.3.

Динамічний гучномовець (рис. 8) складається з дифузора 6, дифузородержателя 5, центруючий шайби 4, звукової котушки 3, і магнітної системи 1, 2, 8. і центруючий шайбою 4, призначення якої центрувати положення звукової котушки 3 в зазорі магнітної системи. Кільцевий магніт 2 і сердечник 1 (так званий керн) приклеєні до дифузоротримача 5 і шайбі з м'якого заліза 8. Між керном 1 і магнітом 2 є зазор 0,5-2,0 мм, в якому створюється сильне магнітне поле. На паперовому кільці, приклеєному до вузької частини дифузора, намотана тонким ізольованим дротом (40-80 витків), звукова котушка 3. Кінці котушки приклеєні до дифузора і з'єднані гнучким дротом з висновками.

Принцип дії гучномовця дуже простий і ґрунтується на явищі руху провідника зі струмом у магнітному полі. На цей провідник діє сила Ампера. Якщо по звуковій котушці протікає змінний струм звукової частоти, то змінюється сила Ампера, що діє з боку магнітного поля постійного магніту. Котушка здійснює коливання і разом з нею здійснює коливання дифузор, який створює звукову (поперечну) хвилю в повітрі – рис. 9.

Сам собою динамік неспроможна якісно відтворити звук . Для цього його треба помістити в порожнистий корпус, і тоді динамік, встановлений в корпусі, буде акустичною системою. Параметри корпусу (розміри, товщина стінок, розташування динаміка, фазоінвертор і т.д.) мають бути розраховані за спеціальними формулами.
Всім відомо, що для відтворення певного діапазонучастот використовуються різні динаміки: низькочастотні, середньочастотні та високочастотні. Є динаміки, які називають широкосмуговими, але це ілюзія. Жоден динамік неспроможна якісно відтворити весь звуковий діапазон.

4. СТЕРЕОФОНІЯ
З погляду фізики просторова звукова картина, яку сприймає людина, є наслідком інтерференції звукових хвиль. До того ж, повторюю, аналізатором звукової картини є мозок.
Перші експерименти 30-х років ХХ століття з отримання об'ємного звучання (за допомогою трьох-семи каналів) дали дивовижні результати. Було встановлено, що при відтворенні 2-х роздільних каналів суб'єктивна якість звуку різко покращується. А найдивовижніше полягає в тому, що експерти віддавали перевагу стереозвуку навіть у тих випадках, коли їм пред'являли об'єктивно якісніші, але монофонічні фонограми. Вирішальною перевагою стала можливість просторової локалізації здаваних джерел звуку. рис. 27 - розподіл уявних джерел звуку на стереопанораме.

на початковому етапірозробники вирішили обмежитись двома каналами. Це, звісно, ​​насамперед було зумовлено небагатими можливостями апаратури тих часів: грамплатівки реально дозволяли розмістити лише два повноцінні канали.
Стереозвук дає деяку прозорість звучання: партії окремих інструментів стають більш помітними і натомість оркестру. Крім того, стереосистема здатна відтворити подібність до звукової атмосфери приміщення, в якому виконувався запис. Почалася епоха 2-канальних стереофонічних систем. Поступово з'явилися стереофонічні грамплатівки та стереопрогравачі, стереомагнітофони, стереофонічне радіомовлення.
У свою чергу, стереозвучання має істотний недолік. Стереопанорама обмежена кутом між напрямками на гучномовці і виходить плоскою. Таке звучання позбавлене природності реального звукового поля, коли людина здатна сприймати реальні джерела практично з усіх напрямків та оцінювати відстань до джерел звуку. Відчуття об'ємного звучання, що створюється у слухача, могло б істотно збагатити тембри музичних інструментів і голосів співаків. При цьому можна було б імітувати ревербераційний процес, властивий приміщенню, в якому зроблено запис.
Однією з перших спроб подолання недоліків, властивих стереофонічних систем, стала квадрофонія. Для відтворення квадрофонічних фонограм використовуються 4 акустичні системи: див. рис. 28 - розподіл джерел звуку, що здаються, на квадропанорамі.
Перші побутові квадросистеми з'явилися на початку 70-х років минулого століття. Здавалося, що на них чекає славне майбутнє. Однак цього не сталося. Причин є кілька. Одна з них традиційна для багатьох новинок техніки і полягає в тому, що виробники квадрофонічної апаратури так і не змогли дійти єдиного стандарту запису та відтворення 4-канального звуку. Свою роль відіграли недосконалість та велика вартість апаратури чотириканального запису-відтворення. Але головне полягає в іншому: з переходом від «стерео» до «квадро» на той час нову якість звуку не виникло. Квадрофонічні системи, як і стереофонічні, не забезпечували повної передачі властивостей реального звукового поля. Недоліків було лише два, але вони суттєві:

Слід зазначити, що ці недоліки обумовлені не стільки обмеженими можливостями чотириканального відтворення звуку, скільки труднощами реалізації панорамування джерел звуку, що здаються, при записі. Під час підготовки фонограм для сучасних багатоканальних системцей фактор враховується. Важливу рольпри цьому грає комп'ютер, здатний впоратися з моделюванням об'ємних ревербераційних процесів і звукорежисеру, що надає зручні регулятори для переміщення джерел звуку по круговій панорамі.
Але в ті далекі часи квадрофонія відступила, а стереофонія перемогла і почала розвиватися по лінії мініатюризації апаратури, покращення її технічних та споживчих якостей, переходу до нових носіїв: компакт-касет та компакт-дисків. Перед звукозаписуючими компаніями та виробниками аудіоапаратури все ще існував найширший фронт робіт та ємний ринок збуту. Вкотре вони пропонували слухачам зміну фонотек. Нагромаджений на грамплатівках за попередні десятиліття музичний матеріал, оновлений та адаптований спочатку під монофонічні котушкові магнітофони, Потім реалізований на компакт-касетах у стереоформаті, вкотре пропонувався меломанам, але тепер вже на лазерних дисках.

5. ПРОЩАЙ, СТЕРЕОФОНІЯ?!
Однак наприкінці XX століття стереофонія, здається, таки почала здавати свої позиції. Цифрові технологіїзаписи звуку, а також ємні, зручні та дешеві носії зняли проблему зберігання багатоканальних фонограм великої тривалості. Крім того, в звуку, що передає акустичні властивості навколишнього простору, виникла гостра потреба. Віртуальні графічні світи комп'ютерних ігорстають все більш складними та схожими на реальність, а отже, вимагають і адекватного звукового оформлення. Кінематограф, який пережив кризу у змаганні з телебаченням, відродився у вигляді домашніх кінотеатрів та кінозалів нового формату, основна відмінність яких від попередників криється не в зображенні, а в принципово новому звуку (хоча і якість зображення теж покращилася завдяки DVD і сучасним проекційним засобам).
Нова ера в звукозаписі почалася в результаті досліджень, виконаних інженерами Dolby Laboratories. Це був новий підхід до передачі багатоканального звуку. Відмінність традиційного способу полягала, передусім, у цьому, що з зберігання аудіосигналів двох додаткових каналів використовувалося матричне кодування, тобто. їх підмішування до основних двох каналів. Змінився і спосіб розміщення акустичних систем: додатково до традиційного для квадрофонії розташування акустичних систем по кутах приміщення додано центральний канал, розміщений між правим та лівим фронтальними каналами, щоб зберегти широку стереобазу для глядачів, що сидять на бічних місцях, а за спинами розміщено канал ефектів (Surround) ). Так виникла система нового кінотеатрального звучання Dolby Stereo. рис. 29 – розміщення випромінювачів звуку у системі Dolby Stereo.
Як уже було сказано, цей чотириканальний формат є матричним форматом, при якому звук, призначений для кожного з чотирьох каналів, кодується та записується на два канали, а при відтворенні декодується знову в чотири канали: лівий, центральний, правий та задній. Сигнал заднього каналу, як правило, спрямовується на дві тилові акустичні системи одночасно. Вперше формат Dolby Stereo був застосований у фільмі "Star Wars" у 1975 році.

Системою відтворення абсолютно нової якості, сумісної зі старим стандартом звукозапису, стала система Dolby Pro Logic. У ній був застосований декодер, що реалізує просторове фокусування звукових образів: технологію, що використовується для зниження взаємного проникнення сигналів одного каналу в інший. У Dolby Pro Logic також виникла можливість створювати затримку звукового сигналу в тиловому каналі. Тим самим було забезпечено узгодження геометричних та акустичних характеристикконкретного приміщення з характеристиками «еталонного кінозалу», під який під час виробництва зводився мультитрековий звук. Дуже важливо, що наразі накопичено величезну кількість музики, фільмів, телепрограм, записаних на різних сучасних носіяхзі звуком у форматі Dolby Pro Logic. А потім настала епоха цифрового кодування та цифрового записубагатоканального об'ємного звуку, і з'явилася система Dolby Digital. Для кодування цифрового звуку використовується алгоритм, званий АС-3(Dolby's third generation audio coding algorithm – алгоритм кодування звуку Dolby третього покоління). АС-3 є алгоритмом компресії багатоканального звуку (кількість незалежних каналів від 1 до 6) із втратами. використовуються в ньому для прийняття рішення про те, яку частину інформації в аудіосигналі можна відкинути, щоб це було не дуже помітно для людського вуха. до 640 Кбіт/с (для каналів 5.1 з мінімальними втратами якості) Типовий бітрейт для 5.1 записів складає 385 Кбіт/с.
Використовується стиснення даних із втратами, проте якість звуку все одно виходить вищою, ніж у попередніх аналогових систем.
Dolby Digital може забезпечити кодування до 6 каналів у форматі 5.1 , де 5 – це канали з повним частотним діапазоном (20 – 20 000 Гц) та .1 - канал низькочастотних (менше 120 Гц) ефектів (LFE).
Об'ємність акустичних сцен, чіткіша деталізація, природність переміщень джерел звуку з фронтальної області в тилову, стереофонічне звучання в тиловій області – все це забезпечило успіх системи.
Позначення « 5.1 » вказує на кількість каналів, але не несе в собі інформації про певний спосіб кодування багатоканального звуку. Використовується п'ять каналів з повним частотним діапазоном (лівий передній, центральний, правий передній, лівий задній та правий задній), а також один низькочастотний канал (з діапазоном від 3 до 120 Гц), що підключається до сабвуфера (рис. 30 - розміщення випромінювачів звуку системі 5.1).
У системі 5.1 формується кругова стереопанорама. Оскільки на наднизьких частотах наш слух практично позбавлений здатності визначати напрямок на джерело звуку, розташування сабвуфера не має істотного значення.
Сабвуфер застосовується у звичайних стереосистемах. У його канал подається низькочастотна частина спектра сумарного сигналу стереоканалів, у результаті забезпечується гарантоване відтворення басових звуків. Однак у системі 5.1 канал низькочастотних ефектів відіграє особливу роль. Його варто розглядати не як низькочастотний компонент багатосмугової акустичної системи, а саме як незалежний канал низькочастотних ефектів.
На думку фахівців, формат 5.1 є найперспективнішим, оскільки підтримується основними розробниками. Важливо, що є відповідні носії (DVD).
І хоча поки що не прийнято єдиний стандарт і одночасно існує кілька систем кодування для 5.1, проте фіаско «первісної» квадрофонії навряд чи повториться, навіть якщо «виживе» не одна, а кілька різних систем кодування. Принципова відмінність формату 5.1 від квадрофонії тридцятирічної давності полягає в тому, що в даному випадкуаудіосигнал має цифрову форму, тому створення універсального декодера, здатного працювати зі звуком, закодованим різними системами, не викличе особливих труднощів і призведе до помітного подорожчання апаратури.
В успіху формату 5.1 зацікавлені виробники аудіо-, відеоапаратури, комп'ютерів, комп'ютерних комплектуючихта програм. До нього цікаво ставляться споживачі: глядачі, слухачі, геймери. Звукорежисери та музиканти знаходять у цьому форматі нові виразні засоби для реалізації творчих задумів та посилення впливу на наші емоції. Формат справді надає відтворюваному звуку нову якість: слухач оточений ним. Щоправда, віртуальний звуковий світ у цьому випадку не дотягує до реального. У синтезованому звуковому просторі джерело звуку може бути праворуч, ліворуч, спереду, ззаду, переміщаючись у цих «координатах». А справжній звуковий простір, крім того, має ще «верх» і «низ».

6. Деякі висновки

  • «Стереофонічне» і «просторове» звучання – це зовсім не те саме, хоча саме слово «СТЕРЕО» перекладається з грецької як «ПРОСТІР». Але, як бачимо, одне – назвати ефект чи процес, і зовсім інше – реалізувати його практично.
  • Майже за 80 років боротьби за «реальний» звук системи відтворення пройшли кілька етапів:
    • ПСЕВДОстерео – це коли один сигнал в одній (або кількох) звуковій колонці відтворювався через роздільні фільтри різними динаміками;
    • КВАЗІстерео - це коли один сигнал штучно поділявся на два з різними параметрами, потім кожен з них посилювався своїм підсилювачем і відтворювався свій звуковою колонкою, як у попередньому випадку;
    • СТЕРЕО – коли два сигнали записувалися окремо, відтворювалися окремо, і кожен їх посилювався своїм підсилювачем і відтворювався свій звуковий колонкою, як у попередньому випадку;
    • ПСЕВДОквадро – коли стереосигнал кожного каналу з ослабленням подавався на відповідні тилові колонки, ліву та праву;
    • КВАЗІквадро - коли стереосигнал піддавався спеціальної обробки за допомогою приставки і далі подавався на відповідні тилові колонки, ліву та праву;
    • КВАДРО - коли чотири сигнали записувалися окремо, відтворювалися окремо, і кожен з них посилювався своїм підсилювачем і відтворювався свій звуковий колонкою, двома фронтальними та двома тиловими;
    • Dolby Stereo Dolby Pro Logic Dolby Digital.
  • Жодна, навіть сама сучасна системанеспроможна створити реальну звукову панораму.

Акустика- Цей термін має й інші значення.

Не зовсім правильне, зате досить просте та зрозуміле визначення динамічного діапазону.

Дифузор гучномовця під час руху вперед стискає повітря перед собою і розріжує його ззаду. Такі стискання та розрідження повітря рівномірно розподіляються попереду та ззаду дифузора. Огинаючи дифузор, вони "накладаються" один на одного і взаємно знищуються. Під час руху назад виходить та сама картина. Такий ефект називається акустичним. «коротким замиканням». Замість того, щоб передавати звукові коливання, дифузор переганяє повітря з одного боку на інший.

Математичний розрахунокакустичних систем виходить далеко за межі цієї статті.

Коронуючий електрод– це електрод, у якому виникає коронний електричний розряд.

З'явився так званий « широкий» або « широкоформатний» Екран, який використовується зараз у всіх кінотеатрах.

Вухо людиниі весь слуховий апаратслужать ТІЛЬКИ для передачі звукових сигналіву мозок. Саме мозокобробляє та формує в людській свідомості просторову (об'ємну, стереофонічну) звукову картину.

Звукова панорама- Це область простору, в якій розташовуються джерела звуку.

Реверберація- це процес поступового зменшення інтенсивності звуку за його багаторазових відбиття від різних предметів у приміщенні. Фактично цей ефект просто відчути в порожньому приміщенні - багаторазове відбиття від стінок.

Я особисто з цим не згоден. Коли я чув якісний квадрофонічний запис, я відчував себе всередині оркестру. Може, це мені здавалося, бо я знав, що мав почути.

Можливо це й такале по глибині (далі-ближче) я розрізняв джерела звуки. А ось що вище чи нижче – цього справді не було.

Психоакустика- наукова дисципліна, що вивчає психологічні та фізіологічні особливості сприйняття звуку людиною.

Термін бітрейтвикористовується у двох основних значеннях:
- характеристика каналу чи пристрою – максимальна кількість біт, яку можна передати в одиницю часу;
- величина потоку даних, що передається у реальному часі (мінімальний розмір каналу, який зможе пропустити цей потік без затримок). Окремий випадок- бітрейт стисненого звуку чи відео.

Партнерський матеріал

Вступ

Одне з п'яти почуттів, доступних людині, – чутка. За допомогою нього ми чуємо навколишній світ.

Більшість із нас має звуки, які ми пам'ятаємо з дитинства. У когось це голоси рідних і близьких, чи скрип дерев'яних мостинок у бабусиному будинку, чи, можливо, це стукіт коліс поїзда по залізниціяка була поруч. У кожного вони будуть своїми.

Що ви відчуваєте, коли чуєте чи згадуєте звуки, знайомі з дитинства? Радість, ностальгію, смуток, тепло? Звук здатний передавати емоції, настрій, спонукати до дії або, навпаки, заспокоювати та розслаблювати.

Крім цього, звук використовується в різних сферах людського життя– у медицині, в обробці матеріалів, у дослідженнях морських глибин та багатьох, багатьох інших.

При цьому, з погляду фізики, це лише природне явище – коливання пружного середовища, а отже, як і в будь-якого природного явища, у звуку є характеристики, деякі з яких можна виміряти, інші – лише почути.

Вибираючи музичну апаратуру, читаючи огляди та описи, ми часто стикаємося з великою кількістю цих характеристик і термінів, які автори використовують без відповідних уточнень і пояснень. І якщо деякі з них зрозумілі і очевидні кожному, то інші для непідготовленої людини не мають ніякого сенсу. Тому ми вирішили простою мовоюрозповісти вам про ці незрозумілі та складні, на перший погляд, слова.

Якщо згадати своє знайомство з портативним звуком, то почалося воно досить давно, і це був такий касетний плеєр, подарований мені батьками на Новий рік.

Він іноді жував плівку, і тоді доводилося розплутувати її скріпками та міцним словом. Він поглинав батарейки з апетитом, якому позаздрив би Робін Бобін Барабек (який з'їв сорок чоловік), а значить, і мої, на той момент дуже мізерні заощадження звичайного школяра. Але всі незручності тьмяніли в порівнянні з головним плюсом - плеєр давав неймовірне відчуття свободи і радості! Так я «захворів» на звук, який можна взяти з собою.

Однак я погрішу проти істини, якщо скажу, що з того часу завжди був нерозлучний із музикою. Були періоди, коли було не до музики, коли у пріоритеті було зовсім інше. Проте весь цей час я намагався бути в курсі портативного аудіо, що відбувається в світі, і, так би мовити, тримати руку на пульсі.

Коли з'явилися смартфони, виявилося, що ці мультимедійні комбайни вміють не лише дзвонити та обробляти величезні обсяги даних, але, що було набагато важливіше для мене, зберігати та відтворювати величезну кількість музики.

Перший раз я «підсів» на «телефонний» звук, коли послухав, як звучить один із музичних смартфонів, у якому були використані найпередовіші на той момент компоненти обробки звуку (до цього, зізнаюся, не сприймав серйозно смартфон як пристрій для прослуховування музики) ). Я дуже хотів собі цей телефон, але не міг собі дозволити. При цьому я почав стежити за модельним рядом цієї компанії, що зарекомендувала себе в моїх очах як виробник якісного звуку, проте виходило так, що наші шляхи з нею постійно розходилися. З того часу я володів різною музичною технікою, але не перестаю шукати для себе по-справжньому музичний смартфон, який міг би по праву носити таке ім'я.

Характеристики

Серед усіх характеристик звуку професіонал з ходу може приголомшити вас десятком визначень і параметрів, на які, на його думку, ви обов'язково, ну ось обов'язково повинні звернути увагу і, не дай бог, якийсь параметр не буде врахований - біда ...

Скажу одразу, я не прихильник такого підходу. Адже зазвичай ми вибираємо обладнання не для «міжнародного конкурсу аудіофілів», а все ж таки для себе коханих, для душі.

Усі ми різні, і всі ми цінуємо у звуці щось своє. Комусь подобається звук «побасовіший», комусь, навпаки, чистий і прозорий, для когось виявляться важливими певні параметри, а для когось – зовсім інші. Чи всі параметри однаково важливі та якими вони бувають? Давайте розумітися.

Чи траплялося вам стикатися з тим, що одні навушники грають на вашому телефоні так, що доводиться робити тихіше, інші, навпаки, змушують викручувати гучність на повну і все одно не вистачає?

У портативній техніці важливу роль цьому грає опір. Найчастіше саме за значенням цього параметра можна зрозуміти, чи вистачатиме вам гучності.

Опір

Вимірюється в Омах (Ом).

Георг Симон Ом - німецький фізик, вивів і підтвердив на досвіді закон, що виражає зв'язок між силою струму в ланцюзі, напругою та опором (відомий як закон Ома).

Цей параметр ще називають імпеданс.

Значення в більшості випадків буває зазначено на коробці або в інструкції до апаратури.

Існує думка, що високоомні навушники грають тихо, а низькоомні навушники - голосно, і для високоомних навушників потрібне джерело потужнішого звуку, а низькоомним вистачить і смартфона. Також часто можна почути вираз – не всякий плеєр зможе «розкачати» ці навушники.

Запам'ятайте, на тому самому джерелі низькоомні навушники звучатимуть голосніше. Незважаючи на те, що з погляду фізики це не зовсім вірно і є нюанси, фактично, це найпростіший спосіб описати значення цього параметра.

Для портативної техніки ( портативні плеєри, смартфони) найчастіше випускаються навушники з опором 32 Ом і нижче, проте слід мати на увазі, що для різного типу навушників низьким буде вважатися різний опір. Так, для повнорозмірних навушниківІмпеданс до 100 Ом вважається низькоомним, вище 100 Ом – високоомним. Для навушників внутрішньоканального типу («затички» або вкладиші) показник опору до 32 Ом вважається низькоомним, вище 32 ОМ - високоомним. Тому, вибираючи навушники, звертайте увагу як саме значення опору, а й у тип навушників.

Важливо: чим вищий опір навушників, тим чистішим буде звук і тим довше працюватиме плеєр або смартфон у режимі відтворення, т.к. високоомні навушники споживають менше струму, а це, у свою чергу, означає менше спотвореньсигналу.

АЧХ (амплітудно-частотна характеристика)

Часто в обговоренні того чи іншого пристрою, будь то навушники, стовпчики або автомобільний сабвуфер, можна почути характеристику - «качає/не качає». Дізнатися, чи пристрій, наприклад, «качати» або більше підійде для любителів вокалу, можна і не слухаючи його.

Для цього достатньо знайти в описі пристрою АЧХ.

Графік дозволяє зрозуміти, як пристрій відтворює інші частоти. При цьому чим менше перепадів, тим точніше апаратура може передати вихідний звук, а отже, тим ближчий звук вийде до оригіналу.

Якщо в першій третині немає яскраво виражених «горбів», то значить навушники не дуже «басові», а якщо навпаки, то вони «качати», те ж саме відноситься і до інших ділянок АЧХ.

Таким чином, дивлячись на АЧХ, ми можемо зрозуміти, який апаратура має тембральний/тональний баланс. З одного боку, можна подумати, що ідеальним балансом буде вважатися пряма лінія, але чи це так?

Спробуємо розібратися докладніше. Так вийшло, що людина спілкування використовує переважно середні частоти (СЧ) і, найкраще здатний розрізняти саме цю смугу частот. Якщо зробити пристрій з «ідеальним» балансом у вигляді прямої лінії, боюся, що прослуховування музики на такому устаткуванні вам не дуже сподобається, оскільки найвищі й низькі частоти будуть звучати не так добре, як середні. Вихід – шукати свій баланс з урахуванням фізіологічних особливостей слуху та призначення обладнання. Для голосу один баланс, для класичної музики- Інший, для танцювальної - третій.

За графіком вище видно, який баланс даних навушників. Низькі та високі частотивиражені більше, на відміну середніх, яких менше, що притаманно більшості продуктів. Однак наявність «горба» на низьких частотах не обов'язково означає якість цих найнижчих частот, тому що вони можуть виявитися хоч і у великій кількості, але поганої якості – бубон, гуді.

На підсумковий результат буде впливати безліч параметрів, починаючи від того, наскільки грамотно була розрахована геометрія корпусу, і закінчуючи тим, з яких матеріалів зроблені елементи конструкції, і дізнатися про це часто можна, тільки послухавши навушники.

Щоб до прослуховування приблизно уявляти, наскільки якісним буде наш звук, після АЧХ слід звернути увагу на такий параметр як коефіцієнт гармонічних спотворень.

Коефіцієнт гармонійних спотворень


По суті це основний параметр, що визначає якість звучання. Питання лише в тому, що для вас якість. Наприклад, усім відомі навушники Beats by Dr. Dre на частоті 1кГц мають коефіцієнт гармонічних спотворень майже 1,5% (понад 1.0% вважається досить посереднім результатом). При цьому, як не дивно, ці навушники популярні у споживачів.

Цей параметр бажано знати для кожної групи частот, тому що для різних частот допустимі значення відрізняються. Наприклад, для низьких частот допустимим значенням можна вважати і 10%, а ось для високих вже не більше того самого 1%.

Не всі виробники люблять вказувати цей параметр на своїх продуктах, тому що, на відміну від тієї ж гучності, його досить непросто дотриматися. Тому, якщо на пристрої, який ви вибираєте, є подібний графік і в ньому ви бачите величину не більше 0,5%, слід придивитися до цього уважніше - це дуже хороший показник.

Ми вже знаємо, як вибрати навушники/колонки, які гратимуть голосніше на вашому пристрої. Але як зрозуміти, наскільки голосно вони гратимуть?

Для цього існує параметр, про який ви, швидше за все, не раз чули. Його дуже люблять використовувати нічні клуби у своїх рекламних матеріалахщоб показати, наскільки голосно буде на вечірці. Цей параметр вимірюється у децибелах.

Чутливість (гучність, рівень шуму)

Децибел (дБ), одиниця виміру інтенсивності звуку – названо так на честь Олександра Грема Белла.

Олександр Грем Белл - вчений, винахідник і бізнесмен шотландського походження, один із основоположників телефонії, засновник компанії Bell Labs (колишній Bell Telephone Company), що визначила весь розвиток телекомунікаційної галузі в США.

Цей параметр нерозривно пов'язані з опором. Достатнім прийнято вважати рівень 95-100 дБ (насправді це дуже багато).

Наприклад, рекорд гучності було встановлено гуртом Kiss 15 липня 2009 року на концерті в Оттаві. Гучність звуку становила 136 дБ. За цим параметром група Kiss обійшла цілу низку знаменитих конкурентів, серед яких такі групи, як The Who, Metallica та Manowar.

Неофіційний рекорд належить американській команді The Swans. За непідтвердженими відомостями, на кількох концертах цієї групи звук досягав гучності 140 дБ.

Якщо захочете повторити чи перевершити цей рекорд, пам'ятайте, що гучний звук може бути розцінений як порушення громадського порядку – для Москви, наприклад, норми передбачають рівень звуку, еквівалентний вночі 30 дБА, удень – 40 дБА, максимальний – 45 дБА вночі, 55 .

І якщо з гучністю більш-менш зрозуміло, то ось наступний параметрзрозуміти і відстежити не так просто, як попередні. Йдеться про динамічний діапазон.

Динамічний діапазон

По суті, це різниця між найгучнішими і тихішими звуками без відсікання частот (перевантаження).

Кожен, хто хоч раз бував у сучасному кінотеатрі, відчував, що таке широкий динамічний діапазон. Це той самий параметр, завдяки якому ви чуєте і, наприклад, звук пострілу у всій його красі, і шарудіння черевиків снайпера, що крадеться по даху, який цей постріл зробив.

Більший діапазон у вашій апаратурі означає більшу кількість звуків, які без втрат зможе передати ваш пристрій.

При цьому виявляється, що недостатньо передати максимально широкий динамічний діапазон, потрібно зробити це так, щоб кожну частоту було не просто чутно, а чутно якісно. За це відповідає один з тих параметрів, який легко зможе оцінити практично кожен при прослуховуванні високоякісного запису на апаратурі, що його цікавить. Йдеться про деталізацію.

Деталізація

Це вміння апаратури розділяти звук за частотами – низькі, середні, високі (НЧ, СЧ, ВЧ).


Саме від цього параметра залежить те, наскільки чітко буде чутно. окремі інструменти, то, наскільки детальною буде музика, чи не перетвориться вона на просто в мішанину звуків.

Однак навіть за найкращої деталізації різна апаратура може давати зовсім різні враження від прослуховування.

Це залежить від уміння апаратури локалізувати джерела звуку.

В оглядах музичної техніки цей параметр часто поділяють на дві елементи - стереопанорама і глибина.

Стереопанорама

В оглядах цей параметр зазвичай описують як широке або вузьке. Давайте розберемося, що таке.

З назви зрозуміло, що йдеться про ширину чогось, але чого?

Уявіть, що ви сидите (стоїте) на концерті вашого улюбленого гурту чи виконавця. І перед вами на сцені у певному порядку розставлені інструменти. Одні ближчі до центру, інші далі.


Уявили? Нехай почнуть грати.

А тепер закрийте очі та спробуйте відрізнити, де знаходиться той чи інший інструмент. Думаю, у вас це легко вийде.

А якщо інструменти поставити перед вами одну лінію один за одним?

Доведемо ситуацію до абсурду і зрушимо інструменти впритул один до одного. І... посадимо трубача на рояль.

Як думаєте, чи сподобається вам таке звучання? Вийде розібрати, де який інструмент?

Останні два варіанти найчастіше можна чути в неякісній апаратурі, виробнику якої не має значення, який звук видає його продукт (як показує практика, ціна при цьому зовсім не показник).

Якісні навушники, колонки, музичні системиповинні вміти вибудовувати правильну стереопанораму у голові. Завдяки цьому, слухаючи музику через хорошу апаратуру, можна почути, де розташований кожен інструмент.

Однак навіть при вмінні апаратури створювати чудову стереопанораму таке звучання все одно відчуватиметься неприродним, плоским через те, що в житті ми сприймаємо звук не лише у горизонтальній площині. Тому не менш важливим є такий параметр, як глибина звуку.

Глибина звуку

Повернемося на наш вигаданий концерт. Піаніста та скрипаля відсунемо трохи вглиб нашої сцени, а гітариста та саксофоніста поставимо трохи вперед. Вакаліст же займе по праву належне йому місце перед усіма інструментами.


На своїй музичній апаратурі це ви почули?

Вітаємо, ваш пристрій може створювати ефект просторового звучання через синтез панорами уявних джерел звуку. А якщо простіше, то у вашої апаратури гарна локалізація звуку.

Якщо йдеться не про навушники, то це питаннявирішується досить просто – використовуються кілька випромінювачів, розставлених довкола, що дозволяють розділити джерела звуку. Якщо ж йдеться про ваші навушники і в них це чути, вітаємо вас вдруге, у вас дуже непогані навушники за цим параметром.

Ваша апаратура має широкий динамічний діапазон, відмінно збалансована і вдало локалізує звук, але чи готова вона до різких перепадів звуку та стрімкого наростання та спаду імпульсів?

Як у неї з атакою?

Атака

З назви, зрозуміло, зрозуміло, що це щось стрімке і невідворотне, як удар батареї «Катюш».

А якщо серйозно, ось що нам говорить про це Вікіпедія: Атака звуку - початковий імпульс звуковидобування, необхідний для утворення звуків при грі на будь-якому музичному інструментіабо під час співу вокальних партій; деякі нюансувальні характеристики різних способів звуковидобування, виконавських штрихів, артикуляції та фразування.

Якщо спробувати перекласти це на зрозуміла мова, то це швидкість наростання амплітуди звуку до досягнення заданого значення. А якщо ще зрозуміліше - якщо у вашої апаратури погано з атакою, то яскраві композиції з гітарами, живими ударними та швидкими перепадами звуку звучатимуть ватно та глухо, а значить, прощавай гарний hard rock і що з ним…

До того ж, у статтях часто можна зустріти такий термін, як сибілянти.

Сибілянти

Дослівно - свистячі звуки. Згодні звуки, при вимові яких потік повітря стрімко проходить між зубами.

Пам'ятаєте цього товариша з диснеївського мультфільму про Робіна Гуда?

Ось у його промові дуже, дуже багато сибілянтів. І якщо ваша апаратура так само свистить і шипить, то, на жаль, це не дуже гарний звук.

Ремарка: до речі, сам Робін Гуд з цього мультфільму підозріло схожий на Лиса з диснеївського ж мультфільму «Зверополіс», який нещодавно вийшов на екрани. Дісней, ти повторюєшся:)

Пісок

Ще один суб'єктивний параметр, який виміряти неможливо. А можна лише почути.


За своєю суттю близький до сибілянтів, виявляється у тому, що на великої гучності, При перевантаженні, високі частоти починають розпадатися на частини і з'являється ефект піску, що сипиться, а іноді і високочастотне деренчання. Звук стає якимсь шорстким і при цьому пухким. Чим раніше це відбувається, тим гірше і навпаки.

Спробуйте вдома, з висоти кілька сантиметрів, повільно висипати жменю цукрового піску на металеву кришку від каструлі. Почули? Ось це воно.

Шукайте звук, у якому немає піску.

Частотний діапазон

Одним із останніх безпосередніх параметрівзвук, який хотілося б розглянути, є частотний діапазон.

Вимірюється у герцах (Гц).

Генріх Рудольф Герц, основне досягнення – експериментальне підтвердження електромагнітної теорії світла Джеймса Максвелла. Герц довів існування електромагнітних хвиль. Ім'ям Герца з 1933 року називається одиниця виміру частоти, яка входить до міжнародної метричної системи одиниць СІ.

Це той параметр, який ви з ймовірністю 99% знайдете в описі практично будь-якої музичної техніки. Чому ж я залишив його потім?

Почати слід з того, що людина чує звуки, що знаходяться у певному частотному діапазоні, а саме від 20 до 20000 Гц. Все, що вище за це значення, – ультразвук. Все, що нижче, – інфразвук. Вони недоступні людському слуху, проте доступні братам нашим меншим. Це знайоме нам зі шкільних курсів фізики та біології.


Насправді ж у більшості людей реальний чуттєвий діапазон куди скромніший, причому, у жінок чуттєвий діапазон зрушений вгору щодо чоловічого, тому чоловіки краще розрізняють низькі, а жінки високі частоти.

Навіщо тоді виробники на своїх продуктах вказують діапазон, що виходить за рамки нашого сприйняття? Можливо, це лише маркетинг?

І так і ні. Людина як чує, а й відчуває, відчуває звук.

Чи доводилося вам стояти поблизу великої колонки, що грає, або сабвуфера? Згадайте свої почуття. Звук не лише чути, він ще й відчувається всім тілом, має тиск, силу. Тому чим більший діапазон вказано на вашій апаратурі, тим краще.


Однак все ж таки не варто надавати цьому показнику занадто великого значення - рідко зустрінеш апаратуру, частотний діапазон якої вже меж людського сприйняття.

додаткові характеристики

Всі перераховані вище характеристики безпосередньо відносяться до якості відтворюваного звуку. Однак на підсумковий результат, а значить, і на задоволення від перегляду/прослуховування, впливає і те, якої якості у вас є вихідний файл і яке джерело звуку ви використовуєте.

Формати

Ця інформація у всіх на слуху, і більшість і так про це знає, але про всяк випадок нагадаємо.

Усього виділяють три основні групи звукових форматів файлів:

  • аудіоформати без стиснення, такі як WAV, AIFF
  • аудіоформати зі стиском без втрат (APE, FLAC)
  • аудіоформати зі стисненням із втратами (MP3, Ogg)

Детальніше про це рекомендуємо прочитати, звернувшись до Вікіпедії.

Ми ж собі відзначимо, що використовувати формати APE, FLAC має сенс, якщо у вас апаратура професійного або напівпрофесійного рівня. В інших випадках зазвичай вистачає можливостей формату MP3, перетисненого з якісного джерела з бітрейтом від 256 кбіт/сек (що вище бітрейт, тим менше було втрат при стисненні звуку). Однак це швидше справа смаку, слуху та індивідуальних уподобань.

Джерело

Не менш важливою є і якість джерела звуку.

Якщо вже мова йшла про музику на смартфонах, давайте розглянемо саме цей варіант.

Ще недавно звук був аналоговим. Пам'ятаєте бобіни, касети? Це аналоговий звук.


І у ваших навушниках ви чуєте аналоговий звук, який пройшов дві стадії перетворення. Спочатку його з аналогового перетворили на цифровий, а потім перед подачею на навушник/колонку назад перетворили на аналоговий. І від того, якої якості було це перетворення, у результаті залежатиме результат – якість звучання.

У смартфоні за цей процес відповідає ЦАП – цифро-аналоговий перетворювач.

Чим якісніший ЦАП, тим якіснішим буде звук, який ви почуєте. І навпаки. Якщо ЦАП у пристрої посередній, то якими б не були ваші колонки або навушники, про високу якість звуку можна забути.

Всі смартфони можна розділити на дві основні категорії:

  1. Смартфони з виділеним ЦАП
  2. Смартфони з вбудованим ЦАП

на НаразіВиробництвом ЦАП для смартфонів займається велика кількість виробників. Що вибрати, ви можете вирішити, скориставшись пошуком та прочитавши опис того чи іншого пристрою. Однак не забувайте, що і серед смартфонів із вбудованим ЦАП, і серед смартфонів із виділеним ЦАП є зразки з дуже хорошим звуком і не дуже, бо важливу роль відіграють оптимізація операційної системи, версія прошивки і той додаток, через який ви слухаєте музику. Крім цього, існують програмні аудіомоди ядра, що дозволяють покращити підсумкову якість звучання. І якщо інженери і програмісти в компанії роблять одну справу і роблять її грамотно, то результат виявляється вартим уваги.

При цьому важливо знати, що при прямому порівнянні двох пристроїв, один з яких оснащений якісним вбудованим ЦАП, а другий - хорошим виділеним ЦАП, виграш незмінно буде за останнім.

Висновок

Звук – невичерпна тема.

Сподіваюся, що завдяки цьому матеріалу багато в музичних оглядах і текстах стало для вас зрозумілішим і простішим, а незнайома раніше термінологія набула додаткового сенсу і значення, адже все легко, коли знаєш.

Обидві частини нашого лікнепу про звук написані за підтримки компанії Meizu. Замість звичайного розхвалювання апаратів ми вирішили зробити для вас корисні та цікаві статті та звернути увагу на важливість джерела відтворення при отриманні якісного звуку.

Для чого це потрібно для Meizu? Днями почалося попереднє замовлення нового музичного флагмана Meizu Pro 6 Plus, тому компанії важливо, щоб звичайний користувач знав про нюанси якісного звуку та ключову роль джерела відтворення. До речі, оформивши оплачене попереднє замовлення до кінця року, ви отримаєте в подарунок до смартфону гарнітуру Meizu HD50.

А ще ми підготували для вас музичну вікторину з розгорнутими коментарями з кожного питання, рекомендуємо спробувати свої сили:

HI-FI AUDIO.RU / Олександр / редаговано


При виборі музичних дисків(CD) велике, якщо не вирішальне значення для слухача відіграє динамічний діапазон запису (DR). Саме через свідомо звужений (компресований) звукорежисер динамічного діапазону запису на CD можуть виникнути претензії до звучання.

Компресія по звукового діапазонузастосовується дедалі частіше як етапі фінальної підготовки диска. Будь-яка компресія DR негативно впливає на враження при прослуховуванні. Якщо у вас при прослуховуванні CD залишається стійке відчуття каші та сумбуру, "брудного" звуку - це ознака того, що диск, швидше за все, немилосердно стиснутий по динамічному діапазону.

Що ж таке динамічний діапазон і навіщо його взагалі потрібно стискати?

Динамічний діапазон — це діапазон між тихими і найгучнішими звуками на фонограмі. Природно, що він більше, то тонше і точно буде поданий музичний матеріал, де у тривимірному просторі буде чути все — від турбуленції повітря від диригентської палички, до пострілу з гармати. Виходячи зі сказаного, стискати динамічний діапазон не потрібно, його стиск можна сприймати як спотворення звуку.

У багатьох складно складених і майстерно виконаних музичних творах динамічний діапазон дуже великий і є місця, де музиканти грають вкрай тихо, а є, де наростає експресія і музика гуркоче. При прослуховуванні, в таких композиціях встановлюється гучність підсилювача досить високо і стають чудово чутні, як тихі звуки, так і в міру наростання, дуже гучні.


У переносних пристроях (смартфони, планшети) стоять малопотужні підсилювачі, які, сумнівно, можуть все це відіграти в повному діапазоні з прийнятною гучністю. Тому стали застосовувати компресію - найтихіші звуки по гучності підтягують до найгучніших (виходить фактично, що починають пошепки кричати), динамічний діапазон звужується, але гучність загалом зростає на 30%, що плюс для мобільних пристроїв, які прослуховуються в агресивному для прослуховування середовищі (шумна вулиця, метро). Таким чином, "музика для мобільників" у всіх випадках - це компроміс між якістю та зручністю. Виробники готові пожертвувати якістю звучання заради любителів мобільної музики, але псують музику для всіх.


На прикладі альбому гурту ZZ Top — спотворення звуку пізнішими релізами. У ремайстрі 2008 року навіть не вгадуються початкові контури. Клацніть на зображення для відображення в динаміці.

Меломани зіткнулися з нелегким завданням підбору для своїх колекції CD, не понівечених компресією динамічного діапазону, що зараз стає все більш нерозв'язною проблемою.

Щоб визначити DR будь-якого музичного твору, достатньо встановити плагін Dynamic Range Meter, що вимірює динамічний діапазон у програвачі foobar2000. Точніше сказати, він вимірює якийсь пік-фактор— різницю між піковими рівнями та RMS (середньоквадратичним значенням рівня звуку в альбомі або аудіотреку). Якщо значення пік-фактора DR фонограми дорівнює 14 - це чудовий показник, а вище 15 - близько до фантастики, але слід розуміти, що цей показник буде різним для жанрів, в яких виконується музика.

Так для рок-музики загалом хороший результат починається з DR 10. Наприклад, альбом гурту Nazareth "Sound Elixir"на CD має DR=10 і при цьому чудово звучить завдяки використанню електронних інструментів. Для важкої музики цього цілком і достатньо, якщо музикантами були використані сильні звукові перепади. Проте, більший динамічний діапазон знадобиться відтворення акустичних інструментів — гітари, саксофона тощо. У таких випадках порадує різниця діапазону від 13 до 15.

У цілому нині більшість добротних CD показує DR від 11 до 14. У цьому зустрічаються диски мають динамічний діапазон рівний 15 (наприклад, група ТБ "Батьківщина ілюзій") і навіть 18. Диски з великим DR слухаються з величезним задоволенням - їхнє звучання відкрите, природне, позбавлене цифрової сухості та великоваговості.

Таблиця мінімального DR відповідно до музичного стилю.

Так, якщо звучання диска брудне, але терпимо, то, швидше за все, це компресований по динамічному діапазону диск зі значенням не більше 8. З таким значенням йдуть багато ранніх концертів гурту Nazarethта інших — це пригнічує, оскільки така цікава та багата на інструменти музика варта кращої якості. Щире здивування викликає, коли апріорі аудіофільські виконавці випускають записи своїх концертів із сильною компресією. Наприклад диск Sade "Soldier of Love"випущений у 2010 (!) році має DR динамічного діапазону рівний лише 10. При цьому, композиції наповнені прекрасним жіночим вокалом та акустичними інструментами. Тут компресія діапазону явно чутна і розчаровує. Стає незрозуміло для кого тоді подібні CD випускаються за принципом - якщо для аудіофілів така якість мало придатна для прослуховування, а музика має явно не комерційний характер.

Сумнівно що сьогодні хтось слухатиме на вулиці музику з переносного CD-програвача, коли в мобільному середовищізамість стиснутих форматів CD давно вже використовуються музичні файли, в більшості випадків це не аудіофільські формати (mp3, AAC), які мають деструктивну природу і обмеження ще й за частотним діапазоном. Тоді виникає розумне питання: навіщо псувати CD DR і писати диски без компресії? Адже здорового глузду перекручувати запис на CD для вищої гучності не проглядається, проте, маркетингова машина війни за гучність запущена на повну потужністьта зворотного ходу не передбачається. Статистика, на жаль, свідчить, що виробник з кожним роком посилює компресію звукового матеріалу, що звичайно негативно позначається на якості звучання на апаратурі класу Hi-Fi.

Дійсно, не компресований диск на дешевому переносному плеєрі або смартфоні через зовнішні шуми, які замаскують найтихіші звуки, звучатиме "неефектно", а компресоване звучання здасться краще через те, що гучність тихих звуків гіперзавищена і знаходиться над зовнішнім шумом. Це схоже на те, що звукорежисер спантеличив метою, записати диск, який звучатиме добре на тлі працюючого відбійного молотка. Можливо, у таких ситуаціях це здасться прекрасним, але чи можна серйозно говорити про якість звучання, якщо використовується глибока компресія?

У будь-якому випадку, низькоякісне та низькосортне відтворення та для високоякісного відтворення на хороших Hi-Fi/Hi-End апаратах компресовані записи не годяться.

Більшості аудіофілів не важлива гучність диска, її можна виставити на підсилювачі, важлива чистота і детальність звучання, і багато інших параметрів.

З появою сучасних висококласних підсилювачів музика відкрила для себе новий вимір, який додає до неї ще одну чудову грань — можливість більшого залучення завдяки аудіофільській промальовці музичних подій. У цьому вимірі сприймається не лише мелодія, а й кожен звук, який у хорошому тракті співає та захоплює, чіпляє за струни душі.

Саме тому більшість сучасних дисківпісля покупки хочеться відразу викинути, наприклад, альбом Madonna "Handy Candy". Звук на них страшенно брудний, кашоподібний, що давить на слух. Причина легко визначається під час перевірки на DR динамічного діапазону. На диску він дорівнює гнітючому значенню 5. Добре звучать дисками можна вважати записи мають діапазон мінімально від 10 і вище. Діапазон CD від DR 8 і нижче викликає при прослуховуванні не найкращі відчуття.


Багато хто запропонує у вигляді панацеї прослуховування вінілових дисків, де компресія малоймовірна, але компресія малоймовірна і на всіх оригінальних CD старих випусків (зустрічається DR до 18), а сучасний вініл може бути так само компресований. Це перший аргумент, а другий походить із того, що при вимірі значення DR динамічного діапазону сучасних вінілових дисків він виявляється не дуже високим. Для різних вінілових дисків значення DR дорівнює 12-14. Але залишилися серйозні підозри, що Нижня границявизначалася не самим тихим звуком, а рокотом і шумом самої вінілової платівки через механічний характер зчитування даних і тоді, ймовірно, реальний DR має ще гірше значення. При цьому не рідко можна зустріти записи на CD з DR динамічного діапазону рівним 15, і, крім того, на диску значно краще виконано поділ каналів і багато інших показників.




Зі сказаного вище можна зробити висновок, що на якість звучання диска CD надає велике значенняінтенсивність компресії звукового діапазону DR Як відповідь цієї ситуації на ринку стали з'являтися спеціальні "аудіофільські" диски без компресії, наприклад, компіляція Audiophile World.

Для допитливих: сайт www.dr.loudness-war.info містить каталог виміряних значень DR великої кількості аудіо CD дисків.

Усі права щодо цього документаналежать автору. Відтворення даного тексту чи його частини допускається лише з письмового дозволу автора.

Біти, герці... Що ховається за цими поняттями? При розробці стандарту аудіо компакт-дисків були прийняті значення 44 кГц, 16 біт. Чому саме стільки? У чому причина вибору, а також - чому роблять спроби підвищити ці значення до, скажімо, 96 кГц і 24 або навіть до 32-х бітів.

Розберемося спочатку з роздільною здатністю семплювання - тобто з бітністю. Так виходить, що вибирати доводиться між числами 16, 24 і 32. Проміжні значення були б, звичайно, зручніше в сенсі звуку, але занадтонеприємні для використання у цифровій техніці.

За що відповідає цей параметр? У двох словах – за динамічний діапазон. Діапазон одночасно відтворюваних гучностей - від максимальної амплітуди (0 дБ) до тієї найменшої, яку дозволяє передати роздільну здатність, наприклад - приблизно -93 дБ для 16 бітного аудіо. Як не дивно, це пов'язано з рівнем шумів фонограми. У принципі, для, наприклад, 16 бітного аудіо цілком можлива передача сигналів потужністю і -120 дБ, проте ці сигнали буде важко застосовувати на практиці через такого фундаментального поняття як шум дискретизації. Справа в тому, що при взятті цифрових значень ми весь час помиляємося, округляючи реальне аналогове значення до можливого найближчого цифрового. Найменша можлива помилка- нульова, максимально ми помиляємося на половину останнього розряду (біта, далі термін молодший біт скорочуватиметься до МБ). Ця помилка дає нам так званий шум дискретизації – випадкова невідповідність оцифрованого сигналу оригіналу. Цей шум має постійний характер і має максимальну амплітуду рівну 0.5МБ. Це можна розглядати як випадкові значення, підмішані в цифровий сигнал. Іноді це називається шум округлення чи квантування.

Зупинимося докладніше у тому, що розуміється під потужністю сигналів, що вимірюється в бітах. Найсильніший сигнал у цифровий обробцізвуку прийнято приймати за 0 дБ, це відповідає всім бітам, поставленим в 1. Якщо старший біт (далі СБ) обнулити, що вийшло цифрове значеннябуде вдвічі менше, що відповідає втрати рівня на 6 дБ. Жодними іншими бітами крім СБ не можна досягти рівня вище -6 дБ. Відповідно - старший біт відповідає за наявність рівня сигналу від -6 до 0 дБ, тому СБ - це біт 0 дБ. Попередній біт відповідає за рівень -6 дБ, а наймолодший, таким чином - за рівень (число_біт-1) * 6 дБ. У разі 16 бітного звуку, МБ відповідає рівень -90 дБ. Коли ми говоримо 0.5МБ, ми маємо на увазі не -90/2, а половину кроку до наступного біта - тобто на 3 дБ нижче, -93 дБ.

Повертаємося до вибору роздільної здатності оцифровки. Як уже було сказано, оцифрування вносить шум на рівні 0.5МБ, це говорить про те, що запис, оцифрований в 16 біт, постійно галасуєна -93 дБ. Вона може передавати сигнали і тихіше, але шум все одно залишається на рівні -93 дБ. За цією ознакою і визначається динамічний діапазон цифрового звуку - там, де співвідношення сигнал/шум перетворюється на шум/сигнал (шумів більше, ніж корисного сигналу), є межа цього діапазону знизу. Таким чином, головнийкритерій оцифрування - скільки шумуми можемо собі дозволити у відновленому сигналі? Відповідь це питання залежить частково від цього, скільки шуму було у вихідної фонограмі. Важливий висновок - якщо ми оцифровуємо щось з рівнем шумів -80 дБ - немає жодних причин цифровувати це в більш ніж 16 біт, тому що, з одного боку, шуми -93 дБ додають дуже мало до вже наявних величезних (порівняно) шумів -80 дБ, а з іншого боку - тихіше ніж -80 дБ у самій фонограмі вже починається шум/сигнал, і оцифровувати і зраджувати такий сигнал просто не потрібно.

Теоретично це єдиний критерій вибору роздільної здатності оцифровки. Більше ми не вносимоабсолютно ніяких спотворень чи неточностей. Практика, як не дивно, майже повністю повторює теорію. Цим і керувалися ті люди, які вибирали роздільну здатність 16 біт для аудіо компакт дисків. Шум -93 дБ - досить гарна умова, яке майже точно відповідає умовам нашого сприйняття: різниця між больовим порогом (140 дБ) та звичайним шумовим фоном у місті (30-50 дБ) становить якраз близько сотні дБ, і якщо врахувати, що на рівні гучності, що приносить біль, музику не слухають - що ще кілька звужує діапазон - виходить, що реальні шуми приміщення або навіть апаратури виходять набагато сильнішими за шуми дискретизації. Якщо ми можемо почути рівень під -90 дБ у цифровому записі – ми почуємо та сприймемо шуми дискретизації, інакше – ми просто ніколи не визначимо, оцифроване це аудіо чи живе. Жодної іншої різниці в сенсі динамічного діапазону просто немає. Але в принципі людина може осмислено чути в діапазоні 120 дБ, і було б непогано зберегти весь цей діапазон, з чим 16 біт, здавалося б, не справляються.

Але це тільки на перший погляд: за допомогою спеціальної техніки, яка називається shaped dithering, можна змінити частотний спектр шумів дискретизації, майже повністю винести їх у область понад 7-15 кГц. Ми як би змінюємо дозвіл за частотою (відмовляємося від відтворення тихих високих частот) на додатковий динамічний діапазон у відрізку частот, що залишився. У поєднанні з особливостями нашого слуху - наша чутливість до області високих частот, що викидається, на десятки дБ нижче ніж в основній області (2-4 кГц) - це робить можливим відносно безшумну передачу корисних сигналів додатково ще на 10-20 дБ тихіше, ніж -93 дБ - таким чином динамічний діапазон 16 бітного звуку для людини становить близько 110 дБ. Та й взагалі - одночасно людина просто не може чути звуки на 110 дБ тихіше ніж щойно почутий гучний звук. Вухо, як і око, підлаштовується під гучність навколишньої дійсності, тому одночасний діапазон нашого слуху становить зовсім порівняно мало - близько 80 дБ. Поговоримо про dithring-е докладніше після обговорення частотних аспектів.

Для компакт дисків вибрано частоту дискретизації 44100 Гц. Існує думка, що це означає, що відтворюються всі частоти до 22.05 кГц, але це не зовсім так. Однозначно можна сказати лише те, що частот вище за 22.05 кГц в оцифрованому сигналі немає. Реальна ж картина відтворення оцифрованого звуку завжди залежить від конкретної технікиі завжди настільки ідеальна, як хотілося б, і як відповідає теорії. Все залежить від конкретного ЦАП.

Розберемося спочатку, що хотілося б отримати. Людина середнього віку (скоріше молода) може відчувати звуки від 10 Гц до 20 кГц, осмислено чути - від 30 Гц до 16 кГц. Звуки вище та нижче сприймаються, але не становлять акустичних відчуттів. Звуки вище 16 кГц відчуваються як дратівливий неприємний фактор - тиск на голову, біль, особливо гучні звуки приносять такий різкий дискомфорт, що хочеться залишити приміщення. Неприємні відчуття настільки сильні, що на цьому заснована дія охоронних пристроїв - кілька хвилин дуже гучного звуку високої частоти зведуть з розуму будь-кого, і красти що-небудь у такій обстановці стає рішуче неможливо. Звуки нижче 30 - 40 Гц при достатній амплітуді сприймаються як вібрація, яка походить від об'єктів (колонок). Точніше навіть сказати так - просто вібрація. Людина акустично майже не визначає просторове становище настільки низьких звуків, тому в хід вже йдуть інші органи почуттів – дотичні, ми відчуваємо такі звуки тілом.

Для передачі звуку як він є було б непогано зберегти весь хоч якийсь сприйманий діапазон від 10 Гц до 20 кГц. З низькими частотами в теорії в цифровому записі проблем зовсім немає. Насправді ж - всі ЦАПи, що працюють за дельта-технологією, мають потенційне джерело проблем. Таких пристроїв зараз 99%, тому проблема так чи інакше має бути, хоча відверто поганих пристроїв майже немає (лише найдешевші схеми). Можна вважати, що з низькими частотами все гаразд - зрештою, це лише цілком вирішувана проблема відтворення, з якою успішно справляються добре сконструйовані ЦАПи ціною більше $1.
З високими частотами все трохи гірше, Крайній міріточно складніше. Майже вся суть удосконалень і ускладнень ЦАПів і АЦП спрямовано якраз більш достовірну передачу високих частот. Під "високими" маються на увазі частоти, порівняні з частотою дискретизації - тобто у випадку 44.1 кГц це 7-10 кГц і вище. Пояснювальний малюнок:

На малюнку зображено частоту 14 кГц, оцифровану з частотою дискретизації 44.1 кГц. Точками позначені моменти взяття амплітуди сигналу. Видно, що на один період синусоїди припадає близько трьох крапок, і щоб відновити вихідну частоту у вигляді синусоїди треба проявити деяку фантазію. Саму синусоїду малювала програма CoolEdit, вона виявляла фантазію - відновлювала дані. Аналогічний процес відбувається і в ЦАП, цим займається відновлюючий фільтр. І якщо порівняно низькі частоти є майже готові синусоїди, то форма і, якість відновлення високих частот лежить цілком на совісті відновлюючої системи ЦАПа. У CoolEdit дуже хороший фільтр, що відновлює, але і він не справляється в екстремальному випадку - наприклад, частота 21 кГц:

Видно, що форма коливань (сині лінії) далека від правильної, та й властивості з'явилися, яких раніше не було. Це і є основною проблемою при відтворенні високих частот. Проблема, однак, не така страшна, як може здатися. У всіх сучасних ЦАП використовується технологія пересемплювання (multirate), яка полягає в цифровому відновленні до в кілька разів вищої частоти дискретизації, і в подальшому перекладі аналоговий сигнал на підвищеній частоті. Таким чином, проблема відновлення високих частот перекладається на плечі цифрових фільтрів, які можуть бути дуже якісними. Настільки якісними, що у випадку дорогих пристроїв проблема повністюзнімається - забезпечується неспотворене відтворення частот до 19-20 кГц. Пересемплювання застосовується і в не дуже дорогих пристроях, тому в принципі і цю проблему можна вважати вирішеною. Пристрої в районі $ 30 - $ 60 (звукові карти) або музичні центри до $ 600, зазвичай аналогічні по ЦАП цих звукових карт, відмінно відтворюють частоти до 10 кГц, стерпно - до 14 - 15, і абияк інші. Цього цілкомдостатньо для більшості реальних музичних застосувань, а якщо комусь потрібна більша якість - він знайде його у професійного класу пристроях, які не те щоб сильно дорожчі - просто вони зроблені з розумом.

Повернемося до dithering-у – подивимося, як можна з користю збільшити динамічний діапазон за межі 16 біт.

Ідея dithering-а полягає в тому, щоб підмішати в сигнал шум. Як не дивно це звучить - для того, щоб зменшити шуми та неприємні ефекти квантування, ми додаємосвій шум. Розглянемо приклад - скористаємося можливістю CoolEdit-а працювати в 32-х бітах. 32 біта - це в 65 тисяч разів більша точність, ніж 16 біт, тому в нашому випадку 32-бітний звук можна вважати аналоговим оригіналом, а переклад його в 16 біт - оцифровкою. Зображення показує 32-х битий звук - музика, записана на такому тихому рівні, що найгучніші моменти досягають лише -110 дБ:

Це із запасом набагато тихіше динамічного діапазону 16 бітного звуку (1МБ 16 бітного уявлення дорівнює одиниці за шкалою праворуч), тому якщо просто округлити дані до 16 біт - ми отримаємо повну цифрову тишу.

Додамо в сигнал білий шумз рівнем в 1МБ - це -90 дБ (приблизно відповідний за рівнем шумів квантування):

Перетворимо на 16 біт (можливі лише цілі значення - 0, 1, -1, ...):


(Не звертайте увагу на синю лінію, яка приймає і проміжні значення - це фільтр CoolEdit моделює реальну амплітуду після фільтра, що відновлює. Точки ж взяття амплітуд розташовані тільки на значеннях 0 і 1)

Як видно, якісь дані лишилися. Там, де вихідний сигнал мав більший рівень, більше значень 1 де менший - нулів. Щоб почути, що ми отримали, посилимо сигнал на 14 біт (на 78 дБ). Результат можна скачати та послухати (dithwht.zip, 183 кб).

Ми чуємо цей звук з величезними перешкодами -90 дБ (до посилення для прослуховування), тоді як корисний сигнал складає всього -110 дБ. Ми вже маємо передачу звуку з рівнем -110 дБ у 16 ​​бітах. У принципі, це і є стандартний спосіб розширення динамічного діапазону, що виходить часто чи не сам собою - шуму скрізь вистачає. Однак саме по собі це досить безглуздо - рівень шумів дискретизації так і залишається на колишньому рівні, а передавати сигнал слабший за шум - заняття не дуже зрозуміле з погляду логіки.

Більш складний спосіб - shaped dithering. Ідея в тому, що раз ми все одно не чуємо високих частот у дуже тихих звуках, Отже слід основну потужність шуму направити у ці частоти, у своїй можна навіть користуватися великим шумом - я скористаюся рівнем 4МБ (це два біта шуму). Посилений результат після фільтрації високих частот (ми не почули б їх у нормальній гучності цього звуку) – ditshpfl.zip, 1023 кб (на жаль, звук перестав архівуватися). Це вже цілком хороша (для занадто низької гучності) передача звуку, шуми приблизно рівні за потужністю самому звуку з рівнем -110 дБ! Важливе зауваження: ми підвищилиреальні шуми дискретизації з 0.5МБ (-93 дБ) до 4МБ (-84 дБ), знизившичутні шуми дискретизації з -93 дБ до -110 дБ. Відношення сигнал/шум погіршилося, Але шум пішов у високочастотну область і перестав бути чутним, що дало суттєве покращення реального(Сприймається людиною) відносини сигнал/шум. Фактично це вже рівень шумів дискретизації 20 бітного звуку. Єдина умова цієї технології – наявність частот для шуму. 44.1 кГц звук дозволяє розміщувати шум у нечутних на тихій гучності частотах 10-20 кГц. А ось якщо оцифровувати в 96 кГц – частотна область для шуму (нечутна людиною) буде настільки велика, що при використанні shaped dithering 16 біт реальноперетворюються і на всі 24.

[На замітку: PC Speaker - однобітний пристрій, проте досить високою максимальною частотою дискретизації (включення/вимикання цього єдиного біта). За допомогою процесу, подібного по суті з dithering-ом, що називається швидше широтно-імпульсна модуляція, на ньому грав досить якісний цифровий звук - з одного біта і високої частоти дискретизації витягувалися 5-8 біт низької частоти, а фільтром високочастотного шуму виступала нездатність апаратури відтворювати такі високі частоти, як і наша нездатність їх чути. Легкий високочастотний свист, проте - чутна частина цього шуму - було чутно.]

Таким чином, shaped dithering дозволяє суттєво знизити і без того низькі шуми дискретизації 16 бітного звуку, спокійно розширивши таким чином корисний (безшумний) динамічний діапазон всюсфера людського слуху. Оскільки зараз вже завжди при перекладі з робочого формату 32 біти в кінцевий 16 біт для CD використовується shaped dithering - наші 16 біт цілком достатні для повної передачі звукової картини.

Єдине що – ця технологія діє тільки на останній стадії – підготовці матеріалу до відтворення. Під час обробки якісного звуку просто необхіднозалишатися в 32х бітах, щоб не застосовувати dithering після кожної операції, якісніше кодуючи результати назад в 16 біт. Але якщо рівень шуму фонограми становить більше -60 дБ - можна без найменших підозр сумління вести всю обробку в 16 бітах. Проміжний dithering забезпечить відсутність спотворень округлення, а доданий їм шум сотні разівслабше вже наявного і тому абсолютно байдужий.

Q:
Чому кажуть, що 32-х бітний звук якісніший за 16 бітний?
A1: Помиляються.
A2: [Мають на увазі трохи інше: при обробці або запису звуку потрібновикористовувати більшу роздільну здатність. Цим користуються завжди. Але в звуку як у готовій продукції роздільна здатність більше 16 біт не вимагається.]
Q: Чи є сенс збільшувати частоту дискретизації (наприклад, до 48 кГц або до 96)?
A1: Не має. При будь-якому грамотному підході в конструюванні ЦАП 44 кГц передають весьнеобхідний частотний діапазон.
A2: [Мають на увазі трохи інше: це має сенс, але лише при обробці або запису звуку.]
Q: Чому все ж таки йде впровадження більших частотта бітності?
A1: Прогресу важливо рухатись. Куди й навіщо - вже не так важливо.
A2: Багато процесів у разі відбуваються легше. Якщо, наприклад, пристрій збирається обробити звук - йому буде легше зробити це в 96 кГц / 32 біта. Багато DSP використовують 32 біти для обробки звуку, і можливість забути про перетворення - полегшення розробки і все ж таки невелике збільшення якості. Та й взагалі – звук для подальшої обробки маєсенс зберігати у більшому дозволі, ніж 16 біт. Для hi-end пристроїв які лише відтворюють звук це абсолютнобайдуже.
Q: 32х чи 24х чи навіть 18 бітні ЦАП краще ніж 16 бітні?
A: У загальному випадку - ні. Якість перетворення аж ніяк не залежить від бітності. У AC97 кодеці (сучасна звукова карта до $ 50) використовується 18 бітний кодек, а в картах за $ 500, звук яких з цією нісенітницею навіть порівнювати не можна - 16 бітний. Це не має абсолютно ніякого значення для відтворення 16-бітного звуку.
Варто також мати на увазі, що більшість ЦАП зазвичай реально відтворюють менше біт, ніж беруться. Наприклад, реальний рівень шумів типового дешевого кодека становить -90 дБ, що становить 15 біт, і навіть якщо він сам 24х бітний - ви не отримаєте ніякої віддачі від "зайвих" 9 біт - результат їхньої роботи, навіть якщо він був, потоне в них ж власному шумі. Більшість же дешевих пристроїв просто ігноруютьдодаткові біти - вони просто реально не беруться до уваги в їх процесі синтезу звуку, хоча і надходять на цифровий вхід ЦАПа.
Q: А для запису?
A: Для запису – краще мати АЦП більшої розрядності. Знову ж таки, більшою реальноюрозрядності. Розрядність ЦАП повинна відповідати рівню шумів вихідної фонограми, або просто бути достатньою для досягнення бажано низького рівня шуму.
Також зручно буває мати розрядність із запасом, щоб використовувати підвищений динамічний діапазон для менш точного регулювання рівня запису. Але пам'ятайте - ви повинні завжди потрапляти в реальнийдіапазон кодеку. Насправді 32х бітний АЦП, наприклад, майже повністю безглуздий, тому що молодший десяток біт просто безперервно шумітимуть - настількималого шуму (під -200 дБ) просто не буваєу аналоговому музичному джерелі.

Вимагати від звуку підвищеної розрядності чи частоти дискретизації, порівняно з CD, кращої якості – не варто. 16 біт/44 кГц, доведені до межі за допомогою shaped dithering, цілком здатні повністюпередати інформацію, яка нас цікавить, якщо справа не йде про процес звукообробки. Не варто витрачати місце на зайві дані готового матеріалу, також як не варто очікувати підвищеної якості звуку від DVD-Audio з його 96 кГц/24 біт. При грамотному підході під час створення звуку у форматі стандартного CD ми матимемо якість, яка просто не потребуєу подальшому покращенні, а відповідальність за правильний звукозапис кінцевих даних давно взяли на себе розроблені алгоритми та люди, які вміють правильно їх використовувати. В останні кілька років ви вже не знайдете нового диска без shaped dithering та інших прийомів доведення якості звукопередачі до краю. Так, лінивим або просто криворуким буде зручніше давати готовий матеріал у 32-х бітах і 96 кГц, але по ідеї - чи варто це в кілька разів більших аудіо даних?