Динамічний діапазон стислий або стандартний. Компресія звуку: принцип та налаштування. Модифікації кодів Хафмана

Ця група методів заснована на тому, що сигнали, що передаються, піддаються нелінійним перетворенням амплітуди, причому в передавальної і приймальній частинах нелінійності взаємозворотні. Наприклад, якщо в передавачі використовується нелінійна функція Öu, у приймачі – u2. Послідовне застосування взаємозворотних функцій призведе до того, що загалом перетворення залишається лінійним.

Ідея нелінійних методів стиснення даних зводиться до того, що передавач може при тій же амплітуді вихідних сигналів передати більший діапазон зміни параметра, що передається (тобто, більший динамічний діапазон). Динамічний діапазон- це виражене у відносних одиницях чи децибелах відношення найбільшої допустимої амплітуди сигналу до найменшої:

;	(2.17)
.	(2.18)

Природне бажання збільшити динамічний діапазон за допомогою зменшення U min обмежується чутливістю апаратури та зростанням впливу перешкод та власних шумів.

Найчастіше стиск динамічного діапазону здійснюється за допомогою пари взаємозворотних функцій логарифмування та потенціювання. Перша операція зміни амплітуди називається компресією(стисненням), друга - експандуванням(Розтягненням). Вибір саме цих функцій пов'язаний з їхньою найбільшою можливістю компресії.

У той самий час ці методи мають недоліки. Перший у тому, що логарифм малого числа негативний й у межі:

тобто чутливість дуже нелінійна.

Для зменшення цих недоліків обидві функції модифікують зміщенням та апроксимацією. Наприклад, для телефонних каналів апроксимована функція має вигляд (тип А):

причому А = 87,6. Виграш від стиснення становить 24дБ.

Стиснення даних шляхом нелінійних процедур реалізується аналоговими засобами з великими похибками. Застосування цифрових засобів може суттєво підвищити точність чи швидкодію перетворення. При цьому пряме застосування засобів обчислювальної техніки (тобто, безпосереднє обчислення логарифмів і експонент) дасть не кращий результат через низьку швидкодію і похибку обчислення, що накопичується.

Стиснення даних шляхом компресії через обмеження точності використовується в невідповідних випадках, наприклад, для передачі мови по телефонних і радіоканалах.

Ефективне кодування

Ефективні коди були запропоновані К. Шенноном, Фано та Хафманом. Сутність кодів полягає в тому, що вони нерівномірні, тобто з неоднаковим числом розрядів, причому довжина коду обернено пропорційна ймовірності його появи. Ще одна чудова особливість ефективних кодів – вони не вимагають роздільників, тобто спеціальних символів, які розділяють сусідні кодові комбінації. Це досягається при дотриманні простого правила: коротші коди не є початком довших. У цьому випадку суцільний потік двійкових розрядів однозначно декодується, оскільки декодер виявляє спочатку коротші кодові комбінації. Ефективні коди довгий час були чисто академічними, але останнім часом успішно використовуються при формуванні баз даних, а також при стисканні інформації в сучасних модемах та програмних архіваторах.

Через нерівномірність вводять середню довжину коду. Середня довжина - математичне очікування довжини коду:

причому, l ср прагне H(x) зверху (тобто l ср > H(x)).

Виконання умови (2.23) посилюється зі збільшенням N.

Існує два різновиди ефективних кодів: Шеннона-Фано та Хафмана. Розглянемо їх отримання з прикладу. Припустимо, що ймовірності символів у послідовності мають значення, наведені в таблиці 2.1.

Таблиця 2.1.

Ймовірність символів

N
p i	0.1	0.2	0.1	0.3	0.05	0.15	0.03	0.02	0.05

Символи ранжуються, тобто подаються в ряд за спаданням ймовірностей. Після цього методом Шеннона-Фано періодично повторюється така процедура: вся група подій ділиться на дві підгрупи з однаковими (або приблизно однаковими) сумарними ймовірностями. Процедура триває до тих пір, поки в черговій підгрупі не залишиться один елемент, після чого цей елемент усувається, а з зазначеними діями, що залишилися, продовжуються. Це відбувається до тих пір, поки останніх двох підгрупах не залишиться по одному елементу. Продовжимо розгляд нашого прикладу, що зведено у таблиці 2.2.

Таблиця 2.2.

Кодування за методом Шеннона-Фано

N	P i
4	0.3		I
	0.2	I	II
6	0.15		I	I
	0.1			II
1	0.1			I	I
9	0.05	II			II
5	0.05		II		I
7	0.03			II	II	I
8	0.02					II

Як видно з таблиці 2.2, перший символ з ймовірністю p 4 = 0.3 брав участь у двох процедурах розбиття на групи та обидва рази потрапляв до групи з номером I . Відповідно до цього він кодується дворозрядним кодом ІІ. Другий елемент першому етапі розбиття належав групі I, другою - групі II. Тому його код 10. Коди інших символів додаткових коментарів не потребують.

Зазвичай нерівномірні коди зображують як кодових дерев. Кодове дерево - це граф, що вказує на дозволені кодові комбінації. Попередньо задають напрямки ребер цього графа, як показано на рис.2.11 (вибір напрямів довільний).

По графу орієнтуються так: складають маршрут для виділеного символу; кількість розрядів йому дорівнює кількості ребер у маршруті, а значення кожного розряду дорівнює напрямку відповідного ребра. Маршрут складається з вихідної точки (на кресленні вона позначена літерою А). Наприклад, маршрут у вершину 5 складається з п'яти ребер, з яких всі крім останнього мають напрям 0; отримуємо код 00001.

Обчислимо для цього прикладу ентропію та середню довжину слова.

H(x) = -(0.3 log 0.3 + 0.2 log 0.2 + 2 0.1 log 0.1+ 2 0.05 log 0.05+

0.03 log 0.03 + 0.02 log 0.02) = 2.23 біт

l ср = 0.3 2 + 0.2 2 + 0.15 3 + 0.1 3 + 0.1 4 + 0.05 5 +0.05 4+

0.03 6 + 0.02 6 = 2.9 .

Як бачимо, середня довжина слова близька до ентропії.

Коди Хафмана будуються за іншим алгоритмом. Процедура кодування складається із двох етапів. На першому етапі послідовно проводять одноразові стискування алфавіту. Одноразовий стиск - заміна двох останніх символів (з нижчими ймовірностями) одним, із сумарною ймовірністю. Стиснення проводять доти, доки не залишиться два символи. При цьому заповнюють таблицю кодування, в якій проставляють результуючі ймовірності, а також зображують маршрути, якими нові символи переходять на наступному етапі.

На другому етапі відбувається власне кодування, яке починається з останнього етапу: першому із двох символів надають код 1, другому - 0. Після цього переходять на попередній етап. До символів, які не брали участь у стисканні на цьому етапі, приписують коди з наступного етапу, а до двох останніх символів двічі приписують код символу, отриманого після склеювання, та дописують до коду верхнього символу 1, нижнього - 0. Якщо символ далі у склеюванні не бере участь, його код залишається незмінним. Процедура триває остаточно (тобто першого етапу).

У таблиці 2.3 показано кодування алгоритму Хафмана. Як видно з таблиці, кодування здійснювалося за 7 етапів. Зліва вказано ймовірність символів, праворуч - проміжні коди. Стрілки показують переміщення новостворених символів. На кожному етапі два останні символи відрізняються лише молодшим розрядом, що відповідає методиці кодування. Обчислимо середню довжину слова:

l ср = 0.3 2 + 0.2 2 + 0.15 3 ++ 2 0.1 3 + +0.05 4 + 0.05 5 + 0.03 6 + 0.02 6 = 2.7

Це ще ближче до ентропії: код ще ефективніший. На рис. 2.12 наведено дерево коду Хафмана.

Таблиця 2.3.

Кодування за алгоритмом Хафмана

N	p i	код	I	II	III	IV	V	VI	VII
	0.3		0.3 11	0.3 11	0.3 11	0.3 11	0.3 11	0.4 0	0.6 1
	0.2		0.2 01	0.2 01	0.2 01	0.2 01	0.3 10	0.3 11	0.4 0
	0.15		0.15 101	0.15 101	0.15 101	0.2 00	0.2 01	0.3 10
	0.1		0.1 001	0.1 001	0.15 100	0.15 101	0.2 00
	0.1		0.1 000	0.1 000	0.1 001	0.15 100
	0.05		0.05 1000	0.1 1001	0.1 000
	0.05		0.05 10011	0.05 1000
	0.03		0.05 10010
	0.02

Обидва коди задовольняють вимогу однозначності декодування: як видно з таблиць, більш короткі комбінації є початком довших кодів.

При збільшенні кількості символів ефективності кодів зростають, тому в деяких випадках кодують більші блоки (наприклад, якщо йдеться про тексти, можна кодувати деякі склади, слова, що найчастіше зустрічаються, і навіть фрази).

Ефект від впровадження таких кодів визначається порівняно з рівномірним кодом:

(2.24)

де n – кількість розрядів рівномірного коду, який замінюється ефективним.

Модифікації кодів Хафмана

Класичний алгоритм Хафмана належить до двопрохідним, тобто. вимагає спочатку набору статистики за символами і повідомленнями, та був описаних вище процедур. Це незручно практично, оскільки збільшує час обробки повідомлень і накопичення словника. Найчастіше використовуються однопрохідні методи, у яких процедури накопичення та кодування поєднуються. Такі методи називаються ще адаптивним стисненням по Хафман [46].

Сутність адаптивного стиснення по Хафману зводиться до побудови початкового кодового дерева та його послідовної модифікації після надходження кожного чергового символу. Як і колись, дерева тут бінарні, тобто. з кожної вершини графа – дерева виходить максимум дві дуги. Прийнято називати вихідну вершину батьком, а дві пов'язані з нею наступні вершини - дітьми. Введемо поняття ваги вершини - кількість символів (слів), відповідних даної вершині, отриманих при подачі вихідної послідовності. Очевидно, що сума ваги дітей дорівнює вазі батька.

Після введення чергового символу вхідної послідовності переглядається кодове дерево: перераховуються ваги вершин і за необхідності вершини переставляються. Правило перестановки вершин таке: ваги нижніх вершин найменші, причому вершини, що знаходяться зліва на графі, мають найменші ваги.

Одночасно вершини нумеруються. Нумерація починається з нижніх (висять, тобто не мають дітей) вершин зліва направо, потім переноситься на верхній рівень і т.д. до нумерації останньої вихідної вершини. При цьому досягається наступний результат: чим менша вага вершини, тим менший її номер.

Перестановка здійснюється переважно для висячих вершин. При перестановці має бути враховано сформульоване вище правило: вершини з великою вагою мають і більший номер.

Після проходження послідовності (вона називається також контрольною або тестовою) всім висячим вершинам присвоюються кодові комбінації. Правило присвоєння кодів аналогічно до вищевикладеного: кількість розрядів коду дорівнює кількості вершин, через які проходить маршрут від вихідної до цієї висячої вершини, а значення конкретного розряду відповідає напрямку від батька до "дитини" (скажімо, перехід вліво від батька відповідає значенню 1, вправо - 0 ).

Отримані кодові комбінації заносяться в пам'ять пристрою стиснення разом з аналогами і утворюють словник. Використання алгоритму ось у чому. Стискана послідовність символів розбивається на фрагменти відповідно до наявного словника, після чого кожен із фрагментів замінюється його кодом зі словника. Не виявлені у словнику фрагменти утворюють нові висячі вершини, набувають ваги і також заносяться до словника. У такий спосіб формується адаптивний алгоритм поповнення словника.

Для підвищення ефективності методу бажано збільшувати розмір словника; у цьому випадку коефіцієнт стиснення підвищується. Фактично розмір словника становить 4 - 16 Кбайт пам'яті.

Проілюструємо наведений алгоритм прикладом. На рис. 2.13 наведено вихідну діаграму (її називають також деревом Хафмана). Кожна вершина дерева показана прямокутником, у якому вписані через дріб дві цифри: перша означає номер вершини, друга - її вага. Як можна переконатися, відповідність ваги вершин та їх номерів виконується.

Припустимо тепер, що символ, що відповідає вершині 1, у тестовій послідовності зустрівся вдруге. Вага вершини змінилася, як показано на рис. 2.14, внаслідок чого правило нумерації вершин порушено. На наступному етапі міняємо розташування висячих вершин, для чого міняємо місцями вершини 1 і 4 і перенумеровуємо всі вершини дерева. Отриманий граф наведено на рис. 2.15. Далі процедура продовжується аналогічно.

Слід пам'ятати, що кожна висяча вершина в дереві Хафмана відповідає певному символу або їх групі. Батько відрізняється від дітей тим, що група символів, що відповідає йому, на один символ коротший, ніж у його дітей, а ці діти відрізняються останнім символом. Наприклад, батькові відповідають символи "кар"; тоді в дітей віком можуть бути послідовності " кара " і " короп " .

Наведений алгоритм не є академічним і активно використовується в програмах - архіваторах, у тому числі при стисканні графічних даних (про них йтиметься нижче).

Алгоритми Лемпеля – Зіва

Це найчастіше використовувані нині алгоритми стискування. Вони використовуються в більшості програм - архіваторів (наприклад, PKZIP. ARJ, LHA). Сутність алгоритмів полягає в тому, що деяка сукупність символів замінюється при архівуванні її номером у спеціально словнику, що формується. Наприклад, фраза "На ваш лист вихідний номер...", що часто зустрічається в діловому листуванні, може займати у словнику позицію 121; тоді замість передачі або зберігання згаданої фрази (30 байт) можна зберігати номер фрази (1,5 байта у двійково-десятковій формі або 1 байт - у двійковій).

Алгоритми названо на честь авторів, які вперше запропонували їх у 1977 році. З них перший – LZ77. Для архівування створюється так зване ковзне за повідомленням вікно, що складається із двох частин. Перша частина, більшого формату, служить для формування словника і має розмір кількох кілобайт. У другу, меншу частину (зазвичай розміром до 100 байт) приймаються поточні символи тексту, що переглядається. Алгоритм намагається знайти у словнику сукупність символів, яка збігається з прийнятими у вікно перегляду. Якщо це вдається, формується код, що складається з трьох частин: зміщення в словнику щодо його початкового підрядка, довжина цього підрядка, що йде за цим підрядком символ. Наприклад, виділений підрядок складається з символів "додатків" (всього 6 символів), наступний за нею символ - "е". Тоді, якщо підрядок має адресу (місце у словнику) 45, то запис у словник має вигляд "45, 6. е". Після цього вміст вікна зсувається на позицію, і пошук продовжується. У такий спосіб формується словник.

Перевагою алгоритму є легко сформульований алгоритм складання словника. Крім того, можливе розархівування без початкового словника (бажано при цьому мати тестову послідовність) - словник формується по ходу розархівування.

Недоліки алгоритму виникають зі збільшенням розміру словника - збільшується час на пошук. З іншого боку, якщо у поточному вікні з'являється рядок символів, відсутня у словнику, триелементним кодом записується кожен символ, тобто. виходить не стиск, а розтяг.

Найкращі характеристики має алгоритм LZSS, запропонований 1978г. У ньому є відмінності у підтримці ковзного вікна та вихідних кодах компресора. Крім вікна, алгоритм формує двійкове дерево, аналогічне дереву Хафмана для прискорення пошуку збігів: кожен підрядок, що залишає поточне вікно, додається до дерева як одного з дітей. Такий алгоритм дозволяє додатково збільшити розмір поточного вікна (бажано, щоб його величина дорівнювала ступені двійки: 128, 256 і т.д. байт). Інакше формуються і коди послідовностей: додатково вводиться 1-бітний префікс для розрізнення незакодованих символів від пар "зміщення, довжина".

Ще більший ступінь стиснення виходить при використанні алгоритмів типу LZW. Описані раніше алгоритми мають фіксований розмір вікна, що призводить до неможливості занесення до словника фраз довше за розмір вікна. В алгоритмах LZW (та їх попередника LZ78) вікно перегляду має необмежений розмір, а словник накопичує фрази (а не сукупність символів, як раніше). Словник має необмежену довжину, а кодер (декодер) працюють у режимі очікування фрази. Коли фраза, що збігається зі словником, сформована, видається код збігу (тобто код цієї фрази у словнику) і код символу, що за ним слідує. Якщо в міру накопичення символів утворюється нова фраза, вона також заноситься до словника, як і коротша. В результаті утворюється рекурсивна процедура, що забезпечує швидке кодування та декодування.

Додаткову можливість компресії забезпечує стисле кодування символів, що повторюються. Якщо в послідовності деякі символи йдуть поспіль (наприклад, у тексті це можуть бути символи "пробіл", в числовій послідовності - нулі, що поспіль, і т.д.), то має сенс замінювати їх парою "символ; довжина" або "ознака, довжина ". У першому випадку в коді вказується ознака, що буде здійснюватися кодування послідовності (зазвичай 1 біт), потім код символу, що повторюється, і довжина послідовності. У другому випадку (передбаченому для символів, що найчастіше зустрічаються) у префіксі вказується просто ознака повторів.

Технологія кодування, яка застосовується у DVD-плеєрах із власними

декодерами звуку та ресиверах. Стиснення (або зменшення) динамічного діапазону застосовується для обмеження піків звуку під час перегляду фільмів. Якщо глядач бажає дивитися фільм, у якому можливі різкі зміни рівня гучності (фільм про війну,

наприклад), але не хоче завдавати занепокоєння членам своєї сім'ї, режим DRC слід включити. Суб'єктивно, на слух після включення DRC в звуку зменшується частка низьких частот і високі звуки втрачають прозорість, тому без необхідності режим DRC включати не варто.

DreamWeaver (Див. – FrontPage)

Візуальний редактор гіпертекстових документів розроблений софтверною фірмою Macromedia Inc. Потужна професійна програма DreamWeaver містить можливості для генерації сторінок HTML будь-якої складності та масштабу, а також має вбудовані засоби підтримки великих мережевих проектів. Є інструментом візуального проектування, що підтримує розвинені засоби концепції WYSIWYG.

Driver (Драйвер) (Див. Драйвер)

Програмний компонент, який дозволяє взаємодіяти з пристроями

комп'ютера, наприклад, мережна карта (NIC), клавіатура, принтер або монітор. Мережеве обладнання (наприклад, концентратор), з'єднане з ПК, вимагає драйверів для того, щоб ПК міг взаємодіяти з цим обладнанням.

DRM (Digital Rights Management – Управління доступом та копіюванням інформації, захищеної копірайтом, Цифрове управління правами)

u Концепція, яка передбачає застосування спеціальних технологій та методів захисту цифрових матеріалів для гарантованого надання їх лише уповноваженим користувачам.

v Клієнтська програма для взаємодії з пакетом Digital Rights Management Services, який призначений для керування доступом до захищеної копірайтом інформації та її копіюванням. DRM Services працює в середовищі Windows Server 2003. Клієнтське програмне забезпечення працюватиме в Windows 98, Me, 2000 і XP, забезпечуючи таким програмам, як Office 2003, доступ до відповідних служб. У майбутньому Microsoft має випустити модуль керування цифровими правами для браузера Internet Explorer. У перспективі планується обов'язкова наявність на комп'ютері такої програми для роботи з будь-яким контентом, який використовує технології DRM для захисту від незаконного копіювання.

Droid (Робот) (Див. Агент)

DSA(Digital Signature Algorithm – Алгоритм цифрового підпису)

Алгоритм цифровий підпис з відкритим ключем. Розроблено NIST (США) у 1991 р.

DSL (Digital Subscrabe Line – Цифрова абонентська лінія)

Сучасна технологія, що підтримується міськими телефонними станціями для обміну сигналами на більш високих частотах, у порівнянні зі звичайними, аналоговими модемами. DSL-модем може працювати одночасно з телефоном (аналоговий сигнал) і цифровою лінією. Оскільки спектри голосового сигналу телефону і цифрового DSL-сигналу не «перетинаються», тобто. не впливають один на одного, DSL дозволяє працювати в Інтернеті і говорити по телефону по одній і тій же фізичній лінії. Більше того, DSL-технологія зазвичай використовує кілька частот, і DSL-модеми з обох боків лінії намагаються підібрати найкращі з них передачі даних. DSL-модем не тільки передає дані, але виконує також роль маршрутизатора. Обладнаний Ethernetпортом, DSL-модем дозволяє підключити до нього кілька комп'ютерів.

DSOM(Distributed System Object Model, Distributed SOM – Модель розподілених системних об'єктів)

Технологія фірми IBM із відповідною програмною підтримкою.

DSR? (Data set ready – Сигнал готовності до передачі даних, сигнал DSR)

Сигнал послідовного інтерфейсу, що показує, що пристрій (наприклад,

модем) готове надіслати біт даних у ПК.

DSR? (Device Status Report – Звіт про стан пристрою)

DSR? (Device Status Register – Регістр стану пристрою)

DSS? (Decision Support System – Система підтримки прийняття рішень) (Див.

Рівень звуку однаковий на протязі всієї композиції, є кілька пауз.

Звуження динамічного діапазону

Звуження динамічного діапазону, або простіше кажучи компресія, необхідна для різних цілей, що найчастіше зустрічаються з них:

1) Досягнення єдиного рівня гучності протягом усієї композиції (або партії інструменту).

2) Досягнення єдиного рівня гучності композицій протягом альбому/радіо передачі.

2) Підвищення розбірливості, переважно при компресії певної партії (вокал, бас бочка).

Як відбувається звуження динамічного діапазону?

Компресор аналізує рівень звуку на вході порівнюючи його з значенням Threshold (Поріг), що задається користувачем.

Якщо рівень сигналу нижче значення Threshold- компресор продовжує аналізувати звук не змінюючи його. Якщо рівень звуку перевищує значення Threshold – компресор починає свою дію. Так як роль компресора полягає в звуженні динамічного діапазону, то логічно припустити те, що він обмежує найбільш великі і найменші значення амплітуди (рівня сигналу). На першому етапі відбувається обмеження найбільших значень, які знижуються з певною силою, що називається Ratio(Ставлення). Подивимося на приклад:

Зелені криві відображають рівень звуку, що більше амплітуда їх коливань від осі X – то більше вписувалося рівень сигналу.

Жовта лінія – це поріг (Threshold) спрацьовування компресора. Роблячи значення порога Threshold вище - користувач віддаляє його від осі X. Роблячи значення порога Threshold нижче - користувач наближає його до осі Y. Зрозуміло, що чим нижче значення порога - тим частіше буде спрацьовувати компресор і навпаки, чим вище - тим рідше. Якщо значення Ratio дуже велике – після досягнення рівня сигналу Threshold весь наступний сигнал буде пригнічений компресором до тиші. Якщо значення Ratio дуже мало – нічого не станеться. Про вибір значень Threshold і Ratio йтиметься пізніше. Зараз нам слід поставити собі наступне питання: Який же сенс придушувати весь наступний звук? Справді, у цьому сенсу немає, нам потрібно позбутися лише значень амплітуди (піків), які перевищують значення Threshold (на графіці позначені червоним). Саме для вирішення цієї проблеми і існує параметр Release(Загасання), яким задається час дії компресії.

На прикладі видно те, що перший і другий перевищення порога Threshold тривають менше ніж третє перевищення порога Threshold. Так, якщо параметр Release налаштувати на перші два піки - то при обробці третього може залишитися необроблена частина (бо перевищення порога Threshold триває довше). Якщо ж параметр Release налаштувати на третій пік, то при обробці першого і другого піку за ними утворюється небажане зниження рівня сигналу.

Те саме стосується параметра Ratio. Якщо параметр Ratio налаштувати на перші два піки, то третій не буде досить пригнічений. Якщо ж параметр Ratio налаштувати на обробку третього піку - обробка перших двох піків буде занадто завищеною.

Ці проблеми можна вирішити двома способами:

1) Завданням параметра атаки (Attack) – часткове рішення.

2) Динамічну компресію – повне рішення.

Параметр атаки (Attack)призначений для завдання часу, після якого компресор розпочне свою роботу після перевищення порога Threshold. Якщо параметр близький до нуля (рівний нулю у разі паралельної компресії, дивись соотв. Статтю) - то компресор почне пригнічувати сигнал відразу ж, і буде працювати у часі, що задається параметром Release. Якщо ж швидкість атаки велика - компресор почне свою дію після закінчення певного проміжку часу (це потрібно для надання чіткості). У нашому випадку можна налаштувати параметри порога (Threshold), згасання (Release) та рівня компресії (Ratio) на обробку перших двох піків, а значення атаки (Attack) поставити близьким до нуля. Тоді компресор придушить перші два піку, і при обробці третього буде пригнічувати його до закінчення перевищення порога (Threshold). Однак це не гарантує якісної обробки звуку та близько до ліміттингу (грубий зріз усіх значень амплітуди, у цьому випадку компресор називається ліміттером).

Погляньмо на результат обробки звуку компресором:

Піки зникли, зауважу те що налаштування обробки були досить щадними і ми придушили тільки значення амплітуди, що виступають. Насправді ж динамічний діапазон звужується набагато сильніше і це тенденція лише прогресує. В умах багатьох композиторів – вони роблять музику голосніше, проте на практиці вони повністю позбавляють її динаміки для тих слухачів, які, можливо, слухатимуть її вдома, а не по радіо.

Нам залишилося розглянути останній параметр компресії, це Gain(Посилення). Посилення призначене для збільшення амплітуди всієї композиції та, по суті, еквівалентне іншому інструменту звукових редакторів – нормалайзу. Подивимося на кінцевий результат:

У нашому випадку компресія була виправданою і покращила якість звуку, оскільки пік, що виділяється, швидше є випадковістю, ніж навмисним результатом. Крім того, видно те, що музика ритмічна, отже їй властивий вузький динамічний діапазон. У випадках коли високі значення амплітуд були зроблені спеціально, компресія може стати помилкою.

Динамічна компресія

Відмінність динамічної компресії від динамічної полягає в тому, що при першій рівень придушення сигналу (Ratio) залежить від рівня вхідного сигналу. Динамічні компресори є у всіх сучасних програмах, керуванням параметрами Ratio та Threshold здійснюється за допомогою вікна (кожному параметру відповідає своя вісь):

Єдиного стандарту відображення графіка немає, десь по осі Y відображається рівень вхідного сигналу, десь навпаки, рівень сигналу після компресії. Десь точка (0,0) знаходиться у верхньому правому кутку, десь у нижньому лівому. У будь-якому випадку, при переміщенні курсору миші по цьому полю змінюються значення цифр, які відповідають параметрам Ratio та Threshold. Тобто. Ви задаєте рівень компресії для кожного значення Threshold, завдяки чому можна дуже гнучко налаштувати компресію.

Сайд чейн (Side Chain)

Сайд чейн компресор аналізує сигнал одного каналу, і коли рівень звуку перевершує поріг (threshold) – застосовує компресію до іншого каналу. Сайд чейн має свої переваги роботи з інструментами, які розташовані в одній частотній області (активно використовується зв'язка бас – бас бочка), проте іноді використовуються і інструменти, розташовані в різних частотних областях, що призводить до цікавого ефекту сайд-чейн.

Частина друга – Етапи компресії

Існує три етапи компресії:

1) Перший етап - компресія окремих звуків (singleshoots).

Тембр будь-якого інструменту має такі характеристики: Атака (Attack), Тримання (Hold), Спад (Decay), Період утримання (Delay) Рівень (Sustain), Згасання (Release).

Етап компресії окремих звуків поділяється на дві частини:

1.1) Компресія окремих звуків ритмічних інструментів

Часто складові біта вимагають окремої компресії надання їм чіткості. Багато хто обробляють бас бочку окремо від інших ритмічних інструментів, як на етапі компресії окремих звуків, так і на етапі компресії окремих партій. Пов'язано це з тим, що вона знаходиться в низькочастотній області, де, крім неї, зазвичай є тільки бас. Під чіткістю бас бочки розуміється наявність характерного клацання (у бас бочки дуже короткий час атаки та тримання). Якщо клацання немає - потрібно обробити її компресором, задаючи поріг рівним нулю а час атаки від 10 до 50 мс. Спад (Realese) компресора має закінчитись до нового удару бас-бочки. Останню проблему можна вирішити за допомогою формули: 60 000 / BPM де BPM – темп композиції. Так, наприклад) 60000/137 = 437,96 (час у мілісекундах до нової сильної частки 4-х розмірної композиції).

Все вище сказане відноситься і до інших ритмічних інструментів з коротким часом атаки – вони повинні мати акцентоване клацання, яке не повинно бути придушене компресором на якомусь з етапів рівнів компресії.

1.2) Компресіяокремих звуківгармонійних інструментів

На відміну від ритмічних інструментів партії гармонійних інструментів досить рідко складаються з окремих звуків. Однак з цього не слід те, що їх не слід обробляти на рівні компресії звуків. Якщо Ви використовуєте семпл із записаною партією – то це другий рівень компресії. До цього рівня компресії відносяться лише гармонійні інструменти, що синтезуються. Це можуть бути семплери, синтезатори, що використовують різні методи синтезу звуку (фізичне моделювання, FM, адитивний, субтрактивний та ін.). Як Ви, напевно, вже здогадалися – йдеться про програмування налаштувань синтезатора. Так! Це також компресія! Практично у всіх синтезаторів є програмований параметр envelope (ADSR), що в перекладі означає загальна. За допомогою огинаючої задається час Атаки (Attack), Спада (Decay), Рівень тримання (Sustain), Затухання (Release). І якщо Ви мені скажіть те, що це не компресія кожного окремого звуку - Ви мій ворог на все життя!

2) Другий етап – компресія окремих партій.

Під компресією окремих партій розумію звуження динамічного діапазону низки об'єднаних окремих звуків. У цей етап входять і записи партій, у тому числі вокал, який вимагає обробки компресії для надання йому чіткості та розбірливості. При обробці компресією партій необхідно враховувати те що при додаванні окремих звуків можуть виникнути небажані піки, яких і необхідно позбутися цьому етапі, оскільки якщо це зробити зараз, то картина може погіршитися на етапі відомості всієї композиції. На етапі компресії окремих партій необхідно враховувати компресію етапу обробки окремих звуків. Якщо Ви досягли чіткості бас бочки, то неправильна повторна обробка на другому етапі може все зіпсувати. Обробка всіх партій компресором не обов'язкова, як і необов'язкова обробка всіх окремих звуків. Я Вам раджу поставити про всяк випадок аналізатор амплітуди, щоб визначати наявність небажаних побічних ефектів поєднання окремих звуків. Крім компресії на цьому етапі необхідно стежити, щоб партії були по можливості в різних частотних діапазонах, щоб було виконано квантування. У звуку є така характеристика як маскування (психоакустика):

1) Більш тихий звук маскується гучнішим, що йде перед ним.

2) Більш тихий звук на низькій частоті маскується гучнішим звуком на високій частоті.

Так, наприклад, якщо Ви маєте партію синтезатора, то часто ноти починають грати до того, як закінчують своє звучання попередні ноти. Іноді це необхідно (створення гармонії, стиль гри, багатоголосся), але часом зовсім немає - Ви можете обрізати їх кінець (Delay - Release) у випадку, якщо він чутний у solo режимі, але не чутний у режимі відтворення всіх партій. Те саме стосується ефектів, наприклад реверберації - вона не повинна тривати до нового початку звучання джерела звуку. Вирізаючи та видаляючи непотрібний сигнал – ви робите звучання чистішим, і це теж може бути розглянуте як компресія – тому що Ви видаляєте непотрібні хвилі.

3) Третій етап – компресія композиції.

При компресії всієї композиції необхідно враховувати те, що всі партії є об'єднанням безлічі окремих звуків. Отже, при їх об'єднанні та подальшій компресії потрібно стежити за тим, щоб кінцева компресія не зіпсувала те, чого ми досягли на перших двох етапах. Також потрібно розділяти композиції, в яких важливий широкий або вузький діапазон. при компресії композицій з широким динамічним діапазоном - достатньо поставити компресор, який тиснутиме короткочасні піки, які утворилися в результаті складання партій між собою. При компресії композиції, в якій важливий тонкий динамічний діапазон, - все набагато складніше. Тут компресори останнім часом називають максимайзерами. Максимайзер – плагін, який поєднує компресор, ліміттер, графічний еквалайзер, енхайзер та інші інструменти перетворення звуку. При цьому він повинен обов'язково мати інструменти аналізу звуку. Максимайзинг, кінцева обробка компресором, багато в чому необхідна боротьби з допущеними помилками попередніх етапах. Помилки – не стільки компресії (втім, якщо Ви робите на останньому етапі те, що Ви могли зробити на першому етапі – це вже помилка), скільки у початковому виборі хороших семплів та інструментів, які не заважали б один одному (йдеться про частотні діапазони) . Саме для цього здійснюється корекція АЧХ. Часто буває так, що при сильній компресії на майстрі потрібно змінювати параметри компресії і відомості на ранніх етапах, так як при сильному звуженні динамічного діапазону вилазять тихі звуки, які раніше маскувалися, змінюється звучання окремих компонентів композиції.

У цих частинах я навмисне не говорив про конкретні параметри компресії. Я вважав за необхідне написати про те, що при компресії необхідно приділяти увагу всім звукам і всім партіям на всіх етапах створення композиції. Тільки так у результаті Ви отримаєте гармонійний результат не лише з погляду теорії музики, а й з погляду звукорежисури.

Далі в таблиці наведено практичні поради щодо обробки окремих партій. Однак у компресії цифри та пресети можуть лише підказати потрібну область, в окрузі якої потрібно шукати. Ідеальні параметри компресії залежать від кожного окремого випадку. Параметри посилення (Gain) та порога (Threshold) мають на увазі нормальний рівень звуку (логічне використання всього діапазону).

Частина третя – Параметри компресії

Коротка довідка:

Поріг спрацьовування (threshold) - Визначає рівень звуку вхідного сигналу, по досягненню якого компресор починає роботу.

Атака (Attack) – визначає час, після якого компресор почне працювати.

Рівень (ratio) – визначає рівень зменшення значень амплітуди (стосовно оригінального значення амплітуди).

Спад (release) – визначає час, після якого компресор перестане працювати.

Посилення (Gain) – визначає рівень підвищення вхідного сигналу після обробки компресором.

Таблиця компресії:

Інструмент	Threshold	Attack	Ratio	Release	Gain	Опис
Вокал	0 ДБ	1-2 мс 2-5 mS 10 мсек 0.1 мс 0.1 мс	менше 4:1 2,5: 1 4:1 – 12:1 2:1 -8:1	150 мс 50-100 mS 150 мсек 150 мс 0.5s		Компресія при записі має бути мінімальна, вимагає обов'язкової обробки на етапі відомості для надання чіткості та розбірливості.
Духові інструменти		1 – 5ms	6:1 – 15:1	0.3s
Бочка		від 10 до 50 мс 10-100 mS	4:1 і вище 10:1	50-100 мс 1 mS		Чим нижче Thrshold і чим більше Ratio і довше Attack, тим сильніше виражений клацання спочатку бочки.
Синтезатори						Залежить від типу хвилі (що обгинають ADSR).
Робочий барабан:		10-40 mS 1-5ms	5:1 5:1 – 10:1	50 mS 0.2s
Хай-Хет		20 mS	10:1	1 mS
Надголовні мікрофони		2-5 mS	5:1	1-50 mS
Ударні		5ms	5:1 – 8:1	10ms
Бас гітара		100-200 mS 4ms to 10ms	5:1	1 mS 10ms
Струнні		0-40 mS	3:1	500 mS
Синт. бас		4ms – 10ms	4:1	10ms		Залежить від огинаючих.

Перкусія		0-20 mS	10:1	50 mS
Акустична гітара, Піаніно		10-30 mS 5 – 10ms	4:1 5:1 -10:1	50-100 mS 0.5s
Електро-нітара		2 – 5ms	8:1	0.5s

Фінальна компресія		0.1 мс 0.1 мс	2:1 від 2:1 до 3:1	50 мс 0.1 мс	0 дБ на виході	Час атаки залежить від мети - чи потрібно видалити піки або зробити трек гладкішим.
Ліміттер після фінальної компресії		0 mS	10:1	10-50 mS	0 дБ на виході	Якщо потрібний тонкий динамічний діапазон і грубий «зріз» хвиль.

Інформація була взята з різних джерел, на які посилаються попуряні ресурси в Інтернеті. Відмінність параметрів компресії пояснюється відмінністю переваг звучання та роботою з різним матеріалом.

Замислимося над питанням – а навіщо нам піднімати гучність? Для того, щоб чути тихі звуки, які не чути в наших умовах (наприклад, якщо не можна слухати голосно, якщо є сторонні шуми в кімнаті і т.д.). А чи можна посилити тихі звуки, а гучні не чіпати? Виявляється, можна. Ця техніка називається стиском динамічного діапазону (компресія, Dynamic Range Compression, DRC). Для цього необхідно змінювати поточну гучність постійно – тихі звуки підсилювати, гучні – ні. Найпростіший закон зміни гучності - лінійний, тобто. гучність змінюється за законом output_loudness = k * input_loudness, де k - коефіцієнт стиснення динамічного діапазону:

Рисунок 18. Стиснення динамічного діапазону.

При k = 1 ніяких змін немає (вихідна гучність дорівнює вхідний). При k< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k >1 - гучність зменшуватиметься, а динамічний діапазон - збільшуватиметься.

Подивимося на графіки гучності (k = 1/2: стиск ДД вдвічі):

Малюнок 19. Графіки гучності.

Як видно в оригіналі були присутні як дуже тихі звуки, на 30дБ нижче за рівень діалогів, так і дуже гучні - на 30дБ вище за рівень діалогів. Т.о. динамічний діапазон становив 60дБ. Після компресії гучні звуки лише на 15дБ вище, а тихі - на 15дБ нижче рівня діалогів (динамічний діапазон тепер становить 30дБ). Таким чином, гучні звуки стали значно тихішими, а тихі - значно голоснішими. При цьому переповнення не відбувається!

Тепер звернемося до гістограм:

Рисунок 20. Приклад компресії.

Як добре видно – при посиленні до +30дБ форма гістограми добре зберігається, що означає, що гучні звуки залишаються добре вираженими (не йдуть у максимум і не обрізаються, як це відбувається при простому посиленні). У цьому виділяються тихі звуки. Гістограма це показує погано, проте різниця помітна на слух. Недолік методу - ті самі стрибки гучності. Однак механізм їх виникнення відрізняється від стрибків гучності, що виникають при обрізанні, а їх характер відмінний - вони виявляються в основному при дуже сильному посиленні тихих звуків (а не при обрізанні гучних, як при звичайному посиленні). Надмірний рівень компресії призводить до сплощення звукової картини - всі звуки прагнуть однакової гучності та невиразності.

Сильне посилення тихих звуків може призвести до того, що почують шуми запису. Тому у фільтрі застосований трохи модифікований алгоритм, щоб рівень шумів піднімався менше:

Малюнок 21. Збільшення гучності без збільшення шуму.

Тобто. на рівні гучності -50дБ відбувається перегин передавальної функції, і шуми посилюватимуться менше (жовта лінія). За відсутності такого перегину шуми будуть значно гучнішими (сіра лінія). Така проста модифікація значно знижує кількість шумів навіть за дуже сильних рівнів стиснення (на малюнку - стиск 1:5). Рівень “DRC” у фільтрі задає рівень посилення тихих звуків (на рівні -50dB), т.о. рівень компресії 1/5, показаний малюнку, відповідає рівню +40дБ в налаштуваннях фільтра.

Або фотографічна широтафотоматеріалу – це відношення між максимальним та мінімальним значенням експозиції, які можуть бути коректно зафіксовані на знімку. Стосовно цифрової фотографії динамічний діапазон фактично еквівалентний відношенню максимального і мінімального можливих значень корисного електричного сигналу, що генерується фотосенсором в ході експонування.

Динамічний діапазон вимірюється у щаблях експозиції (). Кожен ступінь відповідає подвоєнню кількості світла. Так, наприклад, якщо якась камера має динамічний діапазон 8 EV, то це означає, що максимальне можливе значення корисного сигналу її матриці відноситься до мінімального як 2 8:1, а значить, камера здатна зафіксувати в межах одного кадру об'єкти, що відрізняються по яскравості лише у 256 раз. Точніше, відобразити вона може об'єкти з будь-якою яскравістю, проте об'єкти, чия яскравість буде перевищувати максимальне допустиме значення вийдуть на знімку сліпучо білими, а об'єкти, чия яскравість виявиться нижче мінімального значення, - вугільно чорними. Деталі та фактура будуть помітні лише на тих об'єктах, яскравість яких вкладається в динамічний діапазон камери.

Для опису відносини між яскравістю найсвітлішого і найтемнішого з об'єктів, що знімаються, часто використовується не цілком коректний термін «динамічний діапазон сцени». Правильніше говоритиме про діапазон яскравості або про рівень контрасту, оскільки динамічний діапазон – це зазвичай характеристика вимірювального пристрою (у даному випадку матриці цифрового фотоапарата).

На жаль, діапазон яскравості багатьох красивих сцен, з якими ми стикаємося в реальному житті, може значно перевищувати динамічний діапазон цифрової фотокамери. У таких випадках фотограф буває змушений вирішувати, які об'єкти мають бути опрацьовані у всіх деталях, а які можна залишити поза динамічним діапазоном без шкоди для творчого задуму. Для того, щоб максимально ефективно використовувати динамічний діапазон вашої камери, від вас часом може знадобитися не так досконале розуміння принципу роботи фотосенсора, як розвинене художнє чуття.

Чинники, що обмежують динамічний діапазон

Нижня межа динамічного діапазону задана рівнем власного шуму фотосенсора. Навіть неосвітлена матриця генерує фоновий електричний сигнал, який називається темновим шумом. Також перешкоди виникають при переносі заряду в аналого-цифровий перетворювач, та й сам АЦП вносить в сигнал, що оцифровується, певну похибку - т.зв. шум дискретизації.

Якщо зробити знімок у повній темряві або з кришкою на об'єктиві, камера запише тільки цей безглуздий шум. Якщо дозволити мінімальній кількості світла потрапити на детектор, фотодіоди почнуть накопичувати електричний заряд. Розмір заряду, отже, і інтенсивність корисного сигналу, буде пропорційна числу спійманих фотонів. Щоб на знімку проступили хоч скількись осмислені деталі, необхідно, щоб рівень корисного сигналу перевищив рівень фонового шуму.

Таким чином, нижню межу динамічного діапазону або, інакше кажучи, поріг чутливості сенсора формально можна визначити як рівень вихідного сигналу, при якому відношення сигнал/шум більше одиниці.

Верхня межа динамічного діапазону визначається ємністю окремого фотодіода. Якщо під час експозиції який-небудь фотодіод накопичить електричний заряд граничної для себе величини, то піксель зображення, що відповідає перевантаженому фотодіоду зображення вийде абсолютно білим, і подальше опромінення вже ніяк не вплине на його яскравість. Це явище називають кліпінгом. Чим вище перевантажувальна здатність фотодіода, тим більший сигнал здатний він дати на виході, перш ніж досягне насичення.

Для більшої наочності звернемося до характеристичної кривої, яка є графіком залежності вихідного сигналу від експозиції. На горизонтальній осі відкладено двійковий логарифм опромінення, одержуваного сенсором, але в вертикальної – двійковий логарифм величини електричного сигналу, генерованого сенсором у відповідь це опромінення. Мій малюнок значною мірою умовний і має виключно ілюстративні цілі. Характеристична крива справжнього фотосенсора має більш складну форму, та й рівень шуму рідко буває настільки високий.

На графіку добре видно дві критичні переломні точки: у першій їх рівень корисного сигналу перетинає шумовий поріг, тоді як у другий – фотодіоди досягають насичення. Значення експозиції, що лежать між двома точками, і становлять динамічний діапазон. У цьому абстрактному прикладі він дорівнює, як неважко помітити, 5 EV, тобто. камера здатна перетравити п'ять подвоєння експозиції, що рівнозначно 32-кратної (2 5 =32) різниці в яскравості.

Зони експозиції, що становлять динамічний діапазон нерівноцінні. Верхні зони відрізняються більш високим ставленням сигнал/шум, і тому виглядають чистішими та детальнішими, ніж нижні. Внаслідок цього верхня межа динамічного діапазону дуже речова і відчутна - кліпінг обрубує світла при найменшій перетримці, тоді як нижня межа непримітним чином тоне в шумах, і перехід до чорного кольору далеко не такий різкий, як до білого.

Лінійна залежність сигналу від експозиції, а також різкий вихід плато є унікальними рисами саме цифрового фотографічного процесу. Для порівняння погляньте на умовну характеристичну криву традиційної фотоплівки.

Форма кривої і особливо кут нахилу сильно залежить від типу плівки і зажадав від процедури її прояви, але незмінним залишається головне, кидається у вічі відмінність плівкового графіка від цифрового – нелінійний характер залежності оптичної щільності плівки від величини експозиції.

Нижня межа фотографічної широти негативної плівки визначається щільністю вуалі, а верхня - максимальною оптичною досяжною щільністю фотошару; у обертових плівок – навпаки. Як у тінях, так і у світлах спостерігаються плавні вигини характеристичної кривої, що вказують на падіння контрасту при наближенні до меж динамічного діапазону, адже кут нахилу кривої пропорційний контрастності зображення. Таким чином, зони експозиції, що лежать на середній частині графіка, мають максимальний контрастом, у той час як у світлах і тінях контраст знижений. На практиці різниця між плівкою та цифровою матрицею особливо добре помітна у світлах: там, де у цифровому зображенні світла випалені кліпінгом, на плівці деталі все ще помітні, хоч і малоконтрастні, а перехід до чисто білого кольору виглядає плавним та природним.

У сенситометрії використовуються навіть два самостійні терміни: власне фотографічна широта, обмежена порівняно лінійною ділянкою характеристичної кривої, та корисна фотографічна широта, Що включає крім лінійної ділянки також основу та плече графіка.

Примітно, що при обробці цифрових фотографій, до них, як правило, застосовується більш менш виражена S-подібна крива, що підвищує контраст у півтонах ціною його зниження в тінях і світлах, що надає цифровому зображенню більш природний і приємний оку вигляд.

Розрядність

На відміну від матриці цифрового фотоапарата людському зору властивий, скажімо так, логарифмічний погляд на світ. Послідовні подвоєння кількості світла сприймаються нами як рівні зміни яскравості. Світлові числа можна порівняти з музичними октавами, адже дворазові зміни частоти звуку сприймаються на слух як єдиний музичний інтервал. За таким принципом працюють інші органи почуттів. Нелінійність сприйняття дуже розширює діапазон чутливості людини до подразникам різної інтенсивності.

При конвертуванні RAW-файлу (не важливо – засобами камери або в RAW-конвертері), що містить лінійні дані, до нього автоматично застосовується т.зв. гамма-крива, яка покликана нелінійно підвищити яскравість цифрового зображення, приводячи її у відповідність до особливостей людського зору.

При лінійній конверсії зображення виходить занадто темним.

Після гамма-корекції яскравість приходить у норму.

Гамма-крива хіба що розтягує темні тони і стискає світлі, роблячи розподіл градацій рівномірнішим. В результаті зображення набуває природного вигляду, але шум і артефакти дискретизації в тінях неминуче стають помітнішими, що тільки посилюється малою кількістю рівнів яскравості в нижніх зонах.

Лінійний розподіл градацій яскравості.

Рівномірний розподіл після застосування гамма-кривої.

ISO та динамічний діапазон

Незважаючи на те, що в цифровій фотографії використовується та ж концепція світлочутливості фотоматеріалу, що й у фотографії плівкової, слід розуміти, що відбувається це виключно через традицію, оскільки підходи до зміни світлочутливості в цифровій та плівковій фотографії різняться принципово.

Підвищення чутливості ISO у традиційній фотографії означає заміну однієї плівки іншу з більшим зерном, тобто. відбувається об'єктивна зміна властивостей самого фотоматеріалу. У цифровій камері світлочутливість сенсора жорстко задана його фізичними характеристиками і може бути змінена буквально. При підвищенні ISO камера змінює не реальну чутливість сенсора, а лише посилює електричний сигнал, що генерується сенсором у відповідь на опромінення та відповідним чином коригує алгоритм оцифрування цього сигналу.

Важливим наслідком є зниження ефективного динамічного діапазону пропорційно підвищенню ISO, адже разом із корисним сигналом посилюється і шум. Якщо при ISO 100 оцифровується весь діапазон значень сигналу - від нуля і до точки насичення, то при ISO 200 вже половина ємності фотодіодів приймається за максимум. З кожним подвоєнням чутливості ISO верхній ступінь динамічного діапазону як би відсікається, а щаблі, що залишилися, підтягуються на її місце. Саме тому використання надвисоких значень ISO позбавлене практичного змісту. З тим же успіхом можна висвітлити фотографію в RAW-конвертері та отримати порівняний рівень шумів. Різниця між підвищенням ISO та штучним освітленням знімка полягає в тому, що при підвищенні ISO посилення сигналу відбувається до надходження його в АЦП, а значить, шум квантування не посилюється, на відміну від власних шумів сенсора, у той час як у RAW-конвертері підлягають посиленню зокрема й помилки АЦП. Крім того, зменшення діапазону оцифрування означає більш точну дискретизацію значень вхідного сигналу, що залишилися.

До речі, доступне на деяких апаратах зниження ISO нижче за базове значення (наприклад, до ISO 50), аж ніяк не розширює динамічний діапазон, а просто послаблює сигнал вдвічі, що рівноцінно затемненню знімка в RAW-конвертері. Цю функцію можна навіть розглядати як шкідливу, оскільки використання субмінімального значення ISO, провокує камеру на збільшення експозиції, що при незмінному порозі насичення сенсора підвищує ризик отримати кліпінг у світлах.

Справжня величина динамічного діапазону

Існує ряд програм на кшталт (DxO Analyzer, Imatest, RawDigger та ін.), що дозволяють виміряти динамічний діапазон цифрового фотоапарата в домашніх умовах. В принципі, в цьому немає великої необхідності, оскільки дані для більшості камер можна знайти в інтернеті, наприклад, на сайті DxOMark.com .

Чи варто вірити результатам таких випробувань? Цілком. З тим лише застереженням, що це тести визначають ефективний чи, якщо можна сказати, технічний динамічний діапазон, тобто. відношення між рівнем насичення та рівнем шуму матриці. Для фотографа насамперед важливий корисний динамічний діапазон, тобто. кількість зон експозиції, які справді дозволяють відобразити якусь корисну інформацію.

Як пам'ятаєте, поріг динамічного діапазону заданий рівнем шумів фотосенсора. Проблема в тому, що на практиці нижні зони, що формально вже входять в динамічний діапазон, містять все ще занадто багато шуму, щоб їх можна було використати. Тут багато залежить від індивідуальної гидливості - прийнятний рівень шуму кожен визначає для себе сам.

Моя суб'єктивна думка така, що деталі в тінях починають виглядати більш-менш пристойно щодо сигнал/шум не менше восьми. На цій підставі я визначаю для себе корисний динамічний діапазон як технічний динамічний діапазон мінус приблизно три ступені.

Наприклад, якщо дзеркальна камера згідно з результатами достовірних тестів має динамічний діапазон в 13 EV, що дуже непогано за сьогоднішніми мірками, то її корисний динамічний діапазон становитиме близько 10 EV, що, загалом, теж дуже непогано. Зрозуміло, мова йде про зйомку RAW, з мінімальним ISO і максимальною розрядністю. При зйомці в JPEG динамічний діапазон залежить від налаштувань контрасту, але в середньому слід відкинути ще два-три ступені.

Для порівняння: кольорові фотоплівки, що обертаються, мають корисну фотографічну широту в 5-6 ступенів; Чорно-білі негативні плівки дають 9-10 ступенів при стандартних процедурах прояву та друку, а при певних маніпуляціях – аж до 16-18 ступенів.

Підсумовуючи сказане вище, спробуємо сформулювати кілька простих правил, дотримання яких допоможе вам вичавити з сенсора вашої камери максимум продуктивності:

Динамічний діапазон цифрового фотоапарата повністю доступний тільки при зйомці в RAW.
Динамічний діапазон зменшується зі зростанням світлочутливості, тому уникайте високих значень ISO, якщо в них немає гострої необхідності.
Використання вищої розрядності для RAW-файлів не збільшує дійсний динамічний діапазон, але покращує тональний поділ у тінях за рахунок більшої кількості рівнів яскравості.
Exposure to the right. Верхні зони експозиції завжди містять максимум корисної інформації при мінімумі шумів і мають використовуватися найбільш ефективно. При цьому не варто забувати і про небезпеку кліпінгу – пікселі, які досягли насичення, є абсолютно марними.

І головне: не варто зайве переживати щодо динамічного діапазону вашої камери. З динамічним діапазоном у неї все гаразд. Ваше вміння бачити світло та грамотно керувати експозицією – набагато важливіше. Хороший фотограф не стане скаржитися на нестачу фотографічної широти, а постарається дочекатися більш комфортного освітлення, або змінить ракурс, або скористається спалахом, словом, буде діяти відповідно до обставин. Я вам скажу більше: деякі сцени лише виграють через те, що не вкладаються у динамічний діапазон камери. Часто непотрібна різноманітність деталей просто необхідно сховати в напівабстрактний чорний силует, який робить фотографію одночасно лаконічнішим і багатшим.

Високий контраст це завжди погано – треба лише вміти з нею працювати. Навчіться експлуатувати недоліки обладнання так само, як і його переваги, і ви здивуєтеся, наскільки ваші творчі можливості розширяться.

Дякую за увагу!

Василь О.

Post scriptum

Якщо стаття виявилася для вас корисною та пізнавальною, ви можете люб'язно підтримати проект, зробивши внесок у його розвиток. Якщо ж стаття вам не сподобалася, але у вас є думки про те, як зробити її кращою, ваша критика буде прийнята з не меншою вдячністю.

Не забувайте, що ця стаття є об'єктом авторського права. Передрук та цитування допустимі за наявності діючого посилання на першоджерело, причому текст, що використовується, не повинен жодним чином спотворюватися або модифікуватися.