Image Processing Toolbox. Короткий курс теорії обробки зображень. І.М.Журавель. Сегментація у колірному просторі RGB

Редагування зображень і створення колажів було б дуже захоплюючим процесом, якби не доводилося витрачати більшу частину часу на копітку розмітку об'єктів. Завдання ще ускладнюється, коли межі об'єктів розмиті чи є прозорість. Інструменти Photoshop, такі як «магнітне ласо» і «чарівна паличка», не дуже інтелектуальні, оскільки орієнтуються лише на низькорівневі ознаки зображення. Вони повертають жорсткі (Hard) межі, які слід виправляти вручну. Підхід Semantic Soft Segmentation від дослідників Adobe допомагають вирішити це непросте завдання, розділяючи зображення на шари, що відповідають семантично значимим областям, та додаючи плавні переходи на краях.

"М'яка" сегментація

Група дослідників з лабораторії CSAIL у MIT та швейцарського університету ETH Zürich, яка працює під керівництвом Ягиза Аксоя, запропонувала підійти до цієї проблеми, ґрунтуючись на спектральній сегментації, додавши до неї сучасні досягнення глибокого навчання. За допомогою текстурної та колірної інформації, а також високорівневих семантичних ознак, вилучених за зображенням, будується граф спеціального вигляду. Потім з цього графу будується матриця Кірхгофа (Laplacian matrix). Використовуючи спектральне розкладання матриці, алгоритм генерує м'які контури об'єктів. Отримане за допомогою власних векторів розбиття зображення на шари можна використовувати для редагування.

Огляд запропонованого підходу

Опис моделі

Розглянемо спосіб створення семантично значимих шарів покроково:

1. Спектральна маска.Запропонований підхід продовжує роботу Левіна та його колег, які вперше використали матрицю Кірхгофа у задачі автоматичної побудови маски. Вони будували матрицю L, яка ставить попарну схожість між пікселями в деякій локальній області. За допомогою цієї матриці вони мінімізують квадратичний функціонал αᵀLα із заданими користувачем обмеженнями, де задає вектор значень прозорості для всіх пікселів даного шару. Кожен м'який контур є лінійною комбінацією K власних векторів, відповідних найменшим значенням L, яка максимізує так звану розрідженість маски.

2. Колірна близькість.Для обчислення ознак нелокальної близькості кольору дослідники генерують 2500 суперпікселів і оцінюють близькість між кожним суперпікселем і всіма суперпікселями в околиці радіусом 20% розміру зображення. Використання нелокальної близькості гарантує, що області з дуже схожими кольорами залишаться зв'язковими у складних сценах, подібних до зображеної нижче.

Нелокальна колірна близькість

3. Семантична близькість.Ця стадія дозволяє виділяти семантично зв'язні області зображення. Семантична близькість заохочує об'єднання пікселів, що належать одному об'єкту сцени, та штрафує за об'єднання пікселів різних об'єктів. Тут дослідники використовують попередні досягнення в області розпізнавання образів і обчислюють для кожного пікселя вектор ознак корелює з об'єктом, в який входить даний піксель. Вектори ознак обчислюються за допомогою нейромережі, про що ми поговоримо далі докладніше. Семантична близькість, як і колірна, визначається суперпікселях. Однак, на відміну від близькості кольору, семантична близькість пов'язує тільки найближчі суперпікселі, заохочуючи створення зв'язкових об'єктів. Поєднання нелокальної близькості кольору і локальної семантичної близькості дозволяє створити шари, які покривають роз'єднані в просторі зображення фрагмента одного семантично пов'язаного об'єкта (наприклад, рослинність, небо, інші типи фону).

Семантична близькість

4. Створення шарів.На цьому кроці за допомогою обчислених раніше близькостей будується матриця L. З цієї матриці витягуються власні вектори, що відповідають 100 найменшим власним значенням, а потім застосовується алгоритм розріджування, який витягує з них 40 векторів, якими будуються шари. Потім кількість шарів ще раз зменшується за допомогою алгоритму кластеризації k-means за k = 5. Це працює краще, ніж просте розрідження 100 власних векторів до п'яти, оскільки таке сильне скорочення розмірності робить завдання перевизначеним. Дослідники вибрали підсумкове число контурів рівним 5 і стверджують, що це розумне число для більшості зображень. Тим не менш, це число можна змінити вручну в залежності від зображення, що обробляється.

М'які контури до та після угруповання

5. Семантичні векторні ознаки.Для обчислення семантичної близькості використовувалися вектори ознак, пораховані нейросети. Основою нейромережі стала DeepLab-ResNet-101, навчена задачі передбачення метрики. Під час навчання заохочувалася максимізація L2-відстань між ознаками різних об'єктів. Таким чином, нейромережа мінімізує відстань між ознаками, що відповідають одному класу, та максимізує відстань в іншому випадку.

Якісне порівняння зі схожими методами

Зображення, наведені нижче, показують результати роботи запропонованого підходу (підписані як «Our result») у порівнянні з результатами найближчого підходу м'якої сегментації-спектрального методу побудови маски-і двома state-of-the-art методами семантичної сегментації: методом обробки сцен PSPNet та методом сегментації об'єктів Mask R-CNN.

Якісні порівняння м'якої семантичної сегментації з іншими підходами

Можна замінити, що PSPNet і Mask R-CNN схильні помилятися на межах об'єктів, а м'які контури, побудовані спектральним методом, часто заходять за межі об'єктів. При цьому описаний метод повністю охоплює об'єкт, не поєднуючи його з іншими, і досягає високої точності на краях, додаючи м'які переходи, де це потрібно. Однак варто зауважити, що семантичні ознаки, використані в даному методі, не розрізняють два різні об'єкти, що належать до одного класу. В результаті численні об'єкти представлені на одному шарі, що видно на прикладі зображень жирафів та корів.

Редагування зображень за допомогою м'яких семантичних контурів

Нижче наведено кілька прикладів застосування м'яких контурів для редагування зображень та створення колажів. М'які контури можна використовувати для застосування конкретних змін до різних шарів: додавання розмиття, що зображує рух поїзда (2), роздільної корекції кольору для людей і для фону (5, 6), окремої стилізації для повітряної кулі, неба, ландшафту та людини (8) . Звичайно, те саме можна зробити за допомогою створених вручну масок або класичних алгоритмів виділення контуру, але з автоматичним виділенням семантично значущих об'єктів таке редагування стає значно простіше.

Використання м'якої семантичної сегментації для редагування зображень

Висновок

Цей метод автоматично створює м'які контури, що відповідають семантично значимим областям зображення, використовуючи суміш високорівневої інформації від нейронної мережі та низькорівневих ознак. Однак цей метод має кілька обмежень. По-перше, він відносно повільний: час обробки зображення розміром 640 x 480–3–4 хвилини. По-друге, цей метод не створює окремих шарів для різних об'єктів одного класу. І по-третє, як показано нижче, цей метод може помилитися на початкових етапах обробки у випадках, коли кольори об'єктів дуже схожі (верхній приклад) або під час об'єднання м'яких контурів біля великих перехідних областей (нижній приклад).

Випадки помилок алгоритму

Тим не менш, м'які контури, створені за допомогою описаного методу, дають зручне проміжне представлення зображення, що дозволяє витрачати менше часу та сил під час редагування зображень.

Сегментація зображень

Сегментація встановлює характерні підмножини пікселів або розбиття зображення на зв'язкові області, кожна з яких певною мірою "однорідна". Процеси сегментації та виділення ознак можна розглядати як привласнення пікселів міток, що визначають спеціальні класи, до яких ці пікселі належать. Таким чином, на виході процесу сегментації знаходиться символьне зображення, в якому значення пікселя є мітки, а не рівні яскравості.

Класифікація моделей зображень

Для сегментації зображень використовують ту чи іншу модель, що забезпечує більш менш адекватний опис реальних зображень. Виділяють два основні класи моделей зображень: статистичні та просторові. Статистичні моделі описують сукупність точкових елементів зображення чи його області. Просторові моделі описують декомпозицію зображення на складові або області.

Статистичні моделі першого порядку описують сукупність точкових елементів зображення без урахування їх розташування у просторі. Найпростіший опис такого типу - густина ймовірності розподілу значень яскравості, яка розраховується за допомогою гістограми значень яскравості. Часто вважають, що щільність ймовірності розподілу значень реального зображення апроксимується деякою стандартною, наприклад, функцією гаусової щільності ймовірності або сумішшю таких функцій.

У моделях першого порядку не враховується, що зображення складається з узгоджених частин (елементів текстури, об'єктів тощо). Взаємне розташування елементів у просторі враховують моделі сукупностей точкових елементів зображення більш високого порядку. Однією з моделей є матриця суміжності значень яскравості, елементи якої є частоти пар значень яскравості при вибраному зміщенні. Величина усунення практично вибирається досить малої, т. до. при великому зміщенні значення яскравості стають незалежними друг від друга.

Інший метод опису просторових відносин між точковими елементами зображення полягає у розгляді щільності ймовірності розподілу значень локальної ознаки, що найчастіше ефективніше, ніж використання густини ймовірності розподілу значень яскравості вищих порядків. При сегментації зображення особливо корисні локальні ознаки, зумовлені наявністю країв, наприклад значення різних диференціальних операторів вимірювання градієнта яскравості.

До статистичних моделей зображення відносяться також моделі випадкових полів і тимчасових рядів, що використовуються в основному при моделюванні текстур.

Просторові моделі описують зображення у термінах областей. Зображення може бути представлене як сукупність об'єктів на тлі, як розчленоване на області деяким регулярним або випадковим способом, як модель форми областей. Просторові моделі дозволяють у загальному випадку отримати більше інформації із зображення, ніж моделі статистик розподілу яскравості. Однак поки що використовуються лише досить прості моделі, а їхній математичний апарат вимагає подальшої розробки.

Сегментація зображень методами граничної обробки

Найбільш простим і поширеним методом сегментації зображень є порогова обробка. У ряді стандартних методів виділення частин зображення на порозі величини порогів визначаються безпосередньо за гістограмами зображення (статистична модель зображення першого порядку). Історично першим методом цієї групи методів є метод мод. Метод випливає з припущення, що зображення містить певну кількість однорідних за яскравістю класів точок. Крім того, вважається, що граничні ділянки між замкнутими областями займають порівняно невелику площу зображення. Тому на гістограмі їм повинні відповідати міжмодові западини, в межах яких встановлюються пороги сегментації.

Однак реальні зображення погано задовольняють припущенням. Як правило, межі між областями розмиті та модальна структура гістограми виражена недостатньо. Крім того, навіть коли гістограма має помітні моди, її западини можуть бути настільки широкими і плоскими, що важко локалізувати дно западини.

Якщо реальне зображення не відповідає умовам методу мод, застосовуються наступні чотири підходи. По-перше, поліпшення гістограми, зокрема, з урахуванням локальних властивостей зображення з допомогою градієнтної інформації, статистик другого порядку, аналізу кривизни інтегральної функції розподілу. По-друге, апроксимація гістограми сумішшю нормальних розподілів та застосування статистичних методів для оптимального поділу цієї суміші. Недоліком цього підходу є велика обчислювальна складність, крім того, найчастіше гауссоїди погано апроксимують реальні моди. По-третє, введення емпіричного заходу якості сегментованого зображення та максимізація відповідної критеріальної функції - дискримінантний підхід, ентропійний підхід, моментний підхід та ін. По-четверте, перехід до використання інших статистик для вибору порога, зокрема вибір порога безпосередньо за локальними ознаками. Використання локальних ознак дозволяє сегментувати складні реальні зображення якісніше.

Гістограмний аналіз забезпечує задовільна якість сегментації тих зображень, які складаються з однорідних за яскравістю областей. Однак, при виділенні малорозмірних об'єктів на складному тлі точки об'єктів не дають помітних піків на гістограмі яскравості. Тому застосовується обробка зі змінним порогом: для невеликих фрагментів зображення здійснюється побудова гістограм, які перевіряються на бимодальность, а знайдені локальні пороги інтерполуються на частину зображення, що залишилася.

Ряд алгоритмів, що ґрунтуються на дискримінантному аналізі, запропонований у роботах Осту. Нехай G={0,1,...,L)- можливі значення яскравості зображення. Поріг поділяє розподіл значень яскравості зображення на два класи C 0={0,1,...,t) та C 1={t+1,t+2,...,L}, tÎ G. Оптимальний поріг t* визначається як

де - дисперсія розподілу значень яскравості зображення в цілому, w0 - ймовірність приналежності навмання взятої точки до тла, https://pandia.ru/text/80/299/images/image004_46.gif >- середній рівень яскравості фону (класу C 0).

Якщо площі об'єкта і тла різко відрізняються один від одного, гістограма критеріальної функції може бути мультимодальною. Тому необхідно визначати всі локальні піки, що серйозно знижує конкурентоспроможність методу.

Ентропійний критерій вибору оптимального порога. Користуючись введеними раніше визначеннями, гістограму значень яскравості можна як L-символьне джерело інформації з ентропією

де pi- Імовірність яскравості зі значенням i.

Ентропія джерела складається з ентропії об'єкта H 0 та ентропії фону H 1, а оптимальний поріг має давати максимальне значення цієї суми:

, (2)

при цьому .

Оскільки кожне із доданків H 0 та H 1 характеризує рівномірність розподілу яскравостей на відповідних інтервалах і різко зменшується при попаданні в даний інтервал "чужого" фрагмента гістограми максимум ентропійного критерію відповідатиме найкращому варіанту сегментації. Недоліком цього є те, що критеріальна функція може мати кілька близьких за значенням максимумів.

На відміну від дискримінантного підходу в методі збереження моментів вводяться всі моменти зображення до (2 k+1) порядку включно:

Оптимальним вважається поріг, що забезпечує рівність відповідних моментів сегментованого та вихідного зображень. Однак якщо k>3, виникають труднощі, пов'язані з відсутністю аналітичного рішення задачі.

Перехід від вибору порога по гістограмі яскравості до використання інших статистик, безсумнівно, ускладнює алгоритми сегментації, але забезпечує якіснішу сегментацію складних зображень. Для виділення малорозмірних об'єктів перспективним є вибір порога безпосередньо за локальними властивостями точок зображення.

Метод максимуму середнього розмаїття. В основу методу покладено просте евристичне визначення оптимального порога: оптимальним для сегментації зображень вважається поріг, що виділяє більше контрастних і менш низькоконтрастних перепадів яскравості, ніж будь-який інший поріг. Кількісним виразом критерію є середній контраст всіх перепадів яскравості, що виділяються цим порогом. Поріг, який відповідає максимальному середньому контрасту, є оптимальним. Якщо дві суміжні точки Х 1=(х 1,y 1) та X 2=(x 2,y 2) мають значення яскравості f(Х 1) та f(X 2) (без втрати спільності f(X 1)£ f(X 2)), то кількість перепадів, що виділяються порогом t, рівно:

де

Повний контраст, що відповідає порогу t, дорівнює:

де DIV_ADBLOCK169">

. (3)

На основі запропонованих Хараліком матриць суміжності значень яскравості розглянуто наступний метод сегментації. Для зображення будуються матриці спільної появи рівнів яскравостей пар суміжних точок у горизонтальному P 1,0 та вертикальному P 1,90 напрямках, а також сумарна матриця переходів, розміром ( L+1) '( L+1):

Pvh=P 1,0 +P 1,90.

Довільний поріг tрозбиває точки зображення на два класи З 0 та З 1, а матрицю переходів – на 4 блоки.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Міністерство освіти та науки РФ

Рязанський державний радіотехнічний університет

Кафедра ІІБМТ

Курсова робота

Методи обробки зображень. Сегментація

Виконав ст. гр. 432М:

Альошин С.І.

Перевірив доц. кав. ІІБМТ:

Каплан М.Б.

Рязань 2014

Вступ

1. Подання зображень

3. Формати зображень

4. Типи зображень

5.1 Зміна розмаїття

5.2 Згладжування шумів

5.3 Підкреслення кордонів

5.4 Медіанна фільтрація

5.5 Сегментація зображень

5.5.3 Виділення контурів

5.5.7 Методи розрізу графа

6. Опис функцій

7. Тестування алгоритму

Висновок

додаток

Вступ

Ще в середині XX століття обробка зображень була переважно аналоговою і виконувалася оптичними пристроями. Подібні оптичні методи досі важливі у таких галузях як, наприклад, голографія. Проте, з різким зростанням продуктивності комп'ютерів, ці методи дедалі більше витіснялися методами цифрової обробки зображень. Методи цифрової обробки зображень зазвичай є більш точними, надійними, гнучкими та простими у реалізації, ніж аналогові методи. У цифровій обробці зображень широко застосовується спеціалізоване обладнання, таке як процесори з конвеєрною обробкою інструкцій та багатопроцесорні системи. Особливо це стосується систем обробки відео. Обробка зображень виконується також за допомогою програмних засобів комп'ютерної математики, наприклад, MATLAB, Mathcad, Maple, Mathematica та ін. Для цього використовуються як базові засоби, так і пакети розширення Image Processing.

Інтерес до методів цифрової обробки зображень виростає з двох основних областей її застосування, якими є підвищення якості зображень для покращення її візуального сприйняття людиною та обробка зображень для їх зберігання, передачі та подання в автономних системах машинного зору.

Одним із найскладніших методів цифрою обробки зображення є сегментація зображень. Сегментація - це процес поділу цифрового зображення на кілька сегментів, що відрізняються один від одного елементарними ознаками, такими як яскравість, колір, текстура, форма. Мета сегментації полягає у спрощенні та зміні представлення зображення, щоб його було простіше та легше аналізувати. Неправильне виділення сегментів на зображенні зрештою може позначитися на якості розпізнавання і навіть унеможливити його. Тому завдання сегментації є надзвичайно важливим і дуже актуальним.

Існує багато методів сегментації зображень. Кінцевий результат часто визначається точністю сегментації, тому при виборі того чи іншого методу сегментації потрібно приділяти велику увагу надійності алгоритму. Однак, єдиного, загальновизнаного підходу, який лежав би в основі більшості алгоритмів, немає. Немає також і єдиного алгоритму, який дозволяв проводити прийнятну сегментацію для будь-якого зображення. У цьому полягає одна із складностей сегментації, і це причиною великої кількості різних підходів під час вирішення даних завдань обробки зображень.

Незважаючи на актуальність цієї предметної області, було написано порівняно мало книг, у яких розглядалися б одночасно і теоретичні засади, і програмні аспекти вирішення основних завдань сегментації зображень.

У цій роботі викладено основні методи цифрової обробки зображень. Особливо приділено увагу методам сегментації зображень. Реалізовано програму для одного з методів сегментації за допомогою пакету прикладних програм MatLAB.

1. Подання зображень

Принциповими питаннями теорії обробки зображень є питання: формування, введення, подання на комп'ютері і візуалізації. Форму поверхні можна описати як функції відстані F(x, y) від поверхні до точки зображення з координатами x і y. Враховуючи, що яскравість точки на зображенні залежить виключно від яскравості відповідної ділянки поверхні, можна вважати, що візуальна інформація з певним ступенем точності відображає стан яскравості або прозорості кожної точки. Тоді під зображенням розуміється обмежена функція двох просторових змінних f(x, y), задана на обмеженій прямокутній площині Oxy і має певну кількість своїх значень. Наприклад, чорно-біла фотографія може бути представлена як f(x, y)?0, де 0?x?a, 0?y?b і f(x, y) - яскравість (іноді звана оптичною щільністю або ступенем білизни) зображення у точці (x, y); a – ширина кадру, b – висота кадру.

У зв'язку з тим, що цифрова пам'ять комп'ютера здатна зберігати тільки масиви даних, зображення спочатку перетворюється на деяку числову форму (матрицю). Введення зображень у пам'ять комп'ютера здійснюється за допомогою відео датчиків. Датчик відео переводить оптичний розподіл яскравості зображення в електричні сигнали і далі в цифрові коди. Оскільки зображення є функцією двох просторових змінних x та y, а електричний сигнал - функцією однієї змінної t (часу), то перетворення використовується розгортка. Наприклад, при використанні телевізійної камери зображення зчитується рядками, при цьому в межах кожного рядка залежність яскравості від просторової координати x перетворюється на пропорційну залежність амплітуди електричного сигналу від часу t. Перехід від кінця попереднього рядка на початок наступного відбувається практично миттєво.

Введення зображень у комп'ютер неминуче пов'язане з дискретизацією зображень за просторовими координатами x та y і квантуванням значення яскравості в кожній дискретній точці. Дискретизація досягається за допомогою координатної сітки, утвореної лініями, паралельними осям x та y декартової системи координат. У кожному вузлі такої решітки робиться відлік яскравості або прозорості носія інформації, що візуально сприймається, яка потім квантується і подається в пам'яті комп'ютера. Елемент зображення, отриманого в процесі дискретизації зображення, називається пікселем. Для якісного уявлення напівтонового зображення досить 28 = 256 рівнів квантування, тобто. 1 піксел зображення кодується 1 байтом інформації.

Основними характеристиками зображень є:

1. Розмір зображення;

2. Глибина кольору;

3. Дозвіл.

2. Кодування кольорових зображень

Колір - це феномен, який є результатом взаємодії світла, об'єкта та приладу (спостерігача).

Експериментально встановлено, що будь-який колір можна подати у вигляді суми певних кількостей трьох лінійно незалежних кольорів.

Три лінійно незалежні кольори називають первинними кольорами.

Вони визначають колірну координатну систему (ЦКС) чи колірну схему, тобто. набір первинних кольорів для отримання інших кольорів.

Колірні схеми поділяються на два різновиди: колірні схеми від світла, що випромінюється, і від відбитого світла.

Система RGB.

Її первинними кольорами є червоний (Red) із довжиною хвилі 700 нм, зелений (Green) із довжиною хвилі 546,1 нм та синій (Blue) із довжиною хвилі 435,8 нм. Система RGB є адитивною.

При цьому той чи інший колір виходить додаванням первинних кольорів.

Система CMYK.

Дана система використовується для формування кольорів пофарбованих об'єктів, що не світяться, які поглинають частину спектра освітленого білого світла і відображають решту випромінювання.

Система CMYK є основою для друку кольорів.

Вона заснована на субтрактивній моделі CMY (Cyan – блакитний, Magenta – пурпуровий, Yellow – жовтий) – моделі віднімання кольорів. Основних кольорів тут, як і раніше, три.

Для покращення якості поліграфічного зображення до системи додано чорний колір.

Система HSB.

Ця система заснована на використанні тону (Hue) або відтінку, насиченості (Saturation) та освітленості (Lightness). Тон характеризує конкретний відтінок кольору, насиченість - його відносну інтенсивність, яскравість кольору - величину чорного відтінку для більш темного зображення.

Різновидом цієї системи є схема HSL.

3. Формати зображень

В даний час використовується велика кількість різних форматів графічних файлів. Найбільш поширеними є формати TIFF, GIF, JPEG, PNG і BMP.

Формат TIFF (Tagget Image Format) є одним із найбільш надійних та універсальних форматів для зберігання сканованих кольорових зображень з високою якістю. У ньому можна використовувати стиск за алгоритмом LZW, тобто. він відноситься до форматів зберігання зображень без втрат.

Формат GIF (Graphics Interchange Format) має палітру кольорів в 256 кольорів і використовує для стиснення алгоритм без втрат LZW. Якщо вихідна кількість кольорів більша за 256, то частина колірної інформації буде втрачена.

Формат JPEG (Join Photographers Expert Group) ґрунтується на однойменному алгоритмі для стиснення зображень. Він відноситься до алгоритмів стиснення з втратами та призначений для зберігання повнокольорових зображень з високим коефіцієнтом стиснення. При використанні формату можливе керування параметром якості від 0 (максимальне стиснення) до 100 (максимальна якість). Коефіцієнт стиснення в залежності від якості від 10 до 1000. Цей формат найчастіше застосовують для зберігання повнокольорових фотографічних зображень, які не призначені для подальшої обробки.

Формат PNG - растровий формат зберігання графічної інформації, що використовує стиск без втрат за алгоритмом Deflate. Формат PNG спроектований для заміни застарілого та простішого формату GIF, а також, певною мірою, для заміни значно складнішого формату TIFF. Формат PNG позиціонується насамперед для використання в Інтернеті та редагування графіки. Він має такі основні переваги перед GIF: практично необмежену кількість кольорів у зображенні; опціональна підтримка альфа-каналу; можливість гамма-корекції; двовимірна черезрядкова розгортка.

Формат BMP (BitMaP) відноситься до власних растрових форматів операційної системи Windows. Він придатний для зберігання зображень як в індексованому вигляді з палітрою до 256 кольорів, так і у вигляді повнокольорових RGB - зображень із глибиною кольору 24 біти. Можливе застосування алгоритму стиснення RLE.

4. Типи зображень

4.1 Двохрівневе (або монохроматичне) зображення

У цьому випадку всі пікселі можуть мати лише два значення, які зазвичай називають чорним (двійкова одиниця, або основний колір) та білим (двійковий нуль або колір фону).

Кожен піксел такого зображення представлений одним бітом, тому це найпростіший тип зображення.

1. Напівтонове зображення. Таке зображення з шкалою 2n рівнів складено з n-бітових шарів.

2. Кольорове зображення. Таке зображення описується в одному з форматів, наведених вище.

3. Зображення із безперервним тоном. Цей тип зображень може мати багато схожих кольорів (або напівтонів). Коли сусідні пікселі відрізняються лише на одиницю, оку практично неможливо розрізнити їх кольори. В результаті такі зображення можуть містити області, в яких колір здається оку безперервно змінюється. У цьому випадку піксел представляється або більшим числом (у напівтоновому випадку) або трьома компонентами (як кольорового образу). Зображення з безперервним тоном є природними чи природними (на відміну рукотворних, штучних); зазвичай вони виходять під час зйомки на цифрову фотокамеру або під час сканування фотографій або малюнків.

4. Дискретно-тонове зображення (воно називається синтетичним). Зазвичай це зображення виходить штучним шляхом. У ньому може бути лише кілька кольорів або багато кольорів, але в ньому немає шумів та плям природного зображення. Прикладами таких зображень можуть бути фотографії штучних об'єктів, машин або механізмів, сторінки тексту, карти, малюнки або зображення на дисплеї комп'ютера. (Не кожне штучне зображення буде обов'язково дискретно-тоновим. Згенероване комп'ютером зображення, яке має виглядати натуральним, матиме безперервні тони, незважаючи на своє штучне походження.) Штучні об'єкти, тексти, намальовані лінії мають форму, межі, що добре визначаються. Вони сильно контрастують на тлі решти зображення (фону). Прилеглі пікселі дискретно-тонового образу часто бувають одиночними або змінюють свої значення. Такі зображення погано стискаються методами зі втратою даних, оскільки спотворення всього кількох пікселів букви робить її нерозбірливою, перетворює звичне зображення в абсолютно нерозрізнене. Дискретно-тонові зображення, як правило, несуть у собі велику надмірність. Багато її фрагментів повторюються багато разів у різних місцях зображення.

5. Зображення, подібні до мультфільмів. Це кольорові зображення, в яких є великі області одного кольору. При цьому області, що стикаються, можуть дуже відрізнятися за своїм кольором.

5. Методи обробки зображень

Попередній аналіз зображень дозволяє зробити висновок про те, що:

По-перше, більшість зображень, у процесі їх формування (фотографування сканування і т.д.), піддаються впливу низки негативних факторів (вібрація фотокамери, нерівномірність руху скануючого елемента і т.д.), що призводять до змазаності, появи малоконтрастних та зашумлених ділянок і т.д.

По-друге, переважна більшість методів заснована на виділенні об'єктів на зображенні та подальшому їх аналізі.

Таким чином, перш ніж піддатись аналізу, зображення має пройти етап препарування, який полягає у виконанні операцій поліпшення візуальної якості (підвищення розмаїття, усунення розмитості, підкреслення кордонів, фільтрація) та операцій формування графічного препарату (сегментація, виділення контурів) зображення.

5.1 Зміна розмаїття

Слабкий контраст зазвичай викликаний малим динамічним діапазоном зміни яскравості, або сильної нелінійністю передачі рівнів яскравості. Найпростішим методом контрастування є функціональне відображення градації яскравості fij в gij, тобто gij = R (fij). На практиці часто використовують лінійні функціональні відображення. Якщо в результаті нерівномірності освітлення при фотографуванні або виготовленні фотографій, виникає ситуація, коли різні ділянки зображення мають різний контрастом. У разі зміни контрасту використовують адаптивні алгоритми контрастування. Прикладом може бути алгоритм локального посилення розмаїття. Експериментальні дослідження підтвердили високу ефективність роботи алгоритму у тому випадку, якщо на знімку присутні області із явно завищеним чи заниженим контрастами.

Суть алгоритму у тому, що знімок сприймається як набір деякого числа локальних областей, і це області обробляються з урахуванням їх характеристик. Обробка ведеться в наступній послідовності: обчислюється коефіцієнт посилення зрізів щільності р окремо кожної локальної ділянки зображення. І здійснюється обробка кожного пікселя зображення. Якщо р одно одиниці, то над локальним ділянкою зображення ніякого впливу не проводиться (якщо р відмінно від одиниці, здійснюється підвищення контрасту локальної області). Спочатку обчислюється контраст в аналізованій точці щодо найближчого околиці. Потім значення відносного розмаїття складається з одиницею і отримане значення приймається в алгоритмі як коефіцієнт посилення p, а далі проводиться обчислення за формулою:

зображення сегментація програма контраст

де - нове значення яскравості, - поточна яскравість зображення, що обробляється, - необхідне максимальне значення яскравості обробленого зображення.

5.2 Згладжування шумів

Зображення на етапі оцифрування піддаються впливу адитивного та імпульсного шуму. Адитивний шум є деяким випадковим сигналом, який додається до корисного на виході системи, в даному випадку адитивний шум виникає внаслідок зернистості плівки. Імпульсний шум, на відміну адитивного, характеризується впливом на корисний сигнал лише окремих випадкових точках (значення результуючого сигналу у цих точках приймає випадкове значення). Імпульсний шум характерний для цифрових систем передачі та зберігання зображень. Таким чином, у процесі препарування зображення постає завдання придушення шуму.

Найпростішим способом, що згладжує шум, на зображенні є згладжування, тобто. заміна значення яскравості кожного елемента середнім значенням, знайденим на його околиці:

де - безліч точок, що належать до околиці точки (включаючи і саму точку); - Число точок в околиці.

Розглянутий метод ефективно усуває адитивний та імпульсний шум у кожному елементі зображення.

5.3 Підкреслення кордонів

Методи згладжування зображень можуть усувати шум дуже ефективно. Істотним недоліком алгоритмів згладжування є змащення зображення (тобто зниження чіткості контурних елементів), при цьому величина змаза пропорційна розміру маски, що використовується для згладжування. Для однозначного аналізу зображень, особливо при обчисленні геометричних характеристик структурних елементів, дуже важливо усунути змащення з контурів об'єктів у зображенні, тобто посилити різницю між градаціями яскравості контурних елементів об'єкта та сусідніх елементів фону. У цьому випадку для обробки зображень використовуються методи підкреслення контурів.

Зазвичай підкреслення меж здійснюється методом високочастотної просторової фільтрації. Характеристики фільтрів задаються у вигляді маски, в якій середнє значення має дорівнювати нулю.

Ще одним методом підкреслення меж є так зване статичне диференціювання. У цьому методі значення яскравості кожного елемента ділиться на статистичну оцінку середньоквадратичного відхилення, тобто (середньоквадратичне відхилення обчислюється в околиці елемента).

5.4 Медіанна фільтрація

Медіанна фільтрація відноситься до нелінійних методів обробки зображень та має наступні переваги перед лінійною фільтрацією (класичної процедури згладжування): зберігає різкі перепади (кордони); ефективно згладжує імпульсний шум; не змінює яскравість фону.

Медіанна фільтрація здійснюється шляхом руху деякої апертури (маски) вздовж дискретного зображення та заміни значення центрального елемента маски медіанним значенням (середнє значення впорядкованої послідовності) вихідних елементів усередині апертури. Загалом, апертура може мати найрізноманітнішу форму, але на практиці найчастіше застосовується квадратна апертура розміром

5.5 Сегментація зображень

Під сегментацією зображення розуміється процес його розбиття на складові, що мають змістовний зміст: об'єкти, їх межі або інші інформативні фрагменти, характерні геометричні особливості та ін. У разі автоматизації методів отримання зображень сегментацію необхідно розглядати як основний початковий етап аналізу, що полягає у побудові формального опису зображення, якість виконання якого багато в чому визначає успіх розв'язання задачі розпізнавання та інтерпретації об'єктів.

У загальному випадку сегментація являє собою операцію розбиття кінцевої множини площини, на якій визначена функція вихідного зображення на непустих пов'язаних підмножин відповідно до деякого предикату, що визначається на множині і приймає справжні значення, коли будь-яка пара точок з кожної підмножини задовольняє деякому критерію однорідності (наприклад критерій однорідності, заснований на оцінці максимальної різниці яскравості окремого пікселя та середнього значення яскравості, обчисленого за відповідною областю).

5.5.1 Порогові методи сегментації

Порогова обробка є одним з основних методів сегментації зображень завдяки інтуїтивно зрозумілим властивостям. Цей метод орієнтований обробку зображень, окремі однорідні області яких відрізняються середньої яскравістю. Найпоширенішим методом сегментації шляхом порогової обробки є бінарна сегментація, тобто коли у нашому розпорядженні є два типи однорідних ділянок.

У цьому випадку зображення обробляється за пікселями і перетворення кожного пікселя вхідного зображення у вихідне визначається із співвідношення:

де - параметр обробки, званий порогом, - рівні вихідної яскравості. Обробка по пікселям, положення яких на зображенні не відіграє жодної ролі, називається точковою . Рівні та відіграють роль міток. За ними визначають, якого типу віднести цю точку: до H0 чи H1. Або кажуть, що H0 складається з фонових точок, а H1 з точок інтересу. Як правило, рівні та відповідають рівням білого та чорного. Будемо називати класи H1 (він клас інтересу) класом об'єкта, а клас H0 класом фону.

Звичайно сегментація може бути не тільки бінарною і в такому випадку існуючих класів більше, ніж два. Такий вид сегментації називається багаторівневим. Результуюче зображення не є бінарним, але воно складається із сегментів різної яскравості. Формально цю операцію можна записати так:

де – кількість рівнів, а – класи зображення. У такому разі для кожного з класів має бути заданий відповідний поріг, який би відокремлював ці класи між собою. Бінарні зображення легше зберігати та обробляти, ніж зображення, в яких є багато рівнів яскравості.

Найскладнішим у пороговій обробці є процес визначення порога. Поріг часто записують як функцію, що має вигляд:

де - зображення, а - деяка характеристика точки зображення, наприклад, середня яскравість на околиці з центром у цій точці.

Якщо значення порога залежить лише від, тобто однаково всім точок зображення, такий поріг називають глобальним. Якщо поріг залежить від просторових координат, такий поріг називається локальним. Якщо залежить від характеристики, тоді такий поріг називається адаптивним. Таким чином, обробка вважається глобальною, якщо вона відноситься до всього зображення в цілому, а локальною, якщо вона відноситься до певної виділеної області.

Крім перерахованих розмежувань алгоритмів, існує ще безліч методів. Багато хто з них є просто сукупністю інших, але більшість з них, так чи інакше, базуються на аналізі гістограми вихідного зображення, проте є й принципово інші підходи, які не торкаються аналізу гістограм у прямому вигляді або переходять від них до аналізу деяких інших функцій.

5.5.2 Методи нарощування областей

Методи цієї групи ґрунтуються на використанні локальних ознак зображення. Ідея методу нарощування областей полягає в аналізі спочатку стартової точки, потім її сусідніх точок тощо. відповідно до деякого критерію однорідності, і в подальшому зарахуванні проаналізованих точок в ту чи іншу групу (кількість стартових точок має дорівнювати кількості однорідних областей на зображенні). У більш ефективних варіантах методу як відправна точка використовуються не окремі пікселі, а розбиття зображення на ряд невеликих областей. Потім кожна область перевіряється на однорідність, і якщо результат перевірки виявляється негативним, то відповідна область розбивається більш дрібні ділянки. Процес триває доти, доки всі виділені області не витримають перевірку на однорідність. Після цього починається формування однорідних областей за допомогою нарощування.

Порогова сегментація та сегментація за критерієм однорідності на основі середньої яскравості часто не дає бажаних результатів. Така сегментація зазвичай призводить до появи значної кількості невеликих областей, які мають реальних прототипів на зображенні. p align="justify"> Найбільш ефективні результати дає сегментація за критерієм однорідності на основі текстури (або текстурних ознак).

5.5.3 Виділення контурів

Не рідко доводиться стикатися із завданням знаходження периметрів, кривизни, факторів форми, питомої поверхні об'єктів тощо. Усі ці завдання однак пов'язані з аналізом контурних елементів об'єктів.

Методи виділення контурів (меж) на зображенні можна розділити на такі основні класи:

методи високочастотної фільтрації;

методи просторового диференціювання;

методи функціональної апроксимації.

Спільним всім цих методів є прагнення розглядати межі як область різкого перепаду функції яскравості зображення; відрізняє їх введена математична модель поняття кордону і алгоритм пошуку граничних точок.

Відповідно до поставлених завдань до алгоритмів виділення контурів пред'являються такі вимоги: виділені контури повинні бути витонченими, без розривів і замкнутими. Таким чином, процес виділення контурів дещо ускладнюється у зв'язку з необхідністю застосовувати алгоритми потоншення та усунення розривів. Однак і це не завжди дає бажаного результату - у більшості випадків контури виходять незамкненими і, як наслідок, непридатними для процедур аналізу.

Розв'язати завдання можна, проводячи оконтурювання алгоритмом простеження кордонів методом "жука", який дозволяє виділити замкнуті контури об'єктів. Суть алгоритму полягає в наступному: на об'єкті вибирається деяка стартова гранична точка і далі відбувається послідовне простеження контуру до тих пір, поки не буде досягнуто стартової точки. У разі простеження контуру за годинниковою стрілкою для досягнення стартової точки здійснюється по піксельному руху вправо, якщо піксель знаходиться поза об'єктом, і вліво, якщо - на об'єкті.

Виділений в такий спосіб контур є замкнутий ланцюговий код, тобто. послідовність координат граничних точок об'єкта, що дуже зручно на вирішення поставлених завдань.

5.5.4 Методи, що базуються на кластеризації

Метод K-середніх - це ітеративний метод, який використовується, щоб розділити зображення на K кластерів. Базовий алгоритм наведено нижче:

1. Вибрати K центрів кластерів, випадково чи на підставі деякої евристики;

2. Помістити кожен піксель зображення в кластер, центр якого найближче до цього пікселя;

3. Заново обчислити центри кластерів, усереднюючи всі пікселі в кластері;

4. Повторювати кроки 2 і 3 до збіжності (наприклад, коли пікселі залишатимуться у тому кластері).

Тут, як відстань, зазвичай береться сума квадратів або абсолютних значень різниць між пікселем і центром кластера. Різниця зазвичай заснована на кольорі, яскравості, текстурі та розташування пікселя, або на виваженій сумі цих факторів.

K можна вибрати вручну, випадково або евристично.

Цей алгоритм гарантовано сходиться, але він може призвести до оптимального рішення.

Якість рішення залежить від початкової множини кластерів і значення K.

5.5.5 Методи з використанням гістограми

Методи з використанням гістограми дуже ефективні, коли порівнюються з іншими методами сегментації зображень, тому що вони потребують лише одного проходу пікселів. У цьому методі гістограма обчислюється за всіма пікселями зображення та її мінімуми та максимуми використовуються, щоб знайти кластери на зображенні. Колір або яскравість можна використовувати при порівнянні.

Поліпшення цього - рекурсивно застосовувати його до кластерів на зображенні у тому, щоб поділити їх у дрібніші кластери. Процес повторюється з меншими і меншими кластерами до того часу, коли перестануть з'являтися нові кластери.

Один недолік цього методу - те, що йому може бути важко знайти значні мінімуми та максимуми на зображенні. У цьому методі класифікації зображень схожі на метрику відстаней і зіставлення інтегрованих регіонів.

Підходи, засновані на використанні гістограм, можна також швидко адаптувати для декількох кадрів, зберігаючи їх перевагу в швидкості за рахунок одного проходу. Гістограма може бути побудована декількома способами, коли розглядаються кілька кадрів. Той самий підхід, який використовується для одного кадру, може бути застосований для кількох, і після того, як результати об'єднані, мінімуми та максимуми, які було складно виділити, стають помітнішими. Гістограма також може бути застосована для кожного пікселя, де інформація використовується для визначення найчастішого кольору цього положення пікселя. Цей підхід використовує сегментацію, засновану на об'єктах, що рухаються, і нерухомому оточенні, що дає інший вид сегментації, корисний у відео трекінгу.

5.5.6 Методи розростання областей

Першим був метод розростання областей із насіння. Як вхідні дані цей метод приймає зображень і набір насіння. Насіння відзначає об'єкти, які потрібно виділити. Області поступово розростаються, порівнюючи всі незайняті сусідні пікселі з областю. Різниця д між яскравістю пікселя та середньою яскравістю області використовується як міра схожості. Піксель з меншою такою різницею додається у відповідну область. Процес триває доки всі пікселі не будуть додані в один із регіонів.

Метод розростання областей із насіння вимагає додаткового введення. Результат сегментації залежить від вибору насіння. Шум на зображенні може спричинити те, що насіння погано розміщене. Метод розростання областей без використання насіння - це змінений алгоритм, який не вимагає явного насіння. Він починає з однієї області – піксель, обраний тут незначно впливає на кінцеву сегментацію. На кожній ітерації він розглядає сусідні пікселі так само, як метод розростання з використанням насіння. Але він відрізняється там, що якщо мінімальна не менше ніж заданий поріг, то він додається у відповідну область. В іншому випадку піксель вважається сильно різним від усіх поточних областей і створюється нова область, що містить цей піксель.

Один із варіантів цього методу заснований на використанні яскравості пікселів. Середня та дисперсія області та яскравість пікселя-кандидата використовується для побудови тестової статистики. Якщо тестова статистика достатньо мала, то піксель додається до області, і середня і дисперсія області перераховується. Інакше піксель ігноруються і використовується для створення нової області.

5.5.7 Методи розрізу графа

Методи розрізу графа можуть ефективно застосовані для сегментації зображень. У цих методах зображення подається як зважений неорієнтований граф. Зазвичай, піксель чи група пікселів асоціюється вершиною, а ваги ребер визначають схожість чи несхожість сусідніх пікселів. Потім граф розрізається згідно з критерієм, створеним для отримання "хороших" кластерів. Кожна частина вершин (пікселів), одержувана цими алгоритмами, вважається об'єктом зображення.

5.5.8 Сегментація методом вододілу

У сегментації методом вододілу зображення розглядається як деяка карта місцевості, де значення яскравостей є значеннями висот відносно деякого рівня. Якщо цю територію заповнювати водою, тоді утворюються басейни. При подальшому заповненні водою ці басейни об'єднуються. Місця об'єднання цих басейнів відзначаються як лінії вододілу.

У такій інтерпретації розглядаються точки трьох видів:

1. локального мінімуму;

2. точки, що є на схилі, тобто. з яких вода скочується в той самий локальний мінімум;

3. точки локального максимуму, тобто. з яких вода скочується більш ніж в один мінімум.

Поділ предметів, що стикаються, на зображенні є одним з важливих завдань обробки зображень. Часто для вирішення цього завдання використовується так званий метод маркерного вододілу. При перетвореннях за допомогою цього методу потрібно визначити "водозбірні басейни" та "лінії вододілу" на зображенні шляхом обробки локальних областей залежно від їх характеристик яскравості.

Метод маркерного вододілу є одним із найбільш ефективних методів сегментації зображень.

При реалізації цього методу виконуються такі основні процедури:

1. Обчислюється функція сегментації. Вона стосується зображень, де об'єкти розміщені в темних областях і важко помітні.

2. Обчислення маркерів переднього плану зображень. Вони обчислюються виходячи з аналізу зв'язності пікселів кожного об'єкта.

3. Обчислення фонових маркерів. Вони є пікселями, які є частинами об'єктів.

4. Модифікація функції сегментації на підставі значень розташування маркерів фону та маркерів переднього плану.

Одним з найважливіших застосувань сегментації вододілів є виділення на тлі зображення однорідних за яскравістю об'єктів (у вигляді плям). Області, що характеризуються малими варіаціями яскравості, мають малі значення градієнта. Тому на практиці часто зустрічається ситуація, коли метод сегментації за вододілами застосовується не до самого зображення, а до його градієнта.

6. Опис функцій

У роботі представлений алгоритм сегментації зображення з допомогою методу маркерного вододіла.

Основні функції, що використовуються під час створення програми:

Функція fspecial створює двовимірний фільтр зазначеного типу;

Функція imfilter – морфологічна операція створення зображення градієнта;

Функція watershed перетворення вододілу від зображення;

Функція label2rgb перетворює вихідне зображення напівтонове;

Функція imregionalmax визначає всі локальні максимуми зображення;

Функція imextendedmin знаходить "низькі" плями на зображенні, що лежать глибше за деякий заданий пороговий рівень порівняно з їх найближчим оточенням;

Функція imimposemin модифікує напівтонове зображення так, що локальні мінімуми досягаються лише у зазначених положеннях; інші величини пікселів підвищуються зникнення всіх інших точок локального мінімуму;

Функції взабудові і вдосконаленні - реконструкція зображення за допомогою морфологічних операцій розкриття (закриття.)

7. Тестування алгоритму

При реалізації цього методу було виконано такі процедури:

1. Зчитуємо зображення та перетворимо його на напівтонове (рисунок 1);

Малюнок 1. Вихідне (ліворуч) та напівтонове (праворуч) зображення.

2. Використовуємо значення градієнта як функцію сегментації (рисунок 2);

Рисунок 2. Значення градієнта.

3. Проводимо морфологічні операції з зображенням (рисунок 3);

Рисунок 3. Результат застосування морфологічних операцій розкриття – закриття через реконструкцію зображення.

4. Обчислюємо маркери переднього плану та фону зображення (рисунок 4);

Рисунок 4. Маркери переднього плану (ліворуч) та фону (праворуч) зображення.

5. Будуємо межі вододілів (рисунок 5);

Малюнок 5. Межі вододілів.

6. Відображаємо маркери та межі об'єктів на напівтоновому зображенні (рисунок 6);

Малюнок 6. Маркери та межі об'єктів.

7. Відображаємо результат сегментації за допомогою кольорового зображення (ліворуч) та використовую напівпрозорий режим (праворуч).

Рисунок 7. Результати сегментації.

Висновок

У цій роботі розроблено метод маркерного вододілу для сегментації зображення.

Безпосереднє застосування алгоритму сегментації за вододілами дає надмірну сегментацію, тому для управління надмірною сегментацією використаний підхід, заснований на ідеї маркерів.

Маркер є зв'язковою компонентою, що належить зображенню. Також перед проведенням сегментації вододілів проведена необхідна попередня обробка зображення.

Список використаних джерел

1. Гонсалес Р., Вудс Р. Цифрова обробка зображень. - М: Техносфера, 2005. 1072 с.

2. Прет У. Цифрова обробка зображень. - М: Мир, кн.1, 1982. 312с.

3. Ярославський Л.П. Введення у цифрову обробку зображень. - М: Рад. радіо, 1979. 312 с.

4. Прет У. Цифрова обробка зображень. - М: Світ, кн. 1, 1982. 480с.

5. http://www.ict.edu.ru/lib/

6. http://matlab.exponenta.ru/imageprocess/book2/76.php

7. Візільтер Ю.В. Обробка та аналіз цифрових зображень з прикладами на LabVIEW та IMAQ VIsion. – М: ДМК, 2011. 464 с.

8. Гонсалес Р., Вудс Р., Еддінс С. Цифрова обробка зображень у середовищі MATLAB. – М: Техносфера, 2006. 616 с.

9. http://matlab.exponenta.ru/imageprocess/book2/48.php

10. Селомон Д. Стиснення даних, зображень та звуку. - М: Техносфера, 2004. 368 с.

додаток

Вважаємо зображення

rgb=imread("C:\Users\Name\Documents\MATLAB\picture1.jpeg");

Представимо його у вигляді напівтонового

I = rgb2gray (rgb); figure, imshow (I);

Обчислюємо значення градієнта

hy=fspecial("sobel"); hx=hy";

Iy = imfilter (double (I), hy, "replicate");

Ix = imfilter (double (I), hx, "replicate");

gradmag=sqrt(Ix.^2+Iy.^2);

Застосуємо метод вододілу

L = watershed (gradmag); Lrgb = label2rgb (L);

Морфологічні операції

se = strel ("disk", 15);

Ie = imerode(I, se); Iobr = imreconstruct(Ie, I);

Iobrd = imdilate(Iobr, se);

Iobrcbr = imreconstruct(imcomplement(Iobrd), imcomplement(Iobr));

Iobrcbr = imcomplement(Iobrcbr);

Обчислимо локальні максимуми

fgm = imregionalmax(Iobrcbr);

Накладемо маркери на зображення

I2 = I; I2 (fgm) = 255;

Видаляємо окремі ізольовані пікселі

se2 = strel (ones (3,3)); fgm2 = imclose (fgm, se2); fgm3 = imerode (fgm2, se2);

Видалення заданого числа пікселів

fgm4 = bwareaopen(fgm3, 20);

Накладемо на вихідне зображення

I3 = I; I3 (fgm4) = 255;

Обчислимо маркери фону

bw = im2bw(Iobrcbr, graythresh(Iobrcbr));

Вимірюємо відстань до лінії вододілу

D = bwdist(bw); DL = watershed (D); bgm = DL == 0;

figure, imshow(bgm), title("bgm");

Коригуємо значення градієнта

gradmag2 = imimposemin(gradmag, bgm | fgm4);

L = watershed(gradmag2);

Накладемо маркери та межі об'єктів на вихідне зображення

I4 = I;I4(imdilate(L == 0, ones(3, 3)) | bgm | fgm4) = 255;

Відображення результату за допомогою кольорового зображення

Lrgb = label2rgb(L, "jet", "w", "shuffle");

Накладемо маркери та межі об'єктів на напівпрозоре зображення

figure, imshow(I), hold on

himage = imshow(Lrgb);

set(himage, "AlphaData", 0.3);

title("Lrgb2");

Розміщено на Allbest.ru

...

Подібні документи

Цифрові рентгенографічні системи. Методи автоматичного аналізу зображень у середовищі MatLab. Аналіз рентгенівського зображення. Фільтрування, сегментація, покращення зображень. Апаратурні можливості попередньої нормалізації зображень.

курсова робота , доданий 07.12.2013

Вибір методів обробки та сегментації зображень. Математичні засади застосованих фільтрів. Гістограма яскравості зображення. Програмна реалізація комплексного способу обробки зображень. Тестування розробленого програмного забезпечення.

курсова робота , доданий 18.01.2017

Вивчення та програмна реалізація в середовищі Matlab методів обробки, аналізу, фільтрації, сегментації та покращення якості рентгенівських медичних зображень. Цифрові рентгенографічні системи. Розробка статично обґрунтованих алгоритмів.

курсова робота , доданий 20.01.2016

Сучасні системи текстурного аналізу зображення. Приклад текстурної сегментації одноканальних зображень. Використання ознак, отриманих на основі гістограми яскравостей другого порядку для класифікації спектрозональних аерофотознімків.

реферат, доданий 15.01.2017

Комп'ютерна графіка та обробка зображень електронно-обчислювальними машинами є найважливішим аспектом використання ЕОМ в усіх галузях людської діяльності. Розробка "підсистеми лінійної сегментації", опис алгоритму та логіки.

дипломна робота , доданий 23.06.2008

Завдання цифрової обробки зображень. Методи граничної сегментації. Створення програми представлення малюнка у вигляді матриці та застосування до нього граничної обробки. Розробка інтерфейсу програми завантаження та фільтрації зображення з вибраним порогом.

курсова робота , доданий 12.11.2012

Опис математичних методів представлення та обробки графічних зображень. Опис розробленого програмного доповнення. Опис функцій та їх атрибутів. Подання та обробка графічних зображень. Результати тестування програми.

курсова робота , доданий 27.01.2015

Завдання просторово-часової обробки зображень за наявності шумів та перешкод. Методи оптимізації під час просторово-часової обробки зображень. Структура спеціалізованої програми, опис її інтерфейсу користувача. Кошторис витрат.

дипломна робота , доданий 10.06.2013

Виявлення деталей та їх меж зображення. Застосування рангових алгоритмів. Використання алгоритмів адаптивного квантування мод у режимі пофрагментної обробки. Узагальнена лінійна фільтрація зображень. Відновлення відсутніх ділянок.

курсова робота , доданий 17.06.2013

Огляд наявного програмного забезпечення для автоматизації виділення кордонів на зображенні. Розробка математичної моделі обробки зображень та виділення контурів у відтінках сірого та програмного забезпечення для алгоритмів обробки зображень.

Однією з основних завдань обробки та аналізу зображень є сегментація, тобто. поділ зображення на області, для яких виконується певний критерій однорідності, наприклад виділення на зображенні областей приблизно однакової яскравості. Поняття області зображення використовується визначення зв'язної групи елементів зображення, мають певний загальний ознака (властивість).
Один з основних та простих способів – це побудова сегментації за допомогою порога. Поріг – це ознака (властивість), яка допомагає розділити шуканий сигнал на класи. Операція порогового поділу полягає у зіставленні значення яскравості кожного пікселя зображення із заданим значенням порога.

Бінарізація

Операція порогового поділу, що у результаті дає бінарне зображення, називається бінаризацією. Метою операції бінаризації є радикальне зменшення кількості інформації, що міститься на зображенні. У процесі бінаризації вихідне напівтонове зображення, що має кілька рівнів яскравості, перетворюється на чорно-біле зображення, пікселі якого мають тільки два значення – 0 і 1

Порогова обробка зображення може проводитись різними способами.

Бінарізація з нижнім порогом

Бінарізація з нижнім порогом
Бінаризація з нижнім порогом є найпростішою операцією, у якій використовується лише одне значення порога:

Всі значення замість критерію стають 1, в даному випадку 255 (білий) і всі значення (амплітуди) пікселів, які більші за поріг t - 0 (чорний).

Бінаризації з верхнім порогом
Іноді можна використовувати варіант першого методу, що дає негатив зображення, отриманого у процесі бінаризації. Операція бінаризації з верхнім порогом:

Бінарізація з подвійним обмеженням
Для виділення областей, у яких значення яскравості пікселів може змінюватись у відомому діапазоні, вводиться бінаризація з подвійним обмеженням (t 1
Також можливі інші варіації з порогами, де пропускається лише частина даних (середньо смуговий фільтр).

Неповна порогова обробка
Дане перетворення дає зображення, яке може бути простішим для подальшого аналізу, оскільки воно стає позбавленим фону з усіма деталями, присутніми на вихідному зображенні.

Багаторівневе граничне перетворення
Ця операція формує зображення, яке не є бінарним, але складається з сегментів з різною яскравістю.

Щодо бінаризації, то по суті все. Хоча можна додати, що є глобальна, яка використовується для всього зображення і існує локальна, яка захоплює частину картинки (зображення).

Локальна порогова обробка

Метод Отса
Метод використовує гістограму розподілу значень яскравості пікселів растрового зображення. Будується гістограма за значеннями p i =n i / N, де N - це загальна кількість пікселів на зображенні, n i - це кількість пікселів з рівнем яскравості i. Діапазон яскравостей ділиться на два класи за допомогою порогового значення рівня яскравості k,k - ціле значення від 0 до L. Кожному класу відповідають відносні частоти 0 1:

Середні рівні для кожного із двох класів зображення:
Далі обчислюється максимальне значення оцінки якості поділу зображення на частини:
де (σ кл)2 = ω 0 ω 1 (μ 1 -μ 0) 2 - міжкласова дисперсія, а (σ заг) 2 - це загальна дисперсія для всього зображення цілком.

Визначення порога на основі градієнта яскравості зображення
Припустимо, що аналізоване зображення можна розділити на два класи – об'єкти та тло. Алгоритм обчислення порогового значення складається з наступних 2 кроків:
1. Визначається модуль градієнта яскравості кожного пікселя
зображення

2. Обчислення порога:

Разом

Що знайшов із радістю виклав вам, надалі, якщо вийде і буде час, постараюся реалізувати частину алгоритмів. Це лише мала частина всього, що сьогодні існує, але я радий поділиться цим.
Дякую за увагу. 1

Розглядаються математичні методи сегментації зображень стандарту Dicom. Розробляються математичні методи сегментації зображень стандарту Dicom для розпізнавання медичних зображень. Діагностика захворювань залежить від кваліфікації дослідника і вимагає від нього візуально проводити сегментацію, а математичні методи обробки растрових зображень є інструментом для даної діагностики. Обробка отриманих апаратним забезпеченням медичних зображень без попередньої обробки графічних даних здебільшого дає неправильні результати. Виконувалися процедури виділення контурів об'єктів методом Canny та додатковими алгоритмами обробки растрових зображень. Результати досліджень дозволяють обчислити необхідні для подальшого лікування пацієнта морфометричні, геометричні та гістограмні властивості утворень в організмі людини та забезпечити ефективне медичне лікування. Розроблені принципи комп'ютерного автоматизованого аналізу медичних зображень ефективно використовуються як для оперативних завдань медичної діагностики спеціалізованого онкологічного закладу, так і для навчальних цілей.

розпізнавання образів

сегментація об'єктів інтересу

медичні зображення

1. Власов А.В., Цапко І.В. Модифікація алгоритму Кані стосовно обробки рентгенографічних зображень // Вісник науки Сибіру. - 2013. - № 4 (10). - С. 120-127.

2. Гонзалес Р., Вудс Р. Цифрова обробка зображень. - М.: Техносфера, 2006. - С. 1072.

3. Кулябічов Ю.П., Півторацька С.В. Структурний підхід до вибору ознак у системах розпізнавання образів // Природні та технічні науки. - 2011. - № 4. - С. 420-423.

4. Нікітін О.Р., Пасічник А.С. Оконтурювання та сегментація у завданнях автоматизованої діагностики патологій // Методи та пристрої передачі та обробки інформації. - 2009. - № 11. - С. 300-309.

5. Canny J. A Computational approach to edge detection // IEEE Transactions on pattern analysis and machine intelligence. - 1986. - № 6. - P.679-698.

6. DICOM - Mode of access: http://iachel.ru/ zob23tai-staihroe/ DICOM

7. Доронічева А.В., Соколов А.А., Савін С.З. За допомогою Sobel operator для автоматичного ступеня відкриття в медичних зображеннях // Journal of Mathematics and System Science. - 2014. - Vol. 4 № 4 - P. 257-260.

8. Jähne B., Scharr H., Körkel S. Principles of filter design // Handbook of Computer Vision and Applications. Academic Press. - 1999. - 584 p.

Одним із пріоритетних напрямів розвитку медицини в Росії є перехід на власні інноваційні технології електронної реєстрації, зберігання, обробки та аналізу медичних зображень органів та тканин пацієнтів. Це викликано збільшенням обсягів інформації, поданої у формі зображень, при діагностиці соціально значущих захворювань, насамперед онкологічних, лікування яких здебільшого має результат тільки ранніх стадіях.

При проведенні діагностики зображень стандарту DICOM визначається патологічна область, при підтвердженні її патологічного характеру вирішується завдання класифікації: віднесення до якогось із відомих видів або виявлення нового класу. Очевидна складність - дефекти одержуваного зображення, зумовлені як фізичними обмеженнями устаткування, і допустимими межами навантаження організм людини. В результаті саме на програмні засоби лягає завдання додаткової обробки зображень з метою підвищити їхню діагностичну цінність для лікаря, представити у більш зручному вигляді, виділити головне з великих обсягів даних, що одержуються.

Мета дослідження. Розробляються математичні методи сегментації зображень стандарту Dicom для розпізнавання медичних зображень. Діагностика захворювань залежить від кваліфікації дослідника і вимагає від нього візуально проводити сегментацію, а математичні методи обробки растрових зображень є інструментом для даної діагностики. Обробка отриманих апаратним забезпеченням медичних зображень без попередньої обробки графічних даних здебільшого дає неправильні результати. Це з тим, що спочатку зображення отримані незадовільної якості.

Матеріал та методи дослідження

Як матеріал досліджень використовуються комп'ютерні томограми пацієнтів спеціалізованого клінічного закладу. Перш ніж аналізувати реальні графічні дані, необхідно зображення підготувати чи провести передобробку. Цей етап вирішує завдання покращення візуальної якості медичних зображень. Корисно розділити весь процес обробки зображень на великі категорії: методи, в яких як вхідними даними, так і вихідними є зображення; методи, де вхідні дані - зображення, а результаті роботи вихідними даними виступають ознаки і атрибути, виявлені з урахуванням вхідних даних. Цей алгоритм передбачає, що до зображення використовується кожен із вищенаведених процесів. Реєстрація даних - перший із процесів, відбитий на рис. 1.

Мал. 1. Основні стадії цифрової обробки графічних даних

Реєстрація може бути досить простою, як у прикладі, коли вихідне зображення цифрове. Зазвичай етап реєстрації зображення передбачає попередню обробку даних, наприклад, збільшення масштабу зображення. Поліпшення зображення входить до найпростіших і вражаючих напрямів попередньої обробки. Як правило, за методами покращення інформативності зображень визначено завдання пошуку погано помітних пікселів або збільшення контрастності на вихідному зображенні. Одним із найчастіше використовуваних методів поліпшення інформативності зображень є посилення розмаїття зображення, оскільки посилюються межі об'єкта інтересу. Потрібно врахувати, що покращення якості зображення - це певною мірою суб'єктивне завдання в обробці зображень. Відновлення зображень - це завдання також стосується підвищення візуальної якості даних. Методи відновлення зображень спираються на математичні та імовірнісні моделі деформації графічних даних. Обробку зображень як етап слід відокремлювати від поняття обробки зображення як всього процесу змін зображення та отримання деяких даних. Сегментація чи процес виділення об'єктів інтересу ділить зображення на складові об'єкти чи частини. Автоматизоване виділення об'єктів інтересу є до певної міри складним завданням цифрової обробки зображень. Занадто деталізована сегментація робить процес обробки зображення скрутним, якщо необхідно виділити об'єкти інтересу. Але некоректна чи недостатньо деталізована сегментація у більшості завдань призводить до помилок на заключному етапі обробки зображень. Подання та опис графічних даних, як правило, йдуть за етапом виділення об'єктів інтересу на зображенні, на виході якого в більшості випадків є необроблені пікселі, що утворюють межі області або формують всі пікселі областей. За таких варіантів потрібно перетворення даних на вигляд, доступний для комп'ютерного аналізу. Розпізнавання образів є процесом, який визначає до якогось об'єкта ідентифікатор (наприклад, «променева кістка») на підставі його описів. Визначимо взаємозв'язок бази знань із модулями обробки зображень. База знань (тобто інформація про проблемну область) деяким чином зашифрована всередині самої системи обробки зображень. Це знання може бути досить простим, як, наприклад, детальна вказівка об'єктів зображення, де має бути зона інтересу. Таке знання дає можливість обмеження області пошуку. База знань управляє роботою кожного модуля обробки та його взаємодією, що відображено на рис. 1 стрілками, спрямованими у дві сторони між модулями та базою знань. Збереження та друк результатів часто також потребує використання спеціальних методів обробки зображень. Недолік цих етапів обробки зображення в системі обробки медичних зображень полягає в тому, що помилки, створені на перших етапах обробки, наприклад при введенні або виділення об'єктів інтересу на зображенні, можуть призвести до неможливості коректної класифікації. Обробка даних проводиться суворо послідовно, і в більшості випадків відсутня можливість повернення на попередні етапи обробки, навіть якщо раніше були отримані некоректні результати. Методи на етапі попередньої обробки досить різноманітні - виділення об'єктів інтересу, їх масштабування, корекція кольорів, коригування просторового дозволу, зміна контрастності і т.п. Одна з пріоритетних дій на етапі попередньої обробки зображення – це коригування контрастності та яскравості. При використанні відповідних масок можна об'єднати два етапи (фільтрація та попередня обробка) для збільшення швидкості аналізу даних. Заключний результат аналізу зображень здебільшого визначено рівнем якості сегментації, а ступінь деталізації об'єктів інтересу залежить від конкретної поставленої задачі. З цієї причини не розроблено окремий метод або алгоритм, що підходить для вирішення всіх завдань виділення об'єктів інтересу. Оконтурювання областей призначене виділення на зображеннях об'єктів із заданими властивостями. Дані об'єкти, зазвичай, відповідають об'єктам чи його частинам, які маркують діагности. Підсумком оконтурювання є бінарне чи ієрархічне (мультифазне) зображення, де кожен рівень зображення відповідає певному класу виділених об'єктів. Сегментація - це складний етап у обробці та аналізі медичних даних біологічних тканин, оскільки необхідно оконтурювати області, які відповідають різним об'єктам чи структурам на гістологічних рівнях: клітинам, органоїдам, артефактам тощо. Це пояснюється високою варіабельністю їх параметрів, низьким рівнем контрастності аналізованих зображень та складним геометричним взаємозв'язком об'єктів. У більшості випадків для отримання максимально ефективного результату необхідно послідовно використовувати різні методи сегментації інтересів на зображенні. Наприклад, визначення меж об'єкта інтересу застосовується спосіб морфологічного градієнта, після якого областей, які підходять незначним перепадам показників яскравості, проводиться порогова сегментація . Для обробки зображень, у яких незв'язані однорідні ділянки різні за середньою яскравістю, було обрано метод сегментації Canny, дослідження проводяться на клінічному прикладі. При розпізнаванні реальних клінічних зображень моделювання погано застосовується. Велике значення має практичний досвід та експертні висновки про результат аналізу зображень. Для тестового зображення вибрано знімок комп'ютерної томографії, де у явному вигляді є об'єкт інтересу, представлений на рис. 2.

Мал. 2. Знімок комп'ютерної томографії з об'єктом інтересу

Для реалізації сегментування використовуємо метод Canny. Такий підхід стійкий до шуму і демонструє здебільшого найкращі результати стосовно інших методів. Метод Canny включає чотири етапи:

1) передобробка - розмиття зображення (зменшуємо дисперсію адитивного шуму);

2) проведення диференціювання розмитого зображення та подальше обчислення значень градієнта за напрямками x та y;

3) реалізація не максимального придушення на зображенні;

4) порогова обробка зображення.

У першому етапі алгоритму Canny відбувається згладжування зображення з допомогою маски фільтром Гаусса. Рівняння розподілу Гауса в N вимірах має вигляд

або в окремому випадку для двох вимірів

(2)

де r - це радіус розмиття, r 2 = u 2 + v 2; σ - стандартне відхилення розподілу Гауса.

Якщо використовуємо 2 виміри, то ця формула задає поверхню концентричних кіл, що мають розподіл Гауса від центральної точки. Пікселі з розподілом, відмінним від нуля, використовуються для завдання матриці згортки, що застосовується до вихідного зображення. Значення кожного пікселя стає середньозваженим для околиці. Початкове значення пікселя приймає максимальну вагу (має максимальне значення Гауса), а сусідні пікселі приймають мінімальні ваги, залежно від відстані до них. Теоретично розподіл у кожній точці зображення має бути ненульовим, що слід розрахунку вагових коефіцієнтів для кожного пікселя зображення. Але практично з розрахунку дискретного наближення функції Гаусса не враховуються пікселі з відривом > 3σ, оскільки він досить мало. Таким чином, програмі, що обробляє зображення, необхідно розрахувати матрицю, щоб дати гарантію достатньої точності наближення розподілу Гаусса .

Результати дослідження та їх обговорення

Результат роботи фільтра Гауса при даних рівних 5 для розміру маски гауса і 1,9 значення параметра - стандартного відхилення розподілу Гауса, представлений на рис. 3. Наступним кроком здійснюється пошук градієнта області інтересу за допомогою згортки згладженого зображення з похідною від функції Гауса у вертикальному та горизонтальному напрямках вектора.

Застосуємо оператор Собеля для вирішення цього завдання. Процес базується на простому переміщенні маски фільтра від пікселя до пікселя зображення. У кожному пікселі (x, y) відгук фільтра обчислюється попередньо визначених зв'язків. Через війну відбувається початкове виділення країв. Наступним кроком відбувається порівняння кожного пікселя з його сусідами вздовж напрямку градієнта та обчислюється локальний максимум. Інформація про напрям градієнта необхідна для того, щоб видаляти пікселі поряд з кордоном, не розриваючи саму межу поблизу локальних максимумів градієнта, що означає, що пікселями кордонів визначаються точки, в яких досягається локальний максимум градієнта в напрямку вектора градієнта. Такий підхід дозволяє суттєво знизити виявлення хибних країв і забезпечує товщину межі об'єкта в один піксель, що емпірично підтверджується програмною реалізацією алгоритму сегментування зрізу черевної порожнини на знімку комп'ютерної томографії, наведеного нижче на рис. 4.

Наступний крок - використання порога для визначення знаходження кордону в кожному заданому пікселі зображення. Чим менший поріг, тим більше меж буде перебувати в об'єкті інтересу, але тим більше результат буде сприйнятливий до шуму і оконтурювати зайві дані зображення. Високий поріг може проігнорувати слабкі краї області чи отримає кордон кількома областями. Оконтурювання кордонів застосовує два пороги фільтрації: якщо значення пікселя вище верхньої межі - він набуває максимального значення (кордон вважається достовірною), якщо нижче - піксель пригнічується, точки зі значенням, що потрапляє в діапазон між порогами, набувають фіксованого середнього значення. Піксель приєднується до групи, якщо він стикається з нею по одному з восьми напрямків. Серед переваг методу Canny можна вважати те, що при обробці зображення здійснюється адаптація до особливостей сегментування. Це досягається через введення дворівневого порогу відсікання надлишкових даних. Визначаються два рівні порогу, верхній - p high і нижній - p low де p high > p low . Значення пікселів вище за значення p high позначаються як відповідні межі (рис. 5).

Мал. 3. Застосування фільтра Гауса на комп'ютерній томограмі з інтересом

Мал. 4. Придушення не-максимумів на сегментованому зображенні

Мал. 5. Застосування алгоритму сегментації Canny з різними значеннями рівнів порога

Практика показує, що є деякий інтервал на шкалі рівнів порога чутливості, при якому значення площі об'єкта інтересу фактично незмінне, але при цьому існує певний пороговий рівень, після якого відзначається «зрив» методу оконтурювання і результат виділення областей інтересу стає невизначеним. Цей недолік алгоритму можна компенсувати об'єднанням алгоритму Canny з перетворенням Хафа для пошуку кіл. Поєднання алгоритмів дозволяє максимально чітко виділяти об'єкти дослідження, а також усувати розриви у контурах.

Висновки

Таким чином, вирішено завдання формулювання типових характеристик патологічних об'єктів на медичних зображеннях, що дасть змогу надалі проводити оперативний аналіз даних щодо конкретних патологій. Важливими параметрами визначення оцінки якості сегментації є ймовірності помилкової тривоги і пропуску - відмови. Ці параметри визначають застосування автоматизації методу аналізу. Сегментація під час вирішення завдання класифікації та розпізнавання об'єктів на зображеннях є одним із першорядних. Досить добре досліджені та застосовуються методи оконтурювання, що базуються на сегментуванні меж областей – Sobel, Canny, Prewit, Laplassian. Такий підхід визначено тим, що концентрація уваги людини при аналізі зображень фокусується найчастіше на кордонах між більш менш однорідними по яскравості зонами. Виходячи з цього, контури часто виконують завдання основи визначення різних характеристик інтерпретування зображень і об'єктів ними. Основне завдання алгоритмів сегментування зон інтересів – це побудова бінарного зображення, що містить замкнуті структурні області даних на зображенні. Щодо медичних зображень даними областями виступають межі органів, вени, МКЦ, а також пухлини. Розроблені принципи комп'ютерного автоматизованого аналізу медичних зображень ефективно використовуються як оперативних завдань медичної діагностики спеціалізованого онкологічного закладу, і у навчальних цілях.

Досліджено за підтримки програми «Далекий Схід», грант № 15-I-4-014o.

Рецензенти:

Косих Н.Е., д.м.н., професор, головний науковий співробітник, ФДМУН «Обчислювальний центр» ДВО РАН, м. Хабаровськ;

Левкова Є.А., д.м.н., професор, ГОУ ВПО «Далекосхідний державний університет шляхів сполучення», м. Хабаровськ.

Бібліографічне посилання

Доронічева А.В., Савін С.З. МЕТОД СЕГМЕНТАЦІЇ МЕДИЧНИХ ЗОБРАЖЕНЬ // Фундаментальні дослідження. - 2015. - № 5-2. - С. 294-298;
URL: http://fundamental-research.ru/ru/article/view?id=38210 (дата звернення: 06.04.2019). Пропонуємо до вашої уваги журнали, що видаються у видавництві «Академія Природознавства»