Semakan kaedah penapisan dan pembahagian imej digital

Anotasi: pengenalan. Penapis linear: definisi, penapis anti-aliasing, penapis meningkatkan kontras, penapis perbezaan. Penapis tak linear: contoh penapis tak linear, operator morfologi

8.1. pengenalan

Mari kita bayangkan bahawa, melihat beberapa adegan dengan sebelah mata, kita membawa pinggan kaca kepadanya. Jika plat ini tidak telus sempurna, imej yang diperhatikan akan berubah. Bergantung pada kaca dari mana plat dibuat, perubahan boleh menjadi sangat pelbagai. Sebagai contoh, jika kaca ini diwarnakan, maka imej akan memperoleh naungan yang sesuai, tetapi jika kaca itu mendung, ia akan menjadi kabur.

Penapisan imej adalah sama seperti melihat dunia melalui plat kaca, walaupun ia membolehkan anda mencapai pelbagai kesan yang lebih besar daripada eksperimen dengan plat yang berbeza. Penapisan imej ialah operasi yang menghasilkan imej dengan saiz yang sama, diperoleh daripada imej asal mengikut peraturan tertentu. Biasanya, keamatan (warna) setiap piksel dalam imej yang terhasil ditentukan oleh keamatan (warna) piksel yang terletak di beberapa kawasan kejiranan dalam imej asal.

Peraturan yang mentakrifkan penapisan (ia dipanggil penapis), boleh menjadi sangat pelbagai. Dalam kuliah ini kita akan melihat penapis yang paling mudah. Ambil perhatian bahawa, menurut definisi yang dicadangkan, operasi yang terdiri daripada aplikasi berurutan dua atau lebih penapis juga merupakan penapis. Oleh itu, kita boleh bercakap tentang penapis komposit, sepadan dengan gabungan nombor perdana. Setelah mempelajari jenis asas penapis dalam kuliah ini, kami akan menangani penggunaan penapis yang terdiri daripadanya untuk menyelesaikan pelbagai masalah dalam kuliah seterusnya. Penapisan imej ialah salah satu operasi paling asas bagi penglihatan komputer, pengecaman corak dan pemprosesan imej. Malah, kerja kebanyakan kaedah bermula dengan beberapa jenis penapisan imej sumber. Oleh itu, penapis yang dibincangkan dalam kuliah ini adalah amat penting dari segi penggunaannya dalam pelbagai aplikasi.

8.2. Penapis linear

Definisi

(8.1)

Hasilnya ialah imej B. Dalam takrifan (8.1) kami meninggalkan had penjumlahan. Biasanya inti penapis adalah bukan sifar hanya dalam beberapa kejiranan N titik (0, 0). Di luar kejiranan ini, F(i, j) sama ada betul-betul sifar atau sangat hampir dengannya, supaya ia boleh diabaikan. Penjumlahan dalam (8.1) dilakukan di atas , dan nilai setiap piksel B(x, y) ditentukan oleh piksel imej A yang terletak dalam tetingkap N berpusat pada titik (x, y) (kita akan menandakan set ini N(x, y)) . Inti penapis yang ditakrifkan pada kejiranan segi empat tepat N boleh dilihat sebagai matriks m dengan n di mana panjang sisi adalah nombor ganjil. Apabila menentukan kernel oleh matriks M kl, ia harus dipusatkan:

(8.2)

Keadaan apabila piksel (x, y) terletak di sekitar tepi imej juga memerlukan penjelasan lanjut. Dalam kes ini, A(x + i, y + j) dalam takrifan (8.1) boleh sepadan dengan piksel A yang terletak di luar imej A. Masalah ini boleh diselesaikan dengan beberapa cara.

Jangan tapis piksel tersebut dengan memangkas imej B di tepi atau melukisnya, contohnya, dengan hitam.
Jangan sertakan piksel yang sepadan dalam penjumlahan, mengagihkan beratnya F(i, j) sama rata antara piksel lain dalam kejiranan N(x, y) .
Tentukan nilai piksel di luar sempadan imej menggunakan ekstrapolasi. Sebagai contoh, pertimbangkan nilai keamatan berhampiran pemalar sempadan (untuk piksel (-2, 5) kita mempunyai A(-2, 5) = A(0, 5) ) atau pertimbangkan kecerunan intensiti berhampiran pemalar sempadan ( A(-2, 5) = A(0, 5) + 2(A(0, 5) - A(1, 5))).
Takrifkan nilai piksel di luar sempadan imej menggunakan pantulan cermin (A(-2, 5) = A(2, 5) ).

Pemilihan kaedah tertentu mesti dibuat dengan mengambil kira penapis khusus dan ciri-ciri aplikasi tertentu.

Setelah meneliti definisi umum penapis linear, mari kita beralih kepada contoh.

Pelbagai pendekatan peningkatan imej terbahagi kepada dua kategori: kaedah pemprosesan domain spatial (kaedah spatial) dan kaedah pemprosesan domain frekuensi (kaedah frekuensi). Domain spatial merujuk kepada koleksi piksel yang membentuk imej. Fungsi prapemprosesan domain spatial ditulis sebagai

di mana f(x, y) – imej input,

g(x, y) – imej keluaran (diproses),

h– pengendali fungsi f, ditakrifkan dalam beberapa domain ( x, y).

Operasi jenis ini tergolong dalam kelas umum operasi pada elemen jiran. Operasi ini adalah alat utama untuk pemprosesan imej peringkat rendah atau pemprosesan imej domain spatial.

Pendekatan utama untuk menentukan kejiranan sesuatu titik ( x, y) ialah penggunaan kawasan segi empat sama atau segi empat tepat bagi bahagian imej yang berpusat pada titik ( x, y). Bahagian tengah bahagian imej ini bergerak dari piksel ke piksel, bermula, sebagai contoh, dari sudut kiri atas. Pada masa yang sama, untuk mendapatkan g(x, y) operator digunakan untuk setiap jawatan ( x, y). Walaupun bentuk kejiranan lain (seperti bulatan) kadangkala digunakan, bentuk segi empat sama lebih disukai kerana kemudahan pelaksanaannya.

Salah satu kaedah domain spatial yang paling banyak digunakan adalah berdasarkan penggunaan penapis (topeng konvolusi, templat, tingkap). Lazimnya, topeng penapis ialah sistem dua dimensi yang kecil (contohnya, dimensi 3*3), pekalinya dipilih sedemikian rupa untuk mengesan sifat imej tertentu (Rajah 1.5, a).

nasi. 1.5: a – topeng penapis; b – pekali topeng penapis

Jika nilai-nilai w 1 ,w 2 ,…,w 9 mewakili pekali, topeng piksel ( x, y) dan lapan jirannya (Rajah 1.5, b), maka algoritma boleh diwakili sebagai melaksanakan operasi berikut pada kejiranan 3*3 mata (x, y) :

Tugas penapisan imej dalam erti kata yang luas difahami sebagai sebarang prosedur pemprosesan imej di mana imej raster dibekalkan sebagai input kepada prosedur dan imej raster dijana sebagai output. Walau bagaimanapun, lebih kerap "penapisan" difahami sebagai apa yang dipanggil gangguan penapisan. Matlamat utama penapisan hingar adalah untuk memproses imej sedemikian rupa sehingga hasilnya lebih sesuai dari sudut pandangan aplikasi tertentu. Secara umum, kita boleh membezakan penapis linear(penapis melicinkan, penapis mempertingkat kontras, penapis perbezaan) dan penapis tak linear(penapis median).

Berikut ialah penerangan ringkas tentang kaedah penapisan yang paling biasa.

Penapis Lulus Rendah– melemahkan komponen frekuensi tinggi dan meningkatkan peranan komponen frekuensi rendah. Kekerapan, apabila digunakan pada imej, mencerminkan jumlah butiran yang terdapat dalam imej. Perubahan tajam dalam kecerahan, gangguan dan hingar ialah contoh elemen frekuensi tinggi dalam imej. Pelicinan imej dilaksanakan menggunakan kernel berikut:

Penapis Lulus Tinggi– melemahkan komponen frekuensi rendah dalam imej dan meningkatkan peranan komponen frekuensi tinggi. Penapis laluan tinggi digunakan untuk menyerlahkan butiran seperti garis besar, tepi atau untuk menajamkan imej. Setiap lonjakan dalam kecerahan dan setiap kontur mewakili perincian sengit yang dikaitkan dengan frekuensi tinggi. Pengasingan komponen frekuensi tinggi dilakukan menggunakan kernel berikut:

Jurukamera Roberts. Operator Roberts ialah contoh penapis tak linear. Mengubah setiap piksel dengan pengendali silang Roberts boleh menunjukkan terbitan imej di sepanjang pepenjuru bukan sifar, dan gabungan imej yang diubah ini juga boleh dianggap sebagai kecerunan dari dua piksel atas ke dua bawah. Pengendali Roberts digunakan demi kelajuan pengiraan, tetapi lebih rendah daripada alternatif kerana masalah kepekaan yang ketara kepada bunyi bising. Ia menghasilkan garisan yang lebih halus daripada kaedah penonjolan tepi yang lain.

Empat piksel terlibat dalam pemprosesan, terletak seperti berikut (Rajah 1.6).

nasi. 1.6. Piksel yang terlibat dalam pemprosesan oleh pengendali Roberts

Jawapan Operator Roberts:

Kernel konvolusi dalam kes ini akan kelihatan seperti ini:

Konvolusi untuk setiap kernel dikira secara berasingan. Tindak balas penapis ini ialah nilai

, (1.17)

di mana P Dan Q– tindak balas nukleus H 1 dan H 2 .

Kadang-kadang kuantiti
.

Pengendali Sobel. Pengendali Sobel digunakan dalam algoritma pengesanan tepi. Ini ialah operator pembezaan diskret yang mengira nilai anggaran kecerunan kecerahan imej. Hasil daripada menggunakan operator Sobel pada setiap titik dalam imej ialah sama ada vektor kecerunan kecerahan pada titik ini atau normanya. Kaedah peningkatan tepi menggunakan operator Sobel mempertimbangkan dua kernel lilitan berbeza:

Berdasarkan lilitan ini, magnitud dan arah tepi dikira. Konvolusi untuk setiap kernel dikira secara berasingan. Tindak balas penapis ini ialah nilai

, (1.19)

di mana P Dan Q– tindak balas nukleus H 1 dan H 2 .

Kadang-kadang kuantiti
.

Jurukamera Prewitt. Pengendali Prewitt beroperasi sama seperti pengendali Sobel. Pengesan sempadan Prewitt ialah kaedah yang sesuai untuk menganggar saiz dan orientasi sempadan. Walaupun pengesan kecerunan pembezaan memerlukan pengiraan anggaran orientasi yang memakan masa daripada magnitud dalam arah menegak dan mendatar, pengesan tepi Prewitt memberikan arah terus dari kernel dengan hasil maksimum. Kaedah peningkatan tepi menggunakan operator Prewitt menganggap dua kernel lilitan berbeza:

Keputusan pengendali Prewitt ialah

, (1.21)

di mana P Dan Q– tindak balas nukleus H 1 dan H 2 .

pengendali Laplace. Operator Laplace diskret sering digunakan dalam pemprosesan imej, seperti pengekstrakan tepi atau aplikasi anggaran gerakan. Laplacian diskret ditakrifkan sebagai jumlah derivatif kedua dan dikira sebagai jumlah perbezaan dalam jiran piksel pusat. Kaedah peningkatan tepi Laplace mempertimbangkan beberapa biji lilitan yang berbeza. Berikut adalah sebahagian daripada mereka:

Seperti yang anda lihat, jumlah elemen matriks adalah sifar, jadi tindak balas penapis boleh menjadi negatif. Dalam kes ini, nilai tindak balas diambil modulo. Hasil daripada pemprosesan, kawasan dengan keamatan yang berterusan atau meningkat secara linear menjadi hitam, dan kawasan dengan nilai keamatan yang berubah dengan cepat diserlahkan dengan terang.

Di bawah adalah beberapa proses spatial yang tidak termasuk dalam kategori konvolusi dan boleh digunakan untuk menghapuskan pelbagai jenis bunyi.

Penapis min harmonik. Min harmonik bagi siri ini
dikira dengan formula

. (1.23)

Semasa proses penapisan, nilai piksel imej semasa digantikan dengan
set nilai untuk sembilan piksel, termasuk yang semasa dan yang berdekatan.

Min– penapis. Semasa proses penapisan, nilai piksel semasa digantikan dengan nilai minimum piksel jiran. Jadi, sebagai contoh, untuk kernel dimensi 3 kita akan mempunyai:

Maks– penapis. Semasa proses penapisan, nilai piksel semasa digantikan dengan nilai maksimum piksel jiran (serupa dengan penapis sebelumnya).

Min- Maks-penapis. Semasa proses penapisan, nilai piksel semasa dalam imej mula-mula digantikan dengan nilai minimum piksel jiran, dan apabila diluluskan semula, dengan maksimum.

Penapis median. Penapisan purata menggunakan nilai unsur yang terkandung dalam kawasan bersebelahan untuk menentukan nilai baharu. Penapis menyusun elemen kawasan bersebelahan dalam tertib diisih dan memilih nilai purata. Jadi, sebagai contoh, untuk kernel dimensi 3, nilai median ialah yang kelima:

Menggunakan kaedah pemprosesan imej spatial, anda boleh mencapai beberapa kesan menarik. Mari kita senaraikan sebahagian daripada mereka.

Kesan timbul. Menggunakan operasi lilitan, anda boleh melaksanakan transformasi yang memberikan kesan timbul pada imej.

(1.24)

Imej "pseudo-halftone" binari. Imej asal diproses menggunakan topeng D2 atau D4: jika nilai piksel kurang daripada nilai berkadar elemen topeng yang sepadan, maka ia ditetapkan kepada sifar, jika tidak, ia ditetapkan 255. Topeng digunakan pada imej tanpa bertindih . Topeng D2 dan D4:

Apabila menggunakan proses spatial, soalan berikut mungkin timbul berkaitan dengan keanehan pemprosesan piksel:

Penghapusan kesan tepi;

Nilai tindak balas adalah di luar had.

Untuk soalan pertama, penyelesaian berikut adalah mungkin:

Kecualikan piksel sempadan imej daripada penukaran

dalam kes ini, imej output akan menjadi lebih kecil dalam saiz, atau piksel sempadan akan dicat, sebagai contoh, hitam;

Jangan masukkan piksel yang sepadan dalam penjumlahan, mengagihkan beratnya secara sama rata antara piksel lain di kawasan kejiranan;

Lengkapkan (lengkapkan) imej asal dengan menambah bilangan piksel yang diperlukan di sepanjang sempadan. Bilangan lajur yang akan ditambah biasanya bergantung pada saiz kernel. Terdapat dua pilihan di sini:

Tentukan nilai piksel di luar sempadan imej menggunakan ekstrapolasi. Sebagai contoh, pertimbangkan nilai keamatan berhampiran pemalar sempadan atau pertimbangkan kecerunan keamatan berhampiran pemalar sempadan;
Tentukan nilai piksel di luar sempadan imej menggunakan pencerminan.

Untuk menyelesaikan masalah yang berkaitan dengan nilai yang melebihi had, tindakan berikut boleh dilakukan:

Skalakan nilai yang diperoleh untuk tindak balas penapis positif;

Jika tindak balas penapis adalah negatif, ambil sama ada nilai mutlak (modulo) atau kurangkannya kepada sifar.

Juga dalam bahagian ini adalah bernilai memberikan kemungkinan "klasifikasi" bunyi dalam imej:

Bunyi garam dan lada - piksel putih dan hitam rawak;

Bunyi impuls – piksel putih rawak;

Bunyi Gaussian ialah turun naik keamatan yang diedarkan mengikut undang-undang biasa.

DIGITAL RAWATAN Isyarat

Topik 17. PEMPROSESAN IMEJ

Tiada apa yang berani dilakukan oleh imaginasi manusia.

Titus Lucretius. Ahli falsafah dan penyair Rom. abad saya SM e.

Imaginasi adalah perkara yang baik. Tetapi program grafik yang baik akan melakukan kerja yang lebih baik untuk menarik gelandangan keluar dari ruang bawah tanah, mencucinya, mengubahnya menjadi Apollo, membungkusnya dalam kotak mancis dan menghantarnya melalui e-mel kepada rakan.

Anatoly Pyshmintsev, ahli geofizik Novosibirsk dari sekolah Ural. abad XX

pengenalan.

1. Konsep asas. Perwakilan grafik imej. Perwakilan warna dalam grafik komputer. Model warna RGB. Sistem warna CIE XYZ.

2. Transformasi geometri imej raster. Bidang dan peringkat transformasi. Persampelan. Siri interpolasi untuk pembinaan semula isyarat dua dimensi. Herotan kekerapan imej dan penyingkirannya. Pensampelan semula imej.

3. Penapisan imej. Penapis linear. Penapis anti-aliasing. Penapis peningkatan kontras. Penapis perbezaan. Konvolusi kitaran dua dimensi. Penapis bukan linear. Penapisan ambang. Penapisan median. Penapis melampau.

4. Pemampatan imej. Ulangi algoritma pengekodan panjang (RLE). Algoritma kamus. Algoritma pengekodan statistik. Pemampatan imej yang hilang. Anggaran kehilangan dalam imej. Transformasi Fourier. Transformasi gelombang.

PENGENALAN

Skop penyelidikan dalam bidang pengimejan digital berkembang pesat. Ini ditentukan oleh fakta bahawa pemprosesan imej ialah pemprosesan isyarat multidimensi, dan kebanyakan isyarat dalam dunia nyata adalah multidimensi.

Imej dalam perwakilan matematik ialah isyarat dua dimensi yang membawa sejumlah besar maklumat. Imej berwarna 500 × 500 elemen ialah susunan beberapa ratus ribu bait. Maklumat sedemikian hanya boleh diproses oleh organisasi pengiraan yang rasional. Untuk tugas pemprosesan imej tertentu, teknik pemprosesan yang cekap boleh digunakan dengan mengambil kira ciri dan had tugas khusus tersebut. Tetapi jika kita bercakap tentang pemprosesan imej untuk menyelesaikan kelas masalah yang luas, maka adalah perlu untuk mengenal pasti satu set operasi standard dari mana algoritma boleh dibina untuk menyelesaikan masalah sewenang-wenangnya. Ini termasuk transformasi linear, lilitan 2D dan transformasi Fourier diskret 2D.

Tetapi transformasi tak linear juga digunakan secara meluas dalam pemprosesan imej. Keistimewaan imej ialah elemen individu imej berada dalam hubungan tertentu dengan unsur jiran. Oleh itu, kebanyakan algoritma transformasi imej adalah bersifat tempatan, iaitu, ia memproses imej mengikut kumpulan elemen yang terletak di sekitar sekitar yang diberikan. Transformasi linear memenuhi sifat lokaliti dan membenarkan pembinaan algoritma yang kerumitan pengiraannya bergantung sedikit pada saiz kejiranan sekeliling. Sifat yang sama diperlukan untuk transformasi imej tak linear. Kelas transformasi tersebut termasuk algoritma yang dipanggil algoritma penapisan kedudukan, berdasarkan pengiraan statistik kedudukan tempatan imej. Apabila mengira statistik pangkat dan terbitannya, pemudahan adalah mungkin disebabkan oleh lebihan maklumat imej. Algoritma yang paling terkenal dalam kelas ini ialah algoritma penapisan median. Contoh lain algoritma kedudukan termasuk algoritma penapisan melampau, yang menggantikan elemen imej yang dianalisis dengan maksimum atau minimum dalam kejiranan. Satu lagi sifat algoritma kedudukan ialah penyesuaian setempat kepada ciri-ciri imej yang diproses dan potensi penggunaannya bukan sahaja untuk melicinkan dan penyingkiran hingar, tetapi juga untuk menyerlahkan ciri dalam pengecaman imej automatik.

Dalam pemprosesan imej, kaedah untuk memproses isyarat satu dimensi digunakan secara meluas jika ia boleh digeneralisasikan kepada isyarat berbilang dimensi. Pada masa yang sama, adalah perlu untuk mengambil kira bahawa kaedah matematik untuk menerangkan sistem multidimensi tidak lengkap. Sistem multidimensi mempunyai sejumlah besar darjah kebebasan, dan reka bentuknya memperoleh fleksibiliti yang bukan ciri sistem satu dimensi. Pada masa yang sama, polinomial multidimensi tidak boleh diuraikan menjadi faktor utama, yang merumitkan analisis dan sintesis sistem multidimensi.

17.1. Konsep asas

Perwakilan grafik imej. Untuk mempersembahkan maklumat grafik pada satah dua dimensi (skrin monitor), dua pendekatan digunakan: raster dan vektor.

Dengan pendekatan vektor, maklumat grafik diterangkan sebagai satu set objek geometri abstrak - garis lurus, segmen, lengkung, segi empat tepat, dll. Penerangan vektor menganggap pengetahuan priori tentang struktur imej.

Grafik raster beroperasi dengan imej arbitrari dalam bentuk raster. Raster ialah perihalan imej pada satah dengan membahagikan (persampelan) kepada elemen yang sama pada grid biasa dan memberikan setiap elemen warnanya sendiri dan sebarang atribut lain. Raster yang paling mudah ialah segi empat tepat, yang paling menjimatkan dari segi bilangan sampel untuk menghantar imej ialah heksagon. Dari sudut pandangan matematik, raster ialah penghampiran tetap sekeping pada satah fungsi imej berterusan.

Unsur raster dipanggil piksel. Pengenalpastian piksel standard:

f(i, j) = (A(i, j),C(i, j)), (17.1.1)

di mana A(i, j) Ì R2 ialah kawasan piksel, C(i, j) Î C ialah atribut piksel (biasanya warna). Terdapat dua jenis atribut yang paling biasa digunakan:

C(i, j) = I(i, j) - keamatan piksel (kecerahan);

C(i, j) = (R(i, j), G(i, j), B(i, j)) - atribut warna dalam model warna RGB.

Dalam bentuk matriks:

Mij = (Aij, Cij).

Apabila mendiskrisikan imej berterusan, nilai Aij boleh ditakrifkan dalam dua cara, sama ada sebagai nilai titik Aij = (i, j), yang mana atribut Cij ditakrifkan, atau sebagai nilai segi empat sama Aij = (i, i+1) × (j, j+1) atau sebarang bentuk lain, dengan Cij ditentukan oleh nilai purata dalam bentuk ini (Rajah 17.1.1).

Dalam amalan, sebagai peraturan, X dan Y ialah set terhad integer bukan negatif bagi raster segi empat sama atau segi empat tepat dengan nisbah bidang (nisbah aspek) lebar raster kepada ketinggian, yang ditulis dalam bentuk, sebagai contoh, " 4:3".

Perwakilan warna dalam grafik komputer. Konsep warna adalah berdasarkan persepsi oleh mata manusia terhadap gelombang elektromagnet dalam julat frekuensi tertentu. Cahaya siang yang kita anggap mempunyai panjang gelombang λ daripada 400 nm (ungu) hingga 700 nm (merah). Fluks bercahaya boleh digambarkan oleh fungsi spektrumnya I(λ). Cahaya dipanggil monokromatik jika spektrumnya hanya mempunyai satu panjang gelombang tertentu.

Terdapat dua jenis reseptor pada retina mata: rod dan kon. Kepekaan spektrum rod (Rajah 17.1.2) adalah berkadar terus dengan kecerahan cahaya kejadian. Kon dibahagikan kepada tiga jenis, setiap satunya mempunyai kepekaan tertentu dalam julat terhad dengan maksima merah, hijau dan biru, dan kehilangan sensitivitinya secara mendadak dalam gelap. Kepekaan mata kepada biru jauh lebih rendah daripada dua yang lain. Sifat penting persepsi manusia terhadap cahaya ialah kelinearan apabila menambah warna dengan panjang gelombang yang berbeza.

Model warna RGB (Merah, Hijau, Biru - merah, hijau, biru) dalam grafik komputer pada masa ini adalah yang paling biasa. Dalam model ini, fungsi spektrum diwakili sebagai jumlah lengkung kepekaan untuk setiap jenis kon dengan pekali pemberat bukan negatif (dinormalkan daripada 0 hingga 1), yang ditetapkan R, G dan B. Model ini dicirikan oleh sifat ketambahan untuk mendapatkan warna baharu. Sebagai contoh, pengekodan fungsi spektrum:

Hitam: fblack = 0, (R, G, B) = (0,0,0);

Warna violet fviolet = fred + fblue, (R, G, B) = (1,0,1);

Putih fputih = fred + fhijau + fbiru, (R, G, B) = (1,1,1).

Ruang warna tiga dimensi model RGB ditunjukkan dalam Rajah. 17.1.3. Disebabkan oleh keanehan persepsi cahaya oleh reseptor, tidak semua warna yang kelihatan kepada manusia boleh diwakili dalam model ini. Walau bagaimanapun, perkadaran warna yang dihasilkan semula adalah jauh lebih besar daripada perkadaran yang tidak diwakili dalam model ini.

Sistem warna CIE XYZ. Piawaian perwakilan warna antarabangsa CIE (CIE - Commission Internationale de l'Eclairage) telah diterima pakai pada tahun 1931 oleh Suruhanjaya Pencahayaan Antarabangsa. Ia mentakrifkan tiga fungsi asas ρX(λ), ρY(λ), ρZ(λ), bergantung kepada panjang gelombang , kombinasi linear dengan pekali bukan negatif (X, Y dan Z) membolehkan kita memperoleh semua warna yang boleh dilihat oleh manusia. Fungsi ini mengambil kira persepsi relatif keamatan cahaya oleh reseptor mata. Dalam ruang tiga dimensi, sistem warna CIE membentuk kon dalam kuadran pertama dan digunakan untuk paparan imej berwarna yang berkualiti tinggi.

17.2. Transformasi geometri imej raster

Bidang dan peringkat transformasi. Imej boleh dibahagikan kepada tekstur dan perincian. Dalam imej tekstur, semua sampel (elemen) membawa maklumat (imej pada skrin TV). Imej terperinci ialah imej yang anda boleh mengenal pasti objek yang mengganggu, latar belakang dan objek berguna.

Terdapat tiga kumpulan utama algoritma pemprosesan imej pada komputer:

1. Pemprosesan imej utama (awal) untuk tujuan pemulihan, penyingkiran hingar rawak, peningkatan kualiti, pembetulan herotan geometri sistem optik (nyahfokus, penyimpangan, dll.).

2. Penerangan imej, pengecaman corak. Ia dilakukan untuk menentukan parameter butiran imej dan termasuk: mencari kawasan imej yang seragam dalam tahap pencahayaan dan warna, mengenal pasti ciri bentuk imej, menentukan koordinat titik khas objek, dsb.

3. Pengekodan yang cekap untuk mengurangkan jumlah penghantaran dan penyimpanan.

Kebanyakan kaedah prapemprosesan adalah berdasarkan penggunaan penapis invarian ruang linear (SPI). Algoritma linear dilakukan menggunakan analog dua dimensi penapis FIR dan IIR satu dimensi. Ia boleh digunakan, sebagai contoh, apabila melaksanakan penapis untuk mengurangkan hingar dalam imej.

Penapis FIR dilaksanakan menggunakan kaedah lilitan. Kelebihan penapis FIR 2D ialah kejelasan, kesederhanaan dan keteguhan mutlak. Penapis IIR dilaksanakan menggunakan persamaan perbezaan dan transformasi z. Ia lebih pantas daripada penapis FIR, tetapi boleh menjadi tidak stabil. Sintesis penapis IIR dua dimensi berbeza daripada sintesis penapis satu dimensi, kerana untuk fungsi dua dimensi tidak mungkin untuk mengenal pasti kutub secara eksplisit.

Kaedah bukan linear juga mungkin diperlukan untuk memulihkan imej dan meningkatkan kualitinya. Sebagai contoh, untuk menyekat hingar dan pada masa yang sama mengekalkan bahagian kontur imej, adalah perlu menggunakan penapis bukan linear atau linear spatial bukan invarian (SPNI), yang dilaksanakan oleh algoritma kedudukan. Semua penapis tak linear kedudukan adalah berdasarkan algoritma pantas untuk mengira histogram tempatan.

Satu kaedah sedemikian ialah penapisan median. Penggunaan penapis median adalah berkesan untuk menyekat jenis hingar dan gangguan berkala tertentu tanpa memutarbelitkan isyarat secara serentak, sebagai contoh, untuk menyekat letusan letusan hingar, termasuk talian terputus. Kaedah ini juga boleh digunakan untuk menyelesaikan masalah yang berkaitan dengan pengecaman, contohnya, untuk mengenal pasti garis nipis dan objek terpencil kecil.

Algoritma untuk perihalan imej dan pengecaman corak biasanya tidak linear dan bersifat heuristik. Ciri-ciri objek biasanya adalah luas imej objek, perimeter kontur imej, dan nisbah luas kepada segi empat sama perimeter imej. Bentuk objek boleh dicirikan oleh jejari bulatan yang tertulis dalam imej atau diterangkan di sekeliling imej objek, panjang vektor jejari minimum dan maksimum dari "pusat jisim" imej.

Persampelan. Transformasi imej dalam komputer dan penyimpanan data yang diproses dilakukan dalam bentuk diskret. Persampelan digunakan untuk mendapatkan perwakilan diskret daripada imej analog berterusan dunia sebenar. Dalam amalan, ia dijalankan oleh peranti input (kamera digital, pengimbas atau lain-lain). Untuk persepsi visual imej yang diproses pada peranti output (paparan, plotter, dll.), imej analog dibina semula daripada perwakilan sampelnya.

Dalam kes termudah imej hitam dan putih, kita mempunyai tatasusunan dua dimensi sa(x, y). Untuk imej warna dalam model RGB, dengan mengambil kira sifat ketambahan apabila menambah warna, setiap lapisan R, G dan B juga boleh dipertimbangkan dan diproses sebagai tatasusunan dua dimensi, dengan penjumlahan seterusnya hasil.

Daripada cara untuk menyamaratakan pendiskretan berkala satu dimensi kepada kes dua dimensi, yang paling mudah ialah pendiskretan berkala dalam koordinat segi empat tepat:

s(n, m) = sa(nDx, mDy),

dengan Dx dan Dy ialah selang persampelan mendatar dan menegak bagi isyarat selanjar dua dimensi sa(x, y) dengan koordinat x dan y berterusan. Di bawah, nilai Dx dan Dy, seperti dalam kes satu dimensi, diambil bersamaan dengan 1.

Persampelan isyarat dua dimensi juga membawa kepada periodisasi spektrumnya dan sebaliknya. Keadaan kesetaraan maklumat bagi koordinat dan perwakilan frekuensi bagi isyarat diskret juga dikekalkan dengan bilangan titik pensampelan yang sama dalam julat utama isyarat. Untuk pensampelan segi empat tepat, transformasi Fourier ke hadapan dan songsang diberikan oleh:

S(k, l) =s(n, m) exp(-jn2pk/N-jm2pl/M), (17.2.1)

S(k, l) =exp(-jn2pk/N) s(n, m) exp(-jm2pl/M), (17.2.1")

s(n, m) =S(k, l) exp(-jn2pk/N-jm2pl/M). (17.2.2)

s(n, m) =exp(-jn2pk/N) S(k, l) exp(-jm2pl/M). (17.2.2")

nasi. 17.2.1. Periodisasi spektrum.

Ungkapan ini menunjukkan bahawa DFT dua dimensi daripada raster pensampelan data segi empat tepat boleh dikira menggunakan DFT berjujukan satu dimensi. Jumlah kedua ungkapan (17.2.1") dan (17.2.2") ialah DFT satu dimensi bagi bahagian fungsi s(n, m) dan S(k, l) di sepanjang garis n dan k, masing-masing, dan yang pertama ialah DFT satu dimensi bagi fungsi yang dikira dalam bahagian dengan m dan l. Dalam erti kata lain, matriks awal nilai s(n, m) dan S(k, l) mula-mula dikira semula menjadi matriks perantaraan dengan DFT dalam baris (atau dalam lajur), dan matriks perantaraan menjadi matriks akhir dengan DFT dalam lajur. (atau, masing-masing, dalam baris).

Untuk pengulangan berkala spektrum (Rajah 17.2.1), yang disebabkan oleh pensampelan isyarat analog dengan frekuensi Fx=1/Dx dan Fy=1/Dy, bukan untuk menukar spektrum dalam julat frekuensi utama ( berbanding dengan spektrum isyarat analog asal), adalah perlu dan memadai bahawa komponen frekuensi maksimum fmaks dalam spektrum isyarat analog, kedua-dua dalam baris dan lajur, tidak melebihi frekuensi Nyquist (fmaks. x £ fN = Fx/2, fmaks. y £ fM = Fy/2). Ini bermakna kadar pensampelan isyarat mestilah sekurang-kurangnya dua kali lebih tinggi daripada komponen frekuensi maksimum dalam spektrum isyarat:

Fx ³ 2fmaks. x, Fy ³ 2fmaks. y, (17.2.3)

yang memastikan bahawa fungsi spektrum mencapai nilai sifar pada hujung julat spektrum utama.

Siri interpolasi untuk pembinaan semula isyarat dua dimensi. Jika isyarat berterusan sa(x, y) ialah isyarat dengan spektrum terhad, dan tempoh pensampelan dipilih cukup kecil supaya spektrum tempoh bersebelahan tidak bertindih:

Sa(Wx, Wy) = 0 untuk |Wx|p/Dx, |Wy|p/Dx,

maka, seperti dalam kes satu dimensi, isyarat sa(x, y) boleh dibina semula daripada isyarat diskret menggunakan analog dua dimensi siri Kotelnikov-Shannon:

sa(x, y) = Sn Sm s(n, m) . (17.2.4)

Herotan kekerapan imej dan penyingkirannya. Isyarat dengan spektrum tanpa had juga boleh dijadikan sampel, tetapi dalam kes ini terdapat pengalianan spektrum dalam tempoh bersebelahan, dan frekuensi tinggi yang lebih besar daripada frekuensi Nyquist akan "bertopeng," seperti dalam kes satu dimensi, di bawah frekuensi rendah daripada tempoh utama. Kesan "pantulan" dari sempadan tempoh memberikan gambaran yang lebih kompleks disebabkan oleh gangguan frekuensi yang dipantulkan sepanjang koordinat yang berbeza. Kesan serupa, yang dikenali sebagai aliasing, juga akan diperhatikan apabila kadar pensampelan imej tidak mencukupi. Kesan ini boleh diperhatikan terutamanya dengan jelas dalam perubahan kontras yang tajam dalam kecerahan.

Untuk memerangi fenomena sedemikian, prapenapisan (antialiasing) digunakan - lilitan awal imej analog dengan fungsi penapis pemberat yang memotong komponen frekuensi tinggi yang boleh membawa kepada pengalian. Dalam kes dua dimensi, penapisan diterangkan seperti berikut:

z(x, y) = h(x", y") ③③ s(x-x", y-y"). (17.2.5)

Perlu diingatkan bahawa imej analog hanya wujud dalam julat optik, sebagai contoh, dalam bentuk paparan cahaya pada skrin, kertas fotografi atau filem, tetapi tidak boleh wujud dalam ingatan komputer. Oleh itu, pelaksanaan fizikal prapenapisan hanya boleh dilakukan apabila mendaftarkan imej dengan menyahfokusnya, yang, sebagai peraturan, tidak digunakan. Maklumat utama hendaklah sentiasa direkodkan dengan kesempurnaan dan ketepatan maksimum, dan membersihkan maklumat utama daripada butiran dan redundansi yang tidak diperlukan adalah urusan pemprosesan data berikutnya. Oleh itu, berhubung dengan persamaan 17.2.5, prapenapisan dua dimensi, dalam pelaksanaan praktikalnya, hanya boleh mewakili penapisan imej yang disampel dengan margin yang besar pada julat frekuensi utama (dengan resolusi yang berlebihan), dan digunakan, sebagai peraturan, apabila pensampelan semula ke langkah yang lebih besar, contohnya, semasa memampatkan imej. Prapenapisan juga boleh dibina ke dalam algoritma pembinaan imej.

Dalam Rajah. 17.2.3 dan ke bawah, Jadual 17.2.1 menunjukkan contoh penapis satu dimensi yang paling biasa untuk anti-aliasing. Ia juga boleh dilaksanakan dalam bentuk penapis analog dan digunakan, sebagai contoh, apabila menghantar saluran imej televisyen dalam bentuk analog melalui saluran radio (antialiasing mendatar). Pada dasarnya, operasi serupa boleh dilakukan merentasi lajur (imej berganda), dan selepas menjumlahkan imej, operasi anti-aliasing lengkap akan dilakukan, tetapi kaedah ini lebih kepada bidang penyelidikan saintifik khas.

Jadual 17.2.1.

Fungsi berat asas

Tetingkap masa	Fungsi berat badan	Imej Fourier
Semulajadi (P)	P(t) = 1, \|t\|£t; П(t) = 0, \|t\|>t	П(w) = 2t sink
Bartlett (D)		B(w) = t sinc2(wt/2).
Henninga, Ganna	p(t) = 0.5	0.5P(w)+0.25P(w+p/t)+0.25P(w-p/t)
Hemming	p(t) = 0.54+0.46 kos(pt/t)	0.54P(w)+0.23P(w+p/t)+0.23P(w-p/t)
Carre (tingkap kedua)	p(t) = b(t) sinc(pt/t)	t·B(w)*П(w), П(w) = 1 untuk \|w\|
Laplace-Gaussian	p(t) = exp[-b2(t/t)2/2]	[(t/b) exp(-t2w2/(2b2))] ③ П(w)

Analog dua dimensi penapis satu dimensi f1(x) dibina dalam dua pilihan simetri: atau sebagai fungsi jejari:

f2(x, y) = f1(),

atau sebagai karya:

f2(x, y) = f1(x) × f1(y).

Pilihan pertama adalah lebih tepat, tetapi yang kedua mempunyai sifat kebolehpisahan, iaitu lilitan dua dimensi boleh dilakukan oleh dua lilitan satu dimensi secara berurutan di sepanjang baris dengan f1(x) dan sepanjang lajur dengan f1(y).

Pensampelan semula imej atau pensampelan semula ialah perubahan dalam kekerapan pensampelan isyarat digital. Apabila digunakan pada imej digital, ini bermakna mengubah saiz imej.

Terdapat pelbagai algoritma pensampelan semula imej. Sebagai contoh, untuk membesarkan imej sebanyak 2 kali menggunakan kaedah interpolasi bilinear, lajur dan baris perantaraan diperoleh dengan interpolasi linear nilai lajur dan baris bersebelahan. Setiap titik imej baharu boleh diperoleh sebagai jumlah wajaran bilangan mata yang lebih besar dalam imej asal (bikubik dan jenis interpolasi lain). Pensampelan semula kualiti tertinggi diperoleh apabila menggunakan algoritma yang mengambil kira bukan sahaja domain masa, tetapi juga domain frekuensi isyarat.

Mari kita pertimbangkan algoritma pensampelan semula dengan pemeliharaan maksimum maklumat kekerapan imej. Kami akan mempertimbangkan pengendalian algoritma pada isyarat satu dimensi, kerana imej dua dimensi boleh diregangkan atau dimampatkan terlebih dahulu secara mendatar (di sepanjang baris) dan kemudian secara menegak (di sepanjang lajur), dan mengurangkan pensampelan semula imej dua dimensi kepada pensampelan semula daripada isyarat satu dimensi.

Katakan kita mempunyai isyarat satu dimensi (Rajah 17.2.4), dinyatakan pada selang 0-T dan diambil sampel dengan langkah Dt=1 (selang N). Ia adalah perlu untuk "meregangkan" isyarat m kali. Spektrum isyarat yang ditunjukkan dalam rajah dikira dengan transformasi Fourier pantas (FFT, bilangan sampel spektrum adalah sama dengan bilangan sampel isyarat) dan diberikan dalam julat FFT utama (0-2p, frekuensi Nyquist wN = p/Dt = p, atau 0.5N mengikut penomboran sampel spektrum dengan langkah sepanjang spektrum Df = 1/T atau Dw = 2p/T). Terdapat 2 langkah untuk melakukan regangan.

Langkah pertama ialah sifar interpolasi, yang meningkatkan panjang isyarat sebanyak m kali. (Gamb. 17.2.5). Anda perlu mendarab semua sampel isyarat asal dengan m, dan kemudian masukkan nilai sifar m-1 selepas setiap sampel isyarat. Selang 0-T, yang nilainya kekal tidak berubah, kini mengandungi selang persampelan m-kali lebih banyak (mN), dan langkah persampelan baharu akan sama dengan Dx=Dt/m. Sehubungan itu, frekuensi Nyquist baharu untuk isyarat ini ialah mp/Dt = mp. Tetapi nilai fizikal langkah spektrum dalam unit frekuensi adalah songsang nilai fizikal selang penetapan isyarat (Df = 1/T), dan, oleh itu, FFT daripada titik mN isyarat akan mengira titik spektrum mN dalam julat FFT utama 0-2pm dengan langkah spektrum isyarat asal, yang akan mengandungi m-tempoh spektrum isyarat asal (satu bahagian utama dan m-1).

Langkah kedua ialah menapis jalur sisi spektrum menggunakan penapis laluan rendah sama ada dalam domain masa atau spektrum. Dalam Rajah. 17.2.6 spektrum telah dibersihkan dan transformasi Fourier songsang telah dilakukan, menghasilkan isyarat m kali lebih lama daripada yang asal dengan pemeliharaan penuh semua maklumat frekuensi.

Menggunakan prinsip yang sama, algoritma untuk memampatkan (menghancurkan) isyarat sebanyak n kali boleh dibina, dengan susunan langkah diterbalikkan. Apabila memampatkan isyarat, langkah pensampelan isyarat ditingkatkan dan, dengan itu, frekuensi Nyquist dikurangkan, manakala pemotongan frekuensi tinggi (bunyi dan bahagian frekuensi tinggi yang tidak ketara dalam spektrum isyarat) akan dicerminkan dari sempadan julat utama dan disimpulkan dengan maklumat utama, mewujudkan herotan. Untuk menghapuskan fenomena ini, isyarat pertama kali lulus rendah ditapis dengan frekuensi cutoff sama dengan frekuensi Nyquist baharu (antialiasing), dan hanya selepas itu isyarat dihancurkan oleh pereputan.

Apabila pensampelan semula dilakukan hanya dalam domain masa, algoritma regangan dan mampatan digabungkan, sebagai peraturan, ke dalam satu proses berurutan dengan menentukan perubahan dalam langkah pensampelan dalam bentuk nisbah m/n, yang membolehkan anda menentukan nilai integer m dan n untuk nilai pecahan mengubah langkah pensampelan. Ini memudahkan algoritma dengan ketara dan meningkatkan kecekapan dan kualiti kerja mereka. Sebagai contoh, apabila meregangkan isyarat sebanyak 1.5 kali pada m/n = 3/2, isyarat mula-mula diregangkan sebanyak 3 kali (penambahan sifar yang mudah dan seragam kepada semua sampel, kemudian penapisan laluan rendah dilakukan, selepas itu isyarat ditipiskan dengan faktor dua. Penapis anti-aliasing tidak diperlukan , kerana kekerapan potongnya bertindih dengan frekuensi penapis laluan rendah pertama. Dalam operasi mampatan terbalik (contohnya, m/n = 2 /3), hanya penapis anti-aliasing digunakan sama.

17.3. penapisan imej

Penapisan imej ialah operasi yang menghasilkan imej dengan saiz yang sama, diperoleh daripada imej asal mengikut peraturan tertentu. Biasanya, keamatan (warna) setiap piksel dalam imej yang terhasil ditentukan oleh keamatan (warna) piksel yang terletak di beberapa kawasan kejiranan dalam imej asal.

Peraturan penapisan boleh menjadi sangat pelbagai. Penapisan imej ialah salah satu operasi paling asas bagi penglihatan komputer, pengecaman corak dan pemprosesan imej. Kerja sebahagian besar kaedah pemprosesan imej bermula dengan satu atau satu lagi penapisan imej sumber.

Penapis linear mempunyai penerangan matematik yang sangat mudah. Kami akan menganggap bahawa imej halftone asal A diberikan, dan kami akan menandakan keamatan pikselnya sebagai A(x, y). Penapis linear ditakrifkan oleh fungsi bernilai sebenar h (inti penapis) yang ditakrifkan pada raster. Penapisan itu sendiri dilakukan menggunakan operasi lilitan diskret (penjumlahan wajaran):

B(x, y) = h(i, j) ③③A(x, y) = h(i, j) A(x-i, y-j). (17.3.1)

Hasilnya ialah imej B. Biasanya, inti penapis bukan sifar hanya di beberapa kejiranan N titik (0, 0). Di luar kejiranan ini, h(i, j) adalah sama dengan sifar, atau sangat hampir dengannya dan boleh diabaikan. Penjumlahan dilakukan di atas (i, j) О N, dan nilai setiap piksel B(x, y) ditentukan oleh piksel imej A yang terletak pada tetingkap N berpusat pada titik (x, y) (ditandakan oleh set N(x, y) ). Inti penapis yang ditakrifkan pada kejiranan segi empat tepat N boleh dilihat sebagai matriks m dengan n di mana panjang sisi adalah nombor ganjil. Apabila menentukan kernel sebagai matriks, ia harus dipusatkan. Jika piksel (x, y) terletak di sekitar tepi imej, maka koordinat A(x-i, y-j) untuk tertentu (i, j) mungkin sepadan dengan piksel A yang tidak wujud di luar imej. Masalah ini boleh diselesaikan dengan beberapa cara.

Elakkan menapis piksel ini dengan memangkas tepi imej B atau menggunakan nilai asal imej A pada nilainya.

Jangan sertakan piksel yang hilang dalam penjumlahan, mengagihkan beratnya h(i, j) sama rata antara piksel lain dalam kejiranan N(x, y).

Tentukan nilai piksel di luar sempadan imej menggunakan ekstrapolasi.

Tentukan nilai piksel di luar sempadan imej menggunakan kesinambungan cermin imej.

Pemilihan kaedah dibuat dengan mengambil kira ciri penapis dan imej tertentu.

Penapis anti-aliasing. Penapis pelicin segi empat tepat termudah jejari r ditentukan menggunakan matriks bersaiz (2r+1) × (2r+1), semua nilainya adalah sama dengan 1/(2r+1)2, dan hasil tambah nilai adalah sama dengan satu. Ini ialah analog dua dimensi bagi penapis berbentuk U purata bergerak satu dimensi lulus rendah. Apabila menapis dengan kernel sedemikian, nilai piksel digantikan dengan nilai purata piksel dalam segi empat sama dengan sisi 2r+1 di sekelilingnya. Contoh topeng penapis 3×3:

Satu kegunaan penapis ialah pengurangan hingar. Bunyi berbeza secara bebas dari piksel ke piksel dan, dengan syarat jangkaan matematik nilai hingar adalah sifar, hingar piksel berjiran akan membatalkan satu sama lain apabila dijumlahkan. Semakin besar tetingkap penapisan, semakin rendah purata keamatan hingar, walau bagaimanapun, terdapat juga kekaburan yang sepadan bagi butiran imej yang ketara. Imej titik putih pada latar belakang hitam semasa penapisan (tindak balas kepada satu impuls) akan menjadi segi empat sama kelabu seragam.

Pengurangan hingar menggunakan penapis segi empat tepat mempunyai kelemahan yang ketara: semua piksel dalam topeng penapis pada sebarang jarak dari yang sedang diproses mempunyai kesan yang sama pada hasilnya. Hasil yang lebih baik sedikit diperoleh dengan mengubah suai penapis dengan meningkatkan berat titik pusat:

Pengurangan hingar yang lebih berkesan boleh dicapai jika pengaruh piksel pada hasil berkurangan dengan peningkatan jarak dari yang diproses. Penapis Gaussian dengan kernel mempunyai sifat ini: h(i, j) = (1/2ps2) exp(-(i2+j2)/2s2). Penapis Gaussian mempunyai isirong bukan sifar dengan saiz tak terhingga. Walau bagaimanapun, nilai inti penapis berkurangan dengan sangat cepat kepada n), dan oleh itu dalam amalan seseorang boleh mengehadkan dirinya kepada konvolusi dengan tetingkap bersaiz kecil sekitar (0, 0), sebagai contoh, mengambil jejari tetingkap sama dengan 3σ .

Penapisan Gaussian juga melicinkan. Walau bagaimanapun, tidak seperti penapis segi empat tepat, imej titik dengan penapisan Gaussian akan menjadi tempat kabur simetri, dengan kecerahan berkurangan dari tengah ke tepi. Tahap kekaburan imej ditentukan oleh parameter σ.

Penapis peningkatan kontras . Walaupun penapis anti-aliasing mengurangkan kontras setempat imej dengan mengaburkannya, penapis meningkatkan kontras mempunyai kesan sebaliknya dan pada asasnya adalah penapis frekuensi spatial tinggi. Inti penapis meningkatkan kontras pada titik (0, 0) mempunyai nilai yang lebih besar daripada 1, dengan jumlah nilai yang sama dengan 1. Contohnya, penapis meningkatkan kontras ialah penapis dengan kernel yang ditakrifkan oleh matriks :

. .

Contoh penggunaan penapis ditunjukkan dalam Rajah. 17.3.1. Kesan mempertingkatkan kontras dicapai dengan fakta bahawa penapis menekankan perbezaan antara keamatan piksel jiran, mengalihkan keamatan ini dari satu sama lain. Kesan ini akan menjadi lebih kuat lebih besar nilai istilah pusat inti. Artifak ciri penapisan mempertingkat kontras linear ialah cahaya ketara dan lingkaran cahaya gelap yang kurang ketara di sekeliling sempadan.

Penapis perbezaan – ini adalah penapis linear yang ditentukan oleh anggaran diskret bagi operator pembezaan (menggunakan kaedah perbezaan terhingga). Penapis ini memainkan peranan penting dalam banyak aplikasi, contohnya, untuk mencari tepi dalam imej.

Pengendali pembezaan yang paling mudah ialah terbitan berkenaan dengan koordinat-x d/dx, yang ditakrifkan untuk fungsi berterusan. Varian biasa operator serupa untuk imej diskret ialah penapis Prewitt dan Sobel:

. .

Penapis yang menghampiri pengendali terbitan koordinat y d/dy diperoleh dengan mengubah matriks.

Algoritma paling mudah untuk mengira norma kecerunan dari tiga titik bersebelahan:

G(x, y) = .

Formula pengiraan yang dipermudahkan juga digunakan:

Pengiraan norma kecerunan di atas empat titik bersebelahan (operator Roberts):

Algoritma Sobel menggunakan lapan sampel kecerahan di sekitar titik pusat:

G(x, y) = , G(x, y) @ ,

Gxx, y = - ,

Gyx, y = - .

Bersama-sama dengan penentuan norma kecerunan yang lebih tepat, algoritma Sobel membolehkan seseorang menentukan arah vektor kecerunan dalam satah analisis imej dalam bentuk sudut j antara vektor kecerunan dan arah baris matriks:

j(x, y) = argtg(Gyx, y /Gxx, y).

Tidak seperti penapis melicinkan dan mempertingkatkan kontras, yang tidak mengubah purata keamatan imej, aplikasi pengendali perbezaan biasanya menghasilkan imej dengan nilai piksel purata hampir kepada sifar. Perbezaan menegak (sempadan) imej asal sepadan dengan piksel dengan nilai modulus yang besar dalam imej yang dihasilkan. Oleh itu, penapis perbezaan juga dipanggil penapis pemilihan sempadan objek.

Sama seperti penapis di atas, penapis untuk operator pembezaan lain boleh dibina menggunakan kaedah perbezaan terhingga. Khususnya, pengendali Laplace pembezaan (Laplacian) D= 2/x2 + 𝝏2/y2, yang penting untuk banyak aplikasi, boleh dianggarkan untuk imej diskret menggunakan penapis dengan matriks (salah satu pilihan):

Seperti yang dapat dilihat dalam Rajah. 17.3.2, hasil daripada penggunaan Laplacian diskret, nilai yang besar dalam nilai mutlak sepadan dengan kedua-dua perbezaan kecerahan menegak dan mendatar. Oleh itu, penapis ialah penapis yang mencari sempadan sebarang orientasi. Mencari sempadan dalam imej boleh dilakukan dengan menggunakan penapis ini dan mengambil semua piksel yang nilai mutlaknya melebihi ambang tertentu.

Walau bagaimanapun, algoritma sedemikian mempunyai kelemahan yang ketara. Yang utama ialah ketidakpastian dalam memilih nilai ambang. Untuk bahagian imej yang berlainan, hasil yang boleh diterima biasanya diperoleh dengan nilai ambang yang berbeza dengan ketara. Di samping itu, penapis perbezaan sangat sensitif kepada bunyi imej.

Konvolusi kitaran dua dimensi. Seperti isyarat satu dimensi, lilitan dua dimensi boleh dilakukan dalam domain frekuensi spatial menggunakan algoritma transformasi Fourier pantas dan mendarabkan spektrum dua dimensi imej dan inti penapis. Ia juga kitaran, dan biasanya dilakukan dalam versi gelongsor. Mengambil kira kitaran, untuk mengira corak malar spektrum isirong, dimensi topeng penapis isirong digandakan sepanjang paksi dan dipadatkan dengan sifar, dan dimensi topeng yang sama digunakan untuk memilih tetingkap gelongsor merentasi imej, di dalamnya FFT dilakukan. Melaksanakan penapis FIR menggunakan FFT amat berkesan jika penapis mempunyai kawasan rujukan yang besar.

Penapis bukan linear . Dalam pemprosesan imej digital, algoritma bukan linear berdasarkan statistik kedudukan digunakan secara meluas untuk memulihkan imej yang rosak oleh pelbagai model hingar. Mereka membolehkan anda mengelakkan herotan imej tambahan apabila mengeluarkan bunyi, dan juga meningkatkan hasil penapisan pada imej dengan tahap hingar yang tinggi dengan ketara.

Mari kita perkenalkan konsep kejiranan M bagi unsur imej A(x, y), yang merupakan pusat bagi kejiranan ini. Dalam kes paling mudah, kejiranan M mengandungi N-piksel - titik yang jatuh ke dalam topeng penapis, termasuk (atau tidak termasuk) yang tengah. Nilai-nilai elemen-N ini boleh disusun dalam siri variasi V(r), disusun mengikut susunan menaik (atau menurun), dan momen tertentu siri ini boleh dikira, contohnya, nilai purata kecerahan mN dan varians dN. Nilai keluaran penapis, yang menggantikan sampel pusat, dikira menggunakan formula:

B(x, y) = aA(x, y) + (1-a)mN. (17.3.2)

Nilai pekali a = dikaitkan dengan pergantungan tertentu dengan statistik sampel dalam tetingkap penapis, contohnya:

a = dN /(dN + k dS), (17.3.3)

dengan dS ialah serakan hingar ke atas imej secara keseluruhan atau ke atas kejiranan S untuk S > M dan MÎS, k ialah pemalar keyakinan untuk serakan kejiranan S. Seperti berikut daripada formula ini, untuk k = 1 dan dN » dS a » 0.5 berlaku, dan nilai B(x, y) = (A(x, y) + mN)/2, iaitu mereka menambah sama pada nilai sampel pusat dan nilai purata piksel kejiranan M-nya. Apabila nilai dN meningkat, sumbangan kepada hasil nilai rujukan pusat meningkat, dan apabila nilai dN berkurang, nilai mN meningkat. Berat sumbangan nilai purata dalam kejiranan M boleh diubah dengan nilai pekali k.

Pilihan fungsi statistik dan sifat pergantungan pekali a padanya boleh agak pelbagai (contohnya, mengikut serakan perbezaan sampel dalam kejiranan M dengan sampel pusat), dan bergantung kepada kedua-duanya pada saiz apertur penapis dan sifat imej dan bunyi. Pada asasnya, nilai pekali a harus menentukan tahap kerosakan pada sampel pusat dan, dengan itu, fungsi peminjaman untuk pembetulan sampel dari kejiranan M.

Jenis penapis tak linear yang paling mudah dan paling biasa untuk pemprosesan imej ialah penapis ambang dan median.

Penapisan ambang diberikan, sebagai contoh, seperti berikut:

B(x, y) =

Magnitud hlm ialah ambang penapisan. Jika nilai titik pusat penapis melebihi nilai purata sampel mN dalam kejiranan M-nya dengan nilai ambang, maka ia digantikan dengan nilai purata. Nilai ambang boleh sama ada pemalar atau bergantung secara fungsi pada nilai titik pusat.

Penapisan median ditakrifkan seperti berikut:

B(x, y) = med (M(x, y)),

iaitu, hasil penapisan ialah nilai median bagi piksel kejiranan, yang bentuknya ditentukan oleh topeng penapis. Penapisan median boleh mengeluarkan bunyi secara berkesan daripada imej yang secara bebas mempengaruhi piksel individu. Sebagai contoh, gangguan tersebut ialah piksel "pecah" semasa penangkapan digital, bunyi "salji" apabila sesetengah piksel digantikan dengan piksel dengan keamatan maksimum, dsb. Kelebihan penapisan median ialah piksel "panas" pada latar belakang gelap akan digantikan dengan gelap, dan tidak "berlumur" di sekitar kawasan itu.

Penapisan median telah menyatakan selektiviti berkenaan dengan elemen tatasusunan, yang merupakan komponen bukan monotonik bagi jujukan nombor dalam apertur penapis. Pada masa yang sama, penapis median meninggalkan komponen monotonik jujukan tidak berubah. Terima kasih kepada ciri ini, penapis median dengan apertur yang dipilih secara optimum mengekalkan sempadan objek tajam tanpa herotan, menyekat hingar yang tidak berkorelasi atau berkorelasi lemah dan butiran bersaiz kecil.

Penapis melampau ditentukan mengikut peraturan:

Bmin(x, y) = min (M(x, y)),

Bmax(x, y) = maks (M(x, y)),

iaitu hasil penapisan ialah nilai piksel minimum dan maksimum dalam topeng penapis. Penapis sedemikian biasanya digunakan untuk imej binari.

17.4. PEMAMPATAN IMEJ

Imej biasa dengan resolusi kira-kira 3000x2000 pada 24 bit setiap piksel untuk penghantaran warna mempunyai volum 17 megabait. Untuk peranti profesional, saiz raster imej yang terhasil boleh menjadi lebih besar, kedalaman warna sehingga 48 bit setiap piksel, dan saiz satu imej boleh melebihi 200 megabait. Oleh itu, algoritma pemampatan imej sangat relevan untuk mengurangkan jumlah data yang mewakili imej.

Terdapat dua kelas utama algoritma:

1. Mampatan tanpa rugi A (mampatan tanpa rugi), jika terdapat algoritma songsang A-1 yang mana-mana h - imej A[h] = h1 kita mempunyai A-1 = h. Mampatan tanpa rugi digunakan dalam format imej grafik seperti: GIF, PCX, PNG, TGA, TIFF, dan digunakan semasa memproses maklumat utama yang sangat berharga (imej perubatan, gambar udara dan angkasa, dsb.), walaupun herotan yang sedikit tidak diingini.

2. Mampatan lossy, jika ia tidak memberikan keupayaan untuk memulihkan imej asal dengan tepat. Algoritma pemulihan imej anggaran yang dipasangkan dengan A akan dilambangkan sebagai A*. Pasangan (A, A*) dipilih untuk memberikan nisbah mampatan yang tinggi sambil mengekalkan kualiti visual. Mampatan lossy digunakan dalam format imej: JPEG, JPEG2000, dsb.

Semua algoritma dan pernyataan digunakan pada kedua-dua imej dan jujukan arbitrari, yang unsur-unsurnya boleh mengambil bilangan nilai yang terhad. Perlu diingat bahawa tidak ada algoritma ideal yang boleh memampatkan mana-mana set data tanpa kehilangan.

Ulangi Pengekodan Panjang (RLE) Algoritma adalah berdasarkan prinsip mudah: menggantikan kumpulan berulang unsur-unsur urutan asal dengan pasangan (kuantiti, unsur), atau hanya dengan kuantiti.

Tahap bit. Kami akan mempertimbangkan data sumber pada tahap urutan bit, sebagai contoh, mewakili imej hitam dan putih. Biasanya terdapat beberapa 0s atau 1s berturut-turut, dan anda boleh mengekod bilangan digit yang sama dalam satu baris. Tetapi bilangan ulangan juga mesti dikodkan dalam bit. Kita boleh menganggap bahawa setiap nombor ulangan berbeza dari 0 hingga 7 (kod 3-bit), berselang-seli urutan kod satu dan sifar. Sebagai contoh, jujukan boleh dibandingkan dengan nombor 7 0 4, iaitu 7 satu, 0 sifar, 4 satu, dan kita mempunyai tahun baharu - Semakin panjang panjang jujukan bit yang sama, semakin besar kesannya. Oleh itu, urutan 21 satu, 21 sifar, 3 satu dan 7 sifar akan dikodkan seperti berikut: , iaitu, daripada urutan asal 51 bit panjang, kita mempunyai urutan 36 bit panjang.

Tahap bait. Mari kita anggap bahawa input ialah imej halftone, di mana 1 bait diperuntukkan untuk nilai keamatan piksel, dan jangkaan rantaian panjang bit yang sama dikurangkan dengan ketara.

Kami akan membahagikan aliran input kepada bait (kod dari 0 hingga 255) dan mengekod bait berulang dengan pasangan (kuantiti, huruf). Satu bait boleh dibiarkan tidak berubah. Jadi, kami mengekodkan bait AABBBCDAA (2A) (3B) (C) (D) (2A).

Walau bagaimanapun, pengubahsuaian algoritma ini jarang digunakan sendiri (contohnya, dalam format PCX), kerana subkelas jujukan di mana algoritma berkesan adalah agak sempit. Lebih kerap ia digunakan sebagai salah satu peringkat saluran paip mampatan.

Algoritma kamus Daripada mengekod hanya satu elemen urutan masuk, rangkaian elemen dikodkan. Dalam kes ini, kamus rantai (dicipta daripada urutan input) digunakan untuk mengekod yang baharu.

Algoritma LZ77 adalah salah satu yang pertama menggunakan kamus. Unsur N terakhir yang telah dikodkan bagi jujukan digunakan sebagai kamus. Semasa proses pemampatan, kamus jujukan "meluncur" sepanjang jujukan input. Rantaian elemen pada output dikodkan seperti berikut: kedudukan bahagian padanan rantaian unsur yang diproses dalam kamus - mengimbangi (berbanding dengan kedudukan semasa), panjang, elemen pertama mengikuti bahagian rantai yang dipadankan. Panjang rantai padanan dihadkan di atas dengan nombor n. Sehubungan itu, tugasnya adalah untuk mencari rantai terbesar daripada kamus yang sepadan dengan urutan yang sedang diproses. Jika tiada padanan, maka offset sifar, panjang unit dan elemen pertama bagi urutan yang tidak dikodkan direkodkan.

Skim pengekodan yang diterangkan di atas membawa kepada konsep tetingkap gelongsor, yang terdiri daripada dua bahagian:

Susunan unsur yang telah dikodkan dengan panjang N-kamus - penimbal carian;

Susunan panjang n daripada rantaian elemen yang mana perlawanan akan dicuba - penimbal pandangan ke hadapan.

Menyahkod jujukan termampat ialah penyahkodan kod yang direkodkan: setiap rekod dipadankan dengan rantaian daripada kamus dan elemen bertulis secara eksplisit, selepas itu kamus dialihkan. Kamus dicipta semula semasa algoritma penyahkodan berjalan.

Algoritma ini adalah pengasas seluruh keluarga algoritma. Kelebihannya termasuk tahap pemampatan yang baik pada jujukan yang agak besar dan penyahmampatan cepat. Kelemahan termasuk kelajuan mampatan yang perlahan dan nisbah mampatan yang lebih rendah daripada algoritma alternatif.

Algoritma LZW. Kamus dalam algoritma ini ialah jadual yang dipenuhi dengan rantaian elemen semasa algoritma berjalan. Semasa proses pemampatan, rantaian terpanjang yang telah direkodkan dalam kamus ditemui. Setiap kali rantaian elemen baharu tidak ditemui dalam kamus, ia ditambahkan pada kamus dan kod rantaian direkodkan. Secara teori, tidak ada sekatan pada saiz meja, tetapi mengehadkan saiz membolehkan anda meningkatkan nisbah mampatan, kerana rantai yang tidak perlu (tidak berlaku) terkumpul. Lebih banyak entri jadual mempunyai, lebih banyak maklumat perlu diperuntukkan untuk menyimpan kod.

Penyahkodan terdiri daripada mentafsir kod secara langsung, iaitu, membina kamus dan mengeluarkan rantai yang sepadan. Kamus dimulakan dengan cara yang sama seperti dalam pengekod. Kelebihan algoritma termasuk tahap pemampatan yang tinggi dan kelajuan yang agak tinggi bagi kedua-dua pemampatan dan penyahkodan.

Algoritma pengekodan statistik tetapkan kod kepada setiap elemen jujukan supaya panjangnya sepadan dengan kebarangkalian kejadian unsur itu. Mampatan berlaku dengan menggantikan unsur-unsur urutan asal yang mempunyai panjang yang sama (setiap elemen menduduki bilangan bit yang sama) dengan unsur-unsur yang berbeza panjang, berkadar dengan logaritma negatif kebarangkalian, iaitu unsur-unsur yang berlaku lebih kerap daripada yang lain mempunyai kod. lebih pendek panjangnya.

Algoritma Huffman menggunakan kod awalan pembolehubah panjang yang mempunyai sifat khas: kod yang lebih pendek tidak sepadan dengan awalan (bahagian permulaan) kod yang lebih panjang. Kod ini membenarkan pengekodan satu sama satu. Proses pemampatan melibatkan menggantikan setiap elemen urutan input dengan kodnya. Pembinaan satu set kod biasanya dijalankan menggunakan apa yang dipanggil pokok kod.

Algoritma Huffman ialah algoritma dua hala. Pas pertama melalui imej mencipta jadual berat elemen, dan semasa pengekodan kedua berlaku. Terdapat pelaksanaan algoritma dengan jadual tetap. Selalunya berlaku bahawa taburan kebarangkalian a priori bagi unsur-unsur abjad tidak diketahui, kerana keseluruhan urutan tidak tersedia sekaligus, dan pengubahsuaian adaptif algoritma Huffman digunakan.

Pemampatan imej yang hilang. Jumlah maklumat yang diperlukan untuk menyimpan imej biasanya besar. Algoritma klasik, sebagai algoritma tujuan umum, tidak mengambil kira bahawa maklumat yang dimampatkan ialah imej - objek dua dimensi, dan tidak memberikan tahap pemampatan yang mencukupi.

Mampatan lossy adalah berdasarkan ciri persepsi imej manusia: kepekaan terbesar dalam julat gelombang warna tertentu, keupayaan untuk melihat imej secara keseluruhan tanpa melihat herotan kecil. Kelas utama imej yang disasarkan oleh algoritma pemampatan lossy ialah gambar dan imej dengan peralihan warna yang lancar.

Anggaran kehilangan dalam imej. Terdapat banyak langkah untuk menilai kerugian dalam imej selepas ia dipulihkan (dekod) daripada yang dimampatkan, tetapi untuk kesemuanya adalah mungkin untuk memilih dua imej supaya ukuran perbezaannya agak besar, tetapi perbezaannya akan hampir tidak kelihatan. ke mata. Dan sebaliknya - anda boleh memilih imej yang sangat berbeza dengan mata, tetapi mempunyai sedikit perbezaan.

Ukuran kerugian berangka piawai biasanya sisihan piawai (RMS) bagi nilai piksel imej yang dibina semula daripada yang asal. Walau bagaimanapun, "ukuran" penilaian kerugian yang paling penting ialah pendapat pemerhati. Semakin sedikit perbezaan (atau lebih baik lagi, tiada perbezaan) yang dikesan oleh pemerhati, semakin tinggi kualiti algoritma pemampatan. Algoritma mampatan lossy sering memberi pengguna keupayaan untuk memilih jumlah data "hilang" - iaitu, hak untuk memilih antara kualiti dan saiz imej yang dimampatkan. Sememangnya, lebih baik kualiti visual pada nisbah mampatan yang lebih tinggi, lebih baik algoritmanya.

Transformasi Fourier. Secara umum, imej boleh dilihat sebagai fungsi dua pembolehubah, ditakrifkan pada titik raster akhir. Satu set fungsi sedemikian pada titik raster terhingga tetap membentuk ruang Euclidean dimensi terhingga, dan transformasi Fourier diskret, iaitu, perwakilan spektrum imej, boleh digunakan padanya. Ia menyediakan:

Pekali spektrum tidak berkorelasi dan bebas, iaitu ketepatan perwakilan satu pekali tidak bergantung pada pekali yang lain.

- Pemadatan tenaga. Transformasi menyimpan maklumat asas dalam sebilangan kecil pekali. Sifat ini paling ketara dalam imej fotorealistik.

Pekali perwakilan spektrum ialah amplitud frekuensi spatial imej. Dalam kes imej dengan peralihan yang lancar, kebanyakan maklumat terkandung dalam spektrum frekuensi rendah.

Algoritma mampatan yang digunakan dalam format JPEG adalah berdasarkan transformasi Fourier kosinus diskret. Skim mampatan dalam algoritma adalah saluran paip, di mana transformasi ini hanya salah satu peringkat, tetapi salah satu yang utama. Algoritma mengandungi operasi utama berikut:

1. Penukaran kepada ruang warna YCbCr. Di sini Y ialah komponen kecerahan, Cb dan Cr ialah komponen kromatik. Mata manusia lebih sensitif kepada kecerahan daripada warna. Oleh itu, adalah lebih penting untuk mengekalkan ketepatan yang lebih besar semasa memindahkan Y daripada semasa memindahkan Cb dan Cr.

2. Transformasi kosinus diskret (DCT). Imej dibahagikan kepada blok 8 × 8. Satu transformasi kosinus diskret digunakan pada setiap blok (secara berasingan untuk komponen Y, Cb dan Cr).

3. Pengurangan komponen frekuensi tinggi dalam matriks DCT. Mata manusia hampir tidak menyedari perubahan dalam komponen frekuensi tinggi, oleh itu, pekali yang bertanggungjawab untuk frekuensi tinggi boleh disimpan dengan kurang ketepatan.

4. Susunan zigzag matriks. Ini ialah pas matriks khas untuk mendapatkan jujukan satu dimensi. Mula-mula datang elemen T00, kemudian T01, T10, T1. Selain itu, untuk imej fotorealistik biasa, pertama akan ada pekali bukan sifar yang sepadan dengan komponen frekuensi rendah, dan kemudian - satu set sifar (komponen frekuensi tinggi).

5. Mampatan dahulu menggunakan kaedah RLE dan kemudian kaedah Huffman.

Algoritma pemulihan imej beroperasi dalam susunan terbalik. Nisbah mampatan adalah dari 5 hingga 100 kali atau lebih. Pada masa yang sama, kualiti visual untuk kebanyakan imej fotorealistik kekal pada tahap yang baik apabila dimampatkan sehingga 15 kali. Algoritma dan format adalah yang paling biasa untuk menghantar dan menyimpan imej berwarna penuh.

Transformasi gelombang isyarat ialah generalisasi bagi transformasi Fourier klasik. Istilah "wavelet" diterjemahkan daripada bahasa Inggeris bermaksud "gelombang kecil (pendek)." Wavelet ialah nama umum untuk keluarga fungsi matematik dalam bentuk tertentu, yang tempatan dalam masa dan kekerapan, dan di mana semua fungsi diperoleh daripada satu asas satu melalui anjakan dan regangannya sepanjang paksi masa.

Dalam algoritma mampatan lossy, sebagai peraturan, semua operasi saluran paip mampatan dikekalkan dan transformasi Fourier diskret digantikan dengan transformasi wavelet diskret. Transformasi wavelet mempunyai penyetempatan frekuensi-ruang yang sangat baik dan dalam hal ini adalah lebih baik daripada transformasi Fourier tradisional. Dalam kes ini, ia menjadi mungkin untuk menggunakan pengkuantitian yang lebih kuat, meningkatkan sifat urutan untuk pemampatan berikutnya. Algoritma pemampatan imej berdasarkan transformasi ini menunjukkan hasil yang lebih baik dalam mengekalkan kualiti imej pada nisbah mampatan yang sama.

sastera

46. dan lain-lain. Algoritma pantas dalam pemprosesan imej digital. – M.: Radio dan Komunikasi, 1984. – 224 hlm.

47. Pemprosesan imej Soifer. Bahagian 2. Kaedah dan algoritma. – Majalah pendidikan Soros No. 3, 1996.

48. , Bunyi katrij daripada imej berdasarkan algoritma tak linear menggunakan statistik kedudukan. - Universiti Negeri Yaroslavl, 2007.

49. Sistem pengawasan televisyen Andreev. Bahagian II. Asas dan algoritma aritmetik dan logik. Tutorial. - St. Petersburg: St. Petersburg, GUITMO, 2005. – 88 p.

51. Lukin A. Pengenalan kepada pemprosesan isyarat digital (asas Matematik) - M.: Moscow State University, Makmal Grafik Komputer dan Multimedia, 2002. - http://pv. *****/dsp/dspcourse. pdf, http://dsp-book. *****/dspcourse. djvu, http://geogin. *****/arhiv/dsp/dsp4.pdf.

1i. dan lain-lain. Asas algoritma grafik raster. – Universiti Internet Teknologi Maklumat. – http://www. *****/goto/course/rastrgraph/

2i. Lukin -sistem elektronik: Nota kuliah. ITMO, 2004. - St. Petersburg, ITMO IFF, 2004. - http://iff. *****/kons/oes/KL. htm

Mengenai ralat perasan dan cadangan untuk penambahan: *****@***ru.

Kebisingan imej. Model Kebisingan

Kami telah menulis di atas bahawa tugas "penapisan imej" dalam erti kata yang luas kadangkala difahami sebagai mana-mana prosedur pemprosesan imej di mana satu (satu) imej raster dibekalkan kepada input prosedur, dan imej raster juga terbentuk di keluarannya. Prosedur sedemikian jenis (satu input raster, satu output raster) dipanggil\linebreak $\it(filters)$.

Walau bagaimanapun, lebih kerap "penapisan" dalam erti kata yang lebih sempit difahami sebagai apa yang dipanggil $\textit(penapisan hingar)$, atau menapis imej daripada "bunyi". Dalam kes ini, secara tersirat diandaikan bahawa pada mulanya di suatu tempat terdapat imej "asal" tertentu yang bersih (bising), yang kemudiannya, melalui $\it(noise)$ (jenis herotan tertentu), imej sebenar yang kita pemerhatian diperolehi. Tugas penapisan hingar, oleh itu, bermuara kepada fakta bahawa dengan beberapa pemprosesan imej sebenar yang diperhatikan, "membersihkannya daripada hingar" sebaik mungkin, iaitu, untuk mendapatkan imej yang paling hampir dengan ciri-cirinya dengan asal. imej "bising".

Malah, adalah perlu untuk memahami bahawa "bunyi bising" hanyalah model ideal yang sangat mudah untuk berlakunya herotan dalam imej digital objek sebenar. Secara umumnya, herotan dalam imej yang diperoleh melalui penggambaran video objek tiga dimensi sebenar dalam persekitaran semula jadi boleh menjadi sangat kompleks, bergantung pada keadaan penangkapan (pencahayaan, kabus, silau, bayang-bayang, hujan, salji, dll.), ciri-ciri sistem optik (herotan, nyahfokus, kekeruhan kanta dan cermin, dsb.), ciri peralatan rakaman elektronik, ciri saluran penghantaran, ciri peranti pendigitalan dan banyak lagi faktor. Model matematik pembentukan imej digital yang hampir dengan realiti mengandungi beratus-ratus persamaan tak linear kompleks dan banyak pembetulan jadual. Dalam kes ini, undang-undang pembentukan nilai kecerahan setiap piksel imej, sebagai peraturan, tidak bebas daripada pembentukan piksel jiran; parameter kecerahan imej bergantung pada yang geometri, dan sebagainya. Apabila cuba "membetulkan" model pendaftaran imej yang kompleks secara matematik, seseorang tidak lagi bercakap tentang penapisan daripada hingar, tetapi tentang $\it(pemulihan)$ atau $\it(pembinaan semula)$ imej.

Malangnya, kaedah pemulihan imej terlalu kompleks dari segi pengiraan untuk digunakan secara praktikal dalam sistem penglihatan komputer masa nyata. Di samping itu, mereka memerlukan pengetahuan yang tepat tentang model matematik dan semua parameter sistem rakaman video, yang juga hampir mustahil dalam amalan. Oleh itu, dalam sistem penglihatan komputer sebenar, sebagai peraturan, prosedur penapisan hingar yang lebih mudah, tetapi agak berkesan digunakan, direka untuk memerangi herotan yang lebih mudah dalam bentuk $\it(bunyi piksel bebas)$ imej.

Model paling umum untuk hingar piksel bebas ialah $\it(bunyi penggantian)$. Marilah kita diberikan imej halftone awal (“bising”) Im$$, setiap piksel boleh mengambil nilai dalam julat $$. Model umum hingar gantian mengandaikan bahawa selepas hingar, setiap piksel imej yang sebelum ini mempunyai nilai kecerahan $i$ sama ada akan mengekalkan nilai ini dengan beberapa kebarangkalian yang diketahui $p(i)$, atau nilai kecerahan ini akan digantikan secara rawak dengan kebarangkalian $q(i ,j)$ dengan beberapa nilai kecerahan lain $j$ daripada julat diskret terhingga yang sama $$. Seperti yang dapat dilihat, untuk menerangkan model penggantian rawak am sedemikian, kita perlu menentukan jadual $\it(kebarangkalian peralihan)$ bersaiz $I_(\textrm(maks))^(2)$, yang merupakan jumlah yang ketara dalam kes imej halftone $8$-bit konvensional (saiz jadual - $256\kali 256$ elemen). Penerangan ini jelas tidak padat dan oleh itu jarang digunakan dalam amalan untuk imej halftone. Pada masa yang sama, untuk imej binari di mana $I_(\rm (maks)) = 2$, penerangan sedemikian adalah yang paling mudah, ringkas dan semula jadi. Di bawah ini kita juga akan melihat model hingar penggantian pada imej binari - model hingar yang dipanggil "garam dan lada".

Untuk imej halftone, sebagai peraturan, model hingar lain yang lebih spesifik dipertimbangkan - $\it(noise tambahan)$, yang menganggap bahawa imej bising dijana mengikut undang-undang

$$ (\rm Im)^(\prime) = (\rm Im) + R(x,y), $$

di mana $(\rm Im)^(\prime) $ ialah piksel bagi imej bising, $(\rm Im) $ ialah piksel bagi imej asal dan $R(x,y)$ ialah rawak $\ textit(komponen bunyi tambahan)$ . Di samping itu, dalam kebanyakan aplikasi, pergantungan hingar pada koordinat piksel dianggap tidak penting. Akhir sekali, berdasarkan $\it(undang-undang nombor besar)$ yang diketahui dalam statistik, undang-undang taburan komponen hingar aditif sebaiknya diterangkan oleh keluarga parametrik yang mudah $\it(normal)$ ($\it(Gaussian )$) taburan dengan min sifar. Oleh itu, $\textit(Gaussian aditif hingar)$ diterangkan oleh ungkapan

$$ (\rm Im)^(\prime) = (\rm Im) + N(0,\sigma), $$

di mana $N(a,\sigma)$ ialah taburan normal, $a$ ialah jangkaan matematik bagi isyarat taburan normal, $\sigma$ ialah sisihan purata kuasa dua (MSD) bagi nilai taburan normal. Model hingar inilah yang paling sering dipertimbangkan dalam masalah menapis imej halftone.

Dalam Rajah. Rajah 2 - 8 menunjukkan contoh bunyi buatan bagi imej halftone asal leukosit (Rajah 1) dengan bunyi Gaussian aditif yang dijana khas dengan nilai sisihan piawai yang berbeza. Seperti yang anda lihat, semakin besar parameter hingar $\sigma$, semakin herot imej itu kelihatan. Pada nilai besar $\sigma $ (Rajah 7, 8), walaupun mata manusia mengalami kesukaran untuk membezakan garis besar umum objek imej bersaiz besar (dalam kes ini, leukosit); objek yang lebih kecil dan kurang kontras menjadi tidak dapat dibezakan secara praktikal. .

Dalam bahagian berikut, kami akan mengingati contoh ini semasa kami melihat pelbagai teknik penapisan imej digital.

Penapisan imej bertingkap dalam domain spatial

Berdasarkan tugas memulihkan nilai kecerahan asal imej yang bising, dan juga dari fakta bahawa komponen hingar setiap piksel adalah pembolehubah rawak yang tidak diketahui sebelum ini, maka untuk menyelesaikan masalah ini adalah perlu untuk menggunakan satu atau satu lagi prosedur $\textit(anggaran statistik)$. Ini boleh menjadi anggaran Bayesian, anggaran kemungkinan maksimum, atau mana-mana kaedah lain yang diketahui daripada kursus dalam statistik matematik. Walau bagaimanapun, semua kaedah ini memerlukan penggunaan bukan satu ukuran untuk menganggarkan nilai yang diingini (lagipun, ia juga boleh menjadi bising), tetapi lebih besar atau lebih kecil $\textit(sampel statistik, )$sentiasa termasuk beberapa bacaan yang mencirikan nilai ini . Dalam hal ini, idea utama penapisan hingar imej ialah untuk menganggarkan nilai awal setiap piksel dalam imej, bukan sahaja nilai piksel ini sendiri digunakan (seperti dalam transformasi penggredan yang dibincangkan sebelum ini), tetapi juga nilai beberapa piksel lagi berdekatan dengannya yang termasuk dalam apa yang dipanggil penapis "$\it(window)$" atau $\it(aperture)$. Dalam kes ini, "kehampiran" piksel dengan perkara yang sedang dinilai difahami dalam erti kata geometri literal.

Yang paling mudah untuk pelaksanaan pengiraan ialah penapisan $\textit(tingkap segi empat tepat)$ (apertur) yang digunakan secara tradisional, ditakrifkan oleh keadaan mudah seperti "$\textit(semua piksel tetingkap tertentu dijarakkan daripada piksel pusat yang diuji dengan lebih daripada WinX /2 secara mendatar dan WinY /2 menegak)$", di mana WinX dan WinY ialah saiz mendatar dan menegak bagi tetingkap penapisan, masing-masing. Cara lain yang lebih kompleks untuk membentuk tetingkap penapisan adalah mungkin - bulat, segi tiga atau sebarang bentuk sewenang-wenangnya.

Prosedur penapisan tetingkap biasa menganggap bahawa tetingkap penapis bergerak secara berurutan melalui $\textit(imej input)$ (sebagai contoh, algoritma mungkin merentasi imej "dalam urutan bacaan": dari atas ke bawah dalam baris, dari kiri ke kanan dalam setiap baris), manakala pada setiap tetingkap kedudukan, semua piksel yang dimiliki oleh tetingkap pada masa ini dianalisis, dan berdasarkan analisis sedemikian, piksel pusat tetingkap dalam $\textit(imej keluaran)$ diberikan satu atau satu lagi nilai akhir. Imej output yang dijana dengan cara ini juga dipanggil $\textit(hasil penapisan)$.

Prosedur penapisan tetingkap mungkin berbeza-beza:

saiz dan bentuk tingkap (apertur);
jenis statistik tempatan yang dikumpul dalam tetingkap;
satu cara untuk membuat keputusan berdasarkan statistik yang dikumpul.

Walau apa pun, kita bercakap tentang menggunakan maklumat tentang nilai jirannya dalam imej untuk menganggarkan nilai piksel pusat apertur. Dalam erti kata statistik, ini bermakna kita secara tersirat bergantung pada andaian bahawa dalam imej bebas hingar asal, nilai kecerahan semua piksel jiran ini adalah sama atau sangat hampir, dan perbezaan yang diperhatikan dalam kecerahannya dalam bunyi bising. imej ditentukan hanya oleh kehadiran komponen hingar, yang perlu dikecualikan. Sementara itu, seperti yang telah kita lihat semasa memeriksa profil imej, imej yang bermakna sama sekali tidak mewakili satu "satah" yang berterusan. Dalam kawasan yang secara visual kelihatan kepada kita sebagai kawasan yang sama atau perlahan-lahan berubah kecerahan, nilai piksel jiran sebenarnya berbeza sedikit. Pada masa yang sama, pada sempadan kawasan sedemikian, perubahan kecerahan yang sangat tajam kadang-kadang diperhatikan - perbezaan dalam nilai berkisar antara puluhan hingga ratusan penggredan intensiti, walaupun antara piksel yang bersebelahan secara langsung. Oleh itu, kita melihat bahawa penapis tetingkap tidak boleh berfungsi dengan berkesan di sempadan kawasan homogen; sebaliknya, di sini mereka mungkin melakukan kesilapan, yang secara visual akan membawa kepada kesan $\textit(herotan bentuk kontur)$. Selain itu, jika imej asal mengandungi objek (kawasan) yang berkontras yang saiznya jauh lebih kecil daripada saiz tetingkap penapisan, penapis mungkin hanya "tidak melihat" objek sedemikian dan menapisnya sebagai bunyi, yang akan membawa kepada $\textit (kehilangan objek bersaiz kecil)$ untuk imej keluaran yang terhasil.

Nampaknya dari perbincangan sebelumnya ia mengikuti bahawa ia adalah perlu untuk bekerja dengan apertur penapis bersaiz kecil. Lagipun, semakin kecil tetingkap penapis, semakin sedikit bilangan titik kontur yang akan "mempengaruhi" dan semakin besar bilangan titik yang terletak di "dataran tinggi" kawasan homogen, yang mana andaian kecerahan yang sama bagi semua piksel dalam kawasan sekitar akan sah. Walau bagaimanapun, secara intuitif jelas bahawa semakin kuat bunyi yang terdapat dalam imej (lebih banyak bercanggah dan "palsu" secara purata bukti titik mengenai kecerahannya), semakin banyak piksel yang perlu disoal siasat untuk mencapai tahap yang diperlukan keyakinan terhadap jawapan. Iaitu, apertur yang lebih besar mempunyai keupayaan yang lebih besar untuk menyekat komponen hingar, itulah sebabnya, pada dasarnya, penapis gangguan dicipta.

Kualiti penapisan

Oleh itu, apabila membina dan mengkaji prosedur penapisan imej bertingkap, kita mesti sentiasa menilai $\textit(kualiti penapisan)$ yang diperhatikan mengikut dua kedudukan utama berikut:

keupayaan penapis untuk mengeluarkan (menapis) hingar daripada imej;
keupayaan penapis untuk mengekalkan butiran bersaiz kecil dan bentuk kontur dalam imej.

Dari sudut pandangan analisis imej seterusnya, yang ideal ialah penapis bunyi yang boleh menapis sepenuhnya bunyi tanpa memesongkan bentuk kontur. Malangnya, keperluan ini adalah bercanggah, jadi dalam kaedah penapisan yang berbeza kami hanya menangani kompromi yang berbeza antara mereka. Pilihan penapis hingar tertentu untuk dilaksanakan dalam sistem penglihatan komputer praktikal ditentukan oleh keperluan mana yang lebih penting dalam tugas tertentu ini, serta oleh batasan yang dikenakan ke atas sistem oleh seni bina dan kelajuan kemudahan pengkomputeran yang tersedia. .

Mari kita beralih kepada mempertimbangkan algoritma khusus untuk penapisan imej bertingkap. Memandangkan maksud asas prosedur penapisan asas lebih mudah difahami menggunakan contoh penapisan imej binari, kita akan mulakan dengan mengkaji $\textit(penapis binari)$ yang paling mudah.

Seperti yang anda tahu, terdapat banyak cara untuk menukar dan mengedit imej menggunakan kaedah digital. Hasil pemprosesan imej bergantung pada operasi yang boleh anda lakukan dengan imej selepas ia sampai ke komputer anda: anda boleh mengedit RGB-komponen warna untuk mendapatkan keseimbangan warna yang terbaik. Anda boleh menambah atau mengurangkan kecerahan imej, mengedit ketajamannya atau mengaburkan elemen individu menggunakan pelbagai penapis grafik. Kami akan melihat kesan yang sangat popular yang digunakan secara meluas dalam grafik komputer:

Penyongsangan warna.
Kabur.
Tingkatkan ketajaman.
Mencetak timbul.
Kesan cat air.

Matriks – kernel lilitan

Jika kita melihat kesan ini dari sudut pandangan algoritma, kita tidak akan melihat apa-apa yang rumit: kesan ini dicipta menggunakan matriks nombor. Matriks ini dipanggil kernel lilitan.

matriks ini ( 3x3) mengandungi tiga baris tiga nombor. Untuk mengubah piksel imej, ia didarab dengan nilai di tengah kernel, dan nilai piksel di sekelilingnya didarab dengan pekali kernel yang sepadan, selepas itu semua nilai disimpulkan, dan kami dapatkan nilai baharu untuk piksel yang diubah. Proses ini mesti dilakukan secara berurutan dengan setiap piksel imej yang diedit.

Pekali kernel menentukan bagaimana imej yang diedit akan berubah. Untuk mencapai beberapa kesan, perlu menggunakan secara berurutan bukan satu, tetapi beberapa matriks pada imej.

Terbalikkan warna

Ini adalah cara paling mudah untuk mengedit imej: kita tidak memerlukan matriks pun. Kita hanya perlu menukar komponen warna kepada yang bertentangan (lebih terperinci apabila melaksanakan penapis di bahagian seterusnya bab).

Algoritma kabur

Untuk mengaburkan imej, kita perlu membaca nilai ke dalam ingatan RGB-komponen warna setiap piksel. Selepas itu kernel kabur akan digunakan pada semua komponen warna semua piksel imej yang diedit:
Rajah 1. Matriks untuk penapis "Kabur".

Untuk menentukan warna piksel yang terletak di bawah tengah kernel, adalah perlu untuk mendarabkan berat kernel dengan nilai warna yang sepadan bagi imej yang diedit. Selepas ini, hasilnya diringkaskan.

Imej yang terhasil adalah "kabur" berbanding dengan yang asal kerana warna setiap piksel yang diproses telah "tersebar" antara piksel jiran.

Untuk meningkatkan kernel kabur anda boleh:

gunakan kernel yang lebih besar (jadi warna akan diedarkan di antara bilangan piksel jiran yang lebih besar);
ubah pekali sedemikian rupa untuk mengurangkan pengaruh pekali pusat;
melakukan penapisan imej lebih daripada sekali;

Algoritma mengasah

Apabila mencipta kesan penajaman, kami melakukan algoritma yang sama, tetapi menggunakan kernel yang berbeza, kerana kini matlamat kami adalah untuk meningkatkan ketajaman imej. teras G untuk meningkatkan ketajaman:

Rajah 2. Matriks untuk penapis "Mengasah".
Seperti dalam kes sebelumnya, kami memproses secara berasingan RGB-komponen, selepas itu kita membentuk nilai warna piksel yang diproses. Pekali pemberat negatif digunakan untuk meningkatkan kontras antara piksel pusat dan jirannya.

Oleh itu, imej yang terhasil adalah lebih jelas daripada yang asal. Pada asasnya, butiran tambahan datang entah dari mana—ia hanya meningkatkan kontras antara warna piksel.

Algoritma emboss

Embossing dilakukan dengan cara yang sama, tetapi dalam kes ini kita tidak menggunakan satu matriks, tetapi beberapa.
Rajah 3.1 Matriks untuk penapis "Embossing": langkah satu.
Walaupun biji kabur dan mengasah mempunyai jumlah pekali sama dengan satu, dalam kes ini jumlah pemberat dalam isirong timbul adalah sama dengan 0 . Jika jumlah pekali tidak sama 0 , kita akan mendapat sisihan ke arah warna tertentu.

Nilai warna yang terhasil akan diproses selanjutnya (purata) dan dibawa ke julat 0-255 (anda boleh melihat butiran lanjut semasa melaksanakan penapis ini). Menukar nilai kedudukan 1 Dan -1 , kita boleh menukar arah lampu latar.
Rajah 3.2. Matriks untuk penapis "Timbul": langkah dua.

Algoritma pewarnaan air

Nama penapis cat air menyatakan semuanya: imej yang terhasil akan kelihatan seolah-olah ia dicat dengan cat air. Pada peringkat pertama menggunakan penapis ini, kami akan melicinkan warna imej yang diedit.

Rajah 4.1. Matriks untuk penapis "Kesan cat air": langkah pertama.
Dalam langkah seterusnya kami akan menajamkan peralihan untuk melengkapkan kesan cat air.

Rajah 4.2. Matriks untuk penapis "Kesan cat air": langkah kedua.
Itu sahaja. Dengan melaraskan sedikit parameter matriks, kita boleh mendapatkan kesan cat air yang lebih tajam dan licin. br />