Kotak Alat Pemprosesan Imej. Kursus pendek dalam teori pemprosesan imej. I.M. Zhuravel. Segmentasi dalam ruang warna RGB

Mengedit imej dan mencipta kolaj akan menjadi proses yang sangat menarik jika anda tidak perlu menghabiskan sebahagian besar masa anda dengan susah payah menanda objek. Tugas menjadi lebih sukar apabila sempadan objek menjadi kabur atau terdapat ketelusan. Alat Photoshop seperti Magnetic Lasso dan Magic Wand tidak begitu pintar kerana mereka hanya melihat ciri peringkat rendah dalam imej. Mereka mengembalikan sempadan keras, yang kemudiannya perlu diperbetulkan secara manual. Pendekatan Segmentasi Lembut Semantik daripada penyelidik Adobe membantu menyelesaikan masalah sukar ini dengan membahagikan imej kepada lapisan yang sepadan dengan kawasan yang bererti semantik dan menambah peralihan lancar di tepi.

Pembahagian "lembut".

Satu pasukan penyelidik dari makmal CSAIL di MIT dan universiti Switzerland ETH Zürich, yang bekerja di bawah pimpinan Yagiz Aksoy, mencadangkan untuk mendekati masalah ini berdasarkan segmentasi spektrum, menambahnya kemajuan moden dalam pembelajaran mendalam. Menggunakan maklumat tekstur dan warna, serta ciri semantik peringkat tinggi yang diekstrak, jenis graf khas dibina daripada imej. Kemudian, menggunakan graf ini, matriks Kirchhoff (matriks Laplacian) dibina. Menggunakan penguraian spektrum matriks ini, algoritma menjana kontur lembut objek. Pembahagian imej kepada lapisan yang diperoleh menggunakan vektor eigen kemudiannya boleh digunakan untuk penyuntingan.

Gambaran keseluruhan pendekatan yang dicadangkan

Penerangan model

Mari kita lihat kaedah mencipta lapisan bermakna secara semantik langkah demi langkah:

1. Topeng spektrum. Pendekatan yang dicadangkan meneruskan kerja Levin dan rakan-rakannya, yang merupakan orang pertama yang menggunakan matriks Kirchhoff dalam tugas membina topeng secara automatik. Mereka membina matriks L, yang menentukan persamaan berpasangan antara piksel di kawasan setempat tertentu. Menggunakan matriks ini, mereka meminimumkan fungsi kuadratik αᵀLα dengan kekangan yang ditentukan pengguna, dengan α menentukan vektor nilai ketelusan untuk semua piksel dalam lapisan tertentu. Setiap kontur lembut ialah gabungan linear K eigenvectors sepadan dengan nilai eigen terkecil L, yang memaksimumkan apa yang dipanggil sparsity topeng.

2. Perkaitan warna. Untuk mengira ciri kedekatan warna bukan tempatan, penyelidik menjana 2,500 superpiksel dan menganggarkan jarak antara setiap superpiksel dan semua superpiksel dalam kejiranan dengan jejari 20% daripada saiz imej. Menggunakan kedekatan bukan setempat memastikan kawasan dengan warna yang hampir sama kekal koheren dalam adegan kompleks seperti di bawah.

Kehampiran warna bukan tempatan

3. Kedekatan semantik. Peringkat ini membolehkan anda mengenal pasti kawasan yang disambungkan secara semantik pada imej. Kedekatan semantik menggalakkan penggabungan piksel yang tergolong dalam objek pemandangan yang sama dan menghukum penggabungan piksel daripada objek yang berbeza. Di sini, penyelidik mengambil kesempatan daripada kemajuan sebelumnya dalam pengecaman dan pengiraan corak, untuk setiap piksel, vektor ciri yang berkorelasi dengan objek yang menjadi sebahagian daripada piksel itu. Vektor ciri dikira menggunakan rangkaian saraf, yang akan kita bincangkan kemudian dengan lebih terperinci. Kedekatan semantik, seperti kedekatan warna, ditentukan pada superpixel. Walau bagaimanapun, tidak seperti kedekatan warna, kedekatan semantik hanya memautkan superpixel berdekatan, menggalakkan penciptaan objek koheren. Gabungan kedekatan warna bukan tempatan dan kedekatan semantik tempatan memungkinkan untuk membuat lapisan yang meliputi imej yang dipisahkan secara ruang bagi serpihan satu objek yang berkaitan secara semantik (contohnya, tumbuh-tumbuhan, langit, jenis latar belakang yang lain).

Kedekatan semantik

4. Mencipta lapisan. Dalam langkah ini, matriks L dibina menggunakan kedekatan yang dikira sebelumnya. Daripada matriks ini, vektor eigen sepadan dengan 100 nilai eigen terkecil diekstrak, dan kemudian algoritma rarefaction digunakan, yang mengekstrak 40 vektor daripadanya, dari mana lapisan dibina. Bilangan lapisan kemudiannya dikurangkan sekali lagi menggunakan algoritma pengelompokan k-means pada k = 5. Ini berfungsi lebih baik daripada hanya meringankan 100 vektor eigen kepada lima, memandangkan pengurangan dimensi yang begitu kuat menjadikan masalah itu terlalu ditentukan. Para penyelidik memilih bilangan akhir kontur sebanyak 5 dan mendakwa bahawa ini adalah nombor yang munasabah untuk kebanyakan imej. Walau bagaimanapun, nombor ini boleh ditukar secara manual bergantung pada imej yang sedang diproses.


Kontur lembut sebelum dan selepas berkumpul

5. Vektor ciri semantik. Untuk mengira kedekatan semantik, vektor ciri yang dikira menggunakan rangkaian saraf digunakan. Asas rangkaian saraf ialah DeepLab-ResNet-101, dilatih dalam tugas meramal metrik. Semasa latihan, memaksimumkan jarak L2 antara ciri objek yang berbeza telah digalakkan. Oleh itu, rangkaian saraf meminimumkan jarak antara ciri yang sepadan dengan satu kelas dan memaksimumkan jarak dalam kes yang lain.

Perbandingan kualitatif dengan kaedah yang serupa

Imej di bawah menunjukkan hasil pendekatan yang dicadangkan (dilabelkan "Hasil kami") berbanding dengan hasil pendekatan pembahagian lembut yang paling hampir - kaedah topeng spektrum - dan dua kaedah pembahagian semantik terkini: pemprosesan pemandangan PSPNet kaedah dan kaedah pembahagian objek Mask R-CNN.


Perbandingan kualitatif pembahagian semantik lembut dengan pendekatan lain

Ia boleh digantikan bahawa PSPNet dan Mask R-CNN cenderung membuat kesilapan pada sempadan objek, dan kontur lembut yang dibina oleh kaedah spektrum sering melampaui sempadan objek. Pada masa yang sama, kaedah yang diterangkan sepenuhnya meliputi objek tanpa menggabungkannya dengan yang lain, dan mencapai ketepatan tinggi di tepi, menambah peralihan lembut jika diperlukan. Walau bagaimanapun, perlu diperhatikan bahawa ciri semantik yang digunakan dalam kaedah ini tidak membezakan antara dua objek berbeza yang dimiliki oleh kelas yang sama. Akibatnya, berbilang objek diwakili pada satu lapisan, seperti yang dilihat dalam imej zirafah dan lembu.

Mengedit Imej dengan Kontur Semantik Lembut

Di bawah ialah beberapa contoh menggunakan garis besar lembut untuk mengedit imej dan membuat kolaj. Garis besar lembut boleh digunakan untuk menggunakan perubahan khusus pada lapisan berbeza: menambahkan kabur gerakan kereta api (2), pelarasan warna berasingan untuk orang dan latar belakang (5, 6), penggayaan berasingan untuk belon udara panas, langit, landskap dan orang ( 8) . Sudah tentu, perkara yang sama boleh dilakukan menggunakan topeng yang dibuat secara manual atau algoritma pemilihan kontur klasik, tetapi dengan pemilihan automatik objek penting secara semantik, penyuntingan sedemikian menjadi lebih mudah.

Menggunakan Segmentasi Semantik Lembut untuk Penyuntingan Imej

Kesimpulan

Kaedah ini secara automatik mencipta kontur lembut yang sepadan dengan kawasan signifikan semantik imej menggunakan campuran maklumat peringkat tinggi daripada rangkaian saraf dan ciri peringkat rendah. Walau bagaimanapun, kaedah ini mempunyai beberapa batasan. Pertama, ia agak perlahan: masa pemprosesan untuk imej dengan dimensi 640 x 480 ialah 3-4 minit. Kedua, kaedah ini tidak mencipta lapisan berasingan untuk objek berbeza dari kelas yang sama. Dan ketiga, seperti yang ditunjukkan di bawah, kaedah ini boleh gagal awal dalam kes di mana warna objek sangat serupa (contoh atas), atau apabila menggabungkan tepi lembut berhampiran kawasan peralihan yang besar (contoh bawah).

Kes ralat algoritma

Walau bagaimanapun, tepi lembut yang dibuat menggunakan kaedah ini memberikan perwakilan perantaraan yang berguna bagi imej, membolehkan anda menghabiskan lebih sedikit masa dan usaha untuk mengedit imej.

Pembahagian imej

Segmentasi menetapkan subset ciri piksel atau pembahagian imej kepada kawasan koheren, yang setiap satunya adalah "homogen". Proses pembahagian dan pengekstrakan ciri boleh dianggap sebagai memberikan label kepada piksel yang mentakrifkan kelas khas yang dimiliki oleh piksel ini. Oleh itu, output proses segmentasi ialah imej aksara di mana nilai piksel adalah label dan bukannya tahap kecerahan.

Klasifikasi model imej

Untuk membahagikan imej, satu atau model lain digunakan yang memberikan penerangan yang lebih kurang mencukupi bagi imej sebenar. Terdapat dua kelas utama model imej: statistik dan spatial. Model statistik menerangkan koleksi elemen titik imej atau rantaunya. Model spatial menerangkan penguraian imej kepada bahagian atau kawasan komponennya.

Model statistik urutan pertama menerangkan satu set elemen titik dalam imej tanpa mengambil kira lokasinya dalam ruang. Penerangan paling mudah bagi jenis ini ialah ketumpatan kebarangkalian taburan nilai kecerahan, yang dikira menggunakan histogram nilai kecerahan. Selalunya dipercayai bahawa ketumpatan kebarangkalian taburan nilai imej sebenar dianggarkan oleh beberapa piawai, contohnya, fungsi ketumpatan kebarangkalian Gaussian atau campuran fungsi sedemikian.

Model pesanan pertama tidak mengambil kira bahawa imej terdiri daripada mana-mana bahagian yang konsisten (elemen tekstur, objek, dll.). Susunan relatif unsur dalam ruang diambil kira oleh model koleksi elemen imej titik yang lebih tinggi. Satu model ialah matriks bersebelahan nilai kecerahan, unsur-unsur yang mewakili frekuensi pasangan nilai kecerahan pada offset yang dipilih. Dalam amalan, nilai offset dipilih untuk menjadi agak kecil, kerana dengan offset besar nilai kecerahan menjadi bebas antara satu sama lain.

Kaedah lain untuk menerangkan perhubungan ruang antara elemen titik dalam imej adalah dengan mempertimbangkan fungsi ketumpatan kebarangkalian taburan nilai ciri tempatan, yang selalunya lebih berkesan daripada menggunakan fungsi ketumpatan kebarangkalian taburan nilai kecerahan tertib lebih tinggi. Terutamanya berguna dalam pembahagian imej ialah ciri berasaskan tepi tempatan, seperti nilai pelbagai pengendali kecerunan pencahayaan pembezaan.

Model imej statistik juga termasuk medan rawak dan model siri masa, yang digunakan terutamanya dalam pemodelan tekstur.

Model spatial menerangkan imej dari segi wilayah. Imej boleh diwakili sebagai koleksi objek dengan latar belakang, seperti dibahagikan kepada kawasan dalam beberapa cara biasa atau rawak, sebagai model bentuk kawasan. Model spatial secara amnya boleh mengekstrak lebih banyak maklumat daripada imej berbanding model statistik taburan kecerahan. Walau bagaimanapun, setakat ini hanya model yang agak mudah digunakan, dan radas matematik mereka memerlukan pembangunan lanjut.

Pembahagian imej menggunakan kaedah ambang

Kaedah pembahagian imej yang paling mudah dan paling meluas ialah ambang. Dalam beberapa kaedah standard untuk memilih bahagian imej mengikut ambang, nilai ambang ditentukan terus daripada histogram imej (model imej statistik urutan pertama). Dari segi sejarah, kaedah pertama kumpulan kaedah ini ialah kaedah mod. Kaedah berikut dari andaian bahawa imej mengandungi bilangan kelas mata yang diketahui yang homogen dalam kecerahan. Di samping itu, dipercayai bahawa kawasan sempadan antara kawasan tertutup menduduki kawasan imej yang agak kecil. Oleh itu, dalam histogram mereka mesti sepadan dengan lekukan antara mod, di mana ambang segmentasi ditetapkan.

Walau bagaimanapun, imej sebenar tidak memenuhi andaian yang dibuat dengan baik. Sebagai peraturan, sempadan antara kawasan adalah kabur dan struktur modal histogram tidak cukup dinyatakan. Selain itu, walaupun histogram mempunyai mod yang berbeza, lembahnya mungkin sangat luas dan rata sehingga sukar untuk menyetempatkan bahagian bawah lembah.

Jika imej sebenar tidak memenuhi syarat kaedah mod, empat pendekatan berikut digunakan. Pertama, menambah baik histogram, termasuk berdasarkan sifat tempatan imej menggunakan maklumat kecerunan, statistik tertib kedua dan analisis kelengkungan fungsi pengedaran kumulatif. Kedua, histogram dianggarkan oleh campuran taburan normal dan penggunaan kaedah statistik untuk memisahkan campuran ini secara optimum. Kelemahan pendekatan ini ialah kerumitan pengiraan yang tinggi; di samping itu, Gaussoid selalunya kurang menghampiri mod sebenar. Ketiga, pengenalan ukuran empirikal kualiti imej bersegmen dan memaksimumkan fungsi kriteria yang sepadan - pendekatan diskriminasi, pendekatan entropi, pendekatan momen, dll. Keempat, peralihan kepada penggunaan statistik lain untuk memilih ambang, dalam khususnya, memilih ambang secara langsung berdasarkan ciri setempat. Menggunakan ciri setempat membolehkan anda membahagikan imej sebenar yang kompleks dengan lebih cekap.

Analisis histogram memberikan kualiti pembahagian yang memuaskan untuk imej yang terdiri daripada kawasan kecerahan seragam. Walau bagaimanapun, apabila memilih objek kecil dengan latar belakang yang kompleks, titik objek tidak menghasilkan puncak yang ketara dalam histogram kecerahan. Oleh itu, pemprosesan dengan ambang boleh ubah digunakan: untuk serpihan kecil imej, histogram dibina, yang diperiksa untuk bimodaliti, dan ambang tempatan yang ditemui diinterpolasi ke seluruh imej.

Beberapa algoritma berdasarkan analisis diskriminasi telah dicadangkan dalam karya Ostu. biarlah G={0,1,...,L) - nilai kecerahan imej yang mungkin. Ambang membahagikan taburan nilai kecerahan imej kepada dua kelas C 0={0,1,...,t) Dan C 1={t+1,t+2,...,L}, tÎ G. Ambang optimum t* ditakrifkan sebagai

di mana adalah penyebaran taburan nilai kecerahan imej secara keseluruhan, w0 ialah kebarangkalian titik yang diambil secara rawak kepunyaan latar belakang, https://pandia.ru/text/80/299/images/image004_46 .gif" width="21" height="24" >- tahap kecerahan latar belakang purata (class C 0).

Jika kawasan objek dan latar belakang berbeza secara mendadak antara satu sama lain, histogram fungsi kriteria boleh menjadi multimodal. Oleh itu, adalah perlu untuk menentukan semua puncak tempatan, yang secara serius mengurangkan daya saing kaedah.

Kriteria entropi untuk memilih ambang optimum. Menggunakan definisi yang diperkenalkan sebelum ini, histogram nilai kecerahan boleh dianggap sebagai L-sumber simbolik maklumat dengan entropi

,

di mana pi– kebarangkalian kecerahan dengan nilai i.

Entropi sumber ialah jumlah entropi objek H 0 dan entropi latar belakang H 1, dan ambang optimum harus memberikan nilai maksimum amaun ini:

, (2)

di mana .

Oleh kerana setiap syarat H 0 dan H 1 mencirikan keseragaman taburan kecerahan pada selang yang sepadan dan berkurangan dengan mendadak apabila serpihan "asing" histogram jatuh ke dalam selang tertentu; kriteria entropi maksimum akan sepadan dengan pilihan pembahagian terbaik. Kelemahan kaedah ini ialah fungsi kriteria mungkin mempunyai beberapa maksima yang hampir nilainya.

Berbeza dengan pendekatan diskriminasi, dalam kaedah pemeliharaan saat ini semua momen imej sehingga (2 k+1) termasuk pesanan:

.

Ambang optimum ialah ambang yang memastikan kesamaan momen yang sepadan bagi imej bersegmen dan asal. Namun, jika k>3, maka kesukaran timbul kerana ketiadaan penyelesaian analitikal kepada masalah tersebut.

Peralihan daripada memilih ambang berdasarkan histogram kecerahan kepada menggunakan statistik lain sudah pasti merumitkan algoritma pembahagian, tetapi memberikan pembahagian imej yang kompleks yang lebih baik. Untuk mengenal pasti objek bersaiz kecil, nampaknya menjanjikan untuk memilih ambang secara langsung berdasarkan sifat setempat titik imej.

Kaedah kontras purata maksimum. Kaedah ini adalah berdasarkan penentuan heuristik mudah bagi ambang optimum: ambang optimum untuk pembahagian imej ialah ambang yang mengenal pasti lebih banyak kontras tinggi dan lebih sedikit perubahan kecerahan kontras rendah berbanding mana-mana ambang lain. Ungkapan kuantitatif bagi kriteria ialah kontras purata semua perbezaan kecerahan yang dikenal pasti oleh ambang tertentu. Ambang yang sepadan dengan kontras purata maksimum adalah optimum. Jika dua titik yang bersebelahan X 1=(X 1,y 1) dan X 2=(x 2,y 2) mempunyai nilai kecerahan f(X 1) dan f(X 2) (tanpa kehilangan keumuman f(X 1)£ f(X 2)), maka bilangan perbezaan yang diperuntukkan oleh ambang t, sama dengan:

di mana

Kontras penuh sepadan dengan ambang t, adalah sama dengan:

di mana DIV_ADBLOCK169">

. (3)

Berdasarkan matriks bersebelahan nilai kecerahan yang dicadangkan oleh Haralik, kaedah segmentasi berikut dipertimbangkan. Untuk imej, matriks kejadian bersama tahap kecerahan pasangan titik bersebelahan dalam mendatar P 1.0 dan menegak P 1.90 arah, serta jumlah matriks peralihan saiz ( L+1)´( L+1):

Pvh=P 1,0 +P 1,90.

Ambang sewenang-wenangnya t membahagikan titik imej kepada dua kelas DENGAN 0 dan DENGAN 1, dan matriks peralihan kepada 4 blok.

Hantar kerja baik anda di pangkalan pengetahuan adalah mudah. Gunakan borang di bawah

Pelajar, pelajar siswazah, saintis muda yang menggunakan pangkalan pengetahuan dalam pengajian dan kerja mereka akan sangat berterima kasih kepada anda.

Disiarkan di http://www.allbest.ru/

Kementerian Pendidikan dan Sains Persekutuan Rusia

Universiti Kejuruteraan Radio Negeri Ryazan

Jabatan IIBMT

Kerja kursus

Kaedah pemprosesan imej. Segmentasi

Selesai Seni. gr. 432J:

Aleshin S.I.

Disemak oleh Prof. jabatan IIBMT:

Kaplan M.B.

Ryazan 2014

pengenalan

1. Persembahan imej

3. Format imej

4. Jenis imej

5.1 Menukar kontras

5.2 Melicinkan bunyi

5.3 Menekankan sempadan

5.4 Penapisan median

5.5 Pembahagian imej

5.5.3 Menggariskan

5.5.7 Kaedah pemotongan graf

6. Penerangan tentang fungsi

7. Ujian algoritma

Kesimpulan

Permohonan

pengenalan

Kembali pada pertengahan abad ke-20, pemprosesan imej kebanyakannya analog dan dilakukan oleh peranti optik. Teknik optik sedemikian masih penting hari ini, dalam bidang seperti holografi. Walau bagaimanapun, dengan peningkatan dramatik dalam prestasi komputer, kaedah ini semakin digantikan dengan kaedah pemprosesan imej digital. Kaedah pemprosesan imej digital secara amnya lebih tepat, boleh dipercayai, fleksibel, dan lebih mudah untuk dilaksanakan berbanding kaedah analog. Pemprosesan imej digital menggunakan secara meluas perkakasan khusus seperti pemproses saluran paip arahan dan sistem berbilang pemproses. Ini terutama berlaku untuk sistem pemprosesan video. Pemprosesan imej juga dilakukan menggunakan perisian matematik komputer, contohnya, MATLAB, Mathcad, Maple, Mathematica, dll. Untuk ini, mereka menggunakan kedua-dua alat asas dan pakej sambungan Pemprosesan Imej.

Minat dalam kaedah pemprosesan imej digital berpunca daripada dua bidang utama aplikasinya, iaitu peningkatan imej untuk meningkatkan persepsi visual manusia dan pemprosesan imej untuk penyimpanan, penghantaran dan persembahan dalam sistem penglihatan mesin autonomi.

Salah satu kaedah pemprosesan imej digital yang paling kompleks ialah pembahagian imej. Segmentasi ialah proses membahagikan imej digital kepada beberapa segmen yang berbeza antara satu sama lain dalam ciri asas, seperti kecerahan, warna, tekstur, bentuk. Tujuan segmentasi adalah untuk memudahkan dan mengubah representasi sesuatu imej supaya lebih ringkas dan mudah untuk dianalisis. Pemilihan segmen yang salah dalam imej akhirnya boleh menjejaskan kualiti pengecaman malah menjadikannya mustahil. Oleh itu, tugas pembahagian adalah amat penting dan sangat relevan.

Terdapat banyak kaedah pembahagian imej. Hasil akhir sering ditentukan oleh ketepatan pembahagian, jadi apabila memilih kaedah pembahagian tertentu, anda perlu memberi perhatian yang besar kepada kebolehpercayaan algoritma. Walau bagaimanapun, tiada pendekatan tunggal yang diterima umum yang akan mendasari kebanyakan algoritma. Terdapat juga tiada algoritma tunggal yang membenarkan pembahagian yang boleh diterima untuk mana-mana imej. Ini adalah salah satu kesukaran pembahagian, dan ini adalah sebab bagi sejumlah besar pendekatan yang berbeza untuk menyelesaikan masalah pemprosesan imej ini.

Di sebalik perkaitan bidang subjek ini, agak sedikit buku telah ditulis yang membincangkan kedua-dua asas teori dan aspek perisian untuk menyelesaikan masalah pembahagian imej asas.

Kertas kerja ini menggariskan kaedah asas pemprosesan imej digital. Perhatian khusus diberikan kepada kaedah pembahagian imej. Satu program untuk salah satu kaedah segmentasi telah dilaksanakan menggunakan pakej aplikasi MatLAB.

1. Persembahan imej

Isu asas dalam teori pemprosesan imej ialah persoalan: pembentukan, input, perwakilan dalam komputer dan visualisasi. Bentuk permukaan boleh digambarkan sebagai fungsi jarak F(x, y) dari permukaan ke titik imej dengan koordinat x dan y. Memandangkan kecerahan titik dalam imej bergantung semata-mata pada kecerahan kawasan permukaan yang sepadan, kita boleh menganggap bahawa maklumat visual mencerminkan keadaan kecerahan atau ketelusan setiap titik dengan tahap ketepatan tertentu. Kemudian imej difahami sebagai fungsi terikat dua pembolehubah spatial f(x, y), ditakrifkan pada satah segi empat tepat terikat Oxy dan mempunyai set tertentu nilainya. Sebagai contoh, gambar hitam dan putih boleh diwakili sebagai f(x, y)?0, dengan 0?x?a, 0?y?b dan f(x, y) ialah kecerahan (kadangkala dipanggil ketumpatan optik atau keputihan ) imej pada titik (x, y); a - lebar bingkai, b - tinggi bingkai.

Disebabkan fakta bahawa memori digital komputer mampu menyimpan hanya tatasusunan data, imej mula-mula ditukar kepada beberapa bentuk berangka (matriks). Imej dimasukkan ke dalam memori komputer menggunakan penderia video. Sensor video menukar pengedaran optik kecerahan imej kepada isyarat elektrik dan kemudian kepada kod digital. Memandangkan imej ialah fungsi dua pembolehubah ruang x dan y, dan isyarat elektrik ialah fungsi satu pembolehubah t (masa), imbasan digunakan untuk penukaran. Contohnya, apabila menggunakan kamera televisyen, imej dibaca baris demi baris, dan dalam setiap baris, pergantungan kecerahan pada koordinat spatial x ditukar kepada pergantungan berkadar amplitud isyarat elektrik pada masa t. Peralihan dari penghujung baris sebelumnya ke permulaan baris seterusnya berlaku hampir serta-merta.

Memasukkan imej ke dalam komputer tidak dapat dielakkan melibatkan persampelan imej sepanjang koordinat ruang x dan y dan mengukur nilai kecerahan pada setiap titik diskret. Pendiskretan dicapai menggunakan grid koordinat yang dibentuk oleh garis selari dengan paksi x dan y sistem koordinat Cartesan. Pada setiap nod kekisi sedemikian, bacaan dibuat daripada kecerahan atau ketelusan pembawa maklumat yang dilihat secara visual, yang kemudiannya dikuantisasi dan dibentangkan dalam ingatan komputer. Unsur imej yang diperolehi dalam proses persampelan imej dipanggil piksel. Untuk perwakilan imej halftone berkualiti tinggi, 28 = 256 tahap pengkuantitian adalah mencukupi, i.e. 1 piksel imej dikodkan dengan 1 bait maklumat.

Ciri-ciri utama imej adalah:

1. Saiz imej;

2. Kedalaman warna;

3. Kebenaran.

2. Pengekodan imej berwarna

Warna ialah fenomena yang terhasil daripada interaksi cahaya, objek dan peranti (pemerhati).

Telah terbukti secara eksperimen bahawa sebarang warna boleh diwakili sebagai jumlah kuantiti tertentu bagi tiga warna bebas linear.

Tiga warna bebas linear dipanggil warna primer.

Mereka mentakrifkan sistem koordinat warna (CCS) atau skema warna, i.e. satu set warna asas untuk mendapatkan warna yang tinggal.

Skim warna dibahagikan kepada dua jenis: skema warna dari cahaya yang dipancarkan dan dari cahaya yang dipantulkan.

sistem RGB.

Warna utamanya ialah Merah dengan panjang gelombang 700 nm, Hijau dengan panjang gelombang 546.1 nm, dan Biru dengan panjang gelombang 435.8 nm. Sistem RGB adalah aditif.

Dalam kes ini, warna ini atau itu diperoleh dengan menambah warna utama.

sistem CMYK.

Sistem ini digunakan untuk membentuk warna objek bukan bercahaya berwarna yang menyerap sebahagian daripada spektrum cahaya putih yang diterangi dan memantulkan sinaran yang lain.

Sistem CMYK adalah asas untuk percetakan berwarna.

Ia berdasarkan model CMY tolak (Cyan - cyan, Magenta - magenta, Yellow) - model penolakan warna. Masih terdapat tiga warna utama di sini.

Untuk meningkatkan kualiti imej yang dicetak, warna hitam telah ditambahkan pada sistem.

sistem HSB.

Sistem ini berdasarkan penggunaan Hue atau Hue, Saturation dan Lightness. Hue mencirikan rona warna tertentu, ketepuan - keamatan relatifnya, kecerahan warna - jumlah rona hitam untuk menghasilkan imej yang lebih gelap.

Satu variasi sistem ini ialah skim HSL.

3. Format imej

Terdapat sejumlah besar format fail grafik berbeza yang digunakan hari ini. Format yang paling banyak digunakan ialah TIFF, GIF, JPEG, PNG dan BMP.

Format TIFF (Format Imej Tag) ialah salah satu daripada format yang paling boleh dipercayai dan serba boleh untuk menyimpan imej warna yang diimbas berkualiti tinggi. Ia boleh menggunakan pemampatan menggunakan algoritma LZW, i.e. ia merujuk kepada format storan imej tanpa kerugian.

Format GIF (Graphics Interchange Format) mempunyai palet warna 256 warna dan menggunakan algoritma LZW tanpa kehilangan untuk pemampatan. Jika bilangan warna asal lebih daripada 256, maka beberapa maklumat warna akan hilang.

Format JPEG (Join Photographers Expert Group) adalah berdasarkan algoritma pemampatan imej dengan nama yang sama. Ia adalah algoritma mampatan lossy dan direka bentuk untuk menyimpan imej berwarna penuh dengan nisbah mampatan yang tinggi. Apabila menggunakan format, anda boleh mengawal parameter kualiti daripada 0 (mampatan maksimum) hingga 100 (kualiti maksimum). Nisbah mampatan, bergantung pada kualiti, adalah dari 10 hingga 1000. Format ini paling kerap digunakan untuk menyimpan imej fotografi penuh warna yang tidak bertujuan untuk pemprosesan selanjutnya.

Format PNG ialah format raster untuk menyimpan maklumat grafik yang menggunakan pemampatan tanpa kehilangan menggunakan algoritma Deflate. Format PNG direka untuk menggantikan format GIF yang lebih lama dan lebih ringkas, dan sedikit sebanyak menggantikan format TIFF yang lebih kompleks. Format PNG diletakkan terutamanya untuk digunakan di Internet dan penyuntingan grafik. Ia mempunyai kelebihan utama berikut berbanding GIF: bilangan warna yang hampir tidak terhad dalam imej; sokongan saluran alfa pilihan; kemungkinan pembetulan gamma; pengimbasan jalinan dua dimensi.

Format BMP (BitMaP) ialah salah satu daripada format raster asli sistem pengendalian Windows. Ia sesuai untuk menyimpan imej dalam bentuk terindeks dengan palet sehingga 256 warna, dan dalam bentuk imej RGB warna penuh dengan kedalaman warna 24 bit. Ia adalah mungkin untuk menggunakan algoritma pemampatan RLE.

4. Jenis imej

4.1 Imej dua peringkat (atau monokromatik).

Dalam kes ini, semua piksel hanya boleh mempunyai dua nilai, yang biasanya dipanggil hitam (satu binari, atau warna utama) dan putih (sifar binari, atau warna latar belakang).

Setiap piksel dalam imej sedemikian diwakili oleh satu bit, jadi ia adalah jenis imej yang paling mudah.

1. Imej halftone. Imej sedemikian dengan skala tahap 2n terdiri daripada lapisan n-bit.

2. Imej berwarna. Imej sedemikian diterangkan dalam salah satu format yang dibentangkan di atas.

3. Imej ton berterusan. Imej jenis ini boleh mempunyai banyak warna yang serupa (atau halftones). Apabila piksel jiran berbeza dengan hanya satu, hampir mustahil untuk mata membezakan warnanya. Akibatnya, imej sedemikian mungkin mengandungi kawasan di mana warna kelihatan terus berubah pada mata. Dalam kes ini, piksel diwakili oleh sama ada nombor yang besar (dalam kes halftone) atau tiga komponen (dalam kes imej berwarna). Imej ton berterusan adalah semula jadi atau semula jadi (berbanding dengan buatan manusia, tiruan); Ia biasanya diperoleh dengan merakam dengan kamera digital atau dengan mengimbas gambar atau lukisan.

4. Imej ton diskret (juga dipanggil sintetik). Biasanya, imej ini diperoleh secara buatan. Ia mungkin hanya mempunyai beberapa warna atau banyak warna, tetapi ia bebas daripada hingar dan cela imej semula jadi. Contoh imej sedemikian termasuk gambar objek buatan manusia, mesin atau mekanisme, halaman teks, peta, lukisan atau imej pada paparan komputer. (Tidak semua imej tiruan semestinya akan menjadi nada diskret. Imej yang dijana komputer yang bertujuan untuk kelihatan semula jadi akan mempunyai ton berterusan walaupun asal tiruannya.) Objek tiruan, teks dan garisan yang dilukis mempunyai bentuk, sempadan yang jelas. Mereka sangat kontras dengan imej yang lain (latar belakang). Piksel bersebelahan imej ton diskret selalunya tunggal atau berbeza-beza dalam nilai. Imej sedemikian kurang dimampatkan menggunakan kaedah lossy, kerana herotan hanya beberapa piksel huruf menjadikannya tidak boleh dibaca, mengubah gaya biasa menjadi gaya yang tidak dapat dibezakan sepenuhnya. Imej nada diskret biasanya mempunyai banyak redundansi. Banyak serpihannya diulang berkali-kali di tempat yang berbeza dalam imej.

5. Imej seperti kartun. Ini ialah imej berwarna yang mengandungi kawasan besar dengan warna yang sama. Dalam kes ini, kawasan bersebelahan boleh berbeza-beza dalam warna.

5. Kaedah pemprosesan imej

Analisis awal imej membolehkan kita membuat kesimpulan bahawa:

Pertama, kebanyakan imej, dalam proses pembentukannya (imbasan penggambaran, dsb.), dipengaruhi oleh beberapa faktor negatif (getaran kamera, pergerakan elemen pengimbasan yang tidak sekata, dll.), yang membawa kepada kekaburan, penampilan rendah. -kawasan kontras dan bising dsb.

Kedua, sebahagian besar kaedah adalah berdasarkan mengenal pasti objek dalam imej dan menganalisisnya lagi.

Oleh itu, sebelum dianalisis, imej mesti melalui peringkat penyediaan, yang terdiri daripada melakukan operasi untuk meningkatkan kualiti visual (meningkatkan kontras, menghapuskan kabur, menekankan tepi, penapisan) dan operasi untuk membentuk penyediaan grafik (segmentasi, menonjolkan kontur) bagi gambar itu.

5.1 Menukar kontras

Kontras yang lemah biasanya disebabkan oleh julat dinamik yang kecil bagi perubahan kecerahan, atau tidak lineariti yang kuat dalam penghantaran tahap kecerahan. Kaedah kontras yang paling mudah ialah pemetaan fungsi penggredan kecerahan fij kepada gij, iaitu, gij = R(fij). Dalam amalan, pemetaan fungsi linear sangat kerap digunakan. Jika, akibat pencahayaan yang tidak sekata semasa mengambil gambar atau membuat gambar, situasi timbul di mana kawasan imej yang berbeza mempunyai kontras yang berbeza. Dalam kes ini, algoritma kontras penyesuaian digunakan untuk menukar kontras. Contohnya ialah algoritma peningkatan kontras tempatan. Kajian eksperimen telah mengesahkan kecekapan tinggi algoritma jika imej mengandungi kawasan dengan kontras yang jelas terlalu tinggi atau rendah.

Intipati algoritma adalah bahawa imej dianggap sebagai satu set bilangan kawasan tempatan tertentu, dan kawasan ini diproses dengan mengambil kira ciri-cirinya. Pemprosesan dijalankan dalam urutan berikut: faktor perolehan kepingan ketumpatan p dikira secara berasingan untuk setiap kawasan setempat imej. Dan setiap piksel imej diproses. Jika p sama dengan satu, maka tiada tindakan dilakukan pada kawasan tempatan imej (jika p berbeza daripada satu, maka kontras kawasan tempatan meningkat). Pada mulanya, kontras pada titik yang dianalisis berbanding dengan kejiranan terdekat dikira. Kemudian nilai kontras relatif ditambah kepada perpaduan, dan nilai yang terhasil diterima dalam algoritma sebagai faktor keuntungan p, dan kemudian dikira menggunakan formula:

kontras program pembahagian imej

di manakah nilai kecerahan baharu, ialah kecerahan semasa imej yang diproses, ialah nilai kecerahan maksimum yang diperlukan bagi imej yang diproses.

5.2 Melicinkan bunyi

Imej tertakluk kepada bunyi tambahan dan impuls semasa peringkat pendigitalan. Bunyi aditif ialah beberapa isyarat rawak yang ditambahkan pada isyarat yang berguna pada keluaran sistem; dalam kes yang sedang dipertimbangkan, bunyi aditif timbul disebabkan oleh butiran filem. Bunyi impuls, berbeza dengan bunyi aditif, dicirikan oleh kesannya pada isyarat berguna hanya pada titik rawak individu (nilai isyarat yang terhasil pada titik ini mengambil nilai rawak). Bunyi impuls adalah tipikal untuk sistem penghantaran dan penyimpanan imej digital. Oleh itu, dalam proses penyediaan imej, masalah penindasan hingar timbul.

Kaedah paling mudah untuk melicinkan bunyi dalam imej ialah melicinkan, i.e. menggantikan nilai kecerahan setiap elemen dengan nilai purata yang terdapat dalam kejiranannya:

di manakah set mata kepunyaan kejiranan titik (termasuk titik itu sendiri); - bilangan mata di kawasan kejiranan.

Kaedah yang dipertimbangkan berkesan menghapuskan bunyi tambahan dan impuls dalam setiap elemen imej.

5.3 Menekankan sempadan

Teknik pelicinan imej boleh mengeluarkan bunyi dengan sangat berkesan. Kelemahan ketara algoritma anti-aliasing ialah kabur imej (iaitu, penurunan kejelasan elemen kontur), dan jumlah kabur adalah berkadar dengan saiz topeng yang digunakan untuk melicinkan. Untuk analisis imej yang tidak jelas, terutamanya apabila mengira ciri geometri unsur struktur, adalah sangat penting untuk menghapuskan kabur daripada kontur objek dalam imej, iaitu, untuk meningkatkan perbezaan antara penggredan kecerahan elemen kontur objek dan unsur latar belakang jiran. Dalam kes ini, apabila memproses imej, kaedah untuk menekankan kontur digunakan.

Biasanya, peningkatan tepi dilakukan menggunakan penapisan spatial frekuensi tinggi. Ciri-ciri penapis dinyatakan sebagai topeng di mana nilai purata mestilah sama dengan sifar.

Kaedah lain untuk menekankan sempadan ialah pembezaan statik yang dipanggil. Dalam kaedah ini, nilai kecerahan setiap elemen dibahagikan dengan anggaran statistik sisihan piawai, iaitu, (sisihan piawai dikira dalam beberapa kejiranan elemen).

5.4 Penapisan median

Penapisan median merujuk kepada kaedah pemprosesan imej tak linear dan mempunyai kelebihan berikut berbanding penapisan linear (prosedur pelicinan klasik): mengekalkan perubahan mendadak (sempadan); berkesan melicinkan bunyi impuls; tidak mengubah kecerahan latar belakang.

Penapisan median dijalankan dengan menggerakkan beberapa apertur (topeng) di sepanjang imej diskret dan menggantikan nilai elemen pusat topeng dengan nilai median (nilai purata urutan tertib) elemen asal di dalam apertur. Secara umum, apertur boleh mempunyai pelbagai bentuk, tetapi dalam praktiknya, apertur segi empat sama saiz

5.5 Pembahagian imej

Pembahagian imej difahami sebagai proses membahagikannya kepada bahagian komponen yang mempunyai makna yang bermakna: objek, sempadannya atau serpihan bermaklumat lain, ciri geometri ciri, dll. Dalam kes automasi kaedah pemerolehan imej, segmentasi mesti dianggap sebagai peringkat awal analisis utama, yang terdiri dalam membina imej penerangan formal, kualiti yang sebahagian besarnya menentukan kejayaan menyelesaikan masalah mengenali dan mentafsir objek.

Secara umum, segmentasi ialah operasi membahagikan set terhingga satah di mana fungsi imej asal ditakrifkan kepada subset bersambung bukan kosong mengikut beberapa predikat yang ditakrifkan pada set dan mengambil nilai sebenar apabila mana-mana pasangan mata daripada setiap subset memenuhi beberapa kriteria kehomogenan (contohnya, kriteria kehomogenan berdasarkan penilaian perbezaan maksimum dalam kecerahan piksel individu dan nilai kecerahan purata yang dikira pada kawasan yang sepadan).

5.5.1 Kaedah pembahagian ambang

Ambang adalah salah satu kaedah utama untuk pembahagian imej kerana sifat intuitifnya. Kaedah ini tertumpu pada pemprosesan imej, kawasan homogen individu yang berbeza dalam kecerahan purata. Kaedah pembahagian yang paling biasa dengan ambang ialah pembahagian binari, iaitu, apabila kita mempunyai dua jenis kawasan homogen yang boleh kita gunakan.

Dalam kes ini, imej diproses piksel demi piksel dan penukaran setiap piksel imej input kepada output ditentukan daripada hubungan:

di mana parameter pemprosesan dipanggil ambang, dan ialah tahap kecerahan output. Pemprosesan dengan piksel, yang kedudukannya dalam imej tidak memainkan sebarang peranan, dipanggil pemprosesan titik. Tahap memainkan peranan markah. Ia digunakan untuk menentukan jenis titik tertentu yang dikelaskan sebagai: H0 atau H1. Atau mereka mengatakan bahawa H0 terdiri daripada mata latar belakang, dan H1 mata faedah. Sebagai peraturan, tahap sepadan dengan tahap putih dan hitam. Kami akan memanggil kelas H1 (aka kelas minat) kelas objek, dan kelas H0 kelas latar belakang.

Sememangnya, segmentasi boleh bukan sahaja binari, dan dalam kes ini terdapat lebih daripada dua kelas sedia ada. Segmen jenis ini dipanggil pelbagai peringkat. Imej yang dihasilkan bukan binari, tetapi ia terdiri daripada segmen kecerahan yang berbeza-beza. Secara formal, operasi ini boleh ditulis seperti berikut:

di mana bilangan tahap, dan ialah kelas imej. Dalam kes ini, untuk setiap kelas, ambang yang sesuai mesti ditetapkan yang akan memisahkan kelas ini antara satu sama lain. Imej binari lebih mudah disimpan dan diproses daripada imej yang mempunyai banyak tahap kecerahan.

Perkara yang paling sukar tentang ambang adalah proses menentukan ambang itu sendiri. Ambang sering ditulis sebagai fungsi borang:

di manakah imej, dan merupakan beberapa ciri titik imej, sebagai contoh, purata kecerahan dalam kejiranan berpusat pada titik ini.

Jika nilai ambang bergantung hanya pada, iaitu, sama untuk semua titik imej, maka ambang sedemikian dipanggil global. Jika ambang bergantung pada koordinat spatial, maka ambang tersebut dipanggil tempatan. Sekiranya ia bergantung pada ciri-ciri, maka ambang sedemikian dipanggil penyesuaian. Oleh itu, pemprosesan dianggap global jika ia digunakan pada keseluruhan imej secara keseluruhan, dan setempat jika ia digunakan pada kawasan terpilih tertentu.

Sebagai tambahan kepada perbezaan yang disenaraikan antara algoritma, terdapat banyak lagi kaedah. Kebanyakan daripada mereka hanyalah gabungan yang lain, tetapi kebanyakannya, satu cara atau yang lain, adalah berdasarkan analisis histogram imej asal, namun, pada asasnya terdapat pendekatan lain yang tidak secara langsung mempengaruhi analisis histogram atau beralih daripada mereka kepada analisis beberapa fungsi lain.

5.5.2 Kaedah untuk kawasan penanaman

Kaedah kumpulan ini adalah berdasarkan penggunaan ciri imej tempatan. Idea kaedah penanaman kawasan adalah untuk terlebih dahulu menganalisis titik permulaan, kemudian titik jirannya, dsb. selaras dengan beberapa kriteria kehomogenan, dan kemasukan titik yang dianalisis seterusnya dalam satu kumpulan atau yang lain (bilangan titik permulaan mestilah sama dengan bilangan kawasan homogen dalam imej). Versi kaedah yang lebih cekap tidak menggunakan piksel individu sebagai titik permulaan, tetapi memecahkan imej kepada beberapa kawasan kecil. Setiap kawasan kemudiannya diperiksa untuk keseragaman, dan jika keputusan ujian negatif, kawasan yang sepadan dibahagikan kepada bahagian yang lebih kecil. Proses ini berterusan sehingga semua kawasan yang dipilih lulus ujian kehomogenan. Selepas ini, pembentukan kawasan homogen mula menggunakan sambungan.

Pembahagian ambang dan pembahagian berdasarkan kriteria kehomogenan berdasarkan kecerahan purata selalunya tidak memberikan hasil yang diingini. Pembahagian ini biasanya menghasilkan sejumlah besar kawasan kecil yang tidak mempunyai prototaip sebenar dalam imej. Keputusan yang paling berkesan diperoleh melalui segmentasi berdasarkan kriteria kehomogenan berdasarkan tekstur (atau ciri tekstur).

5.5.3 Menggariskan

Ia bukan perkara biasa untuk menghadapi masalah mencari perimeter, kelengkungan, faktor bentuk, luas permukaan objek tertentu, dll. Semua tugas yang disenaraikan adalah dalam satu cara atau yang lain berkaitan dengan analisis elemen kontur objek.

Kaedah untuk mengenal pasti kontur (sempadan) dalam imej boleh dibahagikan kepada kelas utama berikut:

kaedah penapisan laluan tinggi;

kaedah pembezaan spatial;

Kaedah penghampiran berfungsi.

Biasa kepada semua kaedah ini adalah kecenderungan untuk menganggap sempadan sebagai kawasan perubahan tajam dalam fungsi kecerahan imej; Apa yang membezakannya ialah model matematik konsep sempadan yang diperkenalkan dan algoritma untuk mencari titik sempadan.

Selaras dengan tugas yang diberikan, keperluan berikut dikenakan pada algoritma pengekstrakan kontur: kontur yang dipilih mestilah nipis, tanpa pecah dan tertutup. Oleh itu, proses mengenal pasti kontur agak rumit kerana keperluan untuk menggunakan algoritma untuk menipis dan menghapuskan jurang. Walau bagaimanapun, ini tidak selalu memberikan hasil yang diingini - dalam kebanyakan kes, kontur tidak ditutup dan, akibatnya, tidak sesuai untuk beberapa prosedur analisis.

Masalah yang timbul boleh diselesaikan dengan kontur dengan algoritma pengesanan tepi menggunakan kaedah "pepijat", yang membolehkan anda menyerlahkan kontur tertutup objek. Intipati algoritma adalah seperti berikut: titik sempadan permulaan tertentu dipilih pada objek dan kontur dikesan secara berurutan sehingga titik permulaan dicapai. Dalam kes mengesan kontur mengikut arah jam, untuk mencapai titik permulaan, pergerakan piksel demi piksel dilakukan ke kanan jika piksel berada di luar objek, dan ke kiri jika ia berada pada objek.

Kontur yang dipilih dengan cara ini ialah kod rantai tertutup, i.e. urutan koordinat titik sempadan objek, yang sangat mudah untuk menyelesaikan masalah yang diberikan.

5.5.4 Kaedah berasaskan pengelompokan

Kaedah K-means ialah kaedah berulang yang digunakan untuk membahagikan imej kepada kelompok K. Algoritma asas diberikan di bawah:

1. Pilih pusat kluster K, secara rawak atau berdasarkan beberapa heuristik;

2. Letakkan setiap piksel imej dalam kelompok yang pusatnya paling hampir dengan piksel ini;

3. Kira semula pusat kluster dengan purata semua piksel dalam kluster;

4. Ulang langkah 2 dan 3 sehingga penumpuan (contohnya, apabila piksel kekal dalam kelompok yang sama).

Di sini, jarak biasanya diambil sebagai jumlah kuasa dua atau nilai mutlak perbezaan antara piksel dan pusat kluster. Perbezaan biasanya berdasarkan warna, kecerahan, tekstur dan lokasi piksel, atau jumlah wajaran faktor ini.

K boleh dipilih secara manual, rawak atau heuristik.

Algoritma ini dijamin untuk menumpu, tetapi ia mungkin tidak menghasilkan penyelesaian yang optimum.

Kualiti penyelesaian bergantung pada set awal kelompok dan nilai K.

5.5.5 Kaedah histogram

Kaedah berasaskan histogram sangat berkesan jika dibandingkan dengan kaedah pembahagian imej lain kerana ia memerlukan hanya satu laluan melalui piksel. Dalam kaedah ini, histogram dikira ke atas semua piksel dalam imej dan minima dan maksimumnya digunakan untuk mencari kelompok dalam imej. Warna atau kecerahan boleh digunakan sebagai perbandingan.

Penambahbaikan pada kaedah ini adalah dengan menerapkannya secara rekursif pada kelompok dalam imej untuk membahagikannya kepada kelompok yang lebih kecil. Proses ini diulang dengan gugusan yang lebih kecil dan lebih kecil sehingga tiada gugusan baru muncul.

Satu kelemahan kaedah ini ialah ia mungkin mengalami kesukaran mencari minima dan maksimum yang ketara dalam imej. Dalam kaedah pengelasan imej ini, metrik jarak dan padanan wilayah bersepadu adalah serupa.

Pendekatan berasaskan histogram juga boleh disesuaikan dengan cepat merentas berbilang bingkai sambil mengekalkan kelebihan kelajuannya dalam satu hantaran. Histogram boleh dibina dalam beberapa cara apabila berbilang bingkai dipertimbangkan. Pendekatan yang sama yang digunakan untuk satu bingkai boleh digunakan pada beberapa bingkai, dan setelah keputusan digabungkan, rendah dan tinggi yang sukar diasingkan menjadi lebih jelas. Histogram juga boleh digunakan pada asas per piksel, di mana maklumat digunakan untuk menentukan warna yang paling biasa untuk kedudukan piksel tertentu. Pendekatan ini menggunakan pembahagian berdasarkan objek bergerak dan persekitaran pegun, yang menyediakan satu lagi jenis pembahagian yang berguna dalam penjejakan video.

5.5.6 Kaedah untuk kawasan penanaman

Yang pertama ialah kaedah menanam kawasan dari biji benih. Kaedah ini mengambil imej dan satu set benih sebagai input. Benih menandakan objek untuk diserlahkan. Kawasan secara beransur-ansur membesar dengan membandingkan semua piksel jiran yang tidak dihuni dengan rantau ini. Perbezaan d antara kecerahan piksel dan kecerahan purata rantau digunakan sebagai ukuran persamaan. Piksel dengan perbezaan terkecil sedemikian ditambah ke kawasan yang sepadan. Proses ini berterusan sehingga semua piksel ditambahkan pada salah satu wilayah.

Kaedah penanaman kawasan dari benih memerlukan input tambahan. Hasil pembahagian bergantung pada pilihan benih. Kebisingan dalam imej mungkin disebabkan oleh biji benih yang diletakkan dengan buruk. Kaedah penanaman kawasan tanpa menggunakan benih adalah algoritma yang diubah suai yang tidak memerlukan benih eksplisit. Ia bermula dengan satu rantau - piksel yang dipilih di sini mempunyai sedikit kesan pada pembahagian akhir. Pada setiap lelaran, ia menganggap piksel jiran dengan cara yang sama seperti kaedah penanaman wilayah menggunakan benih. Tetapi ia berbeza di sana, bahawa jika minimum tidak kurang daripada ambang yang ditentukan, maka ia ditambah ke kawasan yang sesuai. Jika tidak, piksel dianggap sangat berbeza daripada semua wilayah semasa dan rantau baharu dibuat yang mengandungi piksel ini.

Satu varian kaedah ini adalah berdasarkan penggunaan kecerahan piksel. Min dan varians bagi rantau dan kecerahan piksel calon digunakan untuk membina statistik ujian. Jika statistik ujian adalah cukup kecil, maka piksel akan ditambahkan ke rantau dan min dan varians rantau itu dikira semula. Jika tidak, piksel diabaikan dan digunakan untuk mencipta rantau baharu.

5.5.7 Kaedah pemotongan graf

Kaedah pemotongan graf boleh digunakan dengan berkesan pada pembahagian imej. Dalam kaedah ini, imej diwakili sebagai graf tidak berwajaran. Biasanya, piksel atau kumpulan piksel dikaitkan dengan bucu, dan pemberat tepi menentukan persamaan atau ketidaksamaan piksel jiran. Graf kemudiannya dipotong mengikut kriteria yang dicipta untuk mendapatkan kelompok "baik". Setiap bahagian bucu (piksel) yang dihasilkan oleh algoritma ini dianggap sebagai objek dalam imej.

5.5.8 Pembahagian kawasan tadahan air

Dalam pembahagian tadahan air, imej dianggap sebagai peta kawasan, di mana nilai kecerahan mewakili nilai ketinggian relatif kepada tahap tertentu. Jika kawasan ini dipenuhi dengan air, maka kolam terbentuk. Apabila terus diisi dengan air, kolam ini digabungkan. Tempat di mana lembangan ini bercantum ditandakan sebagai garisan tadahan air.

Dalam tafsiran ini, tiga jenis mata dipertimbangkan:

1. minimum tempatan;

2. titik yang terletak pada cerun, i.e. dari mana air mengalir ke minimum tempatan yang sama;

3. mata maksimum tempatan, i.e. dari mana air bergolek menjadi lebih daripada satu minimum.

Pengasingan objek yang menyentuh dalam imej adalah salah satu masalah penting pemprosesan imej. Selalunya kaedah tadahan air yang dipanggil penanda digunakan untuk menyelesaikan masalah ini. Transformasi menggunakan kaedah ini perlu mengenal pasti "saluran air" dan "garisan aliran air" dalam imej dengan memproses kawasan setempat bergantung pada ciri kecerahannya.

Kaedah aliran air penanda adalah salah satu kaedah pembahagian imej yang paling berkesan.

Apabila melaksanakan kaedah ini, prosedur asas berikut dilakukan:

1. Fungsi pembahagian dikira. Ia melibatkan imej di mana objek terletak di kawasan gelap dan sukar dilihat.

2. Pengiraan penanda latar depan imej. Ia dikira berdasarkan analisis ketersambungan piksel bagi setiap objek.

3. Pengiraan penanda latar belakang. Ia mewakili piksel yang bukan sebahagian daripada objek.

4. Pengubahsuaian fungsi segmentasi berdasarkan nilai lokasi penanda latar belakang dan penanda latar depan.

Salah satu aplikasi pembahagian yang paling penting oleh kawasan tadahan air ialah pemilihan objek dengan kecerahan seragam (dalam bentuk bintik-bintik) dari latar belakang imej. Kawasan yang dicirikan oleh variasi kecil dalam kecerahan mempunyai nilai kecerunan yang kecil. Oleh itu, dalam amalan, situasi sering berlaku apabila kaedah pembahagian aliran air digunakan bukan pada imej itu sendiri, tetapi pada kecerunannya.

6. Penerangan tentang fungsi

Kertas kerja ini membentangkan algoritma pembahagian imej menggunakan kaedah aliran air penanda.

Fungsi utama yang digunakan semasa membuat program:

Fungsi fspecial mencipta penapis dua dimensi daripada jenis yang ditentukan;

Fungsi imfilter ialah operasi morfologi untuk mencipta imej kecerunan;

Fungsi DAS menukarkan DAS daripada imej;

Fungsi label2rgb menukar imej asal kepada skala kelabu;

Fungsi imregionalmax menentukan semua maksimum tempatan imej;

Fungsi imextendedmin mencari titik "rendah" dalam imej yang terletak lebih dalam daripada tahap ambang tertentu berbanding dengan persekitaran terdekatnya;

Fungsi imimposemin mengubah suai imej skala kelabu supaya minima setempat dicapai hanya pada kedudukan bertanda; nilai piksel lain dinaikkan untuk menghapuskan semua titik minimum tempatan yang lain;

Berfungsi untuk membina semula dan tidak melengkapi - pembinaan semula imej menggunakan operasi morfologi pembukaan (penutupan.)

7. Ujian algoritma

Apabila melaksanakan kaedah ini, prosedur berikut dilakukan:

1. Baca imej dan tukarkannya kepada skala kelabu (Rajah 1);

Rajah 1. Imej asal (kiri) dan halftone (kanan).

2. Kami menggunakan nilai kecerunan sebagai fungsi pembahagian (Rajah 2);

Rajah 2. Nilai kecerunan.

3. Kami menjalankan operasi morfologi pada imej (Rajah 3);

Rajah 3. Hasil pengaplikasian operasi buka-tutup morfologi melalui pembinaan semula imej.

4. Kira penanda latar depan dan latar belakang imej (Rajah 4);

Rajah 4. Penanda latar depan (kiri) dan latar belakang (kanan) bagi sesuatu imej.

5. Kami membina sempadan kawasan tadahan air (Rajah 5);

Rajah 5. Sempadan tadahan air.

6. Paparkan penanda dan sempadan objek pada imej halftone (Rajah 6);

Rajah 6. Penanda dan sempadan objek.

7. Paparkan hasil pembahagian menggunakan imej berwarna (kiri) dan menggunakan mod separa lutsinar (kanan).

Rajah 7 Keputusan pembahagian.

Kesimpulan

Dalam makalah ini, kaedah aliran air penanda dibangunkan untuk pembahagian imej.

Penggunaan langsung algoritma pembahagian kawasan tadahan menyebabkan pembahagian berlebihan, jadi pendekatan berasaskan penanda digunakan untuk mengurus pembahagian berlebihan.

Penanda mewakili komponen yang disambungkan kepunyaan imej. Juga, sebelum pembahagian oleh kawasan tadahan air, pra-pemprosesan imej yang diperlukan telah dijalankan.

Senarai sumber yang digunakan

1. Gonzalez R., Woods R. Pemprosesan imej digital. - M.: Tekhnosphere, 2005. 1072 hlm.

2. Pratt W. Pemprosesan imej digital. - M.: Mir, buku 1, 1982. 312 hlm.

3. Yaroslavsky L.P. Pengenalan kepada pemprosesan imej digital. - M: Sov. radio, 1979. 312 hlm.

4. Pratt W. Pemprosesan imej digital. - M: Damai, buku. 1, 1982. 480 hlm.

5. http://www.ict.edu.ru/lib/

6. http://matlab.exponenta.ru/imageprocess/book2/76.php

7. Vizilter Yu.V. Pemprosesan dan analisis imej digital dengan contoh dalam LabVIEW dan IMAQ VIsion. - M: DMK, 2011. 464 hlm.

8. Gonzalez R., Woods R., Eddins S. Pemprosesan imej digital dalam MATLAB. - M: Technosphere, 2006. 616 hlm.

9. http://matlab.exponenta.ru/imageprocess/book2/48.php

10. Salomon D. Pemampatan data, imej dan bunyi. - M.: Tekhnosphere, 2004. 368 hlm.

Permohonan

Kami mengira imej

rgb=imread("C:\Users\Name\Documents\MATLAB\picture1.jpeg");

Mari kita bayangkan ia sebagai halftone

I=rgb2gray(rgb);figure,imshow(I);

Kira nilai kecerunan

hy=fspecial("sobel"); hx=hy";

Iy=imfilter(double(I), hy, "replikat");

Ix=imfilter(double(I), hx, "replikat");

gradmag=sqrt(Ix.^2+Iy.^2);

Jom amalkan kaedah tadahan air

L=watershed(gradmag);Lrgb=label2rgb(L);

Operasi morfologi

se = strel("cakera",15);

Ie = imerode(I, se);Iobr = imreconstruct(Ie, I);

Iobrd = imdilate(Iobr, se);

Iobrcbr = imreconstruct(imcomplement(Iobrd), imcomplement(Iobr));

Iobrcbr = tidak pelengkap(Iobrcbr);

Mari kita mengira maksimum tempatan

fgm = imregionalmax(Iobrcbr);

Mari letakkan penanda pada imej

I2 = I;I2(fgm) = 255;

Mengalih keluar piksel terpencil individu

se2 = strel(ones(3,3));fgm2 = imclose(fgm, se2);fgm3 = imerode(fgm2, se2);

Alih keluar bilangan piksel yang ditentukan

fgm4 = bwareaopen(fgm3, 20);

Tindih pada imej asal

I3 = I;I3(fgm4) = 255;

Mari kita mengira penanda latar belakang

bw = im2bw(Iobrcbr, graythresh(Iobrcbr));

Mengukur jarak ke garisan tadahan air

D = bwdist(bw);DL = watershed(D);bgm = DL == 0;

angka, imshow(bgm), tajuk("bgm");

Melaraskan nilai kecerunan

gradmag2 = imimposemin(gradmag, bgm | fgm4);

L = tadahan air(gradmag2);

Gunakan penanda dan sempadan objek pada imej sumber

I4 = I;I4(indilate(L == 0, one(3, 3)) | bgm | fgm4) = 255;

Paparkan keputusan menggunakan imej berwarna

Lrgb = label2rgb(L, "jet", "w", "shuffle");

Mari kita gunakan penanda dan sempadan objek pada imej lut sinar

angka, imshow(I), tahan

himage = imshow(Lrgb);

set(himage, "AlphaData", 0.3);

tajuk("Lrgb2");

Disiarkan di Allbest.ru

...

Dokumen yang serupa

    Sistem radiografi digital. Kaedah untuk analisis imej automatik dalam persekitaran MatLab. Analisis imej sinar-X. Penapisan, pembahagian, peningkatan imej. Keupayaan perkakasan untuk normalisasi imej awal.

    kerja kursus, ditambah 12/07/2013

    Pemilihan kaedah pemprosesan imej dan pembahagian. Asas matematik penapis yang digunakan. Histogram kecerahan imej. Pelaksanaan perisian kaedah pemprosesan imej yang kompleks. Pengujian perisian yang dibangunkan.

    kerja kursus, ditambah 18/01/2017

    Kajian dan pelaksanaan perisian dalam persekitaran Matlab kaedah untuk pemprosesan, analisis, penapisan, pembahagian dan meningkatkan kualiti imej perubatan sinar-X. Sistem radiografi digital. Pembangunan algoritma berasaskan statik.

    kerja kursus, ditambah 01/20/2016

    Sistem moden untuk analisis tekstur imej. Contoh pembahagian tekstur imej saluran tunggal. Menggunakan ciri yang diperoleh daripada histogram kecerahan tertib kedua untuk mengklasifikasikan foto udara spektrozon.

    abstrak, ditambah 01/15/2017

    Grafik komputer dan pemprosesan imej oleh komputer elektronik adalah aspek yang paling penting dalam penggunaan komputer dalam semua bidang aktiviti manusia. Pembangunan "subsistem segmentasi linear", perihalan algoritma dan logik.

    tesis, ditambah 06/23/2008

    Masalah pemprosesan imej digital. Kaedah pembahagian ambang. Penciptaan program untuk mewakili lukisan dalam bentuk matriks dan menggunakan pemprosesan ambang padanya. Pembangunan antara muka untuk program untuk memuatkan dan menapis imej dengan ambang yang dipilih.

    kerja kursus, ditambah 11/12/2012

    Penerangan kaedah matematik untuk mewakili dan memproses imej grafik. Penerangan mengenai alat tambah perisian yang dibangunkan. Penerangan tentang fungsi dan sifatnya. Persembahan dan pemprosesan imej grafik. Keputusan ujian program.

    kerja kursus, tambah 27/01/2015

    Masalah pemprosesan imej spatiotemporal dengan kehadiran bunyi dan gangguan. Kaedah pengoptimuman untuk pemprosesan imej spatiotemporal. Struktur program khusus, penerangan antara muka penggunanya. Anggaran kos.

    tesis, ditambah 06/10/2013

    Pengesanan butiran dan sempadannya dalam imej. Aplikasi algoritma kedudukan. Menggunakan algoritma pengkuantitian mod adaptif dalam mod pemprosesan serpihan demi serpihan. Penapisan imej linear umum. Pemulihan kawasan yang hilang.

    kerja kursus, tambah 06/17/2013

    Semakan perisian sedia ada untuk mengautomasikan pemilihan tepi dalam imej. Pembangunan model matematik untuk pemprosesan imej dan pengekstrakan kontur dalam warna kelabu dan perisian untuk algoritma pemprosesan imej.

Salah satu tugas utama pemprosesan dan analisis imej ialah segmentasi, i.e. membahagikan imej kepada kawasan yang memenuhi kriteria kehomogenan tertentu, contohnya, menyerlahkan kawasan yang mempunyai kecerahan yang lebih kurang sama dalam imej. Konsep kawasan imej digunakan untuk menentukan kumpulan elemen imej yang koheren yang mempunyai ciri umum tertentu (sifat).
Salah satu cara utama dan paling mudah ialah membina segmentasi menggunakan ambang. Ambang ialah tanda (harta) yang membantu membahagikan isyarat yang dikehendaki ke dalam kelas. Operasi pembahagian ambang adalah untuk membandingkan nilai kecerahan setiap piksel dalam imej dengan nilai ambang yang ditentukan.
Penduaan

Operasi ambang yang menghasilkan imej binari dipanggil binarization. Tujuan operasi binarisasi adalah untuk mengurangkan secara radikal jumlah maklumat yang terkandung dalam imej. Dalam proses perduaan, imej halftone asal, yang mempunyai beberapa tahap kecerahan tertentu, ditukar kepada imej hitam dan putih, piksel yang hanya mempunyai dua nilai - 0 dan 1

Ambang imej boleh dilakukan dengan cara yang berbeza.

Perduaan dengan ambang yang lebih rendah
Perduaan dengan ambang yang lebih rendah
Perduaan dengan ambang yang lebih rendah ialah operasi yang paling mudah, yang menggunakan hanya satu nilai ambang:

Semua nilai dan bukannya kriteria menjadi 1, dalam kes ini 255 (putih) dan semua nilai (amplitud) piksel yang lebih besar daripada ambang t - 0 (hitam).

Perduaan dengan ambang atas
Kadang-kadang anda boleh menggunakan varian kaedah pertama, yang menghasilkan negatif imej yang diperoleh melalui proses binarisasi. Operasi perduaan dengan ambang atas:

Perduaan dengan kekangan berganda
Untuk menyerlahkan kawasan di mana nilai kecerahan piksel boleh berbeza dalam julat yang diketahui, perduaan dengan had berganda diperkenalkan (t 1
Variasi lain dengan ambang juga mungkin, di mana hanya sebahagian daripada data dilalui (penapis jalur tengah).

Ambang tidak lengkap
Transformasi ini menghasilkan imej yang mungkin lebih mudah untuk dianalisis dengan lebih lanjut kerana ia menjadi tanpa latar belakang dengan semua butiran hadir dalam imej asal.

Transformasi Ambang Berbilang Aras
Operasi ini membentuk imej yang bukan binari, tetapi terdiri daripada segmen dengan kecerahan yang berbeza.

Bagi perduaan, itu pada asasnya. Walaupun kita boleh menambah bahawa terdapat yang global, yang digunakan untuk keseluruhan imej, dan terdapat juga yang tempatan, yang menangkap sebahagian daripada gambar (imej).

Ambang tempatan
Kaedah Otsa
Kaedah ini menggunakan histogram taburan nilai kecerahan piksel imej raster. Histogram dibina menggunakan nilai p i =n i /N, di mana N ialah jumlah bilangan piksel dalam imej, n i ialah bilangan piksel dengan tahap kecerahan i. Julat kecerahan dibahagikan kepada dua kelas menggunakan ambang tahap kecerahan k,k - nilai integer dari 0 hingga L. Setiap kelas sepadan dengan frekuensi relatif ω 0 ω 1:

Tahap purata untuk setiap dua kelas imej:
Seterusnya, nilai maksimum untuk menilai kualiti membahagikan imej kepada dua bahagian dikira:
dengan (σ cl)2=ω 0 ω 1 (μ 1 -μ 0) 2 ialah varians antara kelas, dan (jumlah σ) 2 ialah jumlah varians untuk keseluruhan imej.

Ambang berdasarkan kecerunan kecerahan imej
Mari kita anggap bahawa imej yang dianalisis boleh dibahagikan kepada dua kelas - objek dan latar belakang. Algoritma untuk mengira nilai ambang terdiri daripada 2 langkah berikut:
1. Modul kecerunan kecerahan ditentukan untuk setiap piksel
Imej

2. Pengiraan ambang:
Jumlah
Saya gembira berkongsi apa yang saya temui dengan anda; pada masa hadapan, jika saya berjaya dan mempunyai masa, saya akan cuba melaksanakan beberapa algoritma. Ini hanya sebahagian kecil daripada semua yang ada hari ini, tetapi saya gembira untuk berkongsi ini juga.
Terima kasih kerana memberi perhatian. 1

Kaedah matematik untuk membahagikan imej standard Dicom dipertimbangkan. Kaedah matematik untuk pembahagian imej bagi standard Dicom sedang dibangunkan untuk masalah pengecaman imej perubatan. Diagnosis penyakit bergantung pada kelayakan penyelidik dan memerlukannya untuk melakukan segmentasi secara visual, dan kaedah matematik untuk memproses imej raster adalah alat untuk diagnosis ini. Memproses imej perubatan yang diperolehi oleh perkakasan tanpa pra-memproses data grafik dalam kebanyakan kes menghasilkan keputusan yang salah. Prosedur untuk mengekstrak kontur objek menggunakan kaedah Canny dan algoritma pemprosesan imej raster tambahan telah dilakukan. Hasil penyelidikan memungkinkan untuk mengira sifat morfometrik, geometri dan histogram pembentukan dalam tubuh manusia yang diperlukan untuk rawatan lanjut pesakit dan untuk menyediakan rawatan perubatan yang berkesan. Prinsip yang dibangunkan bagi analisis automatik komputer imej perubatan digunakan dengan berkesan untuk tugas operasi diagnostik perubatan institusi onkologi khusus, dan untuk tujuan pendidikan.

pengecaman corak

pembahagian objek yang menarik

imej perubatan

1. Vlasov A.V., Tsapko I.V. Pengubahsuaian algoritma Canny seperti yang digunakan pada pemprosesan imej radiografi // Buletin Sains Siberia. – 2013. – No 4(10). – ms 120–127.

2. Gonzales R., Woods R. Pemprosesan imej digital. – M.: Tekhnosphere, 2006. – P. 1072.

3. Kulyabichev Yu.P., Pivtoratskaya S.V. Pendekatan struktur untuk pemilihan ciri dalam sistem pengecaman corak // Sains semula jadi dan teknikal. – 2011. – No 4. – P. 420–423.

4. Nikitin O.R., Pasechnik A.S. Kontur dan pembahagian dalam tugas diagnostik automatik patologi // Kaedah dan peranti untuk menghantar dan memproses maklumat. – 2009. – No. 11. – P. 300–309.

5. Canny J. Pendekatan Pengiraan untuk pengesanan tepi // Transaksi IEEE pada analisis corak dan kecerdasan mesin. – 1986. – No 6. – P.679–698.

6. DICOM – Mod akses: http://iachel.ru/ zob23tai-staihroe/ DICOM

7. Doronicheva A.V., Sokolov A.A., Savin S.Z. Menggunakan operator Sobel untuk pengesanan tepi automatik dalam imej perubatan // Jurnal Matematik dan Sains Sistem. – 2014. – Jld. 4, No. 4 – P. 257–260.

8. Jähne B., Scharr H., Körkel S. Prinsip reka bentuk penapis // Buku Panduan Penglihatan dan Aplikasi Komputer. Akhbar Akademik. – 1999. – 584 hlm.

Salah satu bidang keutamaan untuk pembangunan perubatan di Rusia ialah peralihan kepada teknologi inovatifnya sendiri untuk pendaftaran elektronik, penyimpanan, pemprosesan dan analisis imej perubatan organ dan tisu pesakit. Ini disebabkan oleh peningkatan dalam jumlah maklumat yang dibentangkan dalam bentuk imej apabila mendiagnosis penyakit penting secara sosial, terutamanya penyakit onkologi, rawatan yang dalam kebanyakan kes hanya mempunyai hasil pada peringkat awal.

Apabila menjalankan pengimejan diagnostik piawaian DICOM, kawasan patologi ditentukan, dan apabila sifat patologinya disahkan, masalah klasifikasi diselesaikan: penugasan kepada salah satu spesies yang diketahui atau pengenalan kelas baru. Kesukaran yang jelas ialah kecacatan pada imej yang terhasil, yang disebabkan oleh kedua-dua had fizikal peralatan dan had beban yang dibenarkan pada tubuh manusia. Akibatnya, alat perisian yang ditugaskan dengan pemprosesan tambahan imej untuk meningkatkan nilai diagnostik mereka untuk doktor, membentangkannya dalam bentuk yang lebih mudah, dan menyerlahkan perkara utama daripada jumlah besar data yang diterima.

Tujuan kajian. Kaedah matematik untuk pembahagian imej bagi standard Dicom sedang dibangunkan untuk masalah pengecaman imej perubatan. Diagnosis penyakit bergantung pada kelayakan penyelidik dan memerlukannya untuk melakukan segmentasi secara visual, dan kaedah matematik untuk memproses imej raster adalah alat untuk diagnosis ini. Memproses imej perubatan yang diperolehi oleh perkakasan tanpa pra-memproses data grafik dalam kebanyakan kes menghasilkan keputusan yang salah. Ini disebabkan oleh fakta bahawa imej yang diterima pada mulanya adalah kualiti yang tidak memuaskan.

Bahan dan kaedah penyelidikan

Tomogram yang dikira pesakit di institusi klinikal khusus digunakan sebagai bahan penyelidikan. Sebelum menganalisis data grafik sebenar, imej mesti disediakan atau dipraproses. Peringkat ini menyelesaikan masalah meningkatkan kualiti visual imej perubatan. Adalah berguna untuk membahagikan keseluruhan proses pemprosesan imej kepada dua kategori yang luas: kaedah di mana kedua-dua input dan output adalah imej; kaedah di mana data input adalah imej, dan sebagai hasil kerja, data output adalah tanda dan atribut yang dikenal pasti berdasarkan data input. Algoritma ini tidak menganggap bahawa setiap proses di atas digunakan pada imej. Pendaftaran data adalah yang pertama daripada proses, ditunjukkan dalam Rajah. 1.

nasi. 1. Peringkat utama pemprosesan digital data grafik

Pendaftaran boleh menjadi agak mudah, seperti dalam contoh di mana imej asal adalah digital. Lazimnya, peringkat pendaftaran imej melibatkan pra-pemprosesan data, contohnya, meningkatkan skala imej. Peningkatan imej ialah salah satu bidang pra-pemprosesan yang paling mudah dan mengagumkan. Sebagai peraturan, kaedah untuk meningkatkan kandungan maklumat imej ditentukan oleh tugas mencari piksel yang tidak dapat dibezakan atau meningkatkan kontras dalam imej asal. Salah satu kaedah yang biasa digunakan untuk menambah baik kandungan maklumat imej adalah untuk meningkatkan kontras imej, kerana sempadan objek yang menarik dipertingkatkan. Perlu diambil kira bahawa meningkatkan kualiti imej pada tahap tertentu adalah tugas subjektif dalam pemprosesan imej. Pemulihan imej - tugas ini juga merujuk kepada peningkatan kualiti visual data. Kaedah pemulihan imej adalah berdasarkan model matematik dan kebarangkalian ubah bentuk data grafik. Pemprosesan imej sebagai satu peringkat harus diasingkan daripada konsep pemprosesan imej sebagai keseluruhan proses menukar imej dan mendapatkan beberapa data. Segmentasi, atau proses mengekstrak objek yang menarik, membahagikan imej kepada objek atau bahagian komponen. Pengekstrakan automatik objek yang menarik adalah tugas yang agak mencabar dalam pemprosesan imej digital. Pembahagian yang terlalu terperinci menyukarkan pemprosesan imej apabila ia datang untuk menyerlahkan objek yang diminati. Tetapi pembahagian yang tidak betul atau tidak cukup terperinci dalam kebanyakan tugas membawa kepada ralat pada peringkat akhir pemprosesan imej. Pembentangan dan perihalan data grafik biasanya mengikuti peringkat menyerlahkan objek yang diminati dalam imej, yang outputnya dalam kebanyakan kes mengandungi piksel mentah yang membentuk sempadan rantau atau membentuk semua piksel wilayah. Dengan pilihan sedemikian, adalah perlu untuk menukar data ke dalam bentuk yang boleh diakses untuk analisis komputer. Pengecaman corak ialah proses yang memberikan pengecam kepada objek (seperti "jejari") berdasarkan penerangannya. Mari kita tentukan hubungan antara pangkalan pengetahuan dan modul pemprosesan imej. Pangkalan pengetahuan (iaitu, maklumat tentang kawasan masalah) entah bagaimana disulitkan dalam sistem pemprosesan imej itu sendiri. Pengetahuan ini boleh menjadi agak mudah, seperti petunjuk terperinci tentang objek dalam imej di mana kawasan yang diminati sepatutnya. Pengetahuan sedemikian memungkinkan untuk mengehadkan kawasan carian. Pangkalan pengetahuan mengawal operasi setiap modul pemprosesan dan interaksinya, seperti yang ditunjukkan dalam Rajah. 1 dengan anak panah diarahkan ke dua arah antara modul dan pangkalan pengetahuan. Menyimpan dan mencetak hasil selalunya juga memerlukan penggunaan teknik pemprosesan imej khas. Kelemahan langkah pemprosesan imej ini dalam sistem pemprosesan imej perubatan ialah ralat yang dibuat pada peringkat pertama pemprosesan, contohnya apabila memasukkan atau menyerlahkan objek yang menarik dalam imej, boleh menyebabkan kegagalan pengelasan yang betul. Pemprosesan data dijalankan secara ketat secara berurutan, dan dalam kebanyakan kes tidak ada kemungkinan untuk kembali ke peringkat pemprosesan sebelumnya, walaupun keputusan yang salah diperoleh sebelum ini. Kaedah pada peringkat pra-pemprosesan agak pelbagai - mengenal pasti objek yang diminati, menskalanya, pembetulan warna, melaraskan resolusi spatial, menukar kontras, dsb. Salah satu tindakan keutamaan pada peringkat pra-pemprosesan imej ialah melaraskan kontras dan kecerahan. Dengan menggunakan topeng yang sesuai, adalah mungkin untuk menggabungkan dua peringkat (penapisan dan prapemprosesan) untuk meningkatkan kelajuan analisis data. Hasil akhir analisis imej dalam kebanyakan kes ditentukan oleh tahap kualiti pembahagian, dan tahap perincian objek yang diminati bergantung pada tugas khusus yang ada. Atas sebab ini, kaedah atau algoritma berasingan belum dibangunkan yang sesuai untuk menyelesaikan semua masalah mengenal pasti objek yang menarik. Menggariskan kawasan bertujuan untuk menyerlahkan objek dengan sifat tertentu dalam imej. Objek ini, sebagai peraturan, sepadan dengan objek atau bahagiannya yang dilabelkan oleh pakar diagnostik. Hasil kontur ialah imej binari atau hierarki (berbilang fasa), di mana setiap tahap imej sepadan dengan kelas objek terpilih tertentu. Segmentasi ialah langkah yang kompleks dalam pemprosesan dan analisis data perubatan daripada tisu biologi, kerana perlu untuk menggambarkan kawasan yang sepadan dengan objek atau struktur yang berbeza pada tahap histologi: sel, organel, artifak, dsb. Ini dijelaskan oleh kebolehubahan tinggi parameter mereka, tahap kontras yang rendah bagi imej yang dianalisis dan hubungan geometri objek yang kompleks. Dalam kebanyakan kes, untuk mendapatkan hasil yang paling berkesan, adalah perlu untuk menggunakan kaedah yang berbeza secara konsisten untuk membahagikan objek yang diminati dalam imej. Sebagai contoh, untuk menentukan sempadan objek yang menarik, kaedah kecerunan morfologi digunakan, selepas itu pembahagian ambang dijalankan untuk kawasan yang sesuai untuk perbezaan kecil dalam ciri kecerahan. Untuk memproses imej di mana kawasan homogen yang tidak berkaitan berbeza dalam kecerahan purata, kaedah segmentasi Canny telah dipilih; penyelidikan dijalankan pada contoh klinikal. Apabila mengenali imej klinikal sebenar, pemodelan tidak boleh digunakan dengan baik. Pengalaman praktikal dan pendapat pakar mengenai hasil analisis imej adalah sangat penting. Untuk imej ujian, imej tomografi yang dikira telah dipilih, di mana objek yang menarik ditunjukkan dalam Rajah 1 jelas hadir. 2.

nasi. 2. Imej tomografi yang dikira dengan objek yang diminati

Untuk melaksanakan pembahagian, kami menggunakan kaedah Canny. Pendekatan ini tahan terhadap bunyi bising dan dalam kebanyakan kes menunjukkan hasil yang lebih baik berbanding kaedah lain. Kaedah Canny melibatkan empat langkah:

1) prapemprosesan - mengaburkan imej (kami mengurangkan penyebaran bunyi tambahan);

2) pembezaan imej kabur dan pengiraan nilai kecerunan seterusnya dalam arah x dan y;

3) pelaksanaan penindasan bukan maksimum dalam imej;

4) pemprosesan imej ambang.

Pada peringkat pertama algoritma Canny, imej dilicinkan menggunakan topeng dengan penapis Gaussian. Persamaan taburan Gaussian dalam dimensi N mempunyai bentuk

atau dalam kes khas untuk dua dimensi

(2)

dengan r ialah jejari kabur, r 2 = u 2 + v 2 ; σ ialah sisihan piawai bagi taburan Gaussian.

Jika kita menggunakan 2 dimensi, maka formula ini menentukan permukaan bulatan sepusat yang mempunyai taburan Gaussian dari titik pusat. Piksel dengan taburan bukan sifar digunakan untuk menentukan matriks lilitan untuk digunakan pada imej asal. Nilai setiap piksel menjadi purata wajaran kejiranan. Nilai piksel awal mengambil berat maksimum (mempunyai nilai Gaussian maksimum), dan piksel jiran mengambil berat minimum, bergantung pada jaraknya. Secara teorinya, taburan pada setiap titik dalam imej hendaklah bukan sifar, yang mengikut pengiraan berat untuk setiap piksel dalam imej. Tetapi dalam amalan, apabila mengira penghampiran diskret fungsi Gaussian, piksel pada jarak > 3σ tidak diambil kira, kerana ia agak kecil. Oleh itu, program pemprosesan imej perlu mengira matriks × untuk memastikan anggaran taburan Gaussian adalah cukup tepat.

Hasil kajian dan perbincangan

Hasil penapis Gaussian dengan data yang sama dengan 5 untuk saiz topeng Gaussian dan 1.9 untuk nilai parameter σ - sisihan piawai taburan Gaussian, dibentangkan dalam Rajah. 3. Langkah seterusnya ialah mencari kecerunan kawasan yang diminati dengan melilitkan imej terlicin dengan terbitan fungsi Gaussian dalam arah menegak dan mendatar vektor.

Mari gunakan operator Sobel untuk menyelesaikan masalah ini. Proses ini berdasarkan hanya memindahkan topeng penapis dari piksel ke piksel dalam imej. Pada setiap piksel (x, y), tindak balas penapis dikira daripada sambungan yang telah ditetapkan. Ini menghasilkan pemilihan tepi awal. Langkah seterusnya ialah membandingkan setiap piksel dengan jirannya sepanjang arah kecerunan dan mengira maksimum tempatan. Maklumat tentang arah kecerunan adalah perlu untuk mengalih keluar piksel berhampiran sempadan tanpa memecahkan sempadan itu sendiri berhampiran maksima tempatan kecerunan, yang bermaksud bahawa piksel sempadan menentukan titik di mana maksimum tempatan kecerunan dicapai dalam arah vektor kecerunan. Pendekatan ini boleh mengurangkan pengesanan tepi palsu dengan ketara dan memastikan ketebalan sempadan objek satu piksel, yang disahkan secara empirik oleh pelaksanaan perisian algoritma untuk membahagikan sepotong rongga perut dalam imej tomografi yang dikira, yang dibentangkan di bawah dalam Rajah. 4.

Langkah seterusnya ialah menggunakan ambang untuk menentukan di mana sempadan berada pada setiap piksel yang diberikan dalam imej. Semakin rendah ambang, semakin banyak tepi yang terdapat pada objek yang diminati, tetapi semakin terdedah hasilnya kepada bunyi bising, dan menggariskan data imej luar. Ambang yang tinggi mungkin mengabaikan bahagian tepi kawasan yang lemah atau bersempadan dengan beberapa kawasan. Kontur sempadan menggunakan dua ambang penapisan: jika nilai piksel berada di atas sempadan atas, ia mengambil nilai maksimum (sempadan dianggap boleh dipercayai), jika di bawahnya, piksel ditindas, titik dengan nilai berada dalam julat antara ambang mengambil nilai purata tetap. Piksel menyertai kumpulan jika ia menyentuhnya dalam satu daripada lapan arah. Antara kelebihan kaedah Canny ialah semasa pemprosesan imej ia menyesuaikan diri dengan ciri-ciri segmentasi. Ini dicapai dengan memperkenalkan ambang dua peringkat untuk memotong data berlebihan. Dua tahap ambang ditakrifkan, yang atas - p tinggi dan yang bawah - p rendah, di mana p tinggi > p rendah. Nilai piksel di atas nilai p tinggi ditetapkan sebagai sepadan dengan sempadan (Rajah 5).

nasi. 3. Menggunakan penapis Gaussian pada imbasan CT dengan objek yang menarik

nasi. 4. Penindasan bukan maksimum dalam imej bersegmen

nasi. 5. Aplikasi algoritma segmentasi Canny dengan tahap ambang yang berbeza

Amalan menunjukkan bahawa terdapat selang tertentu pada skala tahap ambang sensitiviti, di mana nilai kawasan objek yang diminati hampir tidak berubah, tetapi pada masa yang sama terdapat tahap ambang tertentu, selepas itu " kegagalan” kaedah persempadanan semula diperhatikan dan hasil mengenal pasti bidang kepentingan menjadi tidak pasti. Ini adalah kelemahan algoritma yang boleh dikompensasikan dengan menggabungkan algoritma Canny dengan transformasi Hough untuk mencari bulatan. Gabungan algoritma membolehkan anda mengenal pasti objek kajian dengan jelas, serta menghapuskan jurang dalam kontur.

kesimpulan

Oleh itu, masalah merumuskan ciri khas objek patologi dalam imej perubatan telah diselesaikan, yang akan memungkinkan pada masa akan datang untuk menjalankan analisis operasi data pada patologi tertentu. Parameter penting untuk menentukan penilaian kualiti segmentasi ialah kebarangkalian penggera palsu dan kegagalan gagal. Parameter ini menentukan aplikasi automasi kaedah analisis. Segmentasi adalah salah satu yang paling penting apabila menyelesaikan masalah pengelasan dan pengecaman objek dalam imej. Kaedah kontur berdasarkan pembahagian sempadan kawasan - Sobel, Canny, Prewit, Laplassian - telah dikaji dan digunakan dengan agak baik. Pendekatan ini ditentukan oleh fakta bahawa kepekatan perhatian seseorang semasa menganalisis imej sering tertumpu pada sempadan antara zon yang lebih atau kurang seragam dalam kecerahan. Berdasarkan ini, kontur sering menjadi asas untuk menentukan pelbagai ciri untuk mentafsir imej dan objek di dalamnya. Tugas utama algoritma untuk membahagikan kawasan yang menarik ialah pembinaan imej binari yang mengandungi kawasan struktur tertutup data dalam imej. Mengenai imej perubatan, kawasan ini adalah sempadan organ, urat, MCC, dan tumor. Prinsip yang dibangunkan bagi analisis automatik komputer bagi imej perubatan digunakan dengan berkesan untuk tugas operasi diagnostik perubatan institusi onkologi khusus, dan untuk tujuan pendidikan.

Dikaji dengan sokongan program Timur Jauh, geran No. 15-I-4-014o.

Pengulas:

Kosykh N.E., Doktor Sains Perubatan, Profesor, Ketua Penyelidik, Pusat Pengkomputeran, Cawangan Timur Jauh Akademi Sains Rusia, Khabarovsk;

Levkova E.A., Doktor Sains Perubatan, Profesor, Universiti Pengangkutan Negeri Far Eastern, Khabarovsk.

Pautan bibliografi

Doronicheva A.V., Savin S.Z. KAEDAH SEGMENTASI IMEJ PERUBATAN // Penyelidikan Fundamental. – 2015. – No 5-2. – Hlm. 294-298;
URL: http://fundamental-research.ru/ru/article/view?id=38210 (tarikh akses: 04/06/2019). Kami membawa kepada perhatian anda majalah yang diterbitkan oleh rumah penerbitan "Akademi Sains Semula Jadi"