Kikasha cha Kuchakata Picha. Kozi fupi katika nadharia ya usindikaji wa picha. I.M. Zhuravel. Sehemu katika nafasi ya rangi ya RGB

Kuhariri picha na kuunda kolagi itakuwa mchakato wa kufurahisha sana ikiwa haungelazimika kutumia wakati wako mwingi kuweka alama kwa vitu. Kazi inakuwa ngumu zaidi wakati mipaka ya vitu imefifia au kuna uwazi. Zana za Photoshop kama vile Magnetic Lasso na Magic Wand hazina akili sana kwa sababu zinaangalia tu vipengele vya kiwango cha chini kwenye picha. Wanarudi mipaka ngumu, ambayo inahitaji kusahihishwa kwa mikono. Mbinu ya Kugawanya Semantiki Laini kutoka kwa watafiti wa Adobe husaidia kutatua tatizo hili gumu kwa kugawanya picha katika tabaka zinazolingana na maeneo muhimu ya kisemantiki na kuongeza mageuzi laini kwenye kingo.

Sehemu "laini".

Timu ya watafiti kutoka kwa maabara ya CSAIL huko MIT na chuo kikuu cha Uswizi ETH Zürich, wanaofanya kazi chini ya uongozi wa Yagiz Aksoy, walipendekeza kushughulikia tatizo hili kwa kuzingatia mgawanyiko wa spectral, na kuongeza maendeleo yake ya kisasa katika kujifunza kwa kina. Kutumia maelezo ya texture na rangi, pamoja na vipengele vya juu vya semantic vilivyotolewa, aina maalum ya grafu hujengwa kutoka kwa picha. Kisha, kwa kutumia grafu hii, tumbo la Kirchhoff (Laplacian matrix) linajengwa. Kutumia mtengano wa spectral wa matrix hii, algorithm inazalisha contours laini ya vitu. Mgawanyiko wa picha katika tabaka zilizopatikana kwa kutumia eigenveekta zinaweza kutumika kwa uhariri.

Muhtasari wa mbinu iliyopendekezwa

Maelezo ya mfano

Wacha tuangalie njia ya kuunda tabaka zenye maana za kisemantiki hatua kwa hatua:

1. Mask ya Spectral. Njia iliyopendekezwa inaendelea kazi ya Levin na wenzake, ambao walikuwa wa kwanza kutumia tumbo la Kirchhoff katika kazi ya kujenga moja kwa moja mask. Waliunda matrix L, ambayo inabainisha kufanana kwa jozi kati ya saizi katika eneo fulani la karibu. Kwa kutumia tumbo hili, wao hupunguza utendaji wa quadratic αᵀLα na vikwazo vilivyobainishwa na mtumiaji, ambapo α hubainisha vekta ya thamani za uwazi kwa saizi zote kwenye safu fulani. Kila contour laini ni mchanganyiko wa mstari wa K eigenveekta sambamba na eigenvalues ​​ndogo zaidi za L, ambayo huongeza kinachojulikana kama uhaba wa mask.

2. Mshikamano wa rangi. Ili kukokotoa vipengele vya ukaribu wa rangi zisizo za eneo, watafiti hutengeneza pikseli kuu 2,500 na kukadiria ukaribu kati ya kila pikseli kuu na pikseli kuu zote katika kitongoji kilicho na radius ya 20% ya saizi ya picha. Kutumia ukaribu usio wa karibu nawe huhakikisha kuwa maeneo yenye rangi zinazofanana sana yanasalia kushikamana katika matukio changamano kama ilivyo hapa chini.

Ukaribu wa rangi isiyo ya karibu

3. Ukaribu wa kisemantiki. Hatua hii inakuwezesha kutambua maeneo yaliyounganishwa kisemantiki ya picha. Ukaribu wa kisemantiki huhimiza kuunganisha pikseli ambazo ni za kitu kimoja cha tukio na kuadhibu kuunganisha saizi kutoka kwa vitu tofauti. Hapa, watafiti huchukua fursa ya maendeleo ya awali katika utambuzi wa muundo na kukokotoa, kwa kila pikseli, vekta ya kipengele inayohusiana na kitu ambacho pixel ni sehemu yake. Vekta za kipengele huhesabiwa kwa kutumia mtandao wa neva, ambao tutajadili baadaye kwa undani zaidi. Ukaribu wa kisemantiki, kama vile ukaribu wa rangi, hubainishwa katika pikseli kuu. Hata hivyo, tofauti na ukaribu wa rangi, ukaribu wa kisemantiki huunganisha tu pikseli kuu zilizo karibu, na hivyo kuhimiza uundaji wa vitu madhubuti. Mchanganyiko wa ukaribu wa rangi isiyo ya eneo na ukaribu wa kisemantiki wa ndani hufanya iwezekane kuunda safu zinazofunika picha zilizotenganishwa za kipande cha kitu kimoja kinachohusiana kisemantiki (kwa mfano, mimea, anga, aina zingine za usuli).

Ukaribu wa kisemantiki

4. Kujenga tabaka. Katika hatua hii, matrix L inaundwa kwa kutumia ukaribu uliohesabiwa hapo awali. Kutoka kwa tumbo hili, eigenveekta zinazolingana na eigenvalues ​​100 ndogo zaidi hutolewa, na kisha algorithm ya nadra inatumika, ambayo hutoa vekta 40 kutoka kwao, ambayo tabaka hutolewa. kujengwa. Kisha idadi ya tabaka hupunguzwa tena kwa kutumia k-njia ya kuunganisha algoriti katika k = 5. Hii inafanya kazi vizuri zaidi kuliko kuweka tena eigenveekta 100 hadi tano, kwa kuwa upunguzaji mkubwa kama huo wa vipimo hufanya tatizo kuamuliwa kupita kiasi. Watafiti walichagua nambari ya mwisho ya mtaro wa 5 na kudai kuwa hii ni nambari inayofaa kwa picha nyingi. Walakini, nambari hii inaweza kubadilishwa kwa mikono kulingana na picha inayochakatwa.


Mtaro laini kabla na baada ya kupanga

5. Vekta za kipengele cha kisemantiki. Ili kukokotoa ukaribu wa kisemantiki, vekta za vipengele vilivyokokotolewa kwa kutumia mtandao wa neva zilitumika. Msingi wa mtandao wa neva ulikuwa DeepLab-ResNet-101, iliyofunzwa kuhusu kazi ya kutabiri metriki. Wakati wa mafunzo, uboreshaji wa umbali wa L2 kati ya vipengele vya vitu tofauti ulihimizwa. Kwa hivyo, mtandao wa neva hupunguza umbali kati ya vipengele vinavyolingana na darasa moja na kuongeza umbali katika hali nyingine.

Ulinganisho wa ubora na njia zinazofanana

Picha hapa chini zinaonyesha matokeo ya mbinu iliyopendekezwa (iliyoandikwa "Matokeo yetu") ikilinganishwa na matokeo ya mbinu ya karibu ya sehemu laini - mbinu ya mask ya spectral - na mbinu mbili za kisasa za semantic segmentation: usindikaji wa eneo la PSPNet. mbinu na mbinu ya kugawanya kitu cha Mask R-CNN.


Ulinganisho wa ubora wa sehemu laini za kisemantiki na mbinu zingine

Inaweza kubadilishwa kuwa PSPNet na Mask R-CNN huwa na makosa kwenye mipaka ya vitu, na contours laini iliyojengwa na njia ya spectral mara nyingi huenda zaidi ya mipaka ya vitu. Wakati huo huo, njia iliyoelezwa inashughulikia kabisa kitu bila kuchanganya na wengine, na kufikia usahihi wa juu kwenye kando, na kuongeza mabadiliko ya laini inapohitajika. Walakini, inafaa kuzingatia kwamba sifa za semantiki zinazotumiwa katika njia hii hazitofautishi kati ya vitu viwili tofauti vya darasa moja. Matokeo yake, vitu vingi vinawakilishwa kwenye safu moja, kama inavyoonekana kwenye picha za twiga na ng'ombe.

Kuhariri Picha kwa Mikondo laini ya Semantiki

Ifuatayo ni baadhi ya mifano ya kutumia muhtasari laini kuhariri picha na kuunda kolagi. Muhtasari laini unaweza kutumika kutekeleza mabadiliko mahususi kwa tabaka tofauti: kuongeza ukungu wa mwendo wa treni (2), marekebisho ya rangi tofauti kwa watu na mandharinyuma (5, 6), mitindo tofauti ya puto ya hewa moto, anga, mandhari na mtu ( 8). Bila shaka, kitu kimoja kinaweza kufanywa kwa kutumia masks iliyoundwa kwa mikono au algorithms ya uteuzi wa contour ya classic, lakini kwa uteuzi wa moja kwa moja wa vitu muhimu vya semantically, uhariri huo unakuwa rahisi zaidi.

Kutumia Sehemu Laini za Semantiki kwa Uhariri wa Picha

Hitimisho

Njia hii huunda kiotomatiki mtaro laini unaolingana na maeneo muhimu ya kisemantiki ya picha kwa kutumia mchanganyiko wa maelezo ya kiwango cha juu kutoka kwa mtandao wa neva na vipengele vya kiwango cha chini. Hata hivyo, njia hii ina vikwazo kadhaa. Kwanza, ni polepole: wakati wa usindikaji wa picha yenye vipimo vya 640 x 480 ni dakika 3-4. Pili, njia hii haifanyi tabaka tofauti kwa vitu tofauti vya darasa moja. Na tatu, kama inavyoonyeshwa hapa chini, njia hii inaweza kushindwa mapema katika hali ambapo rangi za kitu zinafanana sana (mfano wa juu), au wakati wa kuunganisha kingo laini karibu na maeneo makubwa ya mpito (mfano wa chini).

Kesi za makosa ya algorithm

Hata hivyo, kingo za laini zilizoundwa kwa kutumia njia hii hutoa uwakilishi muhimu wa kati wa picha, kukuwezesha kutumia muda mdogo na jitihada za kuhariri picha.

Mgawanyiko wa picha

Ugawaji huanzisha vipengele vidogo vya saizi au ugawaji wa picha katika maeneo madhubuti, ambayo kila moja ni "homogeneous" kwa maana fulani. Michakato ya utengaji na utoaji wa vipengele inaweza kuzingatiwa kama kugawa lebo kwa saizi ambazo hufafanua aina maalum ambazo saizi hizi ni za. Kwa hivyo, matokeo ya mchakato wa kugawanya ni picha ya mhusika ambayo maadili ya pixel ni lebo badala ya viwango vya mwangaza.

Uainishaji wa mifano ya picha

Ili kugawanya picha, mfano mmoja au mwingine hutumiwa ambao hutoa maelezo zaidi au chini ya kutosha ya picha halisi. Kuna madarasa mawili kuu ya mifano ya picha: takwimu na anga. Miundo ya takwimu inaelezea mkusanyiko wa vipengele vya uhakika vya picha au eneo lake. Miundo ya anga inaelezea mtengano wa picha katika sehemu zake au maeneo.

Miundo ya takwimu ya mpangilio wa kwanza inaelezea seti ya vipengele vya uhakika katika picha bila kuzingatia eneo lao katika nafasi. Maelezo rahisi zaidi ya aina hii ni wiani wa uwezekano wa usambazaji wa maadili ya mwangaza, ambayo huhesabiwa kwa kutumia histogram ya maadili ya mwangaza. Inaaminika mara nyingi kuwa msongamano wa uwezekano wa usambazaji wa maadili halisi ya picha unakadiriwa na kiwango fulani, kwa mfano, kazi ya msongamano wa Gaussian au mchanganyiko wa kazi kama hizo.

Mifano ya utaratibu wa kwanza hazizingatii kwamba picha ina sehemu yoyote thabiti (vipengele vya texture, vitu, nk). Mpangilio wa jamaa wa vipengele katika nafasi huzingatiwa na mifano ya makusanyo ya vipengele vya picha ya uhakika ya utaratibu wa juu. Mfano mmoja ni matriki ya karibu ya thamani ya mwanga, ambayo vipengele vyake vinawakilisha masafa ya jozi za maadili ya mwanga kwa kukabiliana na kuchaguliwa. Kwa mazoezi, thamani ya kukabiliana imechaguliwa kuwa ndogo sana, kwani kwa kukabiliana kubwa maadili ya mwangaza huwa huru kutoka kwa kila mmoja.

Mbinu nyingine ya kuelezea uhusiano wa anga kati ya vipengee vya nukta kwenye picha ni kuzingatia utendaji wa msongamano wa uwezekano wa usambazaji wa thamani za vipengele vya ndani, ambayo mara nyingi huwa na ufanisi zaidi kuliko kutumia uwezekano wa kitendakazi cha msongamano wa usambazaji wa thamani za mpangilio wa juu zaidi wa mwangaza. Muhimu zaidi katika utengaji wa picha ni vipengele vya msingi vya ndani, kama vile thamani za waendeshaji tofauti wa upinde rangi wa mwangaza.

Mifano za picha za takwimu pia zinajumuisha mifano ya uga na mfululizo wa muda, ambayo hutumiwa hasa katika uundaji wa unamu.

Miundo ya anga inaelezea picha kulingana na maeneo. Picha inaweza kuwakilishwa kama mkusanyiko wa vitu dhidi ya usuli, kama imegawanywa katika maeneo kwa njia ya kawaida au nasibu, kama kielelezo cha umbo la maeneo. Miundo ya anga inaweza kwa ujumla kutoa maelezo zaidi kutoka kwa picha kuliko miundo ya takwimu ya usambazaji mwangaza. Walakini, hadi sasa ni mifano rahisi tu inayotumika, na vifaa vyao vya hesabu vinahitaji maendeleo zaidi.

Ugawaji wa picha kwa kutumia njia za kuweka vizingiti

Njia rahisi na iliyoenea zaidi ya kugawanya picha ni kizingiti. Katika idadi ya njia za kawaida za kuchagua sehemu za picha kwa kizingiti, maadili ya kizingiti hutambuliwa moja kwa moja kutoka kwa histograms za picha (mfano wa picha ya utaratibu wa kwanza). Kwa kihistoria, njia ya kwanza ya kundi hili la njia ni njia ya mod. Njia hufuata kutokana na dhana kwamba picha ina idadi inayojulikana ya madarasa ya pointi ambazo ni homogeneous katika mwangaza. Kwa kuongezea, inaaminika kuwa maeneo ya mpaka kati ya maeneo yaliyofungwa yanachukua eneo ndogo la picha. Kwa hiyo, katika histogram wanapaswa kuendana na unyogovu wa intermode, ndani ambayo vizingiti vya sehemu vimewekwa.

Walakini, picha halisi hazikidhi mawazo yaliyofanywa vizuri. Kama sheria, mipaka kati ya maeneo imefichwa na muundo wa modal wa histogram haujaonyeshwa vya kutosha. Zaidi ya hayo, hata wakati histogram ina njia tofauti, mabonde yake yanaweza kuwa pana na gorofa kwamba ni vigumu kuweka chini ya bonde.

Ikiwa picha halisi haikidhi masharti ya njia ya mode, mbinu nne zifuatazo zinatumika. Kwanza, kuboresha histogramu, ikijumuisha kulingana na sifa za ndani za picha kwa kutumia maelezo ya upinde rangi, takwimu za mpangilio wa pili, na uchanganuzi wa mkunjo wa chaguo za kukokotoa za msambao limbikizi. Pili, histogram inakadiriwa na mchanganyiko wa usambazaji wa kawaida na matumizi ya mbinu za takwimu ili kutenganisha mchanganyiko huu kikamilifu. Ubaya wa njia hii ni ugumu wa hali ya juu wa kukokotoa; kwa kuongezea, Gaussoids mara nyingi hukadiria vibaya njia halisi. Tatu, kuanzishwa kwa kipimo cha majaribio cha ubora wa picha iliyogawanywa na uboreshaji wa utendaji wa kigezo sambamba - mbinu ya kibaguzi, mbinu ya entropy, mbinu ya muda, n.k. Nne, mpito kwa matumizi ya takwimu zingine za kuchagua kizingiti, katika hasa, kuchagua kizingiti moja kwa moja kulingana na vipengele vya ndani. Kutumia vipengele vya ndani hukuruhusu kugawa picha halisi changamano kwa ufanisi zaidi.

Uchanganuzi wa histogramu hutoa ubora wa kuridhisha wa sehemu kwa picha hizo ambazo zinajumuisha maeneo ya mwangaza sawa. Hata hivyo, wakati wa kuchagua vitu vidogo dhidi ya historia tata, pointi za kitu hazitoi kilele kinachoonekana katika histogram ya mwangaza. Kwa hiyo, usindikaji na kizingiti cha kutofautiana hutumiwa: kwa vipande vidogo vya picha, histograms hujengwa, ambayo huangaliwa kwa bimodality, na vizingiti vya ndani vilivyopatikana vinaingizwa kwa picha nyingine.

Idadi ya algoriti kulingana na uchanganuzi wa kibaguzi zilipendekezwa katika kazi za Ostu. Hebu G={0,1,...,L) - maadili yanayowezekana ya mwangaza wa picha. Kizingiti kinagawanya usambazaji wa maadili ya mwangaza wa picha katika madarasa mawili C 0={0,1,...,t) Na C 1={t+1,t+2,...,L}, tÎ G. Kizingiti bora t* hufafanuliwa kama

iko wapi usambazaji wa maadili ya mwangaza wa picha kwa ujumla, w0 ni uwezekano kwamba sehemu iliyochukuliwa kwa nasibu ni ya nyuma, https://pandia.ru/text/80/299/images/image004_46 .gif" width="21" height="24" >- wastani wa kiwango cha mwangaza wa usuli (darasa C 0).

Ikiwa maeneo ya kitu na historia hutofautiana kwa kasi kutoka kwa kila mmoja, histogram ya kazi ya kigezo inaweza kuwa multimodal. Kwa hiyo, ni muhimu kuamua vilele vyote vya ndani, ambavyo vinapunguza sana ushindani wa njia.

Kigezo cha Entropy cha kuchagua kizingiti bora. Kutumia ufafanuzi ulioletwa hapo awali, histogram ya maadili ya mwangaza inaweza kuzingatiwa kama L-chanzo cha ishara cha habari na entropy

,

Wapi pi- uwezekano wa mwangaza na thamani i.

Entropy ya chanzo ni jumla ya entropy ya kitu H 0 na entropy ya mandharinyuma H 1, na kizingiti bora kinapaswa kutoa dhamana ya juu ya kiasi hiki:

, (2)

ambapo .

Tangu kila masharti H 0 na H 1 inaangazia usawa wa usambazaji wa mwangaza katika vipindi vinavyolingana na hupungua kwa kasi wakati kipande cha "kigeni" cha histogram kinaanguka katika kipindi fulani; upeo wa kigezo cha entropy utalingana na chaguo bora zaidi cha sehemu. Ubaya wa njia hii ni kwamba kitendakazi cha kigezo kinaweza kuwa na maxima kadhaa ambayo ni karibu kwa thamani.

Kinyume na mbinu ya kibaguzi, kwa sasa njia ya kuhifadhi muda wote wa picha hadi (2 k+1) agizo linajumuisha:

.

Kizingiti bora ni kile kinachohakikisha usawa wa wakati unaolingana wa picha zilizogawanywa na asili. Hata hivyo, kama k> 3, kisha ugumu hutokea kutokana na kukosekana kwa ufumbuzi wa uchambuzi wa tatizo.

Mpito kutoka kwa kuchagua kizingiti kulingana na histogramu ya ung'avu hadi kutumia takwimu zingine bila shaka hutatiza kanuni za ugawaji, lakini hutoa sehemu bora za picha changamano. Ili kutambua vitu vya ukubwa mdogo, inaonekana kuahidi kuchagua kizingiti moja kwa moja kulingana na sifa za mitaa za pointi za picha.

Upeo wa wastani wa mbinu ya utofautishaji. Njia hiyo inategemea uamuzi rahisi wa heuristic wa kizingiti bora zaidi: kizingiti bora cha mgawanyiko wa picha ni kile kinachotambua mabadiliko ya juu ya utofautishaji wa juu na chini ya utofauti kuliko kizingiti kingine chochote. Usemi wa kiasi cha kigezo ni utofautishaji wa wastani wa tofauti zote za mwangaza zinazotambuliwa na kizingiti fulani. Kizingiti kinacholingana na tofauti ya wastani ya juu ni bora. Ikiwa pointi mbili za karibu X 1=(X 1,y 1) na X 2=(x 2,y 2) kuwa na maadili ya mwangaza f(X 1) na f(X 2) (bila kupoteza jumla f(X 1) £ f(X 2)), basi idadi ya tofauti zilizotengwa na kizingiti t, sawa:

Wapi

Tofauti kamili inayolingana na kizingiti t, ni sawa na:

ambapo DIV_ADBLOCK169">

. (3)

Kulingana na matrices ya karibu ya maadili ya mwangaza yaliyopendekezwa na Haralik, njia ifuatayo ya sehemu inazingatiwa. Kwa picha, matrices ya matukio ya ushirikiano wa viwango vya mwangaza vya jozi za pointi zilizo karibu katika mlalo. P 1.0 na wima P Maelekezo 1.90, pamoja na jumla ya ukubwa wa mpito wa ukubwa ( L+1)'( L+1):

Pvh=P 1,0 +P 1,90.

Kizingiti cha kiholela t hugawanya alama za picha katika madarasa mawili NA 0 na NA 1, na matrix ya mpito kuwa vizuizi 4.

Tuma kazi yako nzuri katika msingi wa maarifa ni rahisi. Tumia fomu iliyo hapa chini

Wanafunzi, wanafunzi waliohitimu, wanasayansi wachanga wanaotumia msingi wa maarifa katika masomo na kazi zao watakushukuru sana.

Iliyotumwa kwenye http://www.allbest.ru/

Wizara ya Elimu na Sayansi ya Shirikisho la Urusi

Chuo Kikuu cha Uhandisi cha Redio cha Jimbo la Ryazan

Idara ya IIBMT

Kazi ya kozi

Mbinu za usindikaji wa picha. Mgawanyiko

Sanaa iliyokamilishwa. gr. 432M:

Aleshin S.I.

Imeangaliwa na Assoc. idara IIBMT:

Kaplan M.B.

Ryazan 2014

Utangulizi

1. Uwasilishaji wa picha

3. Miundo ya picha

4. Aina za picha

5.1 Kubadilisha utofautishaji

5.2 Kulainisha kelele

5.3 Kusisitiza mipaka

5.4 Uchujaji wa wastani

5.5 Mgawanyiko wa picha

5.5.3 Muhtasari

5.5.7 Mbinu za kukata grafu

6. Maelezo ya kazi

7. Upimaji wa algorithm

Hitimisho

Maombi

Utangulizi

Nyuma katikati ya karne ya 20, usindikaji wa picha ulikuwa wa analogi na uliofanywa na vifaa vya macho. Mbinu kama hizo za macho bado ni muhimu leo, katika maeneo kama vile holografia. Hata hivyo, kwa ongezeko kubwa la utendaji wa kompyuta, mbinu hizi zilizidi kubadilishwa na mbinu za usindikaji wa picha za digital. Mbinu za uchakataji wa picha dijitali kwa ujumla ni sahihi zaidi, zinategemewa, zinazonyumbulika, na ni rahisi kutekeleza kuliko mbinu za analogi. Uchakataji wa picha dijitali hutumia sana maunzi maalum kama vile vichakataji vya bomba la maelekezo na mifumo ya vichakataji vingi. Hii ni kweli hasa kwa mifumo ya usindikaji wa video. Usindikaji wa picha pia unafanywa kwa kutumia programu ya hisabati ya kompyuta, kwa mfano, MATLAB, Mathcad, Maple, Mathematica, nk Kwa hili, hutumia zana zote za msingi na vifurushi vya ugani vya Usindikaji wa Picha.

Kuvutiwa na mbinu za usindikaji wa picha za kidijitali kunatokana na maeneo makuu mawili ya matumizi yake, ambayo ni uboreshaji wa picha ili kuboresha mtazamo wa kibinadamu wa kuona na usindikaji wa picha kwa ajili ya kuhifadhi, uwasilishaji na uwasilishaji katika mifumo ya maono ya mashine inayojiendesha.

Mojawapo ya njia ngumu zaidi za usindikaji wa picha za dijiti ni sehemu ya picha. Kugawanya ni mchakato wa kugawanya picha ya dijiti katika sehemu kadhaa ambazo hutofautiana katika sifa za kimsingi, kama vile mwangaza, rangi, muundo, umbo. Madhumuni ya kugawanya ni kurahisisha na kubadilisha uwakilishi wa picha ili iwe rahisi na rahisi kuchanganua. Uchaguzi usio sahihi wa sehemu katika picha unaweza hatimaye kuathiri ubora wa utambuzi na hata kuifanya kuwa haiwezekani. Kwa hivyo, kazi ya kugawanya ni muhimu sana na inafaa sana.

Kuna njia nyingi za kugawa picha. Matokeo ya mwisho mara nyingi hutambuliwa na usahihi wa sehemu, hivyo wakati wa kuchagua njia fulani ya sehemu, unahitaji kulipa kipaumbele kikubwa kwa kuaminika kwa algorithm. Walakini, hakuna mbinu moja inayokubalika kwa ujumla ambayo inaweza msingi wa algoriti nyingi. Pia hakuna algoriti moja ambayo inaweza kuruhusu sehemu zinazokubalika kwa picha yoyote. Hii ni mojawapo ya matatizo ya kugawanyika, na hii ndiyo sababu ya idadi kubwa ya mbinu tofauti za kutatua matatizo haya ya usindikaji wa picha.

Licha ya umuhimu wa eneo hili la somo, ni vitabu vichache kiasi ambavyo vimeandikwa ambavyo vinashughulikia misingi ya kinadharia na vipengele vya programu vya kutatua matatizo ya msingi ya sehemu za picha.

Karatasi hii inaelezea njia za msingi za usindikaji wa picha za dijiti. Uangalifu hasa hulipwa kwa njia za kugawanya picha. Mpango wa mojawapo ya mbinu za ugawaji umetekelezwa kwa kutumia kifurushi cha programu cha MatLAB.

1. Uwasilishaji wa picha

Masuala ya msingi katika nadharia ya usindikaji wa picha ni maswali ya: malezi, pembejeo, uwakilishi katika kompyuta na taswira. Umbo la uso linaweza kuelezewa kama utendaji wa umbali F(x, y) kutoka kwa uso hadi sehemu ya picha yenye viwianishi x na y. Kwa kuzingatia kwamba mwangaza wa hatua katika picha unategemea tu mwangaza wa eneo la uso linalofanana, tunaweza kudhani kuwa maelezo ya kuona yanaonyesha hali ya mwangaza au uwazi wa kila hatua kwa kiwango fulani cha usahihi. Kisha taswira inaeleweka kama kazi iliyo na mipaka ya viambishi viwili vya anga f(x, y), vinavyofafanuliwa kwenye ndege iliyo na mipaka ya mstatili Oxy na kuwa na seti fulani ya maadili yake. Kwa mfano, picha nyeusi na nyeupe inaweza kuwakilishwa kama f(x, y)?0, ambapo 0?x?a, 0?y?b na f(x, y) ni mwangaza (wakati mwingine huitwa msongamano wa macho au weupe. ) ya picha katika hatua (x, y); a - upana wa sura, b - urefu wa sura.

Kwa sababu ya ukweli kwamba kumbukumbu ya dijiti ya kompyuta ina uwezo wa kuhifadhi safu tu za data, picha inabadilishwa kwanza kuwa fomu ya nambari (matrix). Picha huingizwa kwenye kumbukumbu ya kompyuta kwa kutumia sensorer za video. Sensor ya video inabadilisha usambazaji wa macho wa mwangaza wa picha kuwa ishara za umeme na kisha kuwa nambari za dijiti. Kwa kuwa picha ni kazi ya vigezo viwili vya anga x na y, na ishara ya umeme ni kazi ya kutofautiana t (wakati), skanisho hutumiwa kwa uongofu. Kwa mfano, wakati wa kutumia kamera ya televisheni, picha inasomwa mstari kwa mstari, na ndani ya kila mstari, utegemezi wa mwangaza kwenye uratibu wa anga x hubadilishwa kuwa utegemezi wa uwiano wa amplitude ya ishara ya umeme kwa wakati t. Mpito kutoka mwisho wa mstari uliopita hadi mwanzo wa ijayo hutokea karibu mara moja.

Kuingiza picha kwenye kompyuta bila shaka huhusisha sampuli za picha pamoja na viwianishi vya anga x na y na kukadiria thamani ya mwangaza katika kila sehemu tofauti. Uadilifu hupatikana kwa kutumia gridi ya kuratibu iliyoundwa na mistari sambamba na shoka za x na y za mfumo wa kuratibu wa Cartesian. Katika kila nodi ya kimiani kama hicho, usomaji unafanywa kwa mwangaza au uwazi wa mtoaji wa habari inayoonekana inayoonekana, ambayo huhesabiwa na kuwasilishwa kwenye kumbukumbu ya kompyuta. Kipengele cha picha iliyopatikana katika mchakato wa sampuli ya picha inaitwa pixel. Kwa uwakilishi wa ubora wa picha ya halftone, viwango vya quantization 28 = 256 vinatosha, i.e. Pikseli 1 ya picha imesimbwa kwa baiti 1 ya maelezo.

Tabia kuu za picha ni:

1. Ukubwa wa picha;

2. Kina cha rangi;

3. Ruhusa.

2. Uwekaji msimbo wa picha ya rangi

Rangi ni jambo linalotokana na mwingiliano wa mwanga, kitu na kifaa (mtazamaji).

Imethibitishwa kwa majaribio kuwa rangi yoyote inaweza kuwakilishwa kama jumla ya idadi fulani ya rangi tatu zinazojitegemea kimstari.

Rangi tatu za kujitegemea kwa mstari huitwa rangi za msingi.

Wanafafanua mfumo wa kuratibu rangi (CCS) au mpango wa rangi, i.e. seti ya rangi za msingi ili kupata rangi zilizobaki.

Mipango ya rangi imegawanywa katika aina mbili: mipango ya rangi kutoka kwa mwanga uliotolewa na kutoka kwa mwanga uliojitokeza.

Mfumo wa RGB.

Rangi zake za msingi ni Nyekundu yenye urefu wa nm 700, Kijani yenye urefu wa nm 546.1, na Bluu yenye urefu wa nm 435.8. Mfumo wa RGB ni nyongeza.

Katika kesi hii, hii au rangi hiyo hupatikana kwa kuongeza rangi za msingi.

Mfumo wa CMYK.

Mfumo huu hutumiwa kuunda rangi za vitu vyenye rangi visivyo na mwanga ambavyo hufyonza sehemu ya wigo wa mwanga mweupe na kuakisi mnururisho uliobaki.

Mfumo wa CMYK ndio msingi wa uchapishaji wa rangi.

Inategemea mfano wa CMY wa kupunguza (Cyan - cyan, Magenta - magenta, Njano) - mfano wa kutoa rangi. Bado kuna rangi tatu za msingi hapa.

Ili kuboresha ubora wa picha iliyochapishwa, rangi nyeusi imeongezwa kwenye mfumo.

Mfumo wa HSB.

Mfumo huu unategemea matumizi ya Hue au Hue, Saturation na Lightness. Hue ina sifa ya kivuli maalum cha rangi, kueneza - ukubwa wake wa jamaa, mwangaza wa rangi - kiasi cha tint nyeusi kuzalisha picha nyeusi.

Tofauti ya mfumo huu ni mpango wa HSL.

3. Miundo ya picha

Kuna idadi kubwa ya fomati tofauti za faili za picha zinazotumika leo. Miundo inayotumika sana ni TIFF, GIF, JPEG, PNG na BMP.

Umbizo la TIFF (Tagget Image Format) ni mojawapo ya umbizo la kuaminika na linalofaa zaidi kuhifadhi picha za rangi zilizochanganuliwa za ubora wa juu. Inaweza kutumia ukandamizaji kwa kutumia algorithm ya LZW, i.e. inarejelea miundo ya hifadhi ya picha isiyo na hasara.

Umbizo la GIF (Graphics Interchange Format) lina paleti ya rangi ya rangi 256 na hutumia algoriti ya LZW isiyo na hasara kwa mgandamizo. Ikiwa idadi ya asili ya rangi ni zaidi ya 256, basi baadhi ya maelezo ya rangi yatapotea.

Umbizo la JPEG (Jiunge na Kikundi cha Wataalamu wa Wapiga Picha) unatokana na kanuni ya kubana picha ya jina moja. Ni algorithm ya ukandamizaji wa hasara na imeundwa kuhifadhi picha za rangi kamili na uwiano wa juu wa mgandamizo. Unapotumia umbizo, unaweza kudhibiti kigezo cha ubora kutoka 0 (ukandamizaji wa kiwango cha juu) hadi 100 (ubora wa juu). Uwiano wa ukandamizaji, kulingana na ubora, ni kutoka 10 hadi 1000. Umbizo hili mara nyingi hutumiwa kuhifadhi picha za picha za rangi kamili ambazo hazikusudiwa usindikaji zaidi.

Umbizo la PNG ni umbizo la raster la kuhifadhi maelezo ya picha ambayo hutumia ukandamizaji usio na hasara kwa kutumia kanuni ya Deflate. Umbizo la PNG limeundwa kuchukua nafasi ya umbizo la zamani na rahisi la GIF, na kwa kiasi fulani kuchukua nafasi ya umbizo ngumu zaidi la TIFF. Umbizo la PNG limewekwa kwa ajili ya matumizi kwenye Mtandao na uhariri wa michoro. Ina faida kuu zifuatazo juu ya GIF: karibu idadi isiyo na kikomo ya rangi kwenye picha; usaidizi wa hiari wa kituo cha alpha; uwezekano wa marekebisho ya gamma; skanning iliyoingiliana ya pande mbili.

Umbizo la BMP (BitMaP) ni mojawapo ya umbizo la asili la raster ya mfumo wa uendeshaji wa Windows. Ni mzuri kwa ajili ya kuhifadhi picha zote katika fomu indexed na palette ya hadi 256 rangi, na katika mfumo wa full-rangi RGB picha na kina rangi ya 24 bits. Inawezekana kutumia algorithm ya ukandamizaji wa RLE.

4. Aina za picha

4.1 Picha ya ngazi mbili (au monochromatic).

Katika kesi hii, saizi zote zinaweza kuwa na maadili mawili tu, ambayo kawaida huitwa nyeusi (binary moja, au rangi kuu) na nyeupe (zero ya binary, au rangi ya asili).

Kila pikseli katika picha kama hiyo inawakilishwa na biti moja, kwa hivyo ni aina rahisi zaidi ya picha.

1. Picha ya nusu. Picha kama hiyo yenye kiwango cha viwango vya 2n imeundwa na tabaka za n-bit.

2. Picha ya rangi. Picha kama hiyo imeelezewa katika muundo mmoja uliowasilishwa hapo juu.

3. Picha ya sauti inayoendelea. Aina hii ya picha inaweza kuwa na rangi nyingi zinazofanana (au halftones). Wakati saizi za jirani zinatofautiana na moja tu, karibu haiwezekani kwa jicho kutofautisha rangi zao. Matokeo yake, picha hizo zinaweza kuwa na maeneo ambayo rangi inaonekana kuendelea kubadilika kwa jicho. Katika kesi hii, pixel inawakilishwa na idadi kubwa (katika kesi ya halftone) au vipengele vitatu (katika kesi ya picha ya rangi). Picha za sauti zinazoendelea ni za asili au za asili (kinyume na mwanadamu, bandia); Kawaida hupatikana kwa kupiga picha na kamera ya dijiti au kwa skanning picha au michoro.

4. Picha ya toni tofauti (pia inaitwa sintetiki). Kawaida, picha hii hupatikana kwa njia ya bandia. Inaweza kuwa na rangi chache tu au rangi nyingi, lakini haina kelele na kasoro za picha ya asili. Mifano ya picha hizo ni pamoja na picha za vitu vilivyotengenezwa na binadamu, mashine au mitambo, kurasa za maandishi, ramani, michoro au picha kwenye onyesho la kompyuta. (Sio kila picha ghushi itakuwa ya sauti isiyo na maana. Picha inayozalishwa na kompyuta ambayo inakusudiwa kuonekana asili itakuwa na toni zinazoendelea licha ya asili yake ya kisanii.) Vitu, maandishi, na mistari iliyochorwa ina maumbo, mipaka iliyobainishwa vyema. Zinatofautiana sana na picha nyingine (chinichini). Pikseli za karibu za picha ya toni tofauti mara nyingi huwa moja au hutofautiana sana katika thamani. Picha kama hizo hazijashinikizwa vibaya kwa kutumia njia za upotezaji, kwani upotoshaji wa saizi chache za herufi huifanya isisomeke, na kubadilisha mtindo wa kawaida kuwa usioweza kutofautishwa kabisa. Picha za toni tofauti kawaida huwa na upungufu mwingi. Vipande vyake vingi vinarudiwa mara nyingi katika maeneo tofauti kwenye picha.

5. Picha zinazofanana na katuni. Hizi ni picha za rangi ambazo zina maeneo makubwa ya rangi sawa. Katika kesi hiyo, maeneo ya karibu yanaweza kutofautiana sana kwa rangi.

5. Mbinu za usindikaji wa picha

Uchambuzi wa awali wa picha unaturuhusu kuhitimisha kuwa:

Kwanza, picha nyingi, katika mchakato wa malezi yao (scan za kupiga picha, nk), huathiriwa na sababu kadhaa hasi (mtetemo wa kamera, harakati zisizo sawa za kipengele cha skanning, nk), na kusababisha ukungu, kuonekana kwa chini. -tofauti na maeneo yenye kelele nk.

Pili, idadi kubwa ya njia ni msingi wa kutambua vitu kwenye picha na kuchambua zaidi.

Kwa hivyo, kabla ya kuchambuliwa, picha lazima ipitie hatua ya utayarishaji, ambayo inajumuisha kufanya shughuli za kuboresha ubora wa kuona (kuongeza utofautishaji, kuondoa ukungu, kusisitiza kingo, kuchuja) na shughuli za kuunda utayarishaji wa picha (mgawanyiko, kuangazia mtaro) muonekano.

5.1 Kubadilisha utofautishaji

Utofautishaji hafifu kwa kawaida husababishwa na safu ndogo inayobadilika ya mabadiliko ya mwangaza, au kutofuata mstari kwa nguvu katika upitishaji wa viwango vya mwangaza. Njia rahisi zaidi ya utofautishaji ni uundaji wa utendakazi wa upangaji mwangaza fij hadi gij, yaani, gij = R(fij). Kwa mazoezi, ramani za kazi za mstari hutumiwa mara nyingi sana. Ikiwa, kutokana na mwanga usio na usawa wakati wa kupiga picha au kufanya picha, hali hutokea ambapo maeneo tofauti ya picha yana tofauti tofauti. Katika kesi hii, algoriti za utofautishaji zinazobadilika hutumiwa kubadilisha utofautishaji. Mfano ni algoriti ya kukuza utofautishaji wa ndani. Uchunguzi wa majaribio umethibitisha ufanisi wa juu wa algoriti ikiwa picha ina maeneo yenye utofautishaji wa juu sana au wa chini.

Kiini cha algorithm ni kwamba picha inachukuliwa kama seti ya idadi fulani ya maeneo ya ndani, na maeneo haya yanashughulikiwa kwa kuzingatia sifa zao. Usindikaji unafanywa kwa mlolongo ufuatao: sababu ya faida ya vipande vya wiani p huhesabiwa kando kwa kila eneo la picha. Na kila pixel ya picha inachakatwa. Ikiwa p ni sawa na moja, basi hakuna hatua inayofanyika kwenye eneo la ndani la picha (ikiwa p ni tofauti na moja, basi tofauti ya eneo la ndani huongezeka). Hapo awali, tofauti katika hatua iliyochambuliwa inayohusiana na ujirani wa karibu huhesabiwa. Kisha thamani ya kulinganisha ya jamaa huongezwa kwa umoja, na thamani inayotokana inakubaliwa katika algorithm kama kipengele cha faida p, na kisha kuhesabiwa kwa kutumia fomula:

utofautishaji wa mpango wa sehemu za picha

iko wapi thamani mpya ya mwangaza, ni mwangaza wa sasa wa picha iliyochakatwa, ni thamani ya juu inayohitajika ya mwangaza wa picha iliyochakatwa.

5.2 Kulainisha kelele

Picha zinakabiliwa na kelele ya ziada na ya msukumo wakati wa hatua ya dijiti. Kelele ya ziada ni mawimbi fulani ya nasibu ambayo huongezwa kwa ile muhimu katika utoaji wa mfumo; katika hali inayozingatiwa, kelele ya nyongeza hutokea kwa sababu ya ugumu wa filamu. Kelele ya msukumo, tofauti na kelele ya kuongeza, ina sifa ya athari yake kwenye ishara muhimu tu kwa pointi za mtu binafsi za random (thamani ya ishara inayotokana katika pointi hizi inachukua thamani ya random). Kelele ya msukumo ni ya kawaida kwa usambazaji wa picha za dijiti na mifumo ya uhifadhi. Kwa hiyo, katika mchakato wa maandalizi ya picha, tatizo la ukandamizaji wa kelele hutokea.

Njia rahisi zaidi ya kulainisha kelele kwenye picha ni laini, i.e. ikibadilisha thamani ya mwangaza ya kila kipengele na thamani ya wastani inayopatikana katika ujirani wake:

ambapo ni seti ya pointi mali ya jirani ya uhakika (ikiwa ni pamoja na uhakika yenyewe); - idadi ya pointi katika kitongoji.

Njia inayozingatiwa huondoa kwa ufanisi kelele ya ziada na ya msukumo katika kila kipengele cha picha.

5.3 Kusisitiza mipaka

Mbinu za kulainisha picha zinaweza kuondoa kelele kwa ufanisi sana. Hasara kubwa ya algoriti za kuzuia uwekaji picha ni ukungu wa picha (yaani, kupungua kwa uwazi wa vipengele vya contour), na kiasi cha ukungu kinalingana na ukubwa wa mask inayotumiwa kwa kulainisha. Kwa uchambuzi wa picha usio na utata, hasa wakati wa kuhesabu sifa za kijiometri za vipengele vya kimuundo, ni muhimu sana kuondoa blur kutoka kwa mtaro wa vitu kwenye picha, ambayo ni, kuongeza tofauti kati ya viwango vya mwangaza wa vipengele vya contour ya kitu na. mambo ya asili ya jirani. Katika kesi hii, wakati wa usindikaji wa picha, njia za kusisitiza contours hutumiwa.

Kwa kawaida, uboreshaji wa kingo hufanywa kwa kutumia uchujaji wa anga wa juu-frequency. Sifa za vichujio zimebainishwa kama kinyago ambacho thamani ya wastani lazima iwe sawa na sifuri.

Njia nyingine ya kusisitiza mipaka ni ile inayoitwa tofauti tuli. Kwa njia hii, thamani ya mwangaza wa kila kipengele imegawanywa na makadirio ya takwimu ya kupotoka kwa kawaida, yaani, (kupotoka kwa kawaida kunahesabiwa katika baadhi ya jirani ya kipengele).

5.4 Uchujaji wa wastani

Uchujaji wa wastani unahusu mbinu za usindikaji wa picha zisizo za mstari na ina faida zifuatazo juu ya kuchuja kwa mstari (utaratibu wa classical smoothing): huhifadhi mabadiliko makali (mipaka); kwa ufanisi hupunguza kelele ya msukumo; haibadilishi mwangaza wa usuli.

Uchujaji wa wastani unafanywa kwa kusogeza kipenyo fulani (kinyago) kando ya picha isiyo na maana na kubadilisha thamani ya kipengele cha kati cha barakoa na thamani ya wastani (thamani ya wastani ya mlolongo ulioamriwa) ya vipengele vya awali ndani ya shimo. Kwa ujumla, aperture inaweza kuwa na aina mbalimbali za maumbo, lakini katika mazoezi ya aperture mraba ya ukubwa

5.5 Mgawanyiko wa picha

Ugawaji wa picha unaeleweka kama mchakato wa kuigawanya katika sehemu za sehemu ambazo zina maana ya maana: vitu, mipaka yao au vipande vingine vya habari, sifa za kijiometri, nk. Katika kesi ya uwekaji wa njia za kupata picha otomatiki, ugawaji lazima uzingatiwe kama njia ya upataji wa picha. hatua kuu ya awali ya uchambuzi, ambayo inajumuisha kujenga picha za maelezo rasmi, ubora ambao kwa kiasi kikubwa huamua mafanikio ya kutatua tatizo la kutambua na kutafsiri vitu.

Kwa ujumla, mgawanyiko ni operesheni ya kugawa seti ndogo ya ndege ambayo kazi ya picha asili imefafanuliwa katika vijisehemu visivyo na tupu vilivyounganishwa kwa mujibu wa kihusishi fulani kilichofafanuliwa kwenye seti na kuchukua maadili ya kweli wakati jozi yoyote ya pointi kutoka kwa kila kikundi kidogo hutimiza baadhi ya kigezo cha homogeneity (kwa mfano, kigezo cha homogeneity kulingana na tathmini ya tofauti ya juu zaidi ya mwangaza wa pikseli mahususi na thamani ya wastani ya mwangaza inayokokotolewa juu ya eneo husika).

5.5.1 Mbinu za kugawanya vizingiti

Kuweka kizingiti ni mojawapo ya njia kuu za kugawanya picha kutokana na sifa zake angavu. Njia hii inalenga katika usindikaji wa picha, maeneo ya mtu binafsi ya homogeneous ambayo hutofautiana katika mwangaza wa wastani. Njia ya kawaida ya kugawanya kwa kuwekea kizingiti ni ugawaji wa sehemu mbili, yaani, tunapokuwa na aina mbili za maeneo yenye uwiano sawa.

Katika hali hii, picha inachakatwa pikseli kwa pikseli na ubadilishaji wa kila pikseli ya picha ya ingizo hadi towe hubainishwa kutoka kwa uhusiano:

iko wapi kigezo cha usindikaji kinachoitwa kizingiti, na ni viwango vya mwangaza vya pato. Usindikaji kwa saizi, nafasi ambayo katika picha haina jukumu lolote, inaitwa usindikaji wa uhakika. Viwango vina jukumu la alama. Zinatumika kuamua ni aina gani sehemu fulani imeainishwa kama: H0 au H1. Au wanasema kuwa H0 ina alama za mandharinyuma, na H1 ya pointi za riba. Kama sheria, viwango vinahusiana na viwango vya nyeupe na nyeusi. Tutaita madarasa H1 (aka darasa la kupendeza) darasa la kitu, na darasa H0 darasa la usuli.

Kwa kawaida, mgawanyiko unaweza kuwa sio tu wa binary, na katika kesi hii kuna zaidi ya madarasa mawili yaliyopo. Aina hii ya mgawanyiko inaitwa ngazi nyingi. Picha inayotokana sio ya binary, lakini inajumuisha sehemu za mwangaza tofauti. Rasmi, operesheni hii inaweza kuandikwa kama ifuatavyo:

iko wapi idadi ya viwango, na ni madarasa ya picha. Katika kesi hii, kwa kila darasa, kizingiti kinachofaa lazima kiweke ambacho kinaweza kutenganisha madarasa haya kutoka kwa kila mmoja. Picha za binary ni rahisi kuhifadhi na kuchakata kuliko picha zilizo na viwango vingi vya mwangaza.

Kitu ngumu zaidi juu ya kizingiti ni mchakato wa kuamua kizingiti yenyewe. Kizingiti mara nyingi huandikwa kama kazi ya fomu:

picha iko wapi, na ni tabia fulani ya sehemu ya picha, kwa mfano, mwangaza wa wastani katika kitongoji unaozingatia hatua hii.

Ikiwa thamani ya kizingiti inategemea tu, yaani, sawa kwa pointi zote za picha, basi kizingiti kama hicho kinaitwa kimataifa. Ikiwa kizingiti kinategemea kuratibu za anga, basi kizingiti hicho kinaitwa ndani. Ikiwa inategemea sifa, basi kizingiti kama hicho kinaitwa adaptive. Kwa hivyo, usindikaji unachukuliwa kuwa wa kimataifa ikiwa unatumika kwa picha nzima kwa ujumla, na ya ndani ikiwa inatumika kwa eneo fulani lililochaguliwa.

Mbali na tofauti zilizoorodheshwa kati ya algorithms, kuna njia nyingi zaidi. Wengi wao ni mchanganyiko wa wengine, lakini wengi wao, kwa njia moja au nyingine, ni msingi wa uchambuzi wa histogram ya picha ya asili, hata hivyo, kuna kimsingi mbinu nyingine ambazo haziathiri moja kwa moja uchambuzi wa histograms au. kuhama kutoka kwao hadi kwenye uchanganuzi wa kazi zingine.

5.5.2 Mbinu za maeneo ya kukua

Mbinu za kikundi hiki zinatokana na matumizi ya vipengele vya picha vya ndani. Wazo la njia ya ukuaji wa eneo ni kuchambua kwanza mahali pa kuanzia, kisha pointi zake za jirani, nk. kwa mujibu wa kigezo fulani cha homogeneity, na kuingizwa kwa pointi zilizochambuliwa katika kundi moja au nyingine (idadi ya pointi za kuanzia lazima iwe sawa na idadi ya maeneo ya homogeneous kwenye picha). Matoleo yenye ufanisi zaidi ya mbinu hayatumii saizi za kibinafsi kama sehemu ya kuanzia, lakini hugawanya picha katika idadi ya maeneo madogo. Kisha kila eneo huangaliwa kwa usawa, na ikiwa matokeo ya mtihani ni hasi, eneo linalolingana limegawanywa katika sehemu ndogo. Mchakato unaendelea mpaka maeneo yote yaliyochaguliwa yatapitisha mtihani wa homogeneity. Baada ya hayo, malezi ya maeneo yenye homogeneous huanza kutumia upanuzi.

Mgawanyiko wa kizingiti na mgawanyiko kulingana na kigezo cha homogeneity kulingana na wastani wa mwangaza mara nyingi haitoi matokeo yaliyohitajika. Sehemu hii kwa kawaida husababisha idadi kubwa ya maeneo madogo ambayo hayana mifano halisi kwenye picha. Matokeo ya ufanisi zaidi hupatikana kwa kugawanya kulingana na kigezo cha homogeneity kulingana na umbile (au vipengele vya texture).

5.5.3 Muhtasari

Sio kawaida kukutana na shida ya kupata perimeters, curvature, sababu za sura, eneo maalum la uso wa vitu, nk. Kazi zote zilizoorodheshwa ni kwa njia moja au nyingine zinazohusiana na uchambuzi wa vipengele vya contour ya vitu.

Njia za kutambua mtaro (mipaka) kwenye picha zinaweza kugawanywa katika vikundi kuu vifuatavyo:

njia za kuchuja kwa kiwango cha juu;

njia za utofautishaji wa anga;

Mbinu za makadirio ya kiutendaji.

Kawaida kwa njia hizi zote ni tabia ya kuzingatia mipaka kama eneo la mabadiliko makali katika kazi ya mwangaza wa picha; Kinachowatofautisha ni mfano wa hisabati ulioletwa wa dhana ya mpaka na algorithm ya kutafuta alama za mipaka.

Kwa mujibu wa kazi zilizopewa, mahitaji yafuatayo yanawekwa kwenye algorithms ya uchimbaji wa contour: contours iliyochaguliwa lazima iwe nyembamba, bila mapumziko na kufungwa. Kwa hivyo, mchakato wa kutambua mtaro ni ngumu kwa sababu ya hitaji la kutumia algorithms kwa kukonda na kuondoa mapengo. Walakini, hii haitoi kila wakati matokeo yaliyohitajika - katika hali nyingi, mtaro haujafungwa na, kwa sababu hiyo, haifai kwa idadi ya taratibu za uchambuzi.

Tatizo ambalo limetokea linaweza kutatuliwa kwa kuzunguka na algorithm ya kufuatilia makali kwa kutumia njia ya "mdudu", ambayo inakuwezesha kuonyesha mtaro uliofungwa wa vitu. Kiini cha algorithm ni kama ifuatavyo: hatua fulani ya mpaka ya kuanzia imechaguliwa kwenye kitu na contour inafuatiliwa kwa mlolongo hadi hatua ya kuanzia ifikiwe. Katika kesi ya kufuatilia contour saa, kufikia hatua ya kuanzia, harakati ya pixel-by-pixel inafanywa kwa haki ikiwa pixel iko nje ya kitu, na kushoto ikiwa iko kwenye kitu.

Contour iliyochaguliwa kwa njia hii ni msimbo wa mnyororo uliofungwa, i.e. mlolongo wa kuratibu za pointi za mipaka ya kitu, ambayo ni rahisi sana kwa kutatua matatizo uliyopewa.

5.5.4 Mbinu za msingi wa nguzo

Mbinu ya K-njia ni mbinu ya kurudia ambayo hutumiwa kugawanya picha katika makundi ya K. Algorithm ya msingi imepewa hapa chini:

1. Chagua vituo vya nguzo K, kwa nasibu au kulingana na baadhi ya heuristics;

2. Weka kila pikseli ya picha kwenye kundi ambalo katikati yake ni karibu zaidi na pikseli hii;

3. Kokotoa upya vituo vya nguzo kwa kufanya wastani wa saizi zote kwenye nguzo;

4. Rudia hatua ya 2 na 3 hadi muunganisho (kwa mfano, wakati saizi zinabaki kwenye nguzo moja).

Hapa, umbali kawaida huchukuliwa kama jumla ya miraba au maadili kamili ya tofauti kati ya pixel na kituo cha nguzo. Tofauti kwa kawaida inategemea rangi, mwangaza, umbile na eneo la pikseli, au jumla ya uzani wa vipengele hivi.

K inaweza kuchaguliwa kwa mikono, nasibu au kiurithi.

Algorithm hii imehakikishwa kuungana, lakini inaweza isilete suluhisho bora.

Ubora wa suluhisho inategemea seti ya awali ya nguzo na thamani ya K.

5.5.5 Mbinu za Histogram

Mbinu za msingi wa histogramu ni nzuri sana zikilinganishwa na njia zingine za kugawanya picha kwa sababu zinahitaji kupita moja tu kupitia saizi. Kwa njia hii, histogram inahesabiwa juu ya saizi zote kwenye picha na minima yake na maxima hutumiwa kupata makundi kwenye picha. Rangi au mwangaza unaweza kutumika kwa kulinganisha.

Uboreshaji wa njia hii ni kuitumia kwa kurudia kwa vikundi kwenye picha ili kuzigawanya katika vikundi vidogo. Mchakato unarudiwa kwa makundi madogo na madogo hadi hakuna makundi mapya yanayoonekana.

Upungufu mmoja wa njia hii ni kwamba inaweza kuwa na ugumu wa kupata minima muhimu na maxima kwenye picha. Katika mbinu hii ya uainishaji wa picha, metriki ya umbali na ulinganishaji wa eneo jumuishi ni sawa.

Mbinu zinazotegemea historia pia zinaweza kubadilishwa kwa haraka kwenye fremu nyingi huku zikidumisha faida yao ya kasi katika pasi moja. Histogram inaweza kujengwa kwa njia kadhaa wakati muafaka nyingi huzingatiwa. Njia sawa ambayo hutumiwa kwa sura moja inaweza kutumika kwa kadhaa, na mara tu matokeo yanapounganishwa, viwango vya chini na vya juu ambavyo vilikuwa vigumu kujitenga vinaonekana zaidi. Histogram pia inaweza kutumika kwa misingi ya per-pixel, ambapo maelezo hutumika kubainisha rangi inayojulikana zaidi kwa nafasi ya pikseli fulani. Mbinu hii hutumia mgawanyiko kulingana na vitu vinavyosogea na mazingira tulivu, ambayo hutoa aina nyingine ya sehemu muhimu katika ufuatiliaji wa video.

5.5.6 Mbinu za maeneo ya kukua

Ya kwanza ilikuwa njia ya kukua maeneo kutoka kwa mbegu. Njia hii inachukua picha na seti ya mbegu kama pembejeo. Mbegu huweka alama kwenye vitu vya kuangaziwa. Mikoa hukua hatua kwa hatua kwa kulinganisha saizi zote za jirani zisizo na mtu na eneo. Tofauti d kati ya mwangaza wa pikseli na mwangaza wa wastani wa eneo hutumika kama kipimo cha ufanano. Pikseli iliyo na tofauti ndogo kama hiyo huongezwa kwa eneo linalolingana. Mchakato unaendelea hadi saizi zote ziongezwe kwenye moja ya maeneo.

Njia ya kukua maeneo kutoka kwa mbegu inahitaji pembejeo ya ziada. Matokeo ya kugawanyika inategemea uchaguzi wa mbegu. Kelele kwenye picha inaweza kusababishwa na mbegu zilizowekwa vibaya. Njia ya kukua mikoa bila kutumia mbegu ni algorithm iliyobadilishwa ambayo hauhitaji mbegu wazi. Huanza na eneo moja - pikseli iliyochaguliwa hapa ina athari ndogo kwenye sehemu ya mwisho. Katika kila marudio, huzingatia saizi za jirani kwa njia sawa na njia ya kukuza eneo kwa kutumia mbegu. Lakini inatofautiana pale, kwamba ikiwa kiwango cha chini sio chini ya kizingiti maalum, basi kinaongezwa kwenye eneo linalofaa. Vinginevyo, pikseli inachukuliwa kuwa tofauti sana na maeneo yote ya sasa na eneo jipya linaundwa likiwa na pikseli hii.

Lahaja moja ya njia hii inategemea utumiaji wa mwangaza wa saizi. Wastani na tofauti za eneo na mwangaza wa pikseli ya kitahini hutumika kuunda takwimu za jaribio. Ikiwa takwimu ya jaribio ni ndogo ya kutosha, basi pikseli huongezwa kwa eneo na wastani na tofauti za eneo huhesabiwa upya. Vinginevyo, pikseli itapuuzwa na kutumika kuunda eneo jipya.

5.5.7 Mbinu za kukata grafu

Mbinu za kukata grafu zinaweza kutumika kwa ugawaji wa picha. Katika njia hizi, picha inawakilishwa kama grafu isiyo na uzani isiyoelekezwa. Kwa kawaida, pikseli au kikundi cha pikseli huhusishwa na kipeo, na uzani wa ukingo huamua mfanano au kutofanana kwa saizi za jirani. Kisha grafu hukatwa kulingana na kigezo kilichoundwa ili kupata makundi "nzuri". Kila sehemu ya vipeo (pikseli) zinazozalishwa na algoriti hizi huchukuliwa kuwa kitu kwenye picha.

5.5.8 Mgawanyiko wa mabonde ya maji

Katika mgawanyiko wa maji, picha inachukuliwa kama ramani ya eneo, ambapo maadili ya mwangaza yanawakilisha maadili ya urefu yanayohusiana na kiwango fulani. Ikiwa eneo hili limejaa maji, basi mabwawa yanaundwa. Wakati wa kujazwa zaidi na maji, mabwawa haya yanaunganishwa. Maeneo ambayo mabonde haya yanaunganishwa yamewekwa alama kama njia za maji.

Katika tafsiri hii, aina tatu za nukta huzingatiwa:

1. kiwango cha chini cha ndani;

2. pointi ziko kwenye mteremko, i.e. ambayo maji huteremka hadi kiwango cha chini sawa cha ndani;

3. pointi za juu za mitaa, i.e. ambapo maji hutiririka hadi zaidi ya kiwango kimoja cha chini.

Kutenganishwa kwa vitu vya kugusa kwenye picha ni mojawapo ya matatizo muhimu ya usindikaji wa picha. Mara nyingi kinachojulikana kama njia ya maji ya alama hutumiwa kutatua tatizo hili. Mabadiliko kwa kutumia njia hii yanahitaji kutambua "mabonde" na "mistari ya maji" kwenye picha kwa usindikaji wa maeneo ya ndani kulingana na sifa zao za mwangaza.

Njia ya maji ya alama ni mojawapo ya mbinu bora zaidi za kugawanya picha.

Wakati wa kutekeleza njia hii, taratibu zifuatazo za msingi hufanywa:

1. Chaguo za kukokotoa za sehemu huhesabiwa. Inahusu picha ambapo vitu viko katika maeneo ya giza na ni vigumu kuona.

2. Uhesabuji wa alama za mbele za picha. Zinakokotolewa kulingana na uchanganuzi wa muunganisho wa pikseli wa kila kitu.

3. Uhesabuji wa alama za nyuma. Zinawakilisha saizi ambazo si sehemu za vitu.

4. Marekebisho ya chaguo la kukokotoa la sehemu kulingana na thamani za eneo za alama za mandharinyuma na alama za mbele.

Mojawapo ya maombi muhimu zaidi ya kugawanyika kwa maji ni uteuzi wa vitu vya mwangaza sare (kwa namna ya matangazo) kutoka kwa nyuma ya picha. Maeneo yenye tofauti ndogo katika mwangaza yana maadili madogo ya gradient. Kwa hiyo, katika mazoezi, mara nyingi hali hutokea wakati njia ya sehemu ya maji inatumiwa si kwa picha yenyewe, bali kwa gradient yake.

6. Maelezo ya kazi

Karatasi hii inawasilisha algorithm ya kugawanya picha kwa kutumia njia ya umwagiliaji wa maji.

Kazi kuu zinazotumiwa wakati wa kuunda programu:

Kazi ya fspecial inajenga chujio cha pande mbili cha aina maalum;

Kazi ya imfilter ni operesheni ya morphological kwa ajili ya kujenga picha ya gradient;

Kazi ya maji hubadilisha maji kutoka kwa picha;

Chaguo za kukokotoa label2rgb hubadilisha taswira asili kuwa kijivujivu;

Chaguo za kukokotoa za imregionalmax huamua upeo wote wa ndani wa picha;

Chaguo za kukokotoa za imextendedmin hupata madoa "chini" kwenye picha yaliyo ndani zaidi ya kiwango fulani cha kizingiti ikilinganishwa na mazingira yao ya sasa;

Kitendaji cha imimposemin hurekebisha taswira ya kijivu ili minima ya ndani ipatikane tu katika nafasi zilizowekwa alama; maadili mengine ya pixel yanaongezwa ili kuondokana na pointi nyingine zote za chini;

Hufanya kazi kuunda upya na kutokamilika - ujenzi wa picha kwa kutumia shughuli za kimofolojia za ufunguzi (kufunga.)

7. Upimaji wa algorithm

Wakati wa kutekeleza njia hii, taratibu zifuatazo zilifanywa:

1. Soma picha na uibadilishe kwa rangi ya kijivu (Mchoro 1);

Kielelezo 1. Picha za awali (kushoto) na halftone (kulia).

2. Tunatumia maadili ya gradient kama kitendakazi cha sehemu (Mchoro 2);

Kielelezo 2. Maadili ya gradient.

3. Tunafanya shughuli za kimaadili kwenye picha (Mchoro 3);

Kielelezo 3. Matokeo ya kutumia shughuli za ufunguaji wa kimofolojia kupitia uundaji upya wa picha.

4. Kuhesabu alama za mbele na za nyuma za picha (Mchoro 4);

Kielelezo 4. Alama za mbele (kushoto) na mandharinyuma (kulia) za picha.

5. Tunajenga mipaka ya maji ya maji (Mchoro 5);

Kielelezo 5. Mipaka ya maji.

6. Onyesha alama na mipaka ya vitu kwenye picha ya halftone (Mchoro 6);

Kielelezo 6. Alama na mipaka ya kitu.

7. Onyesha matokeo ya sehemu kwa kutumia picha ya rangi (kushoto) na kutumia hali ya uwazi nusu (kulia).

Kielelezo 7 Matokeo ya sehemu.

Hitimisho

Katika karatasi hii, njia ya alama ya maji inatengenezwa kwa sehemu za picha.

Utumiaji wa moja kwa moja wa algoriti ya utengaji wa sehemu za maji husababisha ugawaji usiohitajika, kwa hivyo mbinu inayozingatia alama hutumiwa kudhibiti ugawaji usiohitajika.

Alama inawakilisha sehemu iliyounganishwa inayomilikiwa na picha. Pia, kabla ya kugawanyika kwa maji, usindikaji wa awali wa picha ulifanyika.

Orodha ya vyanzo vilivyotumika

1. Gonzalez R., Woods R. Usindikaji wa picha ya Dijiti. - M.: Tekhnosphere, 2005. 1072 p.

2. Pratt W. Usindikaji wa picha ya Dijiti. - M.: Mir, kitabu cha 1, 1982. 312 p.

3. Yaroslavsky L.P. Utangulizi wa usindikaji wa picha za kidijitali. - M: Sov. redio, 1979. 312 p.

4. Pratt W. Usindikaji wa picha ya Dijiti. - M: Amani, kitabu. 1, 1982. 480 uk.

5. http://www.ict.edu.ru/lib/

6. http://matlab.exponenta.ru/imageprocess/book2/76.php

7. Vizilter Yu.V. Usindikaji na uchanganuzi wa picha za dijiti kwa mifano katika LabVIEW na IMAQ Vision. - M: DMK, 2011. 464 p.

8. Gonzalez R., Woods R., Eddins S. Usindikaji wa picha wa kidijitali katika MATLAB. - M: Technosphere, 2006. 616 p.

9. http://matlab.exponenta.ru/imageprocess/book2/48.php

10. Salomon D. Mfinyazo wa data, picha na sauti. - M.: Tekhnosphere, 2004. 368 p.

Maombi

Tunahesabu picha

rgb=imread("C:\Users\Name\Documents\MATLAB\picture1.jpeg");

Wacha tuifikirie kama sauti ya nusu

I=rgb2gray(rgb);takwimu,imshow(I);

Kokotoa thamani ya gradient

hy=fspecial("sobel"); hx=hy";

Iy=imfilter(double(I), hy, "replicate");

Ix=imfilter(double(I), hx, "replicate");

gradmag=sqrt(Ix.^2+Iy.^2);

Wacha tutumie njia ya maji

L=mwaga wa maji(gradmag);Lrgb=label2rgb(L);

Shughuli za morphological

se = strel("disk",15);

Yaani = imerode(I, se);Iobr = imreconstruct(Yaani, mimi);

Iobrd = imdilate(Iobr, se);

Iobrcbr = kutojenga upya(kutokamilika(Iobrd), kutokamilika(Iobr));

Iobrcbr = kutokamilika(Iobrcbr);

Wacha tuhesabu maxima ya kawaida

fgm = imregionalmax(Iobrcbr);

Wacha tuweke alama kwenye picha

I2 = I;I2(fgm) = 255;

Inaondoa pikseli mahususi zilizotengwa

se2 = strel(wale(3,3));fgm2 = imclose(fgm, se2);fgm3 = imerode(fgm2, se2);

Ondoa idadi maalum ya saizi

fgm4 = bwareaopen(fgm3, 20);

Iweke juu ya picha asili

I3 = I;I3(fgm4) = 255;

Hebu tuhesabu alama za mandharinyuma

bw = im2bw(Iobrcbr, graythresh(Iobrcbr));

Kupima umbali wa mstari wa maji

D = bwdist(bw);DL = watershed(D);bgm = DL == 0;

takwimu, imshow(bgm), kichwa("bgm");

Kurekebisha thamani ya gradient

gradmag2 = imimposemin(gradmag, bgm | fgm4);

L = maji (gradmag2);

Weka alama na mipaka ya kitu kwenye picha chanzo

I4 = Mimi;I4(imdilate(L == 0, ndio(3, 3)) | bgm | fgm4) = 255;

Onyesha matokeo kwa kutumia picha ya rangi

Lrgb = label2rgb(L, "jet", "w", "shuffle");

Hebu tuweke alama na mipaka ya kitu kwenye picha inayong'aa

takwimu, imshow(I), shikilia

himage = imshow(Lrgb);

kuweka (himage, "AlphaData", 0.3);

kichwa ("Lrgb2");

Iliyotumwa kwenye Allbest.ru

...

Nyaraka zinazofanana

    Mifumo ya radiografia ya dijiti. Mbinu za uchanganuzi wa picha otomatiki katika mazingira ya MatLab. Uchambuzi wa picha ya X-ray. Kuchuja, sehemu, uboreshaji wa picha. Uwezo wa maunzi kwa urekebishaji wa awali wa picha.

    kazi ya kozi, imeongezwa 12/07/2013

    Uchaguzi wa njia za usindikaji wa picha na sehemu. Msingi wa hisabati wa vichungi vilivyotumika. histogram ya mwangaza wa picha. Utekelezaji wa programu ya mbinu tata ya usindikaji wa picha. Upimaji wa programu zilizotengenezwa.

    kazi ya kozi, imeongezwa 01/18/2017

    Utafiti na utekelezaji wa programu katika mazingira ya Matlab ya mbinu za usindikaji, uchambuzi, uchujaji, sehemu na kuboresha ubora wa picha za matibabu za X-ray. Mifumo ya radiografia ya dijiti. Maendeleo ya algoriti kulingana na takwimu.

    kazi ya kozi, imeongezwa 01/20/2016

    Mifumo ya kisasa ya uchambuzi wa muundo wa picha. Mifano ya mgawanyo wa unamu wa picha za kituo kimoja. Kwa kutumia vipengele vilivyopatikana kutoka kwa histogram ya mpangilio wa pili wa mwangaza kwa kuainisha picha za anga za spectrozonal.

    muhtasari, imeongezwa 01/15/2017

    Graphics za kompyuta na usindikaji wa picha na kompyuta za elektroniki ni kipengele muhimu zaidi cha matumizi ya kompyuta katika nyanja zote za shughuli za binadamu. Ukuzaji wa "mfumo mdogo wa sehemu za mstari", maelezo ya algorithm na mantiki.

    tasnifu, imeongezwa 06/23/2008

    Matatizo ya usindikaji wa picha za digital. Mbinu za kugawanya kizingiti. Uundaji wa mpango wa kuwakilisha mchoro kwa namna ya matrix na kutumia usindikaji wa kizingiti kwake. Ukuzaji wa kiolesura cha programu ya kupakia na kuchuja picha na kizingiti kilichochaguliwa.

    kazi ya kozi, imeongezwa 11/12/2012

    Maelezo ya njia za hisabati za kuwakilisha na usindikaji wa picha za picha. Maelezo ya programu jalizi iliyotengenezwa. Maelezo ya kazi na sifa zao. Uwasilishaji na usindikaji wa picha za picha. Matokeo ya majaribio ya programu.

    kazi ya kozi, imeongezwa 01/27/2015

    Tatizo la usindikaji wa picha za spatiotemporal mbele ya kelele na kuingiliwa. Njia za uboreshaji za usindikaji wa picha za anga. Muundo wa programu maalum, maelezo ya kiolesura chake cha mtumiaji. Makadirio ya gharama.

    tasnifu, imeongezwa 06/10/2013

    Utambuzi wa maelezo na mipaka yao kwenye picha. Utumiaji wa kanuni za viwango. Kwa kutumia algoriti za quantization za modi ya kujirekebisha katika hali ya kuchakata vipande kwa vipande. Uchujaji wa picha wa mstari wa jumla. Marejesho ya maeneo yaliyopotea.

    kazi ya kozi, imeongezwa 06/17/2013

    Mapitio ya programu iliyopo ya kugeuza kiotomati uteuzi wa kingo kwenye picha. Ukuzaji wa kielelezo cha hisabati kwa usindikaji wa picha na uchimbaji wa contour katika vivuli vya kijivu na programu ya algorithms ya usindikaji wa picha.

Moja ya kazi kuu za usindikaji wa picha na uchambuzi ni sehemu, i.e. kugawanya picha katika maeneo ambayo kigezo fulani cha homogeneity kinafikiwa, kwa mfano, kuangazia maeneo ya takriban mwangaza sawa kwenye picha. Dhana ya eneo la picha hutumiwa kufafanua kikundi madhubuti cha vipengele vya picha ambavyo vina kipengele fulani cha kawaida (mali).
Mojawapo ya njia kuu na rahisi ni kujenga sehemu kwa kutumia kizingiti. Kizingiti ni ishara (mali) ambayo husaidia kugawanya ishara inayotaka katika madarasa. Uendeshaji wa mgawanyiko wa kizingiti ni kulinganisha thamani ya mng'ao wa kila pikseli kwenye picha na thamani maalum ya kiwango cha juu.
Binarization

Uendeshaji wa kizingiti unaosababisha picha ya jozi huitwa binarization. Madhumuni ya operesheni ya uunganishaji wa mambo mawili ni kupunguza kwa kiasi kikubwa kiasi cha maelezo yaliyomo kwenye picha. Katika mchakato wa kufanya binarization, picha ya awali ya halftone, ambayo ina idadi fulani ya viwango vya mwangaza, inabadilishwa kuwa picha nyeusi na nyeupe, saizi ambazo zina maadili mawili tu - 0 na 1.

Ufungaji wa picha unaweza kufanywa kwa njia tofauti.

Binarization na kizingiti cha chini
Binarization na kizingiti cha chini
Binarization na kizingiti cha chini ni operesheni rahisi zaidi, ambayo hutumia thamani moja tu ya kizingiti:

Thamani zote badala ya kigezo huwa 1, katika kesi hii 255 (nyeupe) na maadili yote (amplitudes) ya saizi ambayo ni kubwa kuliko kizingiti t - 0 (nyeusi).

Binarization na kizingiti cha juu
Wakati mwingine unaweza kutumia tofauti ya njia ya kwanza, ambayo hutoa hasi ya picha iliyopatikana kupitia mchakato wa binarization. Uendeshaji wa ubinishaji na kizingiti cha juu:

Binarization na kizuizi mara mbili
Ili kuangazia maeneo ambayo thamani za mng'ao wa pikseli zinaweza kutofautiana ndani ya safu inayojulikana, uwekaji wa alama mbili na ukomo maradufu huletwa (t 1
Tofauti zingine zilizo na vizingiti pia zinawezekana, ambapo sehemu tu ya data hupitishwa (kichujio cha bendi ya kati).

Kizingiti kisicho kamili
Mabadiliko haya hutoa picha ambayo inaweza kuwa rahisi kuchanganua zaidi kwa sababu inakuwa haina usuli na maelezo yote yaliyopo kwenye picha asili.

Ubadilishaji wa Kizingiti cha Ngazi nyingi
Uendeshaji huu huunda picha ambayo si ya mfumo wa jozi, lakini inajumuisha sehemu zenye mwangaza tofauti.

Kuhusu binary, kimsingi ndivyo hivyo. Ingawa tunaweza kuongeza kuwa kuna ya kimataifa, ambayo hutumiwa kwa picha nzima, na pia kuna ya ndani, ambayo inachukua sehemu ya picha (picha).

Kizingiti cha ndani
Mbinu ya Otsa
Njia hiyo hutumia histogram ya usambazaji wa maadili ya mwangaza wa saizi mbaya za picha. Histogram huundwa kwa kutumia thamani p i =n i /N, ambapo N ni jumla ya idadi ya saizi kwenye picha, n i ni idadi ya saizi zilizo na kiwango cha mwangaza i. Masafa ya mwangaza yamegawanywa katika madarasa mawili kwa kutumia kizingiti cha kiwango cha mwangaza k,k - thamani kamili kutoka 0 hadi L. Kila darasa linalingana na masafa ya jamaa ω 0 ω 1:

Viwango vya wastani kwa kila darasa la picha mbili:
Ifuatayo, dhamana ya juu ya kutathmini ubora wa kugawanya picha katika sehemu mbili imehesabiwa:
ambapo (σ cl)2=ω 0 ω 1 (μ 1 -μ 0) 2 ni tofauti kati ya darasa, na (σ jumla) 2 ni tofauti ya jumla ya picha nzima.

Kizingiti kulingana na upinde rangi wa mwangaza
Hebu tufikiri kwamba picha iliyochambuliwa inaweza kugawanywa katika madarasa mawili - vitu na historia. Algorithm ya kuhesabu thamani ya kizingiti ina hatua 2 zifuatazo:
1. Moduli ya gradient ya mwangaza imedhamiriwa kwa kila pikseli
Picha

2. Hesabu ya kizingiti:
Jumla
Nilishiriki kwa furaha niliyopata na wewe; katika siku zijazo, nikifaulu na kuwa na wakati, nitajaribu kutekeleza baadhi ya algoriti. Hii ni sehemu ndogo tu ya kila kitu kilichopo leo, lakini nina furaha kushiriki hii pia.
Asante kwa umakini wako. 1

Njia za hisabati za kugawanya picha za kiwango cha Dicom zinazingatiwa. Mbinu za hisabati za ugawaji wa picha za kiwango cha Dicom zinatengenezwa kwa matatizo ya utambuzi wa picha za kimatibabu. Utambuzi wa magonjwa hutegemea sifa za mtafiti na inamhitaji kuibua kutekeleza sehemu, na njia za hesabu za usindikaji wa picha mbaya ni zana ya utambuzi huu. Kuchakata picha za kimatibabu zilizopatikana na maunzi bila kuchakata mapema data ya picha katika hali nyingi hutoa matokeo yasiyo sahihi. Taratibu za kutoa mtaro wa kitu kwa kutumia mbinu ya Canny na algoriti za ziada za uchakataji wa picha mbaya zilitekelezwa. Matokeo ya utafiti hufanya iwezekanavyo kuhesabu mali ya morphometric, kijiometri na histogram ya malezi katika mwili wa binadamu muhimu kwa matibabu zaidi ya mgonjwa na kutoa matibabu ya ufanisi ya matibabu. Kanuni zilizotengenezwa za uchambuzi wa kiotomatiki wa kompyuta wa picha za matibabu hutumiwa kwa ufanisi kwa kazi za uendeshaji za uchunguzi wa matibabu wa taasisi maalum ya oncological, na kwa madhumuni ya elimu.

utambuzi wa muundo

mgawanyiko wa vitu vya riba

picha za matibabu

1. Vlasov A.V., Tsapko I.V. Marekebisho ya algorithm ya Canny kama inavyotumika kwa usindikaji wa picha za radiografia // Bulletin ya Sayansi ya Siberia. - 2013. - No. 4 (10). - ukurasa wa 120-127.

2. Gonzales R., Woods R. Usindikaji wa picha ya Dijiti. - M.: Tekhnosphere, 2006. - P. 1072.

3. Kulyabichev Yu.P., Pivtoratskaya S.V. Mbinu ya kimuundo ya uteuzi wa vipengele katika mifumo ya utambuzi wa muundo // Sayansi asilia na kiufundi. - 2011. - Nambari 4. - P. 420-423.

4. Nikitin O.R., Pasechnik A.S. Contouring na mgawanyiko katika kazi za utambuzi otomatiki wa pathologies // Mbinu na vifaa vya kupitisha na kusindika habari. - 2009. - Nambari 11. - P. 300-309.

5. Canny J. Mbinu ya Kihesabu ya kugundua makali // Shughuli za IEEE kwenye uchanganuzi wa muundo na akili ya mashine. - 1986. - Nambari 6. - P.679-698.

6. DICOM - Njia ya ufikiaji: http://iachel.ru/ zob23tai-staihroe/ DICOM

7. Doronicheva A.V., Sokolov A.A., Savin S.Z. Kutumia opereta wa Sobel kwa ugunduzi wa kingo kiotomatiki katika picha za matibabu // Jarida la Hisabati na Sayansi ya Mfumo. - 2014. - Juz. 4, Nambari 4 - P. 257-260.

8. Jähne B., Scharr H., Körkel S. Kanuni za muundo wa chujio // Kitabu cha Maono ya Kompyuta na Maombi. Vyombo vya Habari vya Kielimu. - 1999. - 584 p.

Moja ya maeneo ya kipaumbele kwa maendeleo ya dawa nchini Urusi ni mpito kwa teknolojia yake ya ubunifu kwa usajili wa elektroniki, uhifadhi, usindikaji na uchambuzi wa picha za matibabu za viungo na tishu za wagonjwa. Hii inasababishwa na ongezeko la kiasi cha habari iliyotolewa kwa namna ya picha wakati wa kuchunguza magonjwa muhimu ya kijamii, hasa magonjwa ya oncological, matibabu ambayo katika hali nyingi ina matokeo tu katika hatua za mwanzo.

Wakati wa kufanya uchunguzi wa uchunguzi wa kiwango cha DICOM, eneo la patholojia limedhamiriwa, na wakati hali yake ya patholojia imethibitishwa, tatizo la uainishaji linatatuliwa: mgawo kwa moja ya aina inayojulikana au kitambulisho cha darasa jipya. Ugumu wa wazi ni kasoro katika picha inayosababisha, ambayo husababishwa na mapungufu ya kimwili ya vifaa na mipaka ya kuruhusiwa ya mzigo kwenye mwili wa mwanadamu. Matokeo yake, ni zana za programu ambazo zina jukumu la usindikaji wa ziada wa picha ili kuongeza thamani ya uchunguzi kwa daktari, kuwasilisha kwa fomu rahisi zaidi, na kuonyesha jambo kuu kutoka kwa kiasi kikubwa cha data iliyopokelewa.

Madhumuni ya utafiti. Mbinu za hisabati za ugawaji wa picha za kiwango cha Dicom zinatengenezwa kwa matatizo ya utambuzi wa picha za kimatibabu. Utambuzi wa magonjwa hutegemea sifa za mtafiti na inamhitaji kuibua kutekeleza sehemu, na njia za kihesabu za usindikaji wa picha mbaya ni zana ya utambuzi huu. Kuchakata picha za kimatibabu zilizopatikana na maunzi bila kuchakata mapema data ya picha katika hali nyingi hutoa matokeo yasiyo sahihi. Hii ni kutokana na ukweli kwamba picha zilizopokelewa awali zilikuwa na ubora usioridhisha.

Nyenzo na mbinu za utafiti

Tomogram zilizohesabiwa za wagonjwa katika taasisi maalum ya kliniki hutumiwa kama nyenzo za utafiti. Kabla ya kuchambua data halisi ya picha, picha lazima iwe tayari au kuchakatwa. Hatua hii hutatua tatizo la kuboresha ubora wa kuona wa picha za matibabu. Ni muhimu kugawanya mchakato mzima wa usindikaji wa picha katika makundi mawili makubwa: mbinu ambazo pembejeo na matokeo ni picha; mbinu ambapo data ya pembejeo ni picha, na kama matokeo ya kazi, data ya pato ni ishara na sifa zinazotambuliwa kwa misingi ya data ya pembejeo. Algorithm hii haifikiri kwamba kila moja ya taratibu hapo juu inatumika kwa picha. Usajili wa data ni wa kwanza wa michakato, iliyoonyeshwa kwenye Mtini. 1.

Mchele. 1. Hatua kuu za usindikaji wa digital wa data ya graphic

Usajili unaweza kuwa rahisi sana, kama katika mfano ambapo picha asili ni digital. Kwa kawaida, hatua ya usajili wa picha inahusisha usindikaji wa awali wa data, kwa mfano, kuongeza picha. Uboreshaji wa picha ni mojawapo ya maeneo rahisi na ya kuvutia zaidi ya usindikaji wa awali. Kama sheria, njia za kuboresha yaliyomo kwenye picha imedhamiriwa na kazi ya kupata saizi zisizoweza kutofautishwa au kuongeza tofauti katika picha asili. Mojawapo ya njia za kawaida za kuboresha maudhui ya habari ya picha ni kuimarisha tofauti ya picha, kwani mipaka ya kitu cha kupendeza inaimarishwa. Inapaswa kuzingatiwa kuwa kuboresha ubora wa picha ni kwa kiasi fulani kazi ya kujitegemea katika usindikaji wa picha. Marejesho ya picha - kazi hii pia inahusu kuboresha ubora wa kuona wa data. Mbinu za kurejesha picha zinatokana na miundo ya hisabati na inayowezekana ya urekebishaji wa data ya picha. Usindikaji wa picha kama hatua unapaswa kutengwa na dhana ya usindikaji wa picha kama mchakato mzima wa kubadilisha picha na kupata data fulani. Mgawanyiko, au mchakato wa kutoa vitu vya kupendeza, hugawanya picha katika vitu vya sehemu au sehemu. Uchimbaji wa kiotomatiki wa vitu vya kupendeza ni kazi yenye changamoto katika uchakataji wa picha dijitali. Ugawaji wa kina sana hufanya uchakataji wa picha kuwa mgumu linapokuja suala la kuangazia vitu vya kupendeza. Lakini mgawanyiko usio sahihi au usio na maelezo ya kutosha katika kazi nyingi husababisha makosa katika hatua ya mwisho ya usindikaji wa picha. Uwasilishaji na maelezo ya data ya picha kwa kawaida hufuata hatua ya kuangazia vitu vinavyovutia kwenye picha, matokeo ambayo katika hali nyingi huwa na saizi mbichi zinazounda mipaka ya eneo au kuunda saizi zote za maeneo. Kwa chaguzi kama hizo, inahitajika kubadilisha data kuwa fomu inayopatikana kwa uchambuzi wa kompyuta. Utambuzi wa muundo ni mchakato ambao hutoa kitambulisho kwa kitu (kama vile "radius") kulingana na maelezo yake. Wacha tuamue uhusiano kati ya msingi wa maarifa na moduli za usindikaji wa picha. Msingi wa maarifa (yaani, taarifa kuhusu eneo la tatizo) kwa namna fulani umesimbwa kwa njia fiche ndani ya mfumo wa uchakataji wa picha yenyewe. Ujuzi huu unaweza kuwa rahisi sana, kama vile dalili ya kina ya vitu kwenye picha ambapo eneo la maslahi linapaswa kuwa. Ujuzi huo hufanya iwezekanavyo kupunguza eneo la utafutaji. Msingi wa maarifa hudhibiti utendakazi wa kila moduli ya uchakataji na mwingiliano wao, kama inavyoonyeshwa kwenye Mtini. 1 yenye mishale iliyoelekezwa pande mbili kati ya moduli na msingi wa maarifa. Matokeo ya kuokoa na uchapishaji mara nyingi pia inahitaji matumizi ya mbinu maalum za usindikaji wa picha. Hasara ya hatua hizi za usindikaji wa picha katika mfumo wa usindikaji wa picha ya matibabu ni kwamba makosa yaliyoundwa katika hatua za kwanza za usindikaji, kwa mfano wakati wa kuingia au kuonyesha vitu vya kupendeza kwenye picha, inaweza kusababisha kushindwa kwa uainishaji sahihi. Usindikaji wa data unafanywa kwa mfululizo, na katika hali nyingi hakuna uwezekano wa kurudi kwenye hatua za awali za usindikaji, hata kama matokeo yasiyo sahihi yalipatikana hapo awali. Njia katika hatua ya usindikaji wa awali ni tofauti kabisa - kutambua vitu vya kupendeza, kuzidisha, kurekebisha rangi, kurekebisha azimio la anga, kubadilisha tofauti, nk. Moja ya hatua za kipaumbele katika hatua ya kuchakata picha ni kurekebisha utofautishaji na mwangaza. Kwa kutumia masks sahihi, inawezekana kuchanganya hatua mbili (kuchuja na kutayarisha) ili kuongeza kasi ya uchambuzi wa data. Matokeo ya mwisho ya uchambuzi wa picha katika hali nyingi imedhamiriwa na kiwango cha ubora wa sehemu, na kiwango cha undani wa vitu vya kupendeza hutegemea kazi maalum inayohusika. Kwa sababu hii, njia tofauti au algorithm haijatengenezwa ambayo inafaa kwa kutatua matatizo yote ya kutambua vitu vya riba. Maeneo ya muhtasari yanalenga kuangazia vitu vilivyo na sifa maalum katika picha. Vitu hivi, kama sheria, vinahusiana na vitu au sehemu zao ambazo wataalamu wa uchunguzi huweka lebo. Matokeo ya contouring ni picha ya binary au hierarchical (multiphase), ambapo kila ngazi ya picha inalingana na darasa fulani la vitu vilivyochaguliwa. Mgawanyiko ni hatua ngumu katika usindikaji na uchambuzi wa data ya matibabu kutoka kwa tishu za kibaolojia, kwani ni muhimu kufafanua maeneo ambayo yanahusiana na vitu au miundo tofauti katika viwango vya histological: seli, organelles, mabaki, nk. Hii inaelezwa na kutofautiana kwa juu ya vigezo vyao, kiwango cha chini cha tofauti ya picha zilizochambuliwa na uhusiano wa kijiometri tata wa vitu. Katika hali nyingi, ili kupata matokeo yenye ufanisi zaidi, ni muhimu kutumia mara kwa mara njia tofauti za kugawanya vitu vya kupendeza kwenye picha. Kwa mfano, kuamua mipaka ya kitu cha kupendeza, njia ya gradient ya morphological hutumiwa, baada ya hapo mgawanyiko wa kizingiti unafanywa kwa maeneo ambayo yanafaa kwa tofauti ndogo katika sifa za mwangaza. Ili kuchakata picha ambazo maeneo yenye homogeneous yanatofautiana katika mwangaza wa wastani, mbinu ya sehemu ya Canny ilichaguliwa; utafiti unafanywa kwenye mfano wa kimatibabu. Wakati wa kutambua picha halisi za kliniki, mfano hautumiki vizuri. Uzoefu wa vitendo na maoni ya wataalam juu ya matokeo ya uchambuzi wa picha ni muhimu sana. Kwa picha ya mtihani, picha ya tomography iliyohesabiwa ilichaguliwa, ambapo kitu cha kupendeza kilichoonyeshwa kwenye Mchoro 1 kinapatikana kwa uwazi. 2.

Mchele. 2. Picha ya tomografia iliyohesabiwa na kitu cha kupendeza

Ili kutekeleza sehemu, tunatumia njia ya Canny. Mbinu hii ni sugu kwa kelele na katika hali nyingi inaonyesha matokeo bora ikilinganishwa na njia zingine. Njia ya Canny inajumuisha hatua nne:

1) usindikaji wa awali - kufuta picha (tunapunguza utawanyiko wa kelele ya kuongeza);

2) utofautishaji wa picha iliyofifia na hesabu inayofuata ya maadili ya gradient katika mwelekeo wa x na y;

3) utekelezaji wa ukandamizaji usio wa juu katika picha;

4) usindikaji wa picha ya kizingiti.

Katika hatua ya kwanza ya algorithm ya Canny, picha inarekebishwa kwa kutumia mask na chujio cha Gaussian. Mlinganyo wa usambazaji wa Gaussian katika vipimo vya N una fomu

au katika kesi maalum kwa vipimo viwili

(2)

ambapo r ni radius ya blur, r 2 = u 2 + v 2; σ ni mkengeuko wa kawaida wa usambazaji wa Gaussian.

Ikiwa tunatumia vipimo 2, basi fomula hii inabainisha uso wa miduara makini yenye usambazaji wa Gaussian kutoka sehemu ya kati. Pikseli zilizo na usambazaji usio na sufuri hutumika kubainisha matrix ya ubadilishaji ili kutumika kwa picha asili. Thamani ya kila pikseli inakuwa wastani wa uzani wa kitongoji. Thamani ya pikseli ya awali inachukua uzani wa juu zaidi (ina thamani ya juu ya Gaussian), na saizi za jirani huchukua uzani wa chini, kulingana na umbali wao. Kinadharia, usambazaji katika kila nukta kwenye picha haupaswi kuwa sufuri, ambayo hufuata hesabu ya uzani kwa kila pikseli kwenye picha. Lakini katika mazoezi, wakati wa kuhesabu makadirio ya kipekee ya kazi ya Gaussian, saizi kwa mbali> 3σ hazizingatiwi, kwani ni ndogo sana. Kwa hivyo, programu ya kuchakata picha inahitaji kukokotoa × matrix ili kuhakikisha kuwa makadirio ya usambazaji wa Gaussian ni sahihi vya kutosha.

Matokeo ya utafiti na majadiliano

Matokeo ya chujio cha Gaussian na data sawa na 5 kwa ukubwa wa mask ya Gaussian na 1.9 kwa thamani ya parameter σ - kupotoka kwa kiwango cha usambazaji wa Gaussian, imewasilishwa kwenye Mtini. 3. Hatua inayofuata ni kutafuta gradient ya eneo la kupendeza kwa kuhusisha picha iliyolainishwa na derivative ya kazi ya Gaussian katika maelekezo ya wima na ya mlalo ya vekta.

Wacha tutumie opereta wa Sobel kutatua shida hii. Mchakato unategemea tu kuhamisha kinyago cha kichujio kutoka kwa pikseli hadi pikseli kwenye picha. Katika kila pikseli (x, y), jibu la kichujio linakokotolewa kutoka kwa miunganisho iliyobainishwa awali. Hii inasababisha uteuzi wa makali ya awali. Hatua inayofuata ni kulinganisha kila pikseli na majirani zake kando ya mwelekeo wa gradient na kuhesabu upeo wa ndani. Taarifa kuhusu mwelekeo wa gradient ni muhimu ili kuondoa saizi karibu na mpaka bila kuvunja mpaka yenyewe karibu na upeo wa ndani wa gradient, ambayo ina maana kwamba saizi za mpaka huamua pointi ambazo upeo wa ndani wa gradient hufikiwa. mwelekeo wa vector ya gradient. Njia hii inaweza kupunguza kwa kiasi kikubwa ugunduzi wa kingo za uwongo na kuhakikisha unene wa mpaka wa kitu wa pixel moja, ambayo inathibitishwa kwa nguvu na utekelezaji wa programu ya algorithm ya kugawanya kipande cha patiti ya tumbo kwenye picha iliyokadiriwa ya tomografia, iliyowasilishwa hapa chini. Mtini. 4.

Hatua inayofuata ni kutumia kizingiti kuamua mahali ambapo mpaka upo katika kila pikseli iliyotolewa kwenye picha. Chini ya kizingiti, kingo zaidi kutakuwa na kitu cha kupendeza, lakini matokeo yanayoweza kuathiriwa zaidi yatakuwa kelele, na kuelezea data ya picha ya nje. Kizingiti cha juu kinaweza kupuuza kingo dhaifu za eneo au kupakana na maeneo kadhaa. Mpangilio wa mpaka unatumika kwa vizingiti viwili vya kuchuja: ikiwa thamani ya pikseli iko juu ya mpaka wa juu, inachukua dhamana ya juu (mpaka unachukuliwa kuwa wa kuaminika), ikiwa chini yake, pikseli imekandamizwa, pointi na thamani inayoanguka ndani ya masafa kati ya vizingiti. kuchukua thamani ya wastani isiyobadilika. Pikseli hujiunga na kikundi ikiwa itaigusa katika moja ya pande nane. Miongoni mwa faida za njia ya Canny ni kwamba wakati wa usindikaji wa picha inafanana na vipengele vya sehemu. Hii inafanikiwa kwa kuanzisha kiwango cha ngazi mbili cha kukata data isiyohitajika. Viwango viwili vya kizingiti vinafafanuliwa, moja ya juu - p ya juu na ya chini - p chini, ambapo p juu > p chini. Thamani za pikseli juu ya thamani ya juu ya p zimeteuliwa kama zinazolingana na mpaka (Mchoro 5).

Mchele. 3. Kutumia kichujio cha Gaussian kwenye CT scan na kitu cha kupendeza

Mchele. 4. Ukandamizaji wa yasiyo ya maxima katika picha iliyogawanywa

Mchele. 5. Utumiaji wa kanuni ya sehemu ya Canny yenye viwango tofauti vya kizingiti

Mazoezi yanaonyesha kuwa kuna muda fulani juu ya kiwango cha kizingiti cha unyeti, ambayo thamani ya eneo la kitu cha kupendeza haibadilika, lakini wakati huo huo kuna kiwango fulani cha kizingiti, baada ya hapo " kutofaulu” kwa njia ya uainishaji hubainika na matokeo ya kubainisha maeneo ya maslahi huwa hayana uhakika. Huu ni upungufu wa algoriti ambayo inaweza kulipwa kwa kuchanganya algoriti ya Canny na ubadilishaji wa Hough ili kutafuta miduara. Mchanganyiko wa algorithms hukuruhusu kutambua wazi vitu vya kusoma, na pia kuondoa mapungufu kwenye mtaro.

hitimisho

Kwa hivyo, tatizo la kuunda sifa za kawaida za vitu vya patholojia katika picha za matibabu zimetatuliwa, ambayo itafanya iwezekanavyo katika siku zijazo kufanya uchambuzi wa uendeshaji wa data juu ya patholojia maalum. Vigezo muhimu vya kubainisha tathmini ya ubora wa sehemu ni uwezekano wa kengele ya uwongo na kutofaulu. Vigezo hivi huamua matumizi ya otomatiki ya njia ya uchambuzi. Mgawanyiko ni mojawapo ya muhimu zaidi wakati wa kutatua tatizo la uainishaji na utambuzi wa vitu kwenye picha. Mbinu za upangaji kulingana na kugawanya mipaka ya maeneo - Sobel, Canny, Prewit, Laplassian - zimefanyiwa utafiti na kutumika vizuri. Njia hii imedhamiriwa na ukweli kwamba mkusanyiko wa tahadhari ya mtu wakati wa kuchambua picha mara nyingi huzingatia mipaka kati ya kanda ambazo zinafanana zaidi au chini katika mwangaza. Kulingana na hili, contours mara nyingi hutumika kama msingi wa kufafanua sifa mbalimbali za kutafsiri picha na vitu ndani yao. Kazi kuu ya algorithms ya kugawa maeneo ya kupendeza ni ujenzi wa picha ya binary ambayo ina maeneo yaliyofungwa ya data kwenye picha. Kuhusu picha za matibabu, maeneo haya ni mipaka ya viungo, mishipa, MCC, na uvimbe. Kanuni zilizotengenezwa za uchambuzi wa kiotomatiki wa kompyuta wa picha za matibabu hutumiwa kwa ufanisi wote kwa kazi za uendeshaji za uchunguzi wa matibabu wa taasisi maalum ya oncological, na kwa madhumuni ya elimu.

Utafiti kwa msaada wa mpango wa Mashariki ya Mbali, ruzuku No. 15-I-4-014o.

Wakaguzi:

Kosykh N.E., Daktari wa Sayansi ya Matibabu, Profesa, Mtafiti Mkuu, Kituo cha Kompyuta, Tawi la Mashariki ya Mbali la Chuo cha Sayansi cha Kirusi, Khabarovsk;

Levkova E.A., Daktari wa Sayansi ya Tiba, Profesa, Chuo Kikuu cha Usafiri cha Jimbo la Mashariki ya Mbali, Khabarovsk.

Kiungo cha bibliografia

Doronicheva A.V., Savin S.Z. NJIA YA UTEKAJI WA PICHA ZA MATIBABU // Utafiti wa Msingi. - 2015. - No. 5-2. – Uk. 294-298;
URL: http://fundamental-research.ru/ru/article/view?id=38210 (tarehe ya ufikiaji: 04/06/2019). Tunakuletea magazeti yaliyochapishwa na shirika la uchapishaji "Chuo cha Sayansi ya Asili"