Kupima taarifa mikabala ya kisintaksia ya kisemantiki na kipragmatiki. Kipimo cha kisintaksia cha habari. Taarifa na data

Mada 2. Misingi ya uwakilishi na usindikaji wa habari kwenye kompyuta

Fasihi

1. Informatics katika Uchumi: Kitabu cha kiada/Mh. B.E. Odintsova, A.N. Romanova. - M.: Kitabu cha kiada cha Chuo Kikuu, 2008.

2. Sayansi ya kompyuta: Kozi ya msingi: Kitabu cha kiada/Mh. S.V. Simonovich. - St. Petersburg: Peter, 2009.

3. Sayansi ya kompyuta. Kozi ya jumla: Kitabu cha kiada/Mwandishi-Mwenza: A.N. Guda, M.A. Butakova, N.M. Nechitailo, A.V. Chernov; Chini ya jumla mh. KATIKA NA. Kolesnikova. - M.: Dashkov na K, 2009.

4. Informatics kwa wachumi: Kitabu cha kiada/Mh. Matyushka V.M. - M.: Infra-M, 2006.

5. Taarifa za Kiuchumi: Utangulizi wa Uchambuzi wa Uchumi mifumo ya habari.- M.: INFRA-M, 2005.

Vipimo vya habari (kisintaksia, kisemantiki, kipragmatiki)

Mbinu mbalimbali zinaweza kutumika kupima habari, lakini zinazotumika sana ni takwimu(uwezekano), semantiki na uk pragmatiki mbinu.

Takwimu(uwezekano) njia ya kupima taarifa ilitengenezwa na K. Shannon mwaka wa 1948, ambaye alipendekeza kuzingatia kiasi cha habari kama kipimo cha kutokuwa na uhakika wa hali ya mfumo, ambayo huondolewa kutokana na kupokea taarifa. Usemi wa kiasi cha kutokuwa na uhakika unaitwa entropy. Ikiwa, baada ya kupokea ujumbe fulani, mwangalizi alipata Taarifa za ziada kuhusu mfumo X, basi kutokuwa na uhakika kumepungua. Kiasi cha ziada cha habari iliyopokelewa hufafanuliwa kama:

iko wapi kiasi cha ziada cha habari kuhusu mfumo X, imepokelewa kwa njia ya ujumbe;

Kutokuwa na uhakika wa awali (entropy) ya mfumo X;

Kutokuwa na uhakika (entropy) ya mfumo X, kutokea baada ya kupokea ujumbe.

Ikiwa mfumo X inaweza kuwa katika moja ya majimbo tofauti, idadi ambayo n, na uwezekano wa kupata mfumo katika kila moja yao ni sawa na jumla ya uwezekano wa majimbo yote ni sawa na moja, basi entropy inahesabiwa kwa kutumia formula ya Shannon:

iko wapi entropy ya mfumo X;

A- msingi wa logarithm, ambayo huamua kitengo cha kipimo cha habari;

n- idadi ya majimbo (maadili) ambayo mfumo unaweza kuwa.

Entropy ni kiasi chanya, na kwa kuwa uwezekano daima huwa chini ya moja, na logarithm yao ni hasi, kwa hivyo ishara ya minus katika fomula ya K. Shannon hufanya entropy kuwa chanya. Kwa hivyo, entropy sawa, lakini kwa ishara kinyume, inachukuliwa kama kipimo cha kiasi cha habari.

Uhusiano kati ya habari na entropy unaweza kueleweka kama ifuatavyo: kupata habari (ongezeko lake) wakati huo huo inamaanisha kupunguza ujinga au kutokuwa na uhakika wa habari (entropy)

Kwa hivyo, mbinu ya takwimu inazingatia uwezekano wa ujumbe kuonekana: ujumbe usio na uwezekano mdogo unachukuliwa kuwa wa habari zaidi, i.e. angalau inavyotarajiwa. Kiasi cha habari kinafikia thamani ya juu, ikiwa matukio yanawezekana kwa usawa.

R. Hartley alipendekeza fomula ifuatayo ya kupima habari:

I=logi 2n ,

Wapi n- idadi ya matukio yanayowezekana kwa usawa;

I- kipimo cha habari katika ujumbe kuhusu kutokea kwa moja ya n matukio

Kipimo cha habari kinaonyeshwa kwa kiasi chake. Mara nyingi hii inahusu kiasi kumbukumbu ya kompyuta na kiasi cha data zinazopitishwa kupitia njia za mawasiliano. Sehemu inachukuliwa kuwa kiasi cha habari ambayo kutokuwa na uhakika kunapunguzwa kwa nusu; kitengo kama hicho cha habari kinaitwa. kidogo .

Ikiwa msingi wa logarithm katika fomula ya Hartley hutumiwa logarithm asili(), basi kitengo cha kipimo cha habari ni nat ( Biti 1 = ln2 ≈ 0.693 nat). Ikiwa nambari ya 3 inatumiwa kama msingi wa logarithm, basi - kutibu, ikiwa 10, basi - dit (Hartley).

Kwa mazoezi, kitengo kikubwa hutumiwa mara nyingi zaidi - kwaheri(kwaheri) sawa na biti nane. Kitengo hiki kilichaguliwa kwa sababu kinaweza kutumika kusimba herufi zozote kati ya 256 za alfabeti ya kibodi ya kompyuta (256 = 2 8).

Mbali na ka, habari hupimwa kwa maneno nusu (2 byte), maneno (4 byte) na maneno mawili (8 byte). Pia hutumiwa sana hata zaidi vitengo vikubwa habari ya kipimo:

Kilobaiti 1 (KB - kilobaiti) = baiti 1024 = baiti 2 10,

Megabaiti 1 (MB - megabaiti) = 1024 KB = baiti 2 20,

Gigabaiti 1 (GB - gigabyte) = 1024 MB = 2 30 byte.

Terabaiti 1 (TB - terabyte) = GB 1024 = baiti 2 40,

Petabyte 1 (PByte - petabyte) = 1024 TB = 2 50 byte.

Mnamo 1980, mwanahisabati wa Urusi Yu. Manin alipendekeza wazo la ujenzi kompyuta ya quantum, kuhusiana na ambayo kitengo hicho cha habari kilionekana kama kobe ​​( quantum kidogo, qubit ) - "quantum bit" ni kipimo cha kupima kiasi cha kumbukumbu katika aina ya kinadharia inayowezekana ya kompyuta inayotumia vyombo vya habari vya quantum, kwa mfano, spins za elektroni. Kubiti inaweza kuchukua sio maadili mawili tofauti ("0" na "1"), lakini kadhaa, sambamba na mchanganyiko wa kawaida wa majimbo mawili ya mzunguko wa ardhi, ambayo hutoa. idadi kubwa zaidi michanganyiko inayowezekana. Kwa hivyo, qubits 32 zinaweza kusimba kuhusu majimbo bilioni 4.

Mbinu ya kisemantiki. Kipimo cha kisintaksia haitoshi ikiwa unahitaji kubainisha si kiasi cha data, lakini kiasi cha taarifa kinachohitajika katika ujumbe. Katika kesi hii, kipengele cha semantic kinazingatiwa, ambacho kinatuwezesha kuamua maudhui ya habari.

Ili kupima maudhui ya kisemantiki ya habari, unaweza kutumia thesaurus ya mpokeaji wake (mtumiaji). Wazo la njia ya thesaurus lilipendekezwa na N. Wiener na kuendelezwa na mwanasayansi wetu wa ndani A.Yu. Schrader.

Thesaurus kuitwa chombo cha habari ambayo mpokeaji wa taarifa anayo. Kuunganisha thesaurus na yaliyomo kwenye ujumbe uliopokelewa hukuruhusu kujua ni kiasi gani inapunguza kutokuwa na uhakika.

Utegemezi wa kiasi cha taarifa ya kisemantiki ya ujumbe kwenye thesaurus ya mpokeaji

Kulingana na utegemezi uliowasilishwa kwenye grafu, ikiwa mtumiaji hana thesaurus yoyote (maarifa juu ya kiini cha ujumbe uliopokelewa, ambayo ni, =0), au uwepo wa thesaurus kama hiyo ambayo haijabadilika kama matokeo ya kuwasili kwa ujumbe (), kisha sauti habari za kisemantiki ndani yake sawa na sifuri. Thesaurus mojawapo () itakuwa moja ambayo kiasi cha habari ya semantic itakuwa ya juu (). Kwa mfano, maelezo ya kisemantiki katika ujumbe unaoingia isiyojulikana lugha ya kigeni itakuwa sifuri, lakini hali hiyo itakuwa katika kesi hiyo ikiwa ujumbe sio habari tena, kwani mtumiaji tayari anajua kila kitu.

Kipimo cha pragmatiki habari huamua manufaa yake katika kufikia malengo ya walaji. Ili kufanya hivyo, inatosha kuamua uwezekano wa kufikia lengo kabla na baada ya kupokea ujumbe na kulinganisha. Thamani ya habari (kulingana na A.A. Kharkevich) inahesabiwa kwa kutumia fomula:

uko wapi uwezekano wa kufikia lengo kabla ya kupokea ujumbe;

Uwezekano wa kufikia lengo ni uwanja wa kupokea ujumbe;

Viwango na muundo habari za kiuchumi. Viwango vya kisintaksia, kisemantiki na pragmatiki vya habari za kiuchumi. Mambo ya kimuundo ya habari ya kiuchumi - maelezo, viashiria, vitengo vya habari (CUI), hati, safu na hifadhidata.

Mada ya kozi hii ni masoko habari jinsi sehemu habari za kiuchumi.

Taarifa za kiuchumi ni seti ya habari inayoashiria uhusiano wa uzalishaji katika jamii. Taarifa hizi zinaweza kurekodiwa, kuhifadhiwa, kusambazwa, kuchakatwa na kutumika katika upangaji, uhasibu, udhibiti na uchambuzi mfumo wa kiuchumi au mchakato.

Taarifa za kiuchumi ni pamoja na habari mbalimbali juu ya muundo na maadili ya kazi, nyenzo na rasilimali za kifedha na hali ya kitu cha usimamizi kwa wakati fulani. Habari za kiuchumi hukuruhusu kupata habari juu ya shughuli za biashara na mashirika kupitia anuwai viashiria vya kiuchumi. Taarifa kutoka kwa yoyote eneo la somo kuwa na idadi ya sifa za tabia.

Kumbuka sifa za habari za kiuchumi:

1. Multidimensionality - idadi kubwa ya na kiasi cha data, bila ambayo usimamizi wa ubora wa michakato ya kiuchumi hauwezekani.

2. Maonyesho ya nambari - habari za kiuchumi, kama sheria, zinaonyesha shughuli za uzalishaji na kiuchumi kwa kutumia mfumo wa viashiria vya asili na gharama. Zinaonyeshwa kwa kutumia data ya nambari, kwa hivyo hutumiwa sana wakati wa kufanya kazi na habari za kiuchumi. aina za nambari data na mbinu za kufanya kazi na aina hizi.

3. Muda - michakato mingi ya uzalishaji na kiuchumi ina sifa ya kurudiwa kwa mzunguko wa hatua zao (mwezi, robo, mwaka), na ipasavyo, kurudiwa kwa habari inayoonyesha michakato katika hatua hizi ni tabia.

4. Uwasilishaji wa picha na tabular wa habari za kiuchumi. Nyaraka za kiuchumi mara nyingi huchukua mfumo wa majedwali na grafu, hivyo wasindikaji lahajedwali hutumiwa sana kuchakata taarifa za kiuchumi.

5. Utofauti wa vyanzo na watumiaji.

Vipengele hivi vya habari za kiuchumi huamua mapema hitaji la kisayansi na kiufundi na uwezekano wa kiuchumi wa kutumia pesa teknolojia ya habari wakati wa ukusanyaji wake, mkusanyiko, maambukizi na usindikaji, ambayo kwa upande inahitaji wataalamu kuwa na uwezo wa kuamua muundo na kiasi cha habari kusindika.

Katika mchakato wa matumizi katika uchumi na mifumo ya usimamizi habari hupitia hatua kadhaa za uwepo:

Habari iliyosasishwa ni uwakilishi wa ujumbe katika akili ya mtu, iliyowekwa juu ya mfumo wa dhana na tathmini zake;


Habari iliyoandikwa - habari iliyorekodiwa kwa fomu ya ishara kwenye njia yoyote ya kimwili;

Habari iliyopitishwa - habari inayozingatiwa wakati wa uhamishaji wake kutoka kwa chanzo hadi kwa mpokeaji anayepokea. Wakati wa mchakato wa uwasilishaji, habari hupita kupitia vibadilishaji kadhaa: vifaa vya usimbuaji na kusimbua, mashine za kompyuta, usindikaji wa habari unaoongoza, mifumo ya mawasiliano, mitandao ya kompyuta Nakadhalika.

Taarifa ni data inayozunguka kati ya vipengele vya kimuundo vya kibinafsi vya mfumo wa kiuchumi au kati ya mifumo yenyewe. Kuna viwango tofauti vya uzingatiaji wa habari: kisintaksia, kisemantiki na pragmatiki.

Kiwango cha kisintaksia husoma muundo wa ishara na uhusiano kati yao katika ujumbe wa habari. Katika kiwango hiki, muundo wa alama na ishara katika hati, muundo wa maelezo, muundo wa safu za habari, n.k. unachambuliwa. Katika kiwango cha kisintaksia, neno "data" hutumiwa na kiasi cha data kinahusiana na idadi ya data. nakala za hati, idadi ya rekodi katika hifadhidata, n.k. Data ya pembejeo iliyopokelewa ni msingi wa usindikaji wa habari, kupata data ya matokeo ambayo hutumika kama msingi wa kufanya maamuzi.

Kiwango cha kisemantiki huamua maudhui ya kisemantiki ya jumla ya habari na inafanya uwezekano wa kuanzisha uhusiano kati ya vipengele tofauti habari. Semantiki huchunguza uhusiano kati ya ishara na vitu vinavyoashiria, bila kujali mpokeaji wa ishara. Anasoma mifumo ya jumla ya ujenzi wa mifumo yoyote ya ishara inayozingatiwa katika sintaksia. Kuna semantiki za kimantiki na za kimuundo. Semantiki za kimantiki inazingatia mifumo ya ishara kama njia ya kuelezea maana, kuanzisha uhusiano kati ya muundo wa mchanganyiko wa ishara na uwezo wao wa kuelezea. Semantiki za muundo- sehemu ya isimu miundo inayojitolea kuelezea maana ya misemo ya kiisimu na uendeshaji juu yake. Uchambuzi wa kisemantiki - seti ya shughuli zinazowakilisha maana ya maandishi ndani lugha ya asili katika mfumo wa rekodi katika baadhi ya lugha rasmi ya kisemantiki (kisemantiki). Uchanganuzi wa kisemantiki ni mfano wa mchakato wa uelewa wa binadamu wa matini. Kadiri hali ya mfumo inavyokuwa dhahiri zaidi kwa mpokeaji wa habari, ndivyo maudhui ya habari ya ujumbe yanavyoongezeka. Washa kiwango cha semantiki maudhui ya habari yanatokana na thesaurus ya mfumo.

Thesaurus(kamusi) inajumuisha seti ya dhana za kimsingi, istilahi, ufafanuzi, miundo thabiti ya data kiwango cha mantiki uwakilishi katika hifadhidata, n.k. Wakati huo huo, maudhui ya taarifa ya ujumbe hutegemea sana uwezo wa mpokeaji kupanua thesauri yake.

Kiwango cha pragmatiki huamua thamani ya habari kwa kukubalika uamuzi wa usimamizi, kwa mfumo wa udhibiti kwa ujumla. Pragmatiki husoma mtazamo wa misemo yenye maana ya mfumo wa ishara kulingana na uwezo wa kusuluhisha wa mtazamaji. Pragmatiki ya kinadharia inazingatia dhana fulani juu ya mali na muundo wa akili, ambayo imeundwa kwa msingi wa data kutoka kwa neurophysiology, saikolojia ya majaribio, bionics, nadharia ya perceptron, nk. Pragmatiki zinazotumika ni pamoja na utafiti unaotolewa kwa uchanganuzi wa kitaalamu wa uelewa wa watu wa misemo mbalimbali ya lugha, utafiti wa midundo na ujumuishaji, na ukuzaji wa mifumo ya kupata habari.

Kwa hivyo, kuna viwango vitatu vya kuzingatia yoyote ujumbe wa habari, viwango vitatu vya uondoaji kutoka kwa sifa za vitendo maalum vya kubadilishana habari. Washa pragmatiki ngazi ya kutambua manufaa ya habari, vipengele vyote vinazingatiwa kubadilishana habari. Washa semantiki kiwango, kujiondoa kutoka kwa mpokeaji wa habari, lengo kuu la kusoma ni maana ya kisemantiki ya ujumbe, utoshelevu wake kwa vitu vilivyoelezewa. Nyembamba zaidi ni kisintaksia kiwango - kiwango cha kusoma ishara tu wenyewe na uhusiano kati yao.

Kazi ya habari ya kiuchumi ni kutoa maelezo ya kutosha ya hali fulani ya mfumo wa kiuchumi au kitu kinachozingatiwa. Kwa hiyo, idadi ya mahitaji yanawekwa kwenye habari za kiuchumi.

Ukamilifu wa habari kwa kufanya maamuzi na utekelezaji wa majukumu ya usimamizi . Ukamilifu umedhamiriwa kuhusiana na kazi za usimamizi. Taarifa inaweza kuwa haijakamilika kwa suala la kiasi na muundo wa habari. Ukosefu wa taarifa hauruhusu kufanya maamuzi sahihi ya usimamizi.Ukamilifu wa taarifa unamaanisha utoshelevu wake wa kuelewa na kufanya maamuzi.

Usahihi na uaminifu wa habari. Sifa hizi huamua kiwango ambacho thamani ya habari inakaribia thamani ya kweli. Kuegemea huonyesha tathmini ya uwezekano wa habari. Kuna viwango fulani vya usahihi katika kutumia data iliyopatikana.

Thamani habari inategemea matatizo gani yanatatuliwa kwa msaada wake.

Umuhimu na ufanisi. Umuhimu unaonyesha kiwango cha umuhimu hali halisi kitu cha kiuchumi na hali ya mfumo wa habari. Ukosefu wa mabadiliko ya wakati katika habari iliyoonyeshwa kwenye mfumo wa habari husababisha usumbufu wa michakato ya usimamizi. Ufanisi huamua kasi ya kuanzisha mabadiliko katika mfumo wa habari wa habari kuhusu hali ya eneo la somo.Ni muhimu kuwa na taarifa za kisasa wakati wa kufanya kazi katika hali zinazobadilika mara kwa mara.

Kutambulika- habari inakuwa wazi Na kueleweka ikiwa imeonyeshwa kwa lugha, mada zinazoeleweka vitu ambavyo vimekusudiwa.

NGAZI ZA MATATIZO YA UHAMISHO WA HABARI

Wakati wa kutekeleza michakato ya habari Daima kuna uhamisho wa habari katika nafasi na wakati kutoka kwa chanzo cha habari hadi kwa mpokeaji (mpokeaji). Katika kesi hii, ishara au alama mbalimbali hutumiwa kusambaza habari, kwa mfano, lugha ya asili au ya bandia (rasmi), kuruhusu kuonyeshwa kwa namna fulani inayoitwa ujumbe.

Ujumbe- aina ya uwakilishi wa habari kwa namna ya seti ya ishara (ishara) zinazotumiwa kwa maambukizi.

Ujumbe kama seti ya ishara kutoka kwa mtazamo wa semiotiki (kutoka kwa Kigiriki. semeion - ishara, sifa) - sayansi ambayo inasoma mali ya ishara na mifumo ya ishara - inaweza kusomwa katika viwango vitatu:

1) kisintaksia, ambapo sifa za ndani za ujumbe huzingatiwa, i.e. uhusiano kati ya ishara, inayoakisi muundo wa mfumo fulani wa ishara. Mali ya nje alisoma katika viwango vya semantiki na pragmatiki;

2) semantiki, ambapo uhusiano kati ya ishara na vitu, vitendo, sifa zinazoashiria huchambuliwa, yaani, maudhui ya semantic ya ujumbe, uhusiano wake na chanzo cha habari;

3) pragmatic, ambapo uhusiano kati ya ujumbe na mpokeaji huzingatiwa, yaani, maudhui ya mtumiaji wa ujumbe, uhusiano wake na mpokeaji.

Kwa hivyo, kwa kuzingatia uhusiano fulani kati ya shida za usambazaji wa habari na viwango vya kusoma mifumo ya ishara, imegawanywa katika viwango vitatu: syntactic, semantic na pragmatic.

Matatizo kiwango cha kisintaksia inahusu uundaji wa misingi ya kinadharia ya kujenga mifumo ya habari, viashiria kuu vya utendaji ambavyo vitakuwa karibu na kiwango cha juu kinachowezekana, na pia kuboresha. mifumo iliyopo ili kuboresha ufanisi wa matumizi yao. Ni safi matatizo ya kiufundi kuboresha njia za kupeleka ujumbe na wabebaji wa nyenzo zao - ishara. Katika kiwango hiki, wanazingatia shida za kupeana ujumbe kwa mpokeaji kama seti ya wahusika, kwa kuzingatia aina ya media na njia ya kuwasilisha habari, kasi ya uwasilishaji na usindikaji, saizi ya nambari za uwasilishaji wa habari, kuegemea na. usahihi wa ubadilishaji wa misimbo hii, n.k., ukiondoa kabisa maudhui ya kisemantiki ya ujumbe na madhumuni yaliyokusudiwa. Katika kiwango hiki, habari inayozingatiwa tu kutoka kwa mtazamo wa kisintaksia kawaida huitwa data, kwani upande wa kisemantiki haujalishi.

Nadharia ya kisasa ya habari husoma shida katika kiwango hiki. Inategemea dhana ya "kiasi cha habari," ambayo ni kipimo cha marudio ya matumizi ya ishara, ambayo kwa njia yoyote haiakisi ama maana au umuhimu wa ujumbe unaotumwa. Katika suala hili, wakati mwingine inasemekana kuwa nadharia ya kisasa ya habari iko katika kiwango cha kisintaksia.

Matatizo kiwango cha semantiki kuhusishwa na urasimishaji na kuzingatia maana habari zinazosambazwa, kuamua kiwango cha mawasiliano kati ya picha ya kitu na kitu yenyewe. Washa kiwango hiki habari ambayo habari inaonyesha inachambuliwa, miunganisho ya kisemantiki inachunguzwa, dhana na maoni huundwa, maana na yaliyomo katika habari hufunuliwa, na ujanibishaji wake unafanywa.

Shida katika kiwango hiki ni ngumu sana, kwani maudhui ya kisemantiki ya habari hutegemea zaidi mpokeaji kuliko semantiki ya ujumbe unaowasilishwa kwa lugha yoyote.

Katika kiwango cha pragmatiki, tunavutiwa na matokeo ya kupokea na kutumia habari hii na watumiaji. Matatizo katika ngazi hii yanahusishwa na kuamua thamani na manufaa ya kutumia habari wakati mtumiaji anatengeneza suluhisho ili kufikia lengo lake. Ugumu kuu hapa ni kwamba thamani na manufaa ya habari inaweza kuwa tofauti kabisa kwa wapokeaji tofauti na, kwa kuongeza, inategemea mambo kadhaa, kama vile, kwa mfano, wakati wa utoaji na matumizi yake. Mahitaji ya juu kuhusiana na kasi ya utoaji wa habari, mara nyingi huagizwa na ukweli kwamba vitendo vya udhibiti lazima vifanyike kwa wakati halisi, yaani, kwa kiwango cha mabadiliko katika hali ya vitu vinavyodhibitiwa au taratibu. Ucheleweshaji wa uwasilishaji au utumiaji wa habari unaweza kuwa na matokeo mabaya.

Wakati wa kutekeleza michakato ya habari, habari huhamishwa kila wakati katika nafasi na wakati kutoka kwa chanzo cha habari hadi kwa mpokeaji (mpokeaji). Katika kesi hii, ishara au alama mbalimbali hutumiwa kusambaza habari, kwa mfano, lugha ya asili au ya bandia (rasmi), kuruhusu kuonyeshwa kwa namna fulani inayoitwa ujumbe.

Ujumbe- aina ya uwakilishi wa habari kwa namna ya seti ya ishara (alama) zinazotumiwa kwa maambukizi.

Ujumbe kama seti ya ishara kutoka kwa mtazamo wa semi ( kutoka Kigiriki setneion - ishara, ishara) - sayansi inayosoma mali ya ishara na mifumo ya ishara - inaweza kusomwa katika viwango vitatu:

1) kisintaksia , ambapo sifa za ndani za ujumbe huzingatiwa, yaani, uhusiano kati ya ishara, kuonyesha muundo wa mfumo wa ishara fulani. Sifa za nje husomwa katika viwango vya semantiki na pragmatiki. Katika kiwango hiki, wanazingatia shida za kupeana ujumbe kwa mpokeaji kama seti ya wahusika, kwa kuzingatia aina ya media na njia ya kuwasilisha habari, kasi ya uwasilishaji na usindikaji, saizi ya nambari za uwasilishaji wa habari, kuegemea na. usahihi wa ubadilishaji wa misimbo hii, n.k., ukiondoa kabisa maudhui ya kisemantiki ya ujumbe na madhumuni yaliyokusudiwa. Katika kiwango hiki, habari inayozingatiwa tu kutoka kwa mtazamo wa kisintaksia kawaida huitwa data, kwani upande wa kisemantiki haujalishi.

Nadharia ya kisasa ya habari husoma shida katika kiwango hiki. Inategemea dhana ya "kiasi cha habari," ambayo ni kipimo cha marudio ya matumizi ya ishara, ambayo kwa njia yoyote haiakisi ama maana au umuhimu wa ujumbe unaotumwa. Katika suala hili, wakati mwingine inasemekana kuwa nadharia ya kisasa ya habari iko katika kiwango cha kisintaksia.

2) semantiki , ambapo uhusiano kati ya ishara na vitu, vitendo, na sifa zinazoashiria huchambuliwa, yaani, maudhui ya semantic ya ujumbe, uhusiano wake na chanzo cha habari. Shida katika kiwango cha semantiki zinahusishwa na kurasimisha na kuzingatia maana ya habari iliyopitishwa, kuamua kiwango cha mawasiliano kati ya picha ya kitu na kitu yenyewe. Katika kiwango hiki, habari inayoonyesha habari inachambuliwa, miunganisho ya kisemantiki inazingatiwa, dhana na maoni huundwa, maana na yaliyomo kwenye habari yanafunuliwa, na ujanibishaji wake unafanywa.

3) pragmatiki , ambapo uhusiano kati ya ujumbe na mpokeaji huzingatiwa, yaani, maudhui ya mtumiaji wa ujumbe, uhusiano wake na mpokeaji.

Katika kiwango hiki, matokeo ya kupokea na kutumia habari hii na watumiaji ni ya riba. Matatizo katika ngazi hii yanahusishwa na kuamua thamani na manufaa ya kutumia habari wakati mtumiaji anatengeneza suluhisho ili kufikia lengo lake. Ugumu kuu hapa ni kwamba thamani na manufaa ya habari inaweza kuwa tofauti kabisa kwa wapokeaji tofauti na, kwa kuongeza, inategemea mambo kadhaa, kama vile, kwa mfano, wakati wa utoaji na matumizi yake.


Kwa kila ngazi ya matatizo ya uhamishaji taarifa yaliyojadiliwa hapo juu, kuna mbinu tofauti za kupima kiasi cha taarifa na vipimo tofauti vya taarifa. Kuna, kwa mtiririko huo, vipimo vya habari katika kiwango cha kisintaksia, kiwango cha semantiki na kiwango cha pragmatiki.

Vipimo vya maelezo ya kiwango cha kisintaksia. Ukadiriaji habari katika kiwango hiki haihusiani na upande wa maudhui ya habari, lakini hufanya kazi na maelezo yasiyo ya kibinafsi ambayo hayaelezi uhusiano wa kimantiki na kitu. Kutokana na hili kipimo hiki inafanya uwezekano wa kutathmini mtiririko wa habari katika vitu tofauti katika maumbile kama mifumo ya mawasiliano, kompyuta, mifumo ya udhibiti, mfumo wa neva wa kiumbe hai, n.k.

Ili kupima habari katika kiwango cha kisintaksia, vigezo viwili vinaletwa: kiasi cha habari (data) - V d(mtazamo wa kiasi) na kiasi cha habari - I(mbinu ya entropy).

Kiasi cha habari V d (mbinu ya kiasi). Wakati wa kutekeleza michakato ya habari, habari hupitishwa kwa njia ya ujumbe, ambayo ni seti ya alama za alfabeti. Aidha, kila mhusika mpya katika ujumbe huongeza kiasi cha habari kinachowakilishwa na mfuatano wa wahusika ya alfabeti hii. Ikiwa sasa kiasi cha habari kilichomo katika ujumbe wa mhusika mmoja kinachukuliwa kuwa moja, basi kiasi cha habari (data) V d katika ujumbe mwingine wowote itakuwa sawa na idadi ya wahusika (bits) katika ujumbe huu. Kwa kuwa habari hiyo hiyo inaweza kuwakilishwa na wengi njia tofauti(kwa kutumia alfabeti tofauti), basi kitengo cha kipimo cha habari (data) kitabadilika ipasavyo.

Kwa hiyo, katika mfumo wa desimali kwa nukuu, tarakimu moja ina uzito sawa na 10, na ipasavyo kitengo cha kipimo cha habari kitakuwa. ndivyo (mahali pa desimali P P ndivyo. Kwa mfano, nambari ya tarakimu nne 2009 ina kiasi cha data cha V d = 4 dit.

KATIKA mfumo wa binary kwa nukuu, tarakimu moja ina uzito sawa na 2, na ipasavyo kitengo cha kipimo cha habari kitakuwa kidogo (kidogo (dijiti ya binary) - tarakimu ya binary) Katika kesi hii, ujumbe katika fomu n Nambari ya tarakimu ina kiasi cha data V d = P kidogo. Kwa mfano, nane-bit msimbo wa binary 11001011 ina kiasi cha data V d = 8 bits.

Katika teknolojia ya kisasa ya kompyuta, pamoja na kitengo cha chini vipimo vya data kidogo kitengo cha kipimo kilichopanuliwa kinatumika sana kwaheri, sawa na biti 8. Ni biti nane haswa zinazohitajika kusimba herufi zozote kati ya 256 za alfabeti ya kibodi ya kompyuta (256 = 2 8).

Wakati wa kufanya kazi na kiasi kikubwa vitengo vikubwa vya kipimo hutumiwa kuhesabu wingi wake:

Kilobaiti 1 (KB) = baiti 1024 = baiti 2 10,

Megabyte 1 (MB) = 1024 KB = 2 20 byte = baiti 1,048,576;

Gigabyte 1 (GB) = 1024 MB = 2 30 byte = 1,073,741,824 byte;

KATIKA Hivi majuzi Kwa sababu ya kuongezeka kwa kiasi cha habari iliyochakatwa, vitengo kama hivyo vinavyotokana vinaanza kutumika kama:

1 Terabyte (TB) = 1024 GB = 2 40 byte = 1,099,511,627,776 byte;

1 Petabyte (PB) = 1024 TB = baiti 2 50 = baiti 1,125,899,906,842,624.

Ikumbukwe kwamba katika mfumo wa kipimo cha habari cha binary (kompyuta), tofauti na mfumo wa metri, vitengo vilivyo na viambishi awali "kilo", "mega", nk hupatikana kwa kuzidisha kitengo cha msingi sio 10 3 = 1000, 10 6. = 1,000,000, nk, na kwa 2 10 = 1024, 2 20 = 1,048,576, nk.

Kiasi cha habari I (mbinu ya entropy). Katika nadharia ya habari na msimbo, mbinu ya entropy ya kupima habari inapitishwa. Njia hii inategemea ukweli kwamba ukweli wa kupata habari daima unahusishwa na kupungua kwa utofauti au kutokuwa na uhakika (entropy) ya mfumo. Kulingana na hili, kiasi cha habari katika ujumbe hufafanuliwa kama kipimo cha kupunguza kutokuwa na uhakika wa hali ya mfumo fulani baada ya kupokea ujumbe. Kutokuwa na uhakika kunaweza kufasiriwa kulingana na jinsi mtazamaji anajua kidogo juu ya mfumo fulani. Mara tu mwangalizi amegundua kitu katika mfumo wa kimwili, entropy ya mfumo hupungua kwa sababu, kwa mwangalizi, mfumo umekuwa wa utaratibu zaidi.

Kwa hivyo, na mbinu ya entropy habari inaeleweka kama thamani ya kiasi cha kutokuwa na uhakika ambayo imetoweka wakati wa mchakato wowote (jaribio, kipimo, n.k.). Katika kesi hii, entropy inaletwa kama kipimo cha kutokuwa na uhakika N, na kiasi cha habari ni sawa na:

I = H apr - H aps

ambapo, H apr - entropy ya kipaumbele kuhusu hali ya mfumo au mchakato unaojifunza;

H aps - entropy ya nyuma.

Sehemu ya nyuma (kutoka lat. posteriori - kutoka kwa kile kinachofuata) - inayotokana na uzoefu (vipimo, vipimo).

A priori (kutoka lat. priori - kutoka kwa uliopita) ni dhana inayobainisha ujuzi unaotangulia uzoefu (ujaribio) na unaojitegemea.

Katika kesi wakati wakati wa mtihani kutokuwa na uhakika uliopo huondolewa (matokeo maalum yanapatikana, i.e. H = 0), kiasi cha habari kilichopokelewa kinapatana na entropy ya awali.

Hebu tuzingatie kama mfumo unaochunguzwa chanzo cha habari (chanzo cha ujumbe tofauti), ambacho tunamaanisha mfumo wa kimwili, kuwa na seti ya mwisho mataifa yanayowezekana {na i}, i = .

Kila kitu kimewekwa A = (a 1, a 2, ..., a n) hali ya mfumo katika nadharia ya habari huitwa alfabeti ya kufikirika au alfabeti ya chanzo cha ujumbe.

Majimbo ya mtu binafsi a 1, a 2,..., n huitwa herufi au alama za alfabeti.

Mfumo kama huo unaweza kuchukua kwa nasibu mojawapo ya seti fupi za majimbo iwezekanavyo wakati wowote. a i. Katika kesi hii, wanasema kwamba majimbo anuwai yanatambuliwa kwa sababu ya chaguo lao na chanzo.

Mpokeaji wa habari (ujumbe) ana wazo fulani juu ya uwezekano wa kutokea kwa matukio fulani. Mawazo haya kwa ujumla hayaaminiki na yanaonyeshwa na uwezekano ambao anatarajia hii au tukio hilo. Kipimo cha jumla cha kutokuwa na uhakika (entropy) kinaonyeshwa na utegemezi fulani wa hisabati juu ya uwezekano huu; kiasi cha habari katika ujumbe huamuliwa na ni kiasi gani kipimo cha kutokuwa na uhakika kinapungua baada ya kupokea ujumbe.

Hebu tueleze wazo hili kwa mfano.

Wacha tuwe na 32 kadi mbalimbali. Uwezekano wa kuchagua kadi moja kutoka kwenye staha ni 32. Kabla ya kufanya uchaguzi, ni kawaida kudhani kuwa nafasi ya kuchagua kadi fulani ni sawa kwa kadi zote. Kwa kufanya uchaguzi, tunaondoa kutokuwa na uhakika huu. Katika kesi hii, kutokuwa na uhakika kunaweza kuonyeshwa na idadi ya chaguzi zinazowezekana zinazowezekana. Ikiwa sasa tunafafanua kiasi cha habari kama kipimo cha kuondoa kutokuwa na uhakika, basi taarifa iliyopatikana kutokana na uchaguzi inaweza kuwa na sifa ya nambari 32. Hata hivyo, ni rahisi zaidi kutumia sio nambari hii yenyewe, lakini logarithm ya makadirio ya msingi ya 2 yaliyopatikana hapo juu:

ambapo m ni nambari ya chaguo zinazowezekana kwa usawa (Wakati m = 2, tunapata habari kwa kidogo). Hiyo ni, kwa upande wetu

H = kumbukumbu 2 32 = 5.

Mbinu iliyoainishwa ni ya mwanahisabati wa Kiingereza R. Hartley (1928). Ina tafsiri ya kuvutia. Inajulikana na idadi ya maswali yenye majibu ya "ndiyo" au "hapana" ili kuamua kadi ambayo mtu alichagua. Maswali 5 kama haya yanatosha.

Ikiwa, wakati wa kuchagua kadi, uwezekano wa kila kadi kuonekana si sawa (tofauti iwezekanavyo), basi tunapata mbinu ya takwimu ya kupima habari iliyopendekezwa na K. Shannon (1948). Katika kesi hii, kipimo cha habari kinapimwa kwa kutumia fomula:

Wapi p i- uwezekano wa kuchagua i tabia ya alfabeti.

Ni rahisi kuona ikiwa kuna uwezekano uk 1, ..., p n ni sawa, basi kila mmoja wao ni sawa 1/N, na fomula ya Shannon inageuka kuwa fomula ya Hartley.

Vipimo vya habari katika kiwango cha semantiki. Ili kupima maudhui ya kisemantiki ya habari, yaani, wingi wake katika kiwango cha kisemantiki, kipimo cha thesaurus, ambacho huunganisha. sifa za semantiki habari na uwezo wa mtumiaji kupokea ujumbe unaoingia. Hakika, ili kuelewa na kutumia habari iliyopokelewa, mpokeaji lazima awe na kiasi fulani cha ujuzi. Ujinga kamili wa somo hauturuhusu kutoa habari muhimu kutoka kwa ujumbe uliopokelewa kuhusu somo hili. Kadiri ujuzi kuhusu somo unavyoongezeka, ndivyo idadi inavyoongezeka habari muhimu, imetolewa kutoka kwa ujumbe.

Ikiwa tunaita maarifa ya mpokeaji juu ya somo fulani thesaurus (yaani, seti fulani ya maneno, dhana, majina ya vitu vilivyounganishwa na viunganisho vya semantic), basi kiasi cha habari kilichomo katika ujumbe fulani kinaweza kutathminiwa na kiwango cha mabadiliko. katika thesaurus binafsi chini ya ushawishi wa ujumbe huu.

Thesaurus- seti ya habari inayopatikana kwa mtumiaji au mfumo.

Kwa maneno mengine, kiasi cha habari ya kisemantiki inayotolewa na mpokeaji kutoka kwa ujumbe unaoingia inategemea kiwango cha utayari wa thesaurus yake kutambua habari kama hiyo.

Kulingana na uhusiano kati ya maudhui ya kisemantiki ya habari S na thesaurus ya mtumiaji S p kiasi cha mabadiliko ya habari ya semantiki Mimi s, inayotambuliwa na mtumiaji na hatimaye kujumuishwa naye katika nadharia yake. Asili ya utegemezi huu imeonyeshwa kwenye Mtini. 2.1. Wacha tuzingatie kesi mbili za kuzuia wakati kiasi cha habari ya semantic I c ni sawa na 0:

a) wakati S p = 0, mtumiaji haoni (haelewi) habari inayoingia;

b) wakati S -> ∞ mtumiaji "anajua kila kitu" na hahitaji habari inayoingia.

Mchele. 1.2. Utegemezi wa kiasi cha habari za semantiki,

kutambuliwa na mtumiaji, kutoka kwa nadharia yake I c =f(S p)

Kiasi cha juu zaidi Mtumiaji hupata habari ya kisemantiki kwa kuratibu maudhui yake ya kisemantiki S na thesaurus yake S p (S = S p opt), wakati habari inayoingia inaeleweka kwa mtumiaji na kumpa habari isiyojulikana hapo awali (sio katika thesaurus yake).

Kwa hivyo, kiasi cha habari ya kisemantiki katika ujumbe, kiasi cha maarifa mapya yaliyopokelewa na mtumiaji, ni thamani ya jamaa. Ujumbe huo unaweza kuwa na maudhui ya maana kwa mtumiaji mwenye uwezo na usiwe na maana kwa mtumiaji asiye na uwezo.

Wakati wa kutathmini kipengele cha semantic (yaliyomo) cha habari, ni muhimu kujitahidi kuoanisha maadili ya S na Sp.

Kipimo cha jamaa cha kiasi cha maelezo ya kisemantiki kinaweza kuwa mgawo wa maudhui C, unaofafanuliwa kama uwiano wa kiasi cha taarifa ya kisemantiki kwa ujazo wake:

C = mimi s / V d

Vipimo vya habari katika kiwango cha pragmatiki. Hatua hii huamua manufaa ya maelezo katika kufikia lengo la mtumiaji. Kipimo hiki pia ni thamani ya jamaa, imedhamiriwa na upekee wa kutumia habari hii katika mfumo fulani.

Mmoja wa wanasayansi wa kwanza wa Kirusi kushughulikia shida ya kutathmini habari katika kiwango cha pragmatic alikuwa A.A. Kharkevich, ambaye alipendekeza kuchukua kama kipimo cha thamani ya habari kiasi cha habari muhimu ili kufikia lengo, yaani, kuhesabu ongezeko la uwezekano wa kufikia lengo. Kwa hivyo, ikiwa kabla ya kupokea habari hiyo uwezekano wa kufikia lengo ulikuwa p 0, na baada ya kuipokea - p 1, basi thamani ya habari imedhamiriwa kama logarithm ya uwiano p 1 / p 0:

I = logi 2 p 1 – logi 2 p 0 = logi 2 (p 1 /p 0)

Kwa hivyo, thamani ya habari hupimwa katika vitengo vya habari, in kwa kesi hii katika bits.

Habari - ni nini? Inategemea nini? Je, inafuata malengo gani na inatimiza kazi gani? Tutazungumza juu ya haya yote katika makala hii.

Habari za jumla

Ni katika hali gani njia ya semantic ya kupima habari inatumiwa? Kiini cha habari kinatumiwa, upande wa maudhui ya ujumbe uliopokelewa ni wa kupendeza - hizi ni dalili za matumizi yake. Lakini kwanza, hebu tutoe maelezo ya ni nini. Ikumbukwe kwamba njia ya semantic ya kupima habari ni mbinu ngumu iliyorasimishwa ambayo bado haijaundwa kikamilifu. Hutumika kupima kiasi cha maana katika data iliyopokelewa. Kwa maneno mengine, ni kiasi gani cha habari iliyopokelewa ni muhimu katika kesi hii. Njia hii hutumiwa kuamua yaliyomo katika habari iliyopokelewa. Na ikiwa tunazungumza juu ya njia ya kisemantiki ya kupima habari, tunatumia dhana ya thesaurus, ambayo inaunganishwa kwa usawa na mada inayozingatiwa. Je, inawakilisha nini?

Thesaurus

Ningependa kufanya utangulizi mfupi na kujibu swali moja kuhusu mbinu ya kisemantiki ya kupima habari. Nani aliianzisha? Mwanzilishi wa cybernetics, Norbert Wiener, alipendekeza kutumia njia hii, lakini ilipata maendeleo makubwa chini ya ushawishi wa mwenzetu A. Yu. Schrader. Je, ni jina gani linalotumika kubainisha jumla ya taarifa ambayo mpokeaji wa taarifa anayo. Ikiwa unalinganisha thesaurus na yaliyomo kwenye ujumbe uliopokelewa, unaweza kujua ni kiasi gani ilipunguza kutokuwa na uhakika. Ningependa kurekebisha kosa moja ambalo mara nyingi huathiri idadi kubwa ya watu. Kwa hivyo, wanaamini kwamba njia ya semantic ya kupima habari ilianzishwa na Claude Shannon. Haijulikani hasa jinsi dhana hii potofu ilivyotokea, lakini maoni haya si sahihi. Claude Shannon alianzisha njia ya takwimu kipimo cha habari, "mrithi" ambaye ni moja ya semantic.

Mbinu ya mchoro ya kuamua kiasi cha maelezo ya kisemantiki katika ujumbe uliopokelewa

Kwa nini unahitaji kuchora kitu? Kipimo cha kisemantiki hutumia uwezo huu kuwasilisha kwa macho manufaa ya data katika michoro inayoeleweka kwa urahisi. Hii ina maana gani katika mazoezi? Ili kuelezea hali ya mambo, uhusiano umepangwa kwa namna ya grafu. Ikiwa mtumiaji hana ujuzi kuhusu kiini cha ujumbe uliopokelewa (sawa na sifuri), basi kiasi cha taarifa za semantic kitakuwa sawa na thamani sawa. Je, inawezekana kupata thamani mojawapo? Ndiyo! Hili ni jina la thesaurus, ambapo kiasi cha habari ya semantic ni ya juu. Hebu tuangalie mfano mdogo. Wacha tuseme mtumiaji anapokea ujumbe ulioandikwa kwa lugha ya kigeni isiyojulikana, au mtu anaweza kusoma kile kilichoandikwa hapo, lakini hii sio habari tena kwake, kwani yote haya yanajulikana. Katika hali kama hizi, wanasema kwamba ujumbe una habari sifuri ya semantiki.

Maendeleo ya kihistoria

Labda hii inapaswa kujadiliwa juu zaidi, lakini bado haijachelewa kupata. Njia ya kisemantiki ya kupima habari ilianzishwa hapo awali na Ralph Hartley mnamo 1928. Hapo awali ilitajwa kuwa Claude Shannon mara nyingi hutajwa kama mwanzilishi. Kwa nini kulikuwa na mkanganyiko huo? Ukweli ni kwamba, ingawa mbinu ya kisemantiki ya kupima taarifa ilianzishwa na Ralph Hartley mwaka wa 1928, ni Claude Shannon na Warren Weaver ambao waliifanya kwa ujumla mwaka wa 1948. Baada ya hayo, mwanzilishi wa cybernetics, Norbert Wiener, aliunda wazo la njia ya thesaurus, ambayo ilipata kutambuliwa zaidi kwa namna ya kipimo kilichotengenezwa na Yu. I. Schneider. Ikumbukwe kwamba ili kuelewa hili, unahitaji kutosha ngazi ya juu maarifa.

Ufanisi

Je, mbinu ya thesaurus inatupa nini kivitendo? Ni uthibitisho wa kweli wa nadharia kwamba habari ina mali kama vile uhusiano. Ikumbukwe kwamba ina thamani ya jamaa (au subjective). Ili kuweza kutathmini kwa ukamilifu habari za kisayansi, ilianzisha dhana ya thesaurus ya ulimwengu wote. Kiwango chake cha mabadiliko kinaonyesha umuhimu wa maarifa ambayo ubinadamu hupokea. Wakati huo huo, haiwezekani kusema hasa ni matokeo gani ya mwisho (au ya kati) yanaweza kupatikana kutoka kwa habari. Hebu tuchukue kompyuta kwa mfano. Uhandisi wa Kompyuta iliundwa kwa kuzingatia teknolojia ya bomba na hali kidogo ya kila mmoja kipengele cha muundo na hapo awali ilitumika kufanya mahesabu. Sasa karibu kila mtu ana kitu kinachofanya kazi kulingana na teknolojia hii: redio, simu, kompyuta, TV, kompyuta. Hata jokofu za kisasa, majiko na beseni za kuosha zina vifaa vya elektroniki, msingi ambao ni habari juu ya kurahisisha matumizi ya vifaa hivi vya nyumbani.

Mbinu ya kisayansi

Mbinu ya kisemantiki ya kupima taarifa imesomwa wapi? Sayansi ya kompyuta ni sayansi inayohusika nayo nyanja mbalimbali swali hili. Je, ni upekee gani? Njia hiyo inategemea matumizi ya mfumo wa "kweli / uongo", au mfumo wa "moja / sifuri". Wakati habari fulani inapofika, hugawanywa katika vipashio tofauti, ambavyo vinaitwa kama vitengo vya hotuba: maneno, silabi, na kadhalika. Kila block inapokea thamani maalum. Hebu tuangalie mfano mdogo. Marafiki wawili wamesimama karibu. Mtu anageukia wa pili kwa maneno haya: "Tuna siku ya kupumzika kesho." Kila mtu anajua wakati siku ni za kupumzika. Kwa hiyo, thamani ya habari hii ni sifuri. Lakini ikiwa wa pili anasema kwamba anafanya kazi kesho, basi kwa wa kwanza itakuwa mshangao. Hakika, katika kesi hii, inaweza kugeuka kuwa mipango ambayo mtu mmoja alifanya, kwa mfano, kwenda bowling au kuzunguka kwenye warsha, itavunjwa. Kila sehemu ya mfano ulioelezewa inaweza kuelezewa kwa kutumia moja na sifuri.

Uendeshaji na dhana

Lakini ni nini kingine kinachotumiwa isipokuwa thesaurus? Nini kingine unahitaji kujua ili kuelewa njia ya kisemantiki ya kupima habari? Dhana za kimsingi ambazo zinaweza kusomwa zaidi ni mifumo ya ishara. Zinaeleweka kama njia za kuelezea maana, kama vile sheria za kutafsiri ishara au mchanganyiko wao. Wacha tuangalie mfano mwingine kutoka kwa sayansi ya kompyuta. Kompyuta hufanya kazi na zero za kawaida na zile. Kimsingi, hii ni voltage ya chini na ya juu ambayo hutolewa kwa vifaa vya vifaa. Kwa kuongezea, wanasambaza hizi na sifuri bila mwisho. Je, teknolojia inawezaje kutofautisha kati yao? Jibu la hili lilipatikana - usumbufu. Wakati habari hii inapitishwa, matokeo ni vitalu mbalimbali kama maneno, misemo na maana za mtu binafsi. Katika hotuba ya kibinadamu inayozungumzwa, pause pia hutumiwa kuvunja data katika vizuizi tofauti. Hazionekani sana hivi kwamba tunaziona nyingi kiotomatiki. Kwa maandishi, vipindi na koma hutumiwa kwa kusudi hili.

Upekee

Wacha tuguse pia juu ya mada ya mali ambayo njia ya semantic ya kupima habari inayo. Tayari tunajua kwamba hii ni jina la mbinu maalum ambayo inatathmini umuhimu wa habari. Je, tunaweza kusema kwamba data ambayo itatathminiwa kwa njia hii itakuwa lengo? Hapana, hiyo si kweli. Habari ni subjective. Hebu tuangalie hili kwa kutumia shule kama mfano. Kuna mwanafunzi bora ambaye yuko mbele ya programu iliyoidhinishwa, na mwanafunzi wa wastani anayesoma kile kinachofundishwa darasani. Kwa mara ya kwanza, habari nyingi atakazopokea shuleni zitakuwa za kupendeza kidogo, kwa kuwa tayari anazijua na hazisikii / kuzisoma kwa mara ya kwanza. Kwa hiyo, kwa kiwango cha kujitegemea, haitakuwa muhimu sana kwake (kutokana na labda baadhi ya maoni ya mwalimu ambayo aliona wakati wa uwasilishaji wa somo lake). Ambapo wastani habari mpya Alisikia kitu kwa mbali tu, kwa hiyo kwake thamani ya data ambayo itawasilishwa katika masomo ni utaratibu wa ukubwa zaidi.

Hitimisho

Ikumbukwe kwamba katika sayansi ya kompyuta, njia ya semantic ya kupima habari sio chaguo pekee ambalo matatizo yaliyopo yanaweza kutatuliwa. Uchaguzi unapaswa kutegemea malengo yaliyowekwa na fursa zilizopo. Kwa hivyo, ikiwa una nia ya mada au kuna haja yake, basi tunaweza tu kupendekeza kwa bidii kuisoma kwa undani zaidi na kujua ni njia gani zingine za kupima habari, badala ya semantiki, zipo.