Teabe süntaktiline mõõt määrab. Süntaktilise tasandi informatsiooni mõõdud. Boole'i algebra.

Minu saladus Rakendamisel teabeprotsessid

Alati toimub teabe ülekanne ruumis ja ajas teabeallikast vastuvõtjale (vastuvõtjale). Sel juhul kasutatakse teabe edastamiseks erinevaid märke või sümboleid, näiteks loomulikku või tehislikku (formaalset) keelt, võimaldades seda väljendada mingil kujul, mida nimetatakse sõnumiks. Sõnum

– edastamiseks kasutatav teabe esitusviis märkide (sümbolite) kogumi kujul. Sõnum kui märkide kogum semiootika seisukohalt ( kreeka keelest setneion - märk, märk

1) ) – teadus, mis uurib märkide ja märgisüsteemide omadusi – saab õppida kolmel tasandil: süntaktiline , kus vaadeldakse sõnumite sisemisi omadusi ehk seoseid märkide vahel, mis peegeldavad antud märgisüsteemi struktuuri. Välised omadused

uuritud semantilisel ja pragmaatilisel tasandil. Sellel tasemel käsitlevad nad sõnumite adressaadile edastamise probleeme kui tähemärkide kogumit, võttes arvesse teabekandja tüüpi ja teabe esitamise meetodit, edastamise ja töötlemise kiirust, teabe esituskoodide suurust, usaldusväärsust ja teabe esitamise viisi. nende koodide teisendamise täpsus jne, mis on täielikult abstraheeritud sõnumite semantilisest sisust ja nende sihtotstarbest. Sellel tasemel nimetatakse teavet, mida vaadeldakse ainult süntaktilisest vaatenurgast, tavaliselt andmeteks, kuna semantiline pool ei oma tähtsust. Kaasaegne infoteooria uurib peamiselt sellel tasemel probleeme. See tugineb mõistele "teabe hulk", mis on märkide kasutamise sageduse mõõt, mis ei kajasta mingil viisil edastatavate sõnumite tähendust ega tähtsust. Sellega seoses öeldakse mõnikord, et kaasaegne infoteooria on juures.

2) süntaktiline tase semantiline , kus analüüsitakse seoseid märkide ja nendega tähistatavate objektide, tegevuste ja omaduste vahel, st sõnumi semantilist sisu, selle seost teabeallikaga. Semantilise tasandi probleemid on seotud formaliseerimise ja tähenduse arvestamisega edastatud teave , millega määratakse objekti kujutise ja objekti enda vaheline vastavusaste. Sees analüüsitakse informatsiooni, mida informatsioon peegeldab, vaadeldakse semantilisi seoseid, kujundatakse mõisteid ja ideid, avalikustatakse teabe tähendus ja sisu ning teostatakse selle üldistamine.

3) pragmaatiline , kus vaadeldakse sõnumi ja saaja vahelist suhet ehk sõnumi tarbijasisu, selle suhet adressaadiga.

Sellel tasandil pakuvad huvi tarbijapoolse teabe saamise ja kasutamise tagajärjed. Selle tasandi probleemid on seotud teabe kasutamise väärtuse ja kasulikkuse kindlaksmääramisega, kui tarbija töötab välja lahenduse oma eesmärgi saavutamiseks. Peamine raskus seisneb siin selles, et teabe väärtus ja kasulikkus võivad erinevatele adressaatidele olla täiesti erinevad ning lisaks sõltub see mitmetest teguritest, nagu näiteks selle edastamise ja kasutamise õigeaegsus.

Iga eespool käsitletud teabeedastusprobleemi tasandi jaoks on teabehulga mõõtmiseks ja teabe mõõtmiseks erinevad lähenemisviisid. Teabe mõõtmed on vastavalt süntaktilisel, semantilisel ja semantilisel tasemel pragmaatiline tasand.

Süntaktilise tasandi informatsiooni mõõdud. Kvantifikatsioon informatsioon sellel tasemel ei ole seotud info sisupoolega, vaid opereerib umbisikulise informatsiooniga, mis ei väljenda semantilist seost objektiga. Sellega seoses võimaldab see meede hinnata teabevooge objektides, mis on oma olemuselt erinevad, näiteks sidesüsteemides, arvutid, juhtimissüsteemid, elusorganismi närvisüsteem jne.

Teabe mõõtmiseks süntaktilisel tasemel võetakse kasutusele kaks parameetrit: teabe (andmete) hulk - V d(mahupõhine lähenemine) ja teabe hulk – I(entroopia lähenemine).

Teabe maht V d (mahuline lähenemine). Infoprotsesside rakendamisel edastatakse teave sõnumi kujul, mis on tähestiku sümbolite kogum. Veelgi enam, iga uus märk sõnumis suurendab märgijadaga esindatava teabe hulka sellest tähestikust. Kui nüüd võtta ühest tähemärgist koosnevas sõnumis sisalduva teabe hulk üheks, siis mis tahes muu sõnumi teabe (andmete) maht V d võrdub selle sõnumi märkide (bittide) arvuga. Kuna sama teavet võivad esindada paljud erinevatel viisidel(kasutades erinevaid tähestikke), siis muutub vastavalt ka info (andmete) mõõtühik.

Niisiis, sisse kümnendsüsteem tähistuses on ühe numbri kaal 10 ja vastavalt sellele on teabe mõõtühik dit (kümnendkoht n n dit. Näiteks neljakohalise numbri 2009 andmemaht on V d = 4 dit.

IN kahendsüsteem tähistuses on ühe numbri kaal 2 ja vastavalt sellele on teabe mõõtühik natuke (bitt (kahendnumber) – kahendnumber). Sel juhul sõnum vormis n-kohalisel arvul on andmemaht V d = n natuke. Näiteks kaheksabitine binaarne kood 11001011 andmemaht on V d = 8 bitti.

Kaasaegses arvutitehnoloogia koos minimaalne ühik andmete mõõtmised natuke laialdaselt kasutatakse suurendatud mõõtühikut bait, võrdne 8 bitiga. Arvuti klaviatuuri tähestiku 256 tähemärgi kodeerimiseks (256 = 2 8) on vaja täpselt kaheksat bitti.

Töötades koos suured mahud selle koguse arvutamiseks kasutatakse rohkem teavet suured üksused mõõdud:

1 kilobait (KB) = 1024 baiti = 210 baiti,

1 megabait (MB) = 1024 KB = 2 20 baiti = 1 048 576 baiti;

1 gigabait (GB) = 1024 MB = 2 30 baiti = 1 073 741 824 baiti;

IN viimasel ajal Seoses töödeldava teabe mahu suurenemisega on kasutusele võetud sellised tuletatud ühikud nagu:

1 terabait (TB) = 1024 GB = 2 40 baiti = 1 099 511 627 776 baiti;

1 petabait (PB) = 1024 TB = 2 50 baiti = 1 125 899 906 842 624 baiti.

Tuleb märkida, et binaarses (arvuti) teabe mõõtmise süsteemis saadakse erinevalt meetermõõdustikust ühikud eesliidetega "kilo", "mega" jne, korrutades põhiühiku mitte arvuga 10 3 = 1000, 10 6 = 1 000 000 jne ja 2 10 puhul = 1024, 2 20 = 1 048 576 jne.

Infohulk I (entroopia lähenemine). Info- ja kodeerimise teoorias kasutatakse teabe mõõtmisel entroopiapõhist lähenemist. See lähenemine põhineb asjaolul, et teabe hankimise fakt on alati seotud süsteemi mitmekesisuse või määramatuse (entroopia) vähenemisega. Selle põhjal sõnumis sisalduva teabe hulk on defineeritud kui meede, mis vähendab teatud süsteemi oleku määramatust pärast sõnumi saamist. Ebakindlust saab tõlgendada selle järgi, kui vähe vaatleja antud süsteemist teab. Kui vaatleja on füüsilises süsteemis midagi tuvastanud, väheneb süsteemi entroopia, kuna vaatleja jaoks on süsteem muutunud korrapärasemaks.

Seega entroopia lähenemisviisiga informatsiooni all mõistetakse määramatuse kvantitatiivset väärtust, mis on kadunud mis tahes protsessi käigus (testimine, mõõtmine jne). Sel juhul võetakse entroopia kasutusele kui määramatuse mõõt N, ja teabe hulk on võrdne:

I = H apr – H aps

kus, H apr – a priori entroopia uuritava süsteemi või protsessi oleku kohta;

H aps – tagumine entroopia.

A posteriori (alates lat. a posteriori – järgnevast) – saadud kogemusest (testid, mõõtmised).

A priori (alates lat. a priori - eelmisest) on teadmisi iseloomustav mõiste, mis eelneb kogemusele (testimisele) ja on sellest sõltumatu.

Juhul, kui testi käigus eemaldatakse olemasolev määramatus (saadakse konkreetne tulemus, st H = 0), langeb saadud teabe hulk kokku esialgse entroopiaga

Vaatleme uuritava süsteemina diskreetset teabeallikat (diskreetsete sõnumite allikat), mille all peame silmas füüsiline süsteem, millel on piiratud hulk võimalikud olekud {ja i}, i = .

Kõik valmis A = (a 1, a 2, ..., a n) süsteemi olekuid nimetatakse infoteoorias abstraktseks tähestikuks või sõnumiallika tähestikuks.

Üksikud osariigid a 1, a 2,..., a n nimetatakse tähestiku tähtedeks või sümboliteks.

Selline süsteem võib igal ajahetkel juhuslikult omandada ühe võimalike olekute lõplikust hulgast. a i. Sel juhul väidavad nad, et erinevad olekud realiseeritakse nende allika valiku tõttu.

Teabe (teate) saajal on teatud ettekujutus teatud sündmuste võimalikust toimumisest. Need ideed on üldiselt ebausaldusväärsed ja neid väljendavad tõenäosus, millega ta seda või teist sündmust ootab. Ebakindluse üldmõõtu (entroopiat) iseloomustab teatav matemaatiline sõltuvus nendest tõenäosustest, mille määrab ära see, kui palju pärast teate saamist määramatuse mõõt väheneb.

Selgitame seda ideed näitega.

Olgu meil 32 erinevaid kaarte. Võimalus valida pakist üks kaart on 32. Enne valiku tegemist on loomulik eeldada, et teatud kaardi valimise võimalused on kõigil kaartidel ühesugused. Valiku tegemisega kõrvaldame selle ebakindluse. Sel juhul saab ebakindlust iseloomustada võimalike võrdselt tõenäoliste valikute arvuga. Kui nüüd defineerida ebakindluse kõrvaldamise mõõdikuna infohulk, siis valiku tulemusena saadud infot saab iseloomustada arvuga 32. Mugavam on aga kasutada mitte seda arvu ennast, vaid selle arvu logaritmi. ülaltoodud hinnang 2 põhjal:

kus m on võimalike võrdselt tõenäoliste valikute arv (Kui m=2, saame informatsiooni ühe bitiga). See tähendab, et meie puhul

H = log 2 32 = 5.

Väljatoodud lähenemisviis kuulub inglise matemaatikule R. Hartleyle (1928). Sellel on huvitav tõlgendus. Seda iseloomustavad mitmed küsimused, mille vastused on jah või ei, et määrata, millise kaardi inimene valis. Piisab 5 sellisest küsimusest.

Kui kaardi valikul ei ole iga kaardi ilmumise võimalus ühesugune (erinevalt tõenäoline), siis saame K. Shannoni (1948) pakutud statistilise lähenemise informatsiooni mõõtmiseks. Sel juhul mõõdetakse teabe suurust valemiga:

Kus p i- valiku tõenäosus i tähestiku märk.

Seda on lihtne näha, kui tõenäosus lk 1, ..., p n on võrdsed, siis on igaüks neist võrdsed 1/N, ja Shannoni valem muutub Hartley valemiks.

Informatsiooni mõõtmised semantilisel tasandil. Mõõta teabe semantilist sisu, st selle kogust per semantiline tasand, tesauruse mõõt, mis ühendab semantilised omadused teave kasutaja võimalusega sissetulevaid sõnumeid vastu võtta. Tõepoolest, selleks, et saadud teavet mõista ja kasutada, peab saajal olema teatud hulk teadmisi. Teema täielik teadmatus ei võimalda meil saadud sõnumist selle teema kohta kasulikku teavet ammutada. Kui teadmised teema kohta kasvavad, kasvab ka nende arv kasulikku teavet, välja võetud sõnumist.

Kui nimetada adressaadi teadmisi antud teema kohta tesauruseks (s.o teatud semantiliste seostega ühendatud sõnade, mõistete, objektide nimetuste kogum), siis saab teatud sõnumis sisalduva teabe hulka hinnata muutuse astme järgi. individuaalses tesauruses selle sõnumi mõjul.

Tesaurus- kasutajale või süsteemile kättesaadav teabe kogum.

Teisisõnu, number semantiline teave, mille saaja eraldab sissetulevatest sõnumitest, sõltub tema tesauruse valmisolekust sellise teabe tajumiseks.

Olenevalt info semantilise sisu vahekorrast S ja kasutaja tesaurus S p semantilise teabe hulk muutub ma s, mida kasutaja tajub ja seejärel lisab ta oma tesaurusesse. Selle sõltuvuse olemus on näidatud joonisel fig. 2.1. Vaatleme kahte piiravat juhtumit, kui semantilise teabe hulk I c on võrdne 0-ga:

a) kui S p = 0, ei taju (ei mõista) kasutaja sissetulevat teavet;

b) kui S -> ∞ kasutaja “teab kõike” ja ei vaja sissetulevat infot.

Riis. 1.2. Sõltuvus semantilise teabe hulgast,

tarbija tajutud tema tesaurusest I c =f(S p)

Maksimaalne kogus Tarbija omandab semantilise teabe, kooskõlastades selle semantilise sisu S oma tesaurusega S p (S = S p opt), kui sissetulev teave on kasutajale arusaadav ja annab talle varem tundmatut (ei ole tema tesauruses) teavet.

Järelikult on sõnumis sisalduva semantilise teabe hulk, kasutaja poolt vastuvõetud uute teadmiste hulk suhteline väärtus. Samal sõnumil võib olla asjatundliku kasutaja jaoks tähendusrikas ja ebapädeva kasutaja jaoks see tähenduseta.

Teabe semantilise (sisu) aspekti hindamisel on vaja püüda ühtlustada S ja Sp väärtusi.

Semantilise teabe hulga suhteline mõõt võib olla sisukordaja C, mis on määratletud semantilise teabe hulga ja selle mahu suhtena:

C = I s / V d

Informatsiooni meetmed pragmaatilisel tasandil. See mõõdik määrab teabe kasulikkuse kasutaja eesmärgi saavutamiseks. See mõõt on ka suhteline väärtus, mille määravad selle teabe kasutamise iseärasused konkreetses süsteemis.

Üks esimesi Venemaa teadlasi, kes tegeles teabe pragmaatilisel tasemel hindamise probleemiga, oli A.A. Kharkevitš, kes tegi ettepaneku võtta teabe väärtuse mõõdupuuks eesmärgi saavutamiseks vajaliku teabe hulk, st arvutada eesmärgi saavutamise tõenäosuse juurdekasv. Niisiis, kui enne teabe saamist oli eesmärgi saavutamise tõenäosus p 0 ja pärast selle saamist - p 1, siis määratakse teabe väärtus suhte p 1 / p 0 logaritmina:

I = log 2 p 1 – log 2 p 0 = log 2 (p 1 /p 0)

Seega mõõdetakse teabe väärtust teabeühikutes, in antud juhul bittides.

Teabe süntaktiline mõõt.

See meede infohulk opereerib umbisikulise informatsiooniga, mis ei väljenda semantilist seost objektiga. Andmemaht Vd sel juhul mõõdetakse sõnumit sõnumis olevate märkide (bittide) arvu järgi. IN erinevaid süsteeme Märgistuses on ühel numbril erinev kaal ja vastavalt muutub andmete mõõtühik.

Näiteks kahendarvusüsteemis on mõõtühikuks bit (bitine kahendnumber - kahendnumber). Bitt on vastus ühele kahendküsimusele ("jah" või "ei"; "0" või "1"), mis edastatakse sidekanalite kaudu signaali abil. Seega määrab sõnumis sisalduva informatsiooni hulk bittides numbri järgi kahendsõnad loomulik keel, märkide arv igas sõnas, iga märgi väljendamiseks vajalike binaarsignaalide arv.

IN kaasaegsed arvutid Koos minimaalse andmemõõtmisühikuga “bit” kasutatakse laialdaselt suurendatud mõõtühikut “bait”, mis on võrdne 8 bitiga. Kümnendarvusüsteemis on mõõtühikuks “bit” (kümnendkoht).

Teabe hulk I süntaktilisel tasandil on võimatu määrata ilma süsteemi oleku määramatuse (süsteemi entroopia) mõistet arvestamata. Tõepoolest, süsteemi kohta teabe saamine on alati seotud saaja teadmatuse astme muutumisega selle süsteemi oleku suhtes, s.t. info hulka mõõdetakse süsteemi oleku määramatuse muutumise (vähenemise) kaudu.

Teabe sisu koefitsient (kraad). sõnumi (kokkuvõtlikkus) määrab infohulga ja andmemahu suhe, s.t.

Y = I / Vd, 0-ga

Kasvamisega Y väheneb töö maht teabe (andmete) teisendamiseks süsteemis. Seetõttu püüavad nad suurendada teabesisu, mille jaoks töötatakse välja spetsiaalsed meetodid teabe optimaalseks kodeerimiseks.

Informatsiooni semantiline mõõt

Informatsiooni semantilise sisu mõõtmiseks, s.o. enim tunnustust on saanud selle kvantiteet semantilisel tasandil, tesauruse mõõt, mis seob info semantilised omadused kasutaja võimega sissetulevat sõnumit vastu võtta. Sel eesmärgil kasutatakse mõistet kasutaja tesaurus.

Tesaurus on kasutajale või süsteemile kättesaadav teabe kogum.

Olenevalt info semantilise sisu vahekorrast S ja kasutaja tesaurus Sp semantilise teabe hulk muutub Ic, kasutaja tajub ja lisab seejärel oma tesaurusesse.

Selle sõltuvuse olemus on näidatud joonisel fig. 1. Mõelge semantilise teabe kogusele kahel piiraval juhul Iс võrdub 0:

juures Sp= 0 kasutaja ei taju ega mõista sissetulevat teavet;

Kell Sp kasutaja teab kõike ja ta ei vaja sissetulevat infot.

Teema 2. Info esitamise ja töötlemise alused arvutis

Kirjandus

1. Informaatika majanduses: õpik/Toim. B.E. Odintsova, A.N. Romanova. – M.: Ülikooli õpik, 2008.

2. Arvutiteadus: põhikursus: õpik/Toim. S.V. Simonovitš. – Peterburi: Peeter, 2009.

3. Arvutiteadus. Üldkursus: Õpik/kaasautor: A.N. Guda, M.A. Butakova, N.M. Nechitailo, A.V. Tšernov; Üldise all toim. V.I. Kolesnikova. – M.: Dashkov ja K, 2009.

4. Informaatika majandusteadlastele: õpik/Toim. Matyushka V.M. - M.: Infra-M, 2006.

5. Majandusinformaatika: Sissejuhatus infosüsteemide majandusanalüüsi - M.: INFRA-M, 2005.

Teabe mõõtmed (süntaktiline, semantiline, pragmaatiline)

Teabe mõõtmiseks võib kasutada erinevaid lähenemisviise, kuid kõige laialdasemalt kasutatakse neid statistiline(tõenäoline), semantiline ja lk pragmaatiline meetodid.

Statistiline(tõenäosusliku) teabe mõõtmise meetodi töötas välja 1948. aastal K. Shannon, kes tegi ettepaneku käsitleda teabe kogust kui süsteemi seisundi määramatuse mõõdikut, mis eemaldati teabe vastuvõtmise tulemusena. Määramatuse kvantitatiivset väljendust nimetatakse entroopiaks. Kui pärast teatud teate saamist on vaatleja saanud süsteemi kohta lisateavet X, siis on ebakindlus vähenenud. Saadud lisateabe hulk määratletakse järgmiselt:

kus on lisateabe hulk süsteemi kohta X, saadud sõnumi kujul;

Süsteemi esialgne määramatus (entroopia). X;

Süsteemi lõplik määramatus (entroopia). X, toimub pärast teate kättesaamist.

Kui süsteem X võib olla ühes diskreetses olekus, mille arv n, ja süsteemi leidmise tõenäosus neist kõigist on võrdne ja kõigi olekute tõenäosuste summa on võrdne ühega, siis arvutatakse entroopia Shannoni valemi abil:

kus on süsteemi X entroopia;

A- logaritmi alus, mis määrab teabe mõõtühiku;

n– olekute (väärtuste) arv, milles süsteem võib olla.

Entroopia on positiivne suurus ja kuna tõenäosused on alati väiksemad kui üks ja nende logaritm on negatiivne, siis muudab miinusmärk K. Shannoni valemis entroopia positiivseks. Seega võetakse infohulga mõõdupuuks sama entroopia, kuid vastupidise märgiga.

Informatsiooni ja entroopia vahelist seost võib mõista järgmiselt: informatsiooni hankimine (selle suurendamine) tähendab samaaegselt teadmatuse või informatsiooni ebakindluse (entroopia) vähendamist.

Seega arvestab statistiline lähenemine teadete ilmumise tõenäosusega: informatiivsemaks peetakse seda sõnumit, mis on vähemtõenäoline, s.t. kõige vähem oodatud. Teabe hulk saavutab maksimaalse väärtuse, kui sündmused on võrdselt tõenäolised.

R. Hartley pakkus teabe mõõtmiseks välja järgmise valemi:

I=log2n ,

Kus n- võrdselt tõenäoliste sündmuste arv;

I– teates sisalduva teabe mõõt ühe sellise esinemise kohta n sündmused

Teabe mõõtmist väljendatakse selle mahus. Enamasti puudutab see arvuti mälu ja sidekanalite kaudu edastatavate andmete hulka. Ühikuks loetakse infohulk, mille puhul määramatust vähendatakse poole võrra natuke .

Kui Hartley valemis kasutatakse logaritmi alusena naturaallogaritmi (), siis on teabe mõõtühik nat ( 1 bitt = ln2 ≈ 0,693 nat). Kui logaritmi alusena kasutatakse arvu 3, siis - ravida, kui 10, siis - dit (Hartley).

Praktikas kasutatakse sagedamini suuremat üksust - bait(bait) võrdne kaheksa bitiga. See üksus valiti sellepärast, et seda saab kasutada arvuti klaviatuuri tähestiku 256 tähemärgi kodeerimiseks (256=28).

Lisaks baitidele mõõdetakse teavet poolsõnades (2 baiti), sõnades (4 baiti) ja topeltsõnades (8 baiti). Laialdaselt kasutatakse ka suuremaid teabeühikuid:

1 kilobait (KB - kilobait) = 1024 baiti = 210 baiti,

1 megabait (MB - megabait) = 1024 KB = 220 baiti,

1 gigabait (GB - gigabait) = 1024 MB = 230 baiti.

1 terabait (TB - terabait) = 1024 GB = 240 baiti,

1 petabait (PByte - petabait) = 1024 TB = 250 baiti.

1980. aastal pakkus vene matemaatik Yu Manin välja idee ehitada kvantarvuti, millega seoses tekkis selline infoühik nagu. kubit ( kvantbitt, kubit ) – “kvantbitt” on mälumahu mõõtmise mõõt teoreetiliselt võimalikus arvutivormis, mis kasutab kvantmeediat, näiteks elektronide spinni. Kubit võib võtta mitte kahte erinevat väärtust (“0” ja “1”), vaid mitut, mis vastavad kahe maapinna pöörlemisoleku normaliseeritud kombinatsioonidele, mis annab suurema arvu võimalikke kombinatsioone. Seega saab 32 kubitit kodeerida umbes 4 miljardit olekut.

Semantiline lähenemine. Süntaktilisest mõõdust ei piisa, kui peate määrama mitte andmemahu, vaid sõnumis vajaliku teabe hulga. Sel juhul võetakse arvesse semantilist aspekti, mis võimaldab meil määrata teabe sisu.

Teabe semantilise sisu mõõtmiseks võite kasutada selle saaja (tarbija) tesaurust. Tesauruse meetodi idee pakkus välja N. Wiener ja selle töötas välja meie kodumaine teadlane A. Yu. Schrader.

Tesaurus helistas teabe kogum mis teabe saajal on. Tesauruse korreleerimine saadud sõnumi sisuga võimaldab teada saada, kui palju see ebakindlust vähendab.

Sõnumi semantilise teabe mahu sõltuvus saaja tesaurusest

Vastavalt graafikul esitatud sõltuvusele, kui kasutajal puudub tesaurus (teadmised vastuvõetud sõnumi olemuse kohta, see on =0) või sellise tesauruse olemasolu, mis ei ole saabumise tulemusel muutunud. sõnumist (), siis on semantilise teabe hulk selles võrdne nulliga. Optimaalne tesaurus () on selline, milles semantilise teabe maht on maksimaalne (). Näiteks sissetuleva sõnumi semantiline teave on sisse lülitatud võõras võõrkeeles jääb nulliks, kuid sama olukord on ka juhtumi puhul kui sõnum pole enam uudis, kuna kasutaja teab juba kõike.

Pragmaatiline meede teavet määrab selle kasulikkuse tarbija eesmärkide saavutamisel. Selleks piisab eesmärgi saavutamise tõenäosuse määramisest enne ja pärast sõnumi saamist ning nende võrdlemist. Teabe väärtus (A. A. Kharkevitši järgi) arvutatakse järgmise valemi abil:

kus on tõenäosus saavutada eesmärk enne sõnumi saamist;

Eesmärgi saavutamise tõenäosus on sõnumi vastuvõtmise väli;

Teabe hindamisel eristatakse selliseid aspekte nagu süntaktiline, semantiline ja pragmaatiline. Süntaktiline aspekt seotud teabe edastamise meetodiga, sõltumata selle semantilistest ja tarbijaomadustest. Süntaktilisel tasandil vaadeldakse selle edastamise ja säilitamise vorme. Tavaliselt nimetatakse edastamiseks mõeldud teavet sõnumiks. Sõnumit saab esitada märkide ja sümbolite kujul, teisendada elektrilisele kujule ja kodeerida, s.t. esitatakse teatud elektriliste signaalide jada kujul, mis üheselt kuvavad edastatud teateid. Sõnumite edastamiseks teisendamise protsesside omadused määratakse süntaktilise aspektiga. Salvestamisel määravad süntaktilise aspekti muud infoesitusvormid, mis võimaldavad parimal viisil infobaasis infot otsida, salvestada, uuendada ja muuta. Teavet, mida vaadeldakse ainult süntaktilise aspektiga seoses, nimetatakse sageli andmeid. Semantiline aspekt annab edasi teabe semantilist sisu ja korreleerib selle varem kättesaadava teabega. Kajastuvad semantilised seosed sõnade ja teiste keeleelementide vahel "tesaurus"(sõnaraamat). See koosneb kahest osast: sõnade ja seatud fraaside loendist, mis on rühmitatud tähenduse järgi, ja teatud võtmest (tähestikust), mis võimaldab teil sõnu teatud järjekorras järjestada. Teabe saamisel saab tesaurust muuta ning selle muutuse määr iseloomustab taasesitava teabe hulka. Pragmaatiline aspekt määrab kindlaks seatud eesmärgi saavutamise võimaluse, võttes arvesse saadud teavet. See aspekt peegeldab teabe tarbijaomadusi – kui teave osutub väärtuslikuks, muutub selle tarbija käitumine õiges suunas. Pragmaatiline aspekt avaldub siis, kui tarbija ja eesmärgi vahel valitseb ühtsus.

Seega läbib teave selle esinemise ja teisenduste kohta 3 etappi, mis määravad selle semantilised, süntaktilised ja pragmaatilised aspektid. Inimene jälgib esmalt mõningaid ümbritseva reaalsuse fakte, mis peegelduvad teatud andmekogumi kujul tema teadvuses – see on koht, kus süntaktiline aspekt. Seejärel, pärast nende andmete struktureerimist vastavalt ainevaldkonnale, vormistab inimene teadmised objekti struktuuri kohta - see semantiline aspekt saadud teavet. Teadmiste kujul olev teave on kõrge struktureerituse astmega, mis võimaldab eraldada täielikku teavet ümbritseva reaalsuse kohta ja luua uuritavate objektide teabemudeleid. Seejärel kasutab inimene omandatud teadmisi oma praktikas ehk oma eesmärkide saavutamiseks, mis peegeldab pragmaatiline aspekt.

Mõiste " teavet"pärineb ladina keelest" informatio", mis tähendab selgitamist, teadvustamist, esitlemist. Materialistliku filosoofia positsioonilt on informatsioon tegeliku maailma peegeldus informatsiooni (sõnumite) abil. Alati toimub teabe ülekanne ruumis ja ajas teabeallikast vastuvõtjale (vastuvõtjale). Sel juhul kasutatakse teabe edastamiseks erinevaid märke või sümboleid, näiteks loomulikku või tehislikku (formaalset) keelt, võimaldades seda väljendada mingil kujul, mida nimetatakse sõnumiks. on teabe esitamise vorm kõne, teksti, piltide, digitaalsete andmete, graafikute, tabelite jne kujul. Laias mõttes teavet on üldteaduslik mõiste, mis hõlmab inimestevahelist infovahetust, signaalivahetust elava ja eluta looduse, inimeste ja seadmete vahel.

Arvutiteadus käsitleb teavet kui kontseptuaalselt omavahel seotud teavet, andmeid, mõisteid, mis muudavad meie ettekujutusi ümbritseva maailma nähtusest või objektist. Koos arvutiteaduse teabega on mõiste " andmeid" Näitame, kuidas need erinevad.

Andmed võib pidada märkideks või salvestatud vaatlusteks, mida mingil põhjusel ei kasutata, vaid ainult talletatakse. Kui neid kasutatakse objekti kohta ebakindluse vähendamiseks (teabe saamiseks), muutuvad andmed teabeks. Andmed eksisteerivad objektiivselt ega sõltu inimesest ja tema teadmiste mahust. Ühe inimese samad andmed võivad muutuda infoks, sest... need aitasid kaasa inimese teadmiste ebakindluse vähendamisele, kuid teise inimese jaoks jäävad need andmeteks.

Näide 1

Kirjutage paberilehele 10 telefoninumbrit 10 numbri jadana ja näidake neid kaasõpilasele. Ta tajub neid numbreid andmetena, sest... nad ei anna talle mingit teavet.

Seejärel märkige iga numbri vastas ettevõtte nimi ja tegevuse liik. Kaasõpilase jaoks varem arusaamatud arvud saavad kindluse ja muutuvad andmetest teabeks, mida ta saaks tulevikus kasutada.

Andmeid saab jagada faktideks, reegliteks ja jooksvaks teabeks. Faktid vastavad küsimusele "Ma tean, et...". Näited faktidest:

Moskva on Venemaa pealinn;
Kaks korda kaks võrdub neli;
Hüpotenuusi ruut võrdub jalgade ruutude summaga.

Reeglid vastavad küsimusele "Ma tean, kuidas...". Reeglite näited:

Ruutvõrrandi juurte arvutamise reeglid;
sularahaautomaadi kasutamise juhend;
Liiklusseadused.

Faktid ja reeglid on piisavad andmed pikaajalise kasutamise kohta.

Need on üsna staatilised, st. aja jooksul muutumatu.

Jooksev informatsioon kujutab endast suhteliselt lühikese aja jooksul kasutatud andmeid – dollari vahetuskurssi, toote hinda, uudiseid.

Üks olulisemaid teabe liike on majandusteave. Selle eripäraks on seos inimeste ja organisatsioonide meeskondade juhtimisprotsessidega. Majandusteave kaasneb materiaalsete kaupade ja teenuste tootmise, levitamise, vahetamise ja tarbimise protsessidega. Märkimisväärne osa sellest on seotud sotsiaalse tootmisega ja seda võib nimetada tootmisinformatsiooniks.

Infoga töötamisel on alati olemas allikas ja tarbija (vastuvõtja). Teed ja protsesse, mis tagavad sõnumite edastamise teabeallikast selle tarbijani, nimetatakse infokommunikatsiooniks.

1.2.2. Teabe adekvaatsuse vormid Teabetarbija jaoks on väga oluline omadus selle.

piisavus

Reaalses elus on olukord, kus saab loota teabe täielikule adekvaatsusele, vaevalt võimalik. Alati on teatav ebakindlus. Tarbija otsuste tegemise õigsus sõltub teabe adekvaatsuse määrast objekti või protsessi tegelikule olekule.

Näide 2

Oled edukalt kooli lõpetanud ja soovid jätkata haridusteed majanduse erialal. Pärast sõpradega vestlemist saate teada, et sarnase koolituse saab omandada erinevates ülikoolides. Selliste vestluste tulemusel saate väga vastuolulist teavet, mis ei võimalda teil langetada otsust ühe või teise variandi kasuks, s.t. saadud teave ei vasta tegelikule asjadele.

Usaldusväärsema teabe saamiseks ostate ülikoolidesse sisseastujatele juhendi, kust saate põhjalikku teavet. Sel juhul võime öelda, et kataloogist saadud teave kajastab adekvaatselt ülikoolide õppesuundi ja aitab teha lõplikku valikut. Teabe adekvaatsust saab väljendada kolmel kujul:

semantiline, süntaktiline, pragmaatiline.

Süntaktiline adekvaatsus kuvab teabe formaalsed ja struktuurilised omadused ega mõjuta semantilist sisu.

Süntaktilisel tasandil võetakse arvesse teabekandja tüüpi ja teabe esitamise meetodit, edastamise ja töötlemise kiirust, teabe esitamise koodide suurust, nende koodide teisendamise usaldusväärsust ja täpsust jne.

Teavet, mida vaadeldakse ainult süntaktilisest vaatepunktist, nimetatakse tavaliselt andmeteks, kuna semantiline pool ei oma tähtsust. See vorm aitab kaasa väliste struktuuriomaduste tajumisele, s.o. teabe süntaktiline pool.

Semantiline (mõtteline) adekvaatsus

Semantiline adekvaatsus määrab objekti kujutise ja objekti enda vastavuse astme. Semantiline aspekt viitab teabe semantilise sisuga arvestamisele. Sellel tasandil analüüsitakse informatsiooni, mida informatsioon peegeldab, ja vaadeldakse semantilisi seoseid. Arvutiteaduses luuakse semantilised seosed info esitamise koodide vahel. See vorm aitab kujundada mõisteid ja ideid, tuvastada teabe tähendust, sisu ja üldistust.

Pragmaatiline (tarbija) adekvaatsus

Pragmaatiline adekvaatsus

peegeldab teabe ja selle tarbija vahelist suhet, teabe vastavust juhtimiseesmärgile, mida selle alusel rakendatakse. Informatsiooni pragmaatilised omadused ilmnevad ainult siis, kui on olemas teabe (objekti), kasutaja ja juhtimiseesmärgi ühtsus. Kaalustamise pragmaatiline aspekt on tarbija jaoks seotud teabe kasutamise väärtuse ja kasulikkusega, et töötada välja lahendus oma eesmärgi saavutamiseks. Sellest vaatenurgast lähtudes analüüsitakse teabe tarbijaomadusi. See adekvaatsuse vorm on otseselt seotud teabe praktilise kasutamisega, selle vastavusega süsteemi sihtfunktsioonile.

1.2.3. Mõõtmisteave

Teabe mõõtmiseks võetakse kasutusele kaks parameetrit:

Nendel parameetritel on olenevalt vaadeldavast adekvaatsuse vormist erinevad väljendused ja tõlgendused. Iga adekvaatsuse vorm vastab oma teabehulga ja andmemahu mõõtmisele (joonis 1).

Riis. 1. Teavitusmeetmed

kahendarvusüsteemis on mõõtühikuks bit ( kahendnumber - kahendnumber). Koos selle mõõtühikuga kasutatakse laialdaselt suurendatud mõõtühikut “bait”, mis on võrdne 8 bitiga.
Kümnendarvusüsteemis on mõõtühikuks dit (kümnendkoht).

Näide 3

Kaheksabitise binaarkoodi 10111011 kujul oleval kahendsüsteemis teatel on andmemaht Kümnendsüsteemis kuuekohalise numbri 275903 kujul oleval teatel on andmemaht

Infohulga I määramine süntaktilisel tasandil on võimatu ilma süsteemi oleku määramatuse (süsteemi entroopia) mõistet arvestamata. Tõepoolest, süsteemi kohta teabe saamine on alati seotud saaja teadmatuse astme muutumisega selle süsteemi oleku suhtes. Mõelgem sellele kontseptsioonile.

Laske tarbijal enne teabe saamist süsteemi kohta eelinfot (a priori) saada a . Tema süsteemi teadmatuse mõõdupuuks on funktsioon H(a), mis samal ajal toimib ka süsteemi oleku määramatuse mõõdupuuna. Seda meedet nimetati entroopia.

Kui tarbijal on süsteemi kohta täielik info, siis on entroopia 0. Kui tarbijal on mingi süsteemi suhtes täielik ebakindlus, siis on entroopia positiivne arv. Uue teabe hankimisel entroopia väheneb. Pärast mõne sõnumi saamist b adressaat omandas teatud lisateavet, mis vähendas tema a priori teadmatust nii, et tagantjärele (peale sõnumi kättesaamist b

) süsteemi oleku määramatus on muutunud. Pärast mõne sõnumi saamist Seejärel sõnumiga saadud süsteemiteabe hulk , , määratletakse kui

st informatsiooni hulka mõõdetakse süsteemi oleku määramatuse muutumise (vähenemise) järgi. Kui lõplik määramatus läheb nulli, siis asendub esialgne puudulik teadmine täielike teadmistega ja infohulk . Teisisõnu, süsteemi entroopia H(a)

võib pidada puuduva teabe mõõdupuuks. läheb nulli, siis asendub esialgne puudulik teadmine täielike teadmistega ja infohulk . Teisisõnu, süsteemi entroopia Süsteemi entroopia , millel N

(1)

võimalikud olekud on Shannoni valemi järgi võrdne i kus on tõenäosus, et süsteem on sees

- tingimus.

(2)

Juhuks, kui süsteemi kõik olekud on võrdselt tõenäolised, s.t. nende tõenäosused on võrdsed, selle entroopia määrab seos

Süsteemi entroopiat kahendarvusüsteemis mõõdetakse bittides.

Süsteemil, mis kirjeldab mündi viskamise protsessi, on kaks võrdselt tõenäolist olekut. Kui peate ära arvama, kumb pool peale kukkus, siis on teil esmalt täielik ebakindlus süsteemi oleku suhtes. Süsteemi oleku kohta teabe saamiseks esitate küsimuse: "Kas see on pea?" Selle küsimusega üritad kõrvale heita pooled tundmatutest olekutest, st.

vähendada määramatust 2 korda. Ükskõik, milline vastus on "jah" või "ei", saate süsteemi oleku kohta täieliku selguse. Seega sisaldab vastus küsimusele 1 bitti teavet. Kuna peale 1. küsimust oli täielik selgus, võrdub süsteemi entroopia 1. Sama vastus annab valemiga (2), sest log2 2=1.

Näide 5.

Mäng "Arva ära number". Peate ära arvama kavandatud arvu vahemikus 1 kuni 100. Arvamise alguses on teil süsteemi oleku suhtes täielik ebakindlus. Arvamisel tuleb küsimusi esitada mitte juhuslikult, vaid nii, et vastus vähendab teadmiste ebakindlust 2 korda, saades seega iga küsimuse peale ligikaudu 1 biti infot. Näiteks peate esmalt esitama küsimuse: "Kas arv on suurem kui 50?" "Õige" lähenemine arvamisele võimaldab ära arvata numbri 6-7 küsimuses. Kui rakendame valemit (2), siis selgub, et süsteemi entroopia võrdub log2 100 = 6,64.

Näide 6.
Tumbo-Jumbo tähestik sisaldab 32 erinevat tähemärki. Mis on süsteemi entroopia? Teisisõnu on vaja kindlaks määrata, kui palju teavet iga sümbol kannab.

Kui eeldada, et iga märk esineb sõnades võrdse tõenäosusega, siis on entroopia log2 32=5.

Teabe sisu koefitsient (kraad). Kõige sagedamini kasutatakse kahend- ja kümnendlogaritme. Mõõtühikud on neil juhtudel vastavalt bit ja dit.

sõnumi (kokkuvõtlikkus) määrab infohulga ja andmemahu suhe, s.t.

Mida suurem on infosisu koefitsient Y, seda väiksem on töömaht teabe (andmete) teisendamiseks süsteemis. Seetõttu püüavad nad suurendada teabesisu, mille jaoks töötatakse välja spetsiaalsed meetodid teabe optimaalseks kodeerimiseks.

Informatsiooni semantiline mõõt Informatsiooni semantilise sisu mõõtmiseks, s.o. selle kogusest semantilisel tasemel pälvis Yu.I Schneideri pakutud tesauruse mõõt suurima tunnustuse. See seob teabe semantilised omadused eelkõige kasutaja võimega sissetulevat sõnumit vastu võtta. Sel eesmärgil on kontseptsioon "".

kasutaja tesaurus S Olenevalt info semantilise sisu vahekorrast ja kasutaja tesaurus muutub semantilise teabe hulk, mida kasutaja tajub ja mida ta seejärel oma tesaurusesse lisab. Selle sõltuvuse olemus on näidatud joonisel fig. 2. Vaatleme kahte piiravat juhtumit, kui semantilise teabe hulk võrdub 0:

Tarbija saab maksimaalselt semantilist teavet selle semantilise sisu kokkuleppimisel S oma tesaurusega , kui sissetulev teave on kasutajale arusaadav ja annab talle varem tundmatut (ei ole tema tesauruses) teavet.

Riis. 2. Tarbija poolt tajutava semantilise teabe hulga sõltuvus tema tesaurusest

Info semantilist (sisulist) aspekti hinnates tuleb püüda väärtuste ühtlustamise poole S Ja Sp.

Semantilise teabe hulga suhteline mõõt võib olla sisukordaja KOOS , mis on määratletud kui semantilise teabe hulga ja selle mahu suhe

Pragmaatiline teabe mõõt

Informatsiooni pragmaatiline mõõt aitab selle kindlaks määrata kasulikkus(väärtused) kasutajale eesmärgi saavutamiseks. See mõõt on ka suhteline väärtus, mille määravad selle teabe kasutamise iseärasused konkreetses süsteemis. Informatsiooni väärtust on soovitav mõõta samades ühikutes (või nende lähedal), milles mõõdetakse sihtfunktsiooni.

Näide 7

Majandussüsteemis saab teabe pragmaatilisi omadusi (väärtust) määrata toimimise majandusliku efekti suurenemisega, mis saavutatakse selle teabe kasutamisega süsteemi haldamiseks:

kus on juhtsüsteemi infosõnumi väärtus ;

- a priori oodatav kontrollsüsteemi toimimise majanduslik mõju;

Süsteemi toimimise eeldatav mõju tingimusel, et teates sisalduvat teavet kasutatakse juhtimiseks.

Võrdluseks esitame tabelis sisestatud teabemõõdud.

Tabel 1. Teabeühikud ja näited	Teabemeetmed	Mõõtühikud Näited
(arvutiala jaoks) Süntaktiline: a) Shannoni lähenemine	b) arvutipõhine lähenemine a) määramatuse vähenemise aste	b) teabe esitamise ühikud b) bitt, bait, KB jne.
Semantiline	a) tesaurus b) majandusnäitajad	a) rakendustarkvarapakett, personaalarvuti, arvutivõrgud jne. b) tasuvus, tootlikkus, amortisatsioonimäär jne.
Pragmaatiline	Väärtus kasutusel	Mälu maht, arvuti jõudlus, andmeedastuskiirus jne. Rahaline väärtus Aeg info töötlemiseks ja otsuste tegemiseks

1.2.4. Teabe omadused

Info kasutamise võimalikkuse ja efektiivsuse määravad sellised põhiomadused nagu: esinduslikkus, sisu, piisavus, juurdepääsetavus, asjakohasus, ajakohasus, täpsus, usaldusväärsus, jätkusuutlikkus.
Info esinduslikkus on seotud selle valiku ja moodustamise õigsusega, et kajastada adekvaatselt objekti omadusi.

Siin on kõige olulisemad asjad:

algse kontseptsiooni sõnastuse aluseks oleva mõiste õigsus;
kuvatava nähtuse oluliste tunnuste ja seoste valiku kehtivus.

Teabe esinduslikkuse rikkumine toob sageli kaasa olulisi vigu.

Sisu informatsioon peegeldab semantilist suutlikkust, mis võrdub sõnumis sisalduva semantilise teabe hulga ja töödeldud andmete mahu suhtega, s.t. . Infosisu kasvades suureneb infosüsteemi semantiline läbilaskevõime, kuna sama info saamiseks on vaja teisendada väiksem hulk andmeid.

Koos sisukoefitsiendiga C , peegeldades semantilist aspekti, saate kasutada ka teabesisu koefitsienti, mida iseloomustab süntaktilise teabe (Shannoni järgi) ja andmemahu suhe. .

Adekvaatsus teabe (täielikkus) tähendab, et see sisaldab minimaalset, kuid piisavat koostist (näitajate kogumit), et teha õige otsus. Info täielikkuse mõiste on seotud selle semantilise sisu (semantika) ja pragmaatikaga. Mittetäielikuna, s.o. Nii ebapiisav teave õige otsuse tegemiseks kui ka liigne teave vähendavad kasutaja tehtud otsuste tõhusust.

Kättesaadavus teave kasutaja tajumisele tagatakse asjakohaste protseduuride rakendamisega selle hankimiseks ja teisendamiseks.

Näiteks infosüsteemis muudetakse teave kättesaadavaks ja kasutajasõbralikuks vormiks. See saavutatakse eelkõige selle semantilise vormi kooskõlastamisega kasutaja tesaurusega. Teabe määrab haldamiseks vajaliku teabe säilivusaste selle kasutamise ajal ja see sõltub selle omaduste muutuste dünaamikast ja ajavahemikust, mis on möödunud selle teabe ilmnemisest.

Õigeaegsus teave tähendab selle saabumist hiljemalt etteantud ajahetkel, mis on kooskõlas ülesande lahendamise ajaga.

Täpsus informatsiooni määrab vastuvõetud informatsiooni lähedusaste objekti, protsessi, nähtuse vms tegelikule olekule.

Digitaalse koodiga kuvatava teabe jaoks on teada neli täpsuse klassifitseerimise kontseptsiooni:
formaalne täpsus, mida mõõdetakse arvu vähima tähendusega numbri ühikuväärtusega;
tegelik täpsus, mis on määratud numbri viimase numbri ühiku väärtusega, mille täpsus on tagatud;
maksimaalne täpsus, mida on võimalik saavutada süsteemi konkreetsetes töötingimustes;

nõutav täpsus, mis on määratud indikaatori funktsionaalse eesmärgiga. Usaldusväärsus

teabe määrab selle omadus peegeldada reaalseid objekte vajaliku täpsusega. Info usaldusväärsust mõõdetakse nõutava täpsuse usaldustõenäosusega, s.o. tõenäosus, et teabe abil kuvatav parameetri väärtus erineb selle parameetri tegelikust väärtusest nõutud täpsuse piires. Jätkusuutlikkus

teave peegeldab selle võimet reageerida lähteandmete muutustele nõutavat täpsust rikkumata.

Info stabiilsuse ja ka esinduslikkuse määrab selle valiku ja moodustamise metoodika.

Kokkuvõttes tuleb märkida, et sellised infokvaliteedi parameetrid nagu esinduslikkus, sisu, piisavus, juurdepääsetavus, stabiilsus on täielikult määratud infosüsteemide arendamise metoodilisel tasandil. Asjakohasuse, õigeaegsuse, täpsuse ja usaldusväärsuse parameetrid on samuti suuremal määral määratud metoodilisel tasandil, kuid nende väärtust mõjutab oluliselt süsteemi toimimise iseloom, eelkõige selle töökindlus. Samal ajal on asjakohasuse ja täpsuse parameetrid rangelt seotud vastavalt ajakohasuse ja usaldusväärsuse parameetritega.. Teabetegevus koosneb mitmesugustest toimingutest, mida tehakse teabega. Nende hulgas on teabe otsimise, vastuvõtmise, töötlemise, edastamise, säilitamise ja kaitsmisega seotud toiminguid.

Inimestevaheline infovahetus, inimkeha reaktsioon loodusnähtustele, inimese ja automatiseeritud süsteemi koosmõju on kõik näited infoprotsessidest.

Protsess kogumine sisaldab:

parameetrite mõõtmine;
parameetrite registreerimine andmete kujul hilisemaks töötlemiseks;
andmete teisendamine süsteemis kasutatavale vormile (kodeerimine, redutseerimine soovitud kujule ja sisestamine töötlemissüsteemi).

Andmete mõõtmiseks ja salvestamiseks peab olema riistvara, mis teisendab signaalid vastuvõtjasüsteemile arusaadavasse (ühilduvasse) vormi. Näiteks patsiendi temperatuuri või mulla niiskuse salvestamiseks järgnevaks raviks on vaja spetsiaalseid andureid. Riistvara on vajalik ka nende andmete kandmiseks või edastamiseks.

Teabe salvestamine on vajalik selleks, et samu andmeid saaks korduvalt kasutada. Teabe salvestamise tagamiseks on vaja riistvara andmete kirjutamiseks füüsilisele andmekandjale ja teabekandjalt lugemiseks.

Protsess vahetada teave eeldab teabe allika ja tarbija (vastuvõtja) olemasolu. Allikast teabe väljastamise protsessi nimetatakse ülekandmine, ja tarbijateabe hankimise protsessi nimetatakse vastuvõtt. Seega tähendab vahetusprotsess kahe omavahel ühendatud edastus- ja vastuvõtuprotsessi olemasolu.

Edastamise ja vastuvõtu protsessid võivad olla ühesuunalised, kahesuunalised või vaheldumisi kahesuunalised.

Nimetatakse teid ja protsesse, mis tagavad sõnumite edastamise teabeallikast selle tarbijani infosuhtlus.

Riis. 3. Infovahetusprotsess

Teabeallikateks ja tarbijateks võivad olla inimesed, loomad, taimed ja automaatsed seadmed. Allikast tarbijale edastatakse teave sõnumite kujul. Sõnumite vastuvõtmine ja edastamine toimub signaalide kujul. Signaal on muutus füüsilises keskkonnas, mis kuvab sõnumi. Signaal võib olla heli-, valgus-, haistmis- (lõhnaline), elektriline, elektromagnetiline jne.

Kodeerija teisendab sõnumi allikale arusaadavas vormis signaalideks füüsilisest kandjast, mille kaudu sõnum edastatakse.

Dekodeerimisseade teostab pöördoperatsiooni ja teisendab meediumisignaalid tarbijale arusaadavasse vormi.

Edastatavate sõnumite materiaalseteks kandjateks võivad olla looduslikud keemilised ühendid (lõhnatud ja maitsestatud), õhu- või telefonimembraanide mehaanilised vibratsioonid (heli edastamisel), elektrivoolu kõikumised juhtmetes (telegraaf, telefon), optilise ulatusega elektromagnetlained (tajutavad). inimsilma poolt), raadiosagedusala elektromagnetlained (heli ja telepildi edastamiseks).

Inimese ja loomade kehas edastatakse teave närvisüsteemi kaudu nõrkade elektrivoolude või spetsiaalsete keemiliste ühendite (hormoonide) kaudu, mis kanduvad veres. Iseloomustab suhtluskanaleid läbilaskevõime

- ajaühikus edastatud andmete hulk. See sõltub transiiveri seadmete teabe teisendamise kiirusest ja kanalite endi füüsilistest omadustest. Läbilaskevõime määrab kanali füüsilise olemuse võimalused.

Arvutustehnikas on infoprotsessid automatiseeritud ning kasutavad riist- ja tarkvarameetodeid, mis viivad signaalid ühilduvale vormile.

Kõik töötlemise ja edastamise etapid nõuavad sobiva ühilduva riistvaraga saate- ja vastuvõtuseadmeid.
Andmed pärast vastuvõtmist saab salvestada andmekandjale, et salvestada kuni järgmise protsessini.

Seetõttu võib teabeprotsess koosneda reast andmete teisendustest ja salvestamisest uuel kujul.

Kaasaegses maailmas kiputakse infoprotsesse automatiseerima arvutis. Üha rohkem tekib infosüsteeme, mis rakendavad infoprotsesse ja rahuldavad infotarbijate vajadusi. Andmete salvestamine arvutikataloogidesse võimaldab teil teavet kiiresti kopeerida, paigutada erinevatele andmekandjatele ja väljastada kasutajatele erineval kujul. Samuti muutuvad pikkade vahemaade taha teabe edastamise protsessid. Inimkond liigub tasapisi üle globaalsete võrgustike kaudu suhtlemisele.

Töötlemine

on teabe teisendamise protsess ühest tüübist teise.
Töötlemiseks on vaja järgmisi tingimusi:
tehnoloogia, mis määratleb andmete teisendamise reeglid (meetodid).

Töötlemisprotsess lõpeb uue teabe (vormis, sisus, tähenduses) saamisega, mida nimetatakse tulemuseks teavet.

Infotöötlusprotsess sarnaneb materjali tootmise protsessiga.
Kaupade valmistamiseks on vaja toorainet (lähtematerjalid), keskkonda ja tootmisvahendeid (töökoda ja masinad), kauba valmistamise tehnoloogiat.

Kõik ülalkirjeldatud teabeprotsessi üksikud aspektid on omavahel tihedalt seotud.

Infoprotsessi läbiviimisel arvutis on andmetega neli toimingute rühma - sisend, salvestamine, töötlemine ja väljund.

Töötlemine hõlmab andmete teisendamist mõnes tarkvarakeskkonnas. Igal tarkvarakeskkonnal on tööriistade komplekt, mille abil saate andmetega töötada. Töötlemise läbiviimiseks on vaja tunda keskkonnas töötamise tehnoloogiat, s.o. tehnoloogia keskkonnatööriistadega töötamiseks.

Töötlemise võimaldamiseks tuleb sisestada andmed, s.o. teisaldatakse kasutajalt arvutisse. Selleks on loodud mitmesugused sisendseadmed.

Andmete kadumise ja taaskasutamise tagamiseks salvestatakse andmed erinevatele teabesalvestusseadmetele.

Infotöötluse tulemuste nägemiseks tuleb see kuvada, s.t. edastatakse arvutist kasutajale, kasutades erinevaid väljundseadmeid.

1.2.6. Numbrilise teabe kodeerimine

Üldmõisted

Kodeerimissüsteemi kasutatakse objekti nime asendamiseks sümboliga (koodiga), et tagada teabe mugav ja tõhusam töötlemine. Kodeerimissüsteem

- objektide kodeerimise reeglite kogum.

Kood põhineb tähestikul, mis koosneb tähtedest, numbritest ja muudest sümbolitest. Koodi iseloomustavad:
pikkus - koodi positsioonide arv;

struktuur – klassifikatsiooniatribuudi tähistamiseks kasutatavate sümbolite koodi järjestus. Kutsutakse välja protseduur, millega määratakse objektile kooditähis

kodeerimine.

Sissejuhatus numbrisüsteemidesse

Arve saab esitada erinevates numbrisüsteemides. Numbrite kirjutamiseks saab kasutada mitte ainult numbreid, vaid ka tähti (näiteks rooma numbrite kirjutamine - XXI, MCMXCIX). Sõltuvalt numbrite esitusviisist jagunevad numbrisüsteemid Ja positsiooniline.

Positsioonilises arvusüsteemis oleneb numbri iga numbri kvantitatiivne väärtus kohast (positsioonist või numbrist), kuhu selle arvu üks või teine number on kirjutatud. Numbrikohad on nummerdatud 0-st paremalt vasakule. Näiteks kümnendarvusüsteemis arvu 2 asukohta muutes saab kirjutada erineva suurusega kümnendarvud, näiteks 2 (arv 2 on 0. positsioonil ja tähendab kahte ühikut); 20 (arv 2 on 1. positsioonil ja tähendab kahte kümmet); 2000 (arv 2 on 3. positsioonil ja tähendab kahte tuhat); 0,02 jne. Numbri asukoha nihutamine naaberkohale suurendab (vähendab) selle väärtust 10 korda.

Mittepositsioonilises arvusüsteemis ei muuda arvud oma kvantitatiivset väärtust, kui nende asukoht (positsioon) arvus muutub. Mittepositsioonilise süsteemi näiteks on Rooma süsteem, kus olenemata asukohast on sama sümbol sama tähendusega (näiteks sümbol X numbris XVX tähendab kümmet, olenemata selle asukohast).

Kutsutakse erinevate sümbolite arvu (p), mida kasutatakse numbri tähistamiseks positsioonilises numbrisüsteemis alusel numbrisüsteemid. Numbrite väärtused on vahemikus 0 kuni p-1.

Kümnendarvude süsteemis kasutatakse suvalise arvu kirjutamiseks p=10 ja 10 numbrit: 0, 1, 2, ... 9.

Arvuti jaoks osutus kõige sobivamaks ja usaldusväärsemaks kahendarvusüsteem (p=2), milles arvude esitamiseks kasutatakse numbrite jadasid - 0 ja 1. Lisaks osutus see arvuti tööks mugav kasutada teabe esitamist veel kahe numbrisüsteemi abil:

kaheksand (p=8, s.t. suvaline arv esitatakse 8 numbriga - 0,1, 2,...7);
kuueteistkümnendsüsteem (p=16, kasutatavad märgid on numbrid - 0, 1, 2, ..., 9 ja tähed - A, B, C, D, E, F, asendades numbreid 10,11, 12, 13, 14, 15 vastavalt).

Kümnend-, kahend- ja kuueteistkümnendsüsteemi koodide vastavus on toodud tabelis 2.

Tabel 2. Kümnend-, kahend- ja kuueteistkümnendsüsteemi koodide vastavus

Kümnend	Binaarne	Kuueteistkümnendsüsteem

Üldiselt võib mis tahes arvu N positsiooninumbrisüsteemis esitada järgmiselt:

kus k on numbrite arv arvu N täisarvus;

- arvu N täisosa (k–1) number, kirjutatud arvusüsteemi alusega p;

Arvu N murdosa N koht, kirjutatud arvusüsteemi alusega p;

n - numbrite arv arvu N murdosas;

Maksimaalne arv, mida saab esitada k numbriga.

Minimaalne arv, mida saab esitada n numbriga.

Kui täisarvu osas on k numbrit ja murdosas n numbrit, saate kirjutada kokku erinevaid arve.

Võttes arvesse neid märke, on arvu N kirjutamine mis tahes positsioonilises arvusüsteemis alusega p kujul:

Näide 8

Kui p = 10, on arvu kirjutamine kümnendarvusüsteemis 2466,675 10, kus k = 4, n = 3.

Kui p = 2, on kahendarvuna kirjutatud arv 1011,112, kus k = 4, n = 2.

Kahend- ja kuueteistkümnendsüsteemil on samad omadused nagu kümnendarvudel, ainult numbrite esitamiseks, ei kasutata 10 numbrit, vaid esimesel juhul ainult kahte ja teisel juhul 10 numbrit ja 6 tähte. Vastavalt sellele ei nimetata arvu numbrit kümnend-, vaid kahend- või kuueteistkümnendsüsteemiks.

Aritmeetiliste toimingute sooritamise põhiseadusi kahend- ja kuueteistkümnendsüsteemis järgitakse samamoodi nagu kümnendsüsteemis.

Võrdluseks vaatleme arvude esitamist erinevates arvusüsteemides terminite summana, milles võetakse arvesse iga numbri kaal.

Näide 9

Kümnendarvude süsteemis

Kahendarvusüsteemis

Kuueteistkümnendsüsteemis

Arvude ühest numbrisüsteemist teise teisendamiseks kehtivad reeglid.

Arvude esitamise vormid arvutis

Arvutid kasutavad kahendarvude esitamiseks kahte vormi:
loomulik vorm või fikseeritud punktvorm;

normaalvorm või ujukoma (punkt) vorm.

Loomulikul kujul (fikseeritud punktiga) esitatakse kõik numbrid numbrijadana, mille koma asukoht on kõigi arvude jaoks konstantne, eraldades täisarvu murdosast.

Näide 10

Kümnendarvusüsteemis on arvu täisarvus 5 numbrit ja arvu murdosas 5 numbrit. Sellises bitiruudustikus kirjutatud numbrid on näiteks kujul: +00564.24891; -10304.00674 jne. Maksimaalne arv, mida sellises bitiruudustikus saab esitada, on 99999.99999..

Kui kasutatakse arvusüsteemi, mille alus on p ja arvu täisarvuosas on k numbrit ja murdosas n numbrit, siis fikseeritud punkti kujul esitatavate oluliste arvude vahemiku N määrab seos:

Näide 11

Kui p =2, k =10, n =6, määratakse oluliste arvude vahemik järgmise seosega:

Tavalisel kujul (ujukoma) Iga number on esitatud kahe numbrirühmana. Esimest numbrirühma nimetatakse mantiss, teine - järjekorras, ja mantissi absoluutväärtus peab olema väiksem kui 1 ja järjekord peab olema täisarv.

Üldiselt võib ujukomakujulist arvu esitada järgmiselt:< 1);

kus M on arvu mantiss (| M |

r – arvujärk (r - täisarv);

p – arvusüsteemi alus.

Näide 12

Näites 3 toodud numbrid on +00564.24891; -10304.00674 esitatakse ujukoma kujul järgmiste avaldistega:

Tavalisel esitusviisil on suur hulk numbreid ja see on tänapäeva arvutites peamine. Arvu märk on kodeeritud kahendnumbrina. Sel juhul tähendab kood 0 "+" märki, kood 1 tähendab "-" märki.

Kui kasutatakse arvusüsteemi, mille alus on p ja mantissis on m ja järjekorras s numbrit (arvestamata järgu ja mantissi märgilisi numbreid), siis tavakujul esitamisel on oluliste arvude vahemik N. määratakse seosega:

Näide 13

Kui p =2, m =10, s =6, määratakse oluliste arvude vahemik ligikaudu vahemikust kuni

Vormid arvude esitamiseks arvutis Sageli nimetatakse mitmest bitist või baidist koosnevat jada valdkonnas

andmeid. Arvu bitid (sõnas, väljas jne) nummerdatakse paremalt vasakule, alustades 0-ndast bitist.

Arvuti suudab töödelda püsiva ja muutuva pikkusega välju.

Püsiva pikkusega väljad:

sõna - 2 baiti

poolsõna – 1 bait

topeltsõna – 4 baiti

laiendatud sõna – 8 baiti. Muutuva pikkusega väljad

suurus võib olla 0 kuni 256 baiti, kuid peab olema võrdne baitide täisarvuga.

Fikseeritud punktiga numbrid on enamasti sõna- ja poolsõnavormingus.

Ujukomanumbrid – topelt- ja laiendatud sõnavorming.

Näide 14

Arv –193 kümnendsüsteemis vastab arvule –11000001 kahendsüsteemis. Esitame selle numbri kahes vormingus.

Selle arvu (fikseeritud punkti) esitamise loomulik vorm nõuab sõna, mille maht on 2 baiti. (Tabel 3).

Tabel 3

Numbrimärk

Tavakujul on kümnendmärgistuses arv -19310 -0,193x103 ja kahendsüsteemis on sama arv -0,11000001x21000. Mantissil, mis tähistab numbrit 193, kirjutatud kahendvormingus, on 8 positsiooni. Seega on arvu eksponent 8, seega on arvu 2 aste 8 (10002). Arv 8 kirjutatakse ka kahendvormingus. Selle arvu esitamise normaalvorm (ujukoma) eeldab topeltsõna, s.t. 4 baiti (tabel 4).

Tabel 4

	Selle arvu (fikseeritud punkti) esitamise loomulik vorm nõuab sõna, mille maht on 2 baiti. (Tabel 3).	Telli	Mantissa
Numbrimärk

Arvu märk kirjutatakse kõige vasakpoolsemasse 31. bitti. Numbrite järjekorra (24. kuni 30.) salvestamiseks on eraldatud 7 bitti. Need positsioonid sisaldavad arvu 8 binaarses vormis. Mantissi salvestamiseks eraldatakse 24 bitti (0 kuni 23). Mantiss kirjutatakse vasakult paremale.

Konverteerimine mis tahes asendisüsteemist kümnendarvusüsteemi

Teisendamine mis tahes positsioonilisest arvusüsteemist, näiteks arvutis, mille alus on p = 2; 8; 16, tehakse kümnendarvude süsteemi valemi (1) järgi.

Näide 15

Teisendage kahendarvu kümnendarvusüsteemiks.

Asendades algnumbri vastavad kahendnumbrid teisendusvalemis (1), leiame:

Näide 16

Näide 17

Teisendage arv kümnendsüsteemiks.

Tõlkimisel võeti arvesse, et 16. numbrisüsteemis asendab A-täht väärtust 10.

Täisarvu teisendamine kümnendsüsteemist teise positsiooninumbrisüsteemi

Vaatleme pöördtõlget – kümnendsüsteemist teise arvusüsteemi. Lihtsuse huvides piirdume ainult täisarvude teisendamisega.

Üldine tõlkereegel on järgmine: peate arvu N jagama p-ga. Saadud jääk annab numbri N p-tähise 1. numbris. Seejärel jagage saadud jagatis uuesti p-ga ja jätke saadud jääk uuesti meelde - see on teise numbri number jne. See järjestikune jagamine jätkub seni, kuni jagatis on väiksem kui arvusüsteemi alus - p. See viimane jagatis on suurim number.

Näide 18

Toimime vastavalt ülaltoodud reeglile (joonis 4). Esimene jagamine annab jagatise 10 ja ülejäänud 0. See on vähima tähtsusega number. Teine jagamine annab jagatise - 5 ja jääk - 1. Kolmas jagamine annab jagatise - 2 ja jääk - 0. Jagamine jätkub seni, kuni jagatis on null. Viies jagatis on 0. Jääk on 1. See jääk on saadud kahendarvu kõige olulisem number. Siin lõpeb jaotus. Nüüd kirjutame tulemuse üles, alustades viimasest jagatisest, seejärel kirjutame kõik jäägid ümber. Selle tulemusena saame:

Riis. 4. Kümnendarvu teisendamine kahendarvuks jagamise meetodil

1.2.7. Tekstiandmete kodeerimine

Tekstiandmed on mõnele füüsilisele andmekandjale (paber, magnetketas, kujutis ekraanil) salvestatud tähe-, numbri- ja erimärkide kogum.

Klaviatuuri klahvi vajutamisel saadetakse arvutisse signaal kahendarvuna, mis salvestatakse kooditabelisse. Kooditabel on sümbolite sisemine esitus arvutis. ASCII (Ameerika standardkood teabevahetuseks) tabel on kogu maailmas standardiks võetud.

Ühe märgi kahendkoodi salvestamiseks eraldatakse 1 bait = 8 bitti. Arvestades, et iga biti väärtus on 1 või 0, on võimalike ühtede ja nullide kombinatsioonide arv võrdne . See tähendab, et 1 baidiga saate 256 erinevat kahendkoodi kombinatsiooni ja saate neid kasutada 256 erineva tähemärgi kuvamiseks. Need koodid moodustavad ASCII tabeli. Kirjete lühendamiseks ja nende märgikoodide kasutamise hõlbustamiseks kasutatakse tabelis kuueteistkümnendsüsteemi, mis koosneb 16 märgist – 10 numbrist ja 6 ladina tähest: A, B, C, D, E, F. Tähemärkide kodeerimisel on number kirjutatakse esimene veerg ja seejärel rida, mille ristumiskohas see sümbol asub.

Iga märgi kodeerimine 1. baidi järgi on seotud sümbolisüsteemi entroopia arvutamisega (vt näide 6). Märgikodeerimissüsteemi väljatöötamisel arvestasime, et vaja oli kodeerida 26 ladina (inglise) tähestiku väiketähte ja 26 suurtähte, numbreid 0 kuni 9, kirjavahemärke, erimärke ja aritmeetilisi märke. Need on nn rahvusvahelised sümbolid. See töötab umbes 128 tähemärgini. Veel 128 koodi on eraldatud rahvustähestiku märkide ja mõnede lisamärkide kodeerimiseks. Vene keeles on 33 väiketähte ja 33 suurtähte. Kodeeritavate märkide koguarv on suurem või väiksem kui . Eeldades, et kõik sümbolid esinevad võrdse tõenäosusega, on süsteemi entroopia 7< H < 8. Поскольку для кодирования используется целое число бит, то 7 бит будет мало. Поэтому для кодирования каждого символа используется по 8 бит. Как было сказано выше, 8 бит позволяют закодировать символов. Это число дало название единице измерения объема данный «байт».

Näide 19

Ladina tähte S ASCII tabelis tähistab kuueteistkümnendkood - 53. Kui vajutate klaviatuuril S-tähte, kirjutatakse arvuti mällu selle vaste - kahendkood 01010011, mis saadakse iga kuueteistkümnendkoha numbri asendamisel kuueteistkümnendsüsteemiga. selle binaarne ekvivalent.

Sel juhul asendatakse number 5 koodiga 0101 ja number 3 koodiga 0011. Kui arvutiekraanil kuvatakse S-täht, toimub dekodeerimine - selle pilt ehitatakse selle kahendkoodi abil.

Pöörake tähelepanu! Kõik ASCII-tabelis olevad märgid on kodeeritud 8 kahendnumbri või 2 kuueteistkümnendkohalise numbriga (1 numbrit tähistab 4 bitti).

Tabelis (joonis 5) kuvatakse tähemärkide kodeering kuueteistkümnendsüsteemis. Esimesed 32 märki on juhtmärgid ja mõeldud peamiselt juhtkäskude edastamiseks. Need võivad tarkvarast ja riistvarast olenevalt erineda. Kooditabeli teine pool (128 kuni 255) ei ole Ameerika standardiga määratletud ja on mõeldud rahvusmärkide, pseudograafia ja mõnede matemaatiliste sümbolite jaoks. Erinevad riigid võivad oma tähestiku tähtede kodeerimiseks kasutada kooditabeli teise poole erinevaid versioone.

Pöörake tähelepanu! Numbrid kodeeritakse ASCII standardit kasutades kahel juhul – sisendi/väljundi ajal ja siis, kui need esinevad tekstis.

Võrdluseks kaaluge kahe kodeerimisvaliku numbrit 45.

Tekstis kasutamisel on selle numbri esitamiseks vaja 2 baiti, sest iga numbrit tähistab oma kood vastavalt ASCII tabelile (joonis 4). Kuueteistkümnendsüsteemis oleks kood 34 35, binaarselt 00110100 00110101, mis vajaks 2 baiti.

Riis. 5. ASCII kooditabel (fragment)

1.2.8. Graafilise teabe kodeerimine

Värvide mõistmine arvutis

Graafilised andmed on mitmesugused graafikud, diagrammid, diagrammid, joonised jne. Mis tahes graafilist kujutist saab kujutada teatud värvialade kompositsioonina. Värv määrab nähtavate objektide omaduse, mida silm vahetult tajub.

Arvutitööstuses põhineb mis tahes värvi kuvamine kolmel nn põhivärvil: sinine, roheline, punane. Nende tähistamiseks kasutatakse lühendit RGB (Red - Green - Blue).

Kõiki looduses leiduvaid värve saab luua nende kolme värvi segamisel ja intensiivsuse (heleduse) muutmisel. 100% iga värvi segu annab valge. 0% iga värvi segu annab musta värvi.

Arvuti värvide taasesitamise kunsti, lisades erinevates vahekordades kolm peamist RGB-värvi, nimetatakse liitsegamiseks.

Inimsilm suudab tajuda tohutul hulgal värve. Monitor ja printer suudavad reprodutseerida vaid piiratud osa sellest vahemikust.

Tulenevalt vajadusest kirjeldada erinevaid füüsikalisi värvide taasesitamise protsesse arvutis, on välja töötatud erinevaid värvimudeleid. Taasesitatavate värvide valik ja kuvamisviis on monitoridel ja printeritel erinev, olenevalt kasutatavatest värvimudelitest.

Värvimudeleid kirjeldatakse matemaatika abil ja need võimaldavad kujutada erinevaid värvitoone, segades mitut põhivärvi.

Värvid võivad monitori ekraanil paista teistsugused kui printimisel. See erinevus tuleneb asjaolust, et printimiseks kasutatakse muid värvimudeleid peale monitori omade.

Värvimudelite hulgas on tuntumad RGB, CMYK, HSB, LAB.

RGB mudel

RGB-mudelit nimetatakse aditiivseks, kuna komponentide värvide heleduse kasvades suureneb ka saadud värvi heledus.

RGB-värvimudelit kasutatakse tavaliselt monitoride, skannerite ja värvifiltrite kuvatavate värvide kirjeldamiseks. Seda ei kasutata trükiseadme värvigamma kuvamiseks.

Värv RGB mudelis on esindatud kolme põhivärvi – punase (Red), rohelise (Green) ja sinise (Blue) – summana (joonis 6). RGB taasesitab värve hästi vahemikus sinisest roheliseni, kuid veidi halvemini kollase ja oranži puhul.

RGB mudelis iseloomustab iga põhivärvi heledus (intensiivsus), mis võib võtta 256 diskreetset väärtust vahemikus 0 kuni 255. Seetõttu saate värve segada erinevates proportsioonides, muutes iga komponendi heledust. Seega võite saada

256x256x256 = 16 777 216 värvi.

Iga värvi saab seostada koodiga, mis sisaldab kolme komponendi heleduse väärtusi. Kasutatakse kümnend- ja kuueteistkümnendkoodi esitusi.

Riis. 6. RGB mudeli põhivärvide kombinatsioonid

Kümnendmärk on kolm komadega eraldatud kolme kümnendarvu rühma, näiteks 245 155 212. Esimene number vastab punase komponendi heledusele, teine rohelisele ja kolmas sinisele.

Kuueteistkümnendvormingus värvikood on 0xХХХХХХ. Eesliide 0x näitab, et tegemist on kuueteistkümnendarvuga. Prefiksile järgneb kuus kuueteistkümnendnumbrit (0, 1, 2,...,9, A, B, C, D, E, F). Esimesed kaks numbrit on kuueteistkümnendarvud, mis tähistavad punase komponendi heledust, teine ja kolmas paar vastavad rohelise ja sinise komponendi heledusele.

Näide 20

Põhivärvide maksimaalne heledus võimaldab kuvada valget. See vastab koodile 255 255 255 kümnendsüsteemis ja koodile 0xFFFFFF kuueteistkümnendsüsteemis.

Minimaalne heledus (või) vastab mustale. See vastab koodile 0,0,0 kümnendsüsteemis ja koodile 0x000000 kuueteistkümnendsüsteemis.

Erineva, kuid võrdse heledusega punase, rohelise ja sinise värvi segamine annab halli skaala 256 tooni (gradatsiooni) - mustast valgeni. Halltoonides pilte nimetatakse ka halltoonides kujutisteks.

Kuna värvi iga põhikomponendi heledus võib võtta ainult 256 täisarvu, saab iga väärtust esitada 8-bitise kahendarvuna (8 nullist ja ühest koosnev jada, () st üks bait. Seega RGB-mudeli puhul vajab teave iga värvi kohta 3 baiti (üks bait iga põhivärvi kohta) või 24 bitti mälu. Kuna kõik hallid toonid tekivad kolme sama heledusega komponendi segamisel, on esitamiseks vaja ainult 1 baiti. mis tahes 256 hallist toonist.

CMYK mudel

CMYK-mudel kirjeldab trükivärvide segamist trükiseadmes. See mudel kasutab kolme põhivärvi: tsüaan (Cyan), magenta (magenta) ja kollane (kollane). Lisaks kasutatakse musta värvi (blackK) (joonis 7). Sõnades esile tõstetud suurtähed moodustavad paleti lühendi.

Riis. 7. CMYK mudeli põhivärvide kombinatsioonid

Kõik kolm CMYK-põhivärvi saadakse valgest ühe RGB-põhivärvi lahutamisel. Näiteks tsüaan saadakse valgest punase lahutamisel ja kollane sinise värvi lahutamisel. Tuletame meelde, et RGB-mudelis on valge värv esindatud maksimaalse heledusega punase, rohelise ja sinise seguna. Seejärel saab CMYK-mudeli põhivärve esitada RGB-mudeli põhivärvide lahutamise valemite abil järgmiselt:

Tsüaan = RGB – R = GB = (0 255 255)

Kollane = RGB – B = RG = (255 255,0)

Magenta = RGB – G = RB = (255,0,255)

Kuna CMYK põhivärvid saadakse valgest RGB põhivärvide lahutamisel, nimetatakse neid lahutavateks.

CMYK baasvärvid on erksad värvid ja ei sobi eriti tumedate värvide taasesitamiseks. Nii et neid kokku segades pole praktikas tulemuseks puhas must, vaid määrdunudpruun värv. Seetõttu sisaldab CMYK värvimudel ka puhast musta, mida kasutatakse tumedate varjundite loomiseks, aga ka mustade pildielementide printimiseks.

Subtraktiivsed CMYK-värvid ei ole nii puhtad kui aditiivsed RGB-värvid.

Kõiki CMYK-mudeli värve ei saa RGB-mudelis esitada ja vastupidi. Kvantitatiivselt on CMYK värvivalik väiksem kui RGB värvivalik. See asjaolu on väga oluline ja ei tulene ainult monitori või printimisseadme füüsilistest omadustest.

Mudel HSB

HSB mudel põhineb kolmel parameetril: H – toon või toon (Hue), S – küllastus (Saturation) ja B – heledus (Brightness). See on RGB-mudeli variant ja põhineb ka põhivärvide kasutamisel.

Kõigist praegu kasutusel olevatest mudelitest vastab see mudel kõige rohkem sellele, kuidas inimsilm värve tajub. See võimaldab kirjeldada värve intuitiivselt selgelt. Sageli kasutavad kunstnikud.

HSB mudelis iseloomustab küllastus värvi puhtust. Nullküllastus vastab hallile värvile ja maksimaalne küllastus selle värvi eredaimale versioonile. Heleduse all mõistetakse valgustusastet.

Graafiliselt saab HSB mudelit kujutada rõngana, mille ääres paiknevad värvitoonid (joonis 8).

Riis. 8. HSB mudeli graafiline esitus

Mudeli labor

Trükiseadme jaoks kasutatakse mudelit Lab. See on arenenum kui CMYK mudel, millel puuduvad paljud toonid. Labori mudeli graafiline esitus on näidatud joonisel fig. 9.

Riis. 9. Labori mudeli graafiline esitus

Labi mudel põhineb kolmel parameetril: L - heledus (heledus) ja kaks värviparameetrit - a ja b. Parameeter a sisaldab värve tumerohelisest hallist erkroosani. Parameeter b sisaldab värve helesinisest hallini erekollaseni.

Graafilise teabe kodeerimine

Graafilised pildid salvestatakse graafilistes failivormingutes.

Pildid on graafiliste elementide (pildielement) või lühidalt pikslite (piksel) kogum. Kujutise kirjeldamiseks on vaja määrata ühe piksli kirjeldamise viis.

Pikslivärvi kirjeldus on sisuliselt värvikood vastavalt konkreetsele värvimudelile. Piksli värvi kirjeldavad mitmed numbrid. Neid numbreid nimetatakse ka kanaliteks. RGB, CMYK ja Lab mudelite puhul nimetatakse neid kanaleid ka värvikanaliteks.

Arvutis nimetatakse igale pikslile värviteabe esitamiseks eraldatud bittide arvu värvisügavuseks või bitisügavuseks. Värvisügavus määrab, kui palju värve üks piksel esindada suudab. Mida suurem on värvisügavus, seda suurem on pildi kirjeldust sisaldava faili suurus.

Näide 21

Kui värvisügavus on 1 bitt, võib piksel esindada ainult ühte kahest võimalikust värvist – valget või musta. Kui värvisügavus on 8 bitti, siis võimalike värvide arv on 2. Värvisügavusel 24 bitti ületab värvide arv 16 miljonit.

RGB, CMYK, Lab ja hallskaala kujutised sisaldavad tavaliselt 8 bitti värvikanali kohta. Kuna RGB-l ja Labil on kolm värvikanalit, on nende režiimide värvisügavus 8?3 = 24. CMYK-l on neli kanalit ja seetõttu on värvisügavus 8?4 = 32. Pooltoonipiltidel on ainult üks kanal, seega ka selle värv sügavus on 8.

Graafilised failivormingud

Graafika failivorming on seotud graafilise kujutise kodeerimismeetodiga.

Praegu on rohkem kui kaks tosinat graafilise failivormingut, näiteks BMP, GIF, TIFF, JPEG, PCX, WMF jne. On faile, mis lisaks staatilistele piltidele võivad sisaldada animatsiooniklippe ja/või heli, näiteks Näiteks GIF, PNG, AVI, SWF, MPEG, MOV jne. Nende failide oluline omadus on võime esitada nendes sisalduvaid andmeid tihendatud kujul.

VMR-vorming(Bit Map Picture – Windows Device Independent Bitmap) on Windowsi vorming, seda toetavad kõik selle kontrolli all töötavad graafilised redaktorid. Kasutatakse bitmap-piltide salvestamiseks Windowsis kasutamiseks. Võimalik salvestada nii indekseeritud (kuni 256 värvi) kui ka RGB-värve (16 miljonit tooni).

GIF-vormingus(Graphics Interchange Format) – graafikavahetusvorming kasutab LZW kadudeta teabe tihendamise algoritmi ja on loodud rasterpiltide salvestamiseks kuni 256 värviga.

PNG-vormingus(Portable Network Graphics) - GIF-vormingu asendamiseks töötati välja võrgu kaasaskantav graafikavorming. PNG-vorming võimaldab salvestada pilte 24-bitise või isegi 48-bitise värvisügavusega ning see võimaldab lisada ka maskikanaleid, et kontrollida gradiendi läbipaistvust, kuid see ei toeta kihte. PNG ei tihenda kadudega pilte, nagu JPEG.

JPEG-vormingus(Joint Photographic Experts Group) - fotograafiaekspertide ühisrühma formaat on mõeldud mitmevärviliste piltide kompaktseks salvestamiseks fotograafilise kvaliteediga. Selles vormingus failid on laiendiga jpg, jpe või jpeg.

Erinevalt GIF-ist kasutab JPEG-vormingus kadudega tihendusalgoritmi, mis saavutab väga kõrge tihendusastme (ühikutest sadade kordadeni).

1.2.9. Heliteabe kodeerimine

Heli mõiste

Alates 90ndate algusest on personaalarvutid saanud töötada heliteabega. Iga arvuti, millel on helikaart, mikrofon ja kõlarid, saab heliteavet salvestada, salvestada ja esitada.

Heli on pidevalt muutuva amplituudi ja sagedusega helilaine (joonis 10).

Riis. 10. Helilaine

Mida suurem on signaali amplituud, seda valjem on see inimese jaoks, mida suurem on signaali sagedus (T), seda kõrgem on toon. Helilaine sagedust väljendatakse hertsides (Hz, Hz) või vibratsioonide arvus sekundis. Inimkõrv tajub helisid vahemikus (ligikaudu) 20 Hz kuni 20 kHz, mida nimetatakse helisagedusvahemikuks.

Helikvaliteedi spetsifikatsioonid

Heli kodeerimise sügavus- bittide arv helisignaali kohta.

Kaasaegsed helikaardid pakuvad 16-, 32- või 64-bitise heli kodeerimise sügavust. Taseme arvu (amplituudi gradatsioone) saab arvutada valemi abil

Signaalitasemed (amplituudi gradatsioonid)

Proovivõtu sagedus– see on signaalitasemete mõõtmiste arv 1 sekundi jooksul

Üks mõõtmine sekundis vastab sagedusele 1 Hz

1000 mõõtmist 1 sekundiga - 1 kHz

Mõõtmiste arv võib jääda vahemikku 8000 kuni 48 000(8 kHz – 48 kHz)

8 kHz vastab raadiosaadete sagedusele,

48 kHz – audio-CD helikvaliteet.

Meetodid heliteabe kodeerimiseks

Selleks, et arvuti töötleks pidevat helisignaali, tuleb see teisendada elektriimpulsside jadaks (binaarsed ühed ja nullid). Erinevalt numbrilistest, tekstilistest ja graafilistest andmetest ei olnud helisalvestistel aga sama pikk ja tõestatud kodeerimisajalugu. Selle tulemusena on heliteabe kodeerimise meetodid kahendkoodi abil standardimisest kaugel. Paljud üksikud ettevõtted on välja töötanud oma ettevõtte standardid, kuid üldiselt võib eristada kahte põhivaldkonda.

FM (Frequency Modulation) meetod põhineb asjaolul, et teoreetiliselt saab iga keeruka heli lagundada erineva sagedusega lihtsate harmooniliste signaalide jadaks, millest igaüks esindab regulaarset sinusoidi, ja seetõttu saab seda kirjeldada arvparameetritega, see tähendab koodiga. Looduses on helisignaalidel pidev spekter, see tähendab, et nad on analoogsed. Nende laiendamine harmoonilisteks seeriateks ja diskreetsete digitaalsignaalide kujul esitamine toimub spetsiaalsete seadmete - analoog-digitaalmuundurite (ADC) abil. Pöördkonversiooni numbriliselt kodeeritud heli taasesitamiseks teostavad digitaal-analoogmuundurid (DAC). Heli muundamise protsess on näidatud joonisel 11.

Riis. 11. Heli muundamise protsess

Selliste teisenduste korral on kodeerimismeetodiga seotud teabekaod vältimatud, mistõttu ei ole helisalvestuse kvaliteet tavaliselt täiesti rahuldav. Samal ajal annab see kodeerimismeetod kompaktse koodi ja seetõttu leidis see rakendust neil aastatel, kui arvutiressurssidest oli selgelt puudu.

Laine-tabeli meetod süntees vastab paremini praegusele tehnoloogia arengutasemele. Lihtsamalt öeldes võib öelda, et kuskil eelnevalt koostatud tabelites on salvestatud paljude erinevate muusikariistade helinäidised (kuigi mitte ainult nende jaoks). Tehnoloogias nimetatakse selliseid näidiseid proovideks. Arvkoodid väljendavad pilli tüüpi, selle mudeli numbrit, heli kõrgust, heli kestust ja tugevust, selle muutumise dünaamikat, heli esinemiskeskkonna mõningaid parameetreid, aga ka muid heli omadusi iseloomustavaid parameetreid. Kuna sämplitena kasutatakse “päris” helisid, on sünteesi tulemusel saadava heli kvaliteet väga kõrge ja läheneb päris muusikariistade helikvaliteeti.

Põhilised helifailivormingud

MIDI (Musical Instrument Digital Interface) formaat– muusikariistade digitaalne liides. Loodud 1982. aastal juhtivate elektrooniliste muusikariistade tootjate - Yamaha, Roland, Korg, E-mu jt poolt. Algselt oli see mõeldud asendama tol ajal aktsepteeritud analoogsignaale kasutavate muusikainstrumentide juhtimist teabepõhise juhtimisega. digitaalliidese kaudu edastatavad sõnumid. Seejärel sai sellest de facto standard elektrooniliste muusikariistade ja arvutisünteesimoodulite valdkonnas.

WAV helifaili vorming, suvalise heli esitamine sellisena, nagu see on - originaalse helivibratsiooni või helilaine (laine) digitaalse esituse kujul, mistõttu mõnel juhul nimetatakse selliste failide loomise tehnoloogiat lainetehnoloogiaks. Võimaldab töötada mis tahes tüüpi, kuju ja kestusega helidega.

WAV-faili graafiline esitus on väga mugav ning seda kasutatakse sageli heliredaktorites ja sekventsiprogrammides nendega töötamiseks ja hilisemaks teisendamiseks (sellest tuleb juttu järgmises peatükis). Selle vormingu töötas välja Microsoft ja kõigil standardsetel Windowsi helidel on WAV-laiend.

MP3 formaadis. See on üks Fraunhofer IISi ja THOMPSONi (1992) välja töötatud digitaalse heli salvestusvormingust, mis kiideti hiljem heaks MPEG1 ja MPEG2 tihendatud video- ja helistandardite osana. See skeem on MPEG Layer 1/2/3 perekonna kõige keerulisem. See nõuab kodeerimiseks rohkem arvutiaega võrreldes teistega ja tagab parema kodeerimiskvaliteedi. Kasutatakse peamiselt heli reaalajas edastamiseks võrgulinkide kaudu ja CD-heli kodeerimiseks.

1.2.10. Videoteabe kodeerimine

Videokodeerimise põhimõtted

Ladina keelest tõlgitud video tähendab "ma vaatan, ma näen". Kui inimesed räägivad videost, peavad nad eelkõige silmas liikuvat pilti teleriekraanil või arvutimonitoril.

Videokaamera teisendab edastatava stseeni optilise kujutise elektriliste signaalide jadaks. Need signaalid edastavad teavet pildi üksikute alade heleduse ja värvide kohta. Hilisemaks taasesituseks säilitamiseks saab need salvestada magnetlindile analoog- või digitaalsel kujul.

Analoogsalvestusel on muutused videolindi magnetiseerimises sarnased valgus- või helilaine kujuga. Analoogsignaalid on erinevalt digitaalsetest signaalidest ajas pidevad.

Digitaalsignaal on elektriimpulsside koodikombinatsioonide jada.

Digitaalselt esitatud teavet mõõdetakse bittides. Pideva signaali koodsõnade komplektiks muutmise protsessi nimetatakse analoog-digitaalmuundamiseks.

Analoog-digitaalsignaali muundamine toimub kolmes etapis. Diskreetimisetapis (joonis 12) esitatakse pidevat signaali selle hetkeväärtuste valimite jadana. Need näidud võetakse korrapäraste ajavahemike järel.

Riis. 12. Diskretiseerimine

Järgmine etapp– kvantimine (joon. 13). Kogu signaali väärtuste vahemik on jagatud tasemeteks. Iga proovi väärtus asendatakse lähima kvantimistaseme ümardatud väärtusega, selle seerianumbriga

Riis. 13. Taseme kvantimine

Kodeerimine lõpetab analoogsignaali digiteerimise protsessi (joonis 14), millel on nüüd lõplik arv väärtusi. Iga väärtus vastab kvantimistaseme seerianumbrile. Seda arvu väljendatakse kahendühikutes. Ühe diskreetimisintervalli jooksul edastatakse üks koodsõna.

Riis. 14. Digitaalne kodeerimine

Seega saab digitaalsel kujul esitatud pilditeavet edasiseks töötlemiseks ja redigeerimiseks arvuti kõvakettale üle kanda ilma täiendavate teisendusteta.

Arvutivideot iseloomustavad järgmised parameetrid:

kaadrite arv sekundis (15, 24, 25...);

andmevoog (kilobaiti/s);

failivorming (avi, mov...);

tihendusmeetod (Microsoft Video for Windows, MPEG, MPEG-I, MPEG-2, Moution JPEG).

Videoteabe vormingud

AVI-vorming on tihendamata videovorming, mis luuakse pildi digiteerimisel. See on kõige ressursimahukam formaat, kuid samas on sellesse digiteerimisel andmekadu minimaalne. Seetõttu pakub see rohkem võimalusi redigeerimiseks, efektide rakendamiseks ja muuks failitöötluseks. Arvestada tuleb aga sellega, et keskmiselt võtab üks sekund digipildist 1,5–2 MB kõvakettaruumi.

MPEG-vorming on lühend ISO ekspertrühma (Moving Picture Expert Group) nimest, mis töötab välja video- ja heliandmete kodeerimise ja tihendamise standardeid. Tänapäeval on teada mitut sorti MPEG-vorminguid.

MPEG-1 – sünkroniseeritud video ja heli salvestamiseks CD-ROM-ile, võttes arvesse maksimaalset lugemiskiirust ca 1,5 Mbit/s. MPEG-1-ga töödeldavate videoandmete kvaliteediparameetrid on paljuski sarnased tavalise VHS-videoga, seega kasutatakse seda vormingut eelkõige seal, kus standardse analoogvideomeediumi kasutamine on ebamugav või ebaotstarbekas;

MPEG-2 – televisiooniga võrreldava kvaliteediga videopiltide töötlemiseks, andmeedastussüsteemi võimsusega 3 kuni 15 Mbit/s. Paljud telekanalid töötavad MPEG-2-l põhinevatel tehnoloogiatel; selle standardi kohaselt tihendatud signaal edastatakse televisiooni satelliitide kaudu ja seda kasutatakse suurte videomaterjalide arhiveerimiseks;

MPEG-3 – kasutamiseks kõrglahutusega televisiooni (HDTV) süsteemides andmevookiirusega 20–40 Mbit/s; kuid hiljem sai see MPEG-2 standardi osaks ja seda enam eraldi ei kasutata;

MPEG-4 – meediumiandmete digitaalse esitusega töötamiseks kolmes valdkonnas: interaktiivne multimeedia (sh optilistel ketastel ja võrgu kaudu levitatavad tooted), graafilised rakendused (sünteetiline sisu) ja digitaaltelevisioon

Viiteteave arvude esitamise kohta arvutis on toodud tabelis (tabel 5).

1.2.11. Tabel 5. Numbrilise, tekstilise, graafilise teabe esitamine arvutis

Järeldused

See teema käsitleb teabe mõistet ja erinevaid viise selle arvutis kodeerimiseks.

Kuvatakse teabe ja andmete erinevused. Tutvustatakse teabe adekvaatsuse mõistet ja esitatakse selle põhivormid: süntaktiline, semantiline ja pragmaatiline. Nende vormide jaoks on esitatud kvantitatiivse ja kvalitatiivse hindamise meetmed. Arvesse võetakse teabe põhiomadusi: esinduslikkus, sisu, piisavus, asjakohasus, ajakohasus, täpsus, usaldusväärsus, stabiilsus. Infoprotsess on esitatud teabe transformatsiooni põhietappide kogumina.

Palju tähelepanu pööratakse arvutis erinevat tüüpi teabe kodeerimise küsimustele. Antud on peamised vormingud arvulise, teksti-, graafilise, heli- ja videoteabe esitamiseks arvutis. Vaadeldavate vormingute omadused on näidatud olenevalt teabe tüübist.

Enesetesti küsimused

Mis vahe on teabel ja andmetel?
Mis on adekvaatsus ja millistes vormides see avaldub?
Millised teavitamismeetmed on olemas ja millal tuleks neid kasutada?
Selgitage teabe süntaktilist mõõdet.
Selgitage teabe semantilist mõõdet.
Rääkige pragmaatilisest teabemõõdust.
Millised on teabe kvaliteedi näitajad?
Mis on teabe kodeerimissüsteem?
Kuidas kujutate ette teabeprotsessi?
Mis on kodeerimissüsteem ja kuidas seda iseloomustatakse?
Milliseid arvusüsteeme tuntakse ja mille poolest need erinevad?
Milliseid numbrisüsteeme kasutatakse arvutites?
Millise suhtega saab arvu kujutada positsioonilises arvusüsteemis?
Milliseid arvuesituse vorme kasutatakse arvutis ja mille poolest need erinevad?
Tooge näiteid fikseeritud ja ujukoma vormide arvu esitusvormingute kohta.
Kuidas toimub teisendamine mis tahes positsioonilisest arvusüsteemist kümnendarvusüsteemi? Too näiteid.
Kuidas teisendatakse täisarv kümnendsüsteemist teise positsiooninumbrisüsteemi? Too näiteid.
Kuidas tekstiteavet kodeeritakse? Too näiteid.
Mis on graafilise teabe kodeerimise olemus?
Rääkige meile RGB mudelist graafilise teabe kodeerimiseks.
Millal kasutatakse CMYK graafilise kodeeringu mudelit?
Kuidas see erineb RGB mudelist?