ascii pseudograafilised koodid. ASCII-kodeering (Ameerika standardkood teabevahetuseks) - ladina tähestiku põhiteksti kodeering

Kutsutakse välja märkide kogum, millega tekst on kirjutatud tähestik.

Tähemärkide arv tähestikus on selle võimsus.

Infohulga määramise valem: N=2b,

kus N on tähestiku aste (märkide arv),

b – bittide arv (sümboli infokaal).

256 tähemärki mahutav tähestik mahutab peaaegu kõik vajalikud märgid. Seda tähestikku nimetatakse piisav.

Sest 256 = 2 8, siis on 1 märgi kaal 8 bitti.

Mõõtühikule 8 bitti anti nimi 1 bait:

1 bait = 8 bitti.

Iga tähemärgi binaarkood arvutitekstis võtab 1 baidi mälu.

Kuidas tekstiteavet arvutimälus esitatakse?

Bait-baitilise märgikodeeringu mugavus on ilmne, kuna bait on mälu väikseim adresseeritav osa ja seetõttu pääseb protsessor teksti töötlemisel igale märgile eraldi juurde. Teisest küljest on 256 tähemärki üsna piisav arv, et esindada väga erinevat sümboolset teavet.

Nüüd tekib küsimus, milline kaheksabitine binaarne kood sobitada iga tähemärki.

On selge, et see on tingimuslik, võite välja mõelda palju kodeerimismeetodeid.

Kõik arvutitähestiku märgid on nummerdatud vahemikus 0 kuni 255. Iga number vastab kaheksabitisele kahendkoodile vahemikus 00000000 kuni 11111111. See kood on lihtsalt tähemärgi seerianumber kahendsüsteem Arvestus.

Tabel, milles kõik arvutitähestiku märgid on üksteisele määratud seerianumbrid, nimetatakse kodeerimistabeliks.

Sest erinevat tüüpi Arvutid kasutavad erinevaid kodeerimistabeleid.

Tabelist on saanud personaalarvutite rahvusvaheline standard ASCII(loe Aski) (Ameerika standardkood teabevahetuseks).

ASCII kooditabel on jagatud kaheks osaks.

Vaid tabeli esimene pool on rahvusvaheline standard, s.o. sümbolid numbritega alates 0 (00000000), kuni 127 (01111111).

ASCII kodeeringu tabeli struktuur
Seerianumber Kood Sümbol
0 - 31 00000000 - 00011111

Sümboleid numbritega 0 kuni 31 nimetatakse tavaliselt juhtsümboliteks.
Nende ülesanne on juhtida teksti ekraanil kuvamise või printimise protsessi, helisignaali andmist, teksti märgistamist jne.

32 - 127 00100000 - 01111111

Tabeli standardosa (inglise keeles). See hõlmab väiketähti ja suured tähed ladina tähestik, kümnendkohad, kirjavahemärgid, igasugused sulud, kaubanduslikud ja muud sümbolid.
Märk 32 on tühik, st. tühi koht tekstis.
Kõik teised peegelduvad teatud märkide kaudu.

128 - 255 10000000 - 11111111

Tabeli alternatiivne osa (vene).
ASCII kooditabeli teisel poolel, mida nimetatakse koodileheks (128 koodi, alates 10000000 ja lõpetades numbriga 11111111), võivad olla erinevad valikud, igal valikul on oma number.
Koodilehte kasutatakse peamiselt muude rahvuslike tähestike kui ladina tähestiku mahutamiseks. Vene rahvusliku kodeeringu puhul paigutatakse sellesse tabeli ossa vene tähestiku märgid.

ASCII kooditabeli esimene pool

Juhin teie tähelepanu asjaolule, et kodeerimistabelis asuvad tähed (suur- ja väiketähed) tähestikuline järjekord, ja numbrid on järjestatud kasvavas järjekorras. Sellist leksikograafilise korra järgimist sümbolite paigutusel nimetatakse tähestiku järjestikuse kodeerimise põhimõtteks.

Vene tähestiku tähtede puhul järgitakse ka järjestikuse kodeerimise põhimõtet.

ASCII kooditabeli teine ​​pool

Kahjuks on praegu viis erinevat kirillitsa kodeeringut (KOI8-R, Windows. MS-DOS, Macintosh ja ISO). Seetõttu tekivad sageli probleemid venekeelse teksti ülekandmisel ühest arvutist teise, ühest tarkvarasüsteem teisele.

Kronoloogiliselt oli üks esimesi standardeid vene tähtede kodeerimiseks arvutites KOI8 ("Informatsioonivahetuskood, 8-bitine"). Seda kodeeringut kasutati 70ndatel ES-i arvutiseeria arvutites ja alates 80ndate keskpaigast hakati seda kasutama esimestes venestatud versioonides. operatsioonisüsteemi UNIX.

Alates 90ndate algusest, MS DOS operatsioonisüsteemi domineerimise ajast, jääb alles CP866 kodeering ("CP" tähendab "koodilehte", "koodilehte").

Arvutid Apple tegutseb operatsioonisaali kontrolli all Mac süsteemid OS, kasutage nende enda Maci kodeeringut.

Lisaks on Rahvusvaheline Standardiorganisatsioon (ISO) heaks kiitnud vene keele standardiks veel ühe kodeeringu nimega ISO 8859-5.

Kõige tavalisem praegu kasutatav kodeering on Microsoft Windows, lühend CP1251.

Alates 90ndate lõpust on märgikodeeringu standardimise probleem lahendatud uue rahvusvaheline standard mida nimetatakse Unicode. See on 16-bitine kodeering, st. see eraldab iga märgi jaoks 2 baiti mälu. Loomulikult suurendab see hõivatud mälu mahtu 2 korda. Aga selline kooditabel võimaldab lisada kuni 65536 tähemärki. Täielik spetsifikatsioon Unicode'i standard hõlmab kõiki olemasolevaid, väljasurnud ja kunstlikult loodud tähestikke maailmas, samuti palju matemaatilisi, muusikalisi, keemilisi ja muid sümboleid.

Proovime kasutada ASCII tabelit, et kujutada ette, millised sõnad arvuti mälus välja näevad. Sõnade sisemine esitus arvutimälus

Mõnikord juhtub, et teisest arvutist saadud vene tähestiku tähtedest koosnevat teksti ei saa lugeda - monitori ekraanil on näha mingisugune “abrakadabra”. See juhtub seetõttu, et arvutid kasutavad vene keele jaoks erinevat märgikodeeringut.

detsHexSümbol detsHexSümbol
000 00 spetsialist. NOP 128 80 Ђ
001 01 spetsialist. SOH 129 81 Ѓ
002 02 spetsialist. STX 130 82
003 03 spetsialist. ETX 131 83 ѓ
004 04 spetsialist. EOT 132 84
005 05 spetsialist. ENQ 133 85
006 06 spetsialist. ACK 134 86
007 07 spetsialist. BEL 135 87
008 08 spetsialist. B.S. 136 88
009 09 spetsialist. TAB 137 89
010 0Aspetsialist. LF 138 8AЉ
011 0Bspetsialist. VT 139 8B‹ ‹
012 0Cspetsialist. FF 140 8CЊ
013 0Dspetsialist. CR 141 8DЌ
014 0Espetsialist. NII 142 8EЋ
015 0Fspetsialist. S.I. 143 8FЏ
016 10 spetsialist. DLE 144 90 ђ
017 11 spetsialist. DC1 145 91
018 12 spetsialist. DC2 146 92
019 13 spetsialist. DC3 147 93
020 14 spetsialist. DC4 148 94
021 15 spetsialist. N.A.K. 149 95
022 16 spetsialist. SYN 150 96
023 17 spetsialist. ETB 151 97
024 18 spetsialist. CAN 152 98
025 19 spetsialist. E.M. 153 99
026 1Aspetsialist. SUB 154 9Aљ
027 1Bspetsialist. ESC 155 9B
028 1Cspetsialist. FS 156 9Cњ
029 1Dspetsialist. G.S. 157 9Dќ
030 1Espetsialist. R.S. 158 9Eћ
031 1Fspetsialist. USA 159 9Fџ
032 20 sidur SP (kosmos) 160 A0
033 21 ! 161 A1 Ў
034 22 " 162 A2ў
035 23 # 163 A3Ћ
036 24 $ 164 A4¤
037 25 % 165 A5Ґ
038 26 & 166 A6¦
039 27 " 167 A7§
040 28 ( 168 A8Yo
041 29 ) 169 A9©
042 2A* 170 A.A.Є
043 2B+ 171 AB«
044 2C, 172 A.C.¬
045 2D- 173 AD­
046 2E. 174 A.E.®
047 2F/ 175 A.F.Ї
048 30 0 176 B0°
049 31 1 177 B1±
050 32 2 178 B2І
051 33 3 179 B3і
052 34 4 180 B4ґ
053 35 5 181 B5µ
054 36 6 182 B6
055 37 7 183 B7·
056 38 8 184 B8e
057 39 9 185 B9
058 3A: 186 B.A.є
059 3B; 187 BB»
060 3C< 188 B.C.ј
061 3D= 189 BDЅ
062 3E> 190 OLEѕ
063 3F? 191 B.F.ї
064 40 @ 192 C0 A
065 41 A 193 C1 B
066 42 B 194 C2 IN
067 43 C 195 C3 G
068 44 D 196 C4 D
069 45 E 197 C5 E
070 46 F 198 C6 JA
071 47 G 199 C7 Z
072 48 H 200 C8 JA
073 49 I 201 C9 Y
074 4AJ 202 C.A. TO
075 4BK 203 C.B. L
076 4CL 204 CC M
077 4DM 205 CD N
078 4EN 206 C.E. KOHTA
079 4FO 207 CF P
080 50 P 208 D0 R
081 51 K 209 D1 KOOS
082 52 R 210 D2 T
083 53 S 211 D3 U
084 54 T 212 D4 F
085 55 U 213 D5 X
086 56 V 214 D6 C
087 57 W 215 D7 H
088 58 X 216 D8 Sh
089 59 Y 217 D9 SCH
090 5AZ 218 D.A. Kommersant
091 5B[ 219 D.B. Y
092 5C\ 220 DC b
093 5D] 221 DD E
094 5E^ 222 DE Yu
095 5F_ 223 DF I
096 60 ` 224 E0 A
097 61 a 225 E1 b
098 62 b 226 E2 V
099 63 c 227 E3 G
100 64 d 228 E4 d
101 65 e 229 E5 e
102 66 f 230 E6 ja
103 67 g 231 E7 h
104 68 h 232 E8 Ja
105 69 i 233 E9 th
106 6Aj 234 E.A. To
107 6Bk 235 E.B. l
108 6Cl 236 E.C. m
109 6Dm 237 ED n
110 6En 238 E.E. O
111 6Fo 239 EF n
112 70 lk 240 F0 r
113 71 q 241 F1 Koos
114 72 r 242 F2 T
115 73 s 243 F3 juures
116 74 t 244 F4 f
117 75 u 245 F5 X
118 76 v 246 F6 ts
119 77 w 247 F7 h
120 78 x 248 F8 w
121 79 y 249 F9 sch
122 7Az 250 F.A. ъ
123 7B{ 251 FB s
124 7C| 252 F.C. b
125 7D} 253 FD uh
126 7E~ 254 F.E. yu
127 7FSpetsialist. DEL 255 FF I
ASCII Windowsi märgikooditabel.
Eri(juht)märkide kirjeldus Tuleb märkida, et algselt kasutati ASCII tabeli juhtmärke andmevahetuse tagamiseks teletüüpi teel, andmete sisestamiseks perfolindilt ja välisseadmete lihtsaks juhtimiseks.
Praegu ei kanna enamik ASCII tabeli juhtmärke enam seda koormust ja neid saab kasutada muudel eesmärkidel. Koodi kirjeldus
NULL, 00Null, tühi
SOH, 01Rubriigi algus
STX, 02Teksti algus, teksti algus.
ETX, 03TEKSTI lõpp, teksti lõpp
EOT, 04Edastamise lõpp, edastuse lõpp
ENQ, 05Küsige. Palun kinnita
AK, 06Tunnustus. kinnitan
BEL, 07Bell, helista
BS, 08Backspace, mine ühe tähemärgi võrra tagasi
TAB, 09Vahekaart, horisontaalne vahekaart
LF, 0AReavahetus, reavahetus.
Tänapäeval tähistatakse seda enamikus programmeerimiskeeltes kui \n
VT, 0BVertikaalne tabel, vertikaalne tabel.
FF, 0CVormivoog, lehevoog, uus leht
CR, 0DKäru tagasi, vankri tagasi.
Tänapäeval tähistatakse seda enamikus programmeerimiskeeltes kui \r
SO,0EShift Out, muutke prindiseadme tindiriba värvi
SI,0FShift In, tagastab prindiseadmes oleva tindiriba värvi tagasi
DLE, 10Data Link Escape, lülitades kanali andmeedastusse
DC1, 11
DC2, 12
DC3, 13
DC4, 14
Seadme juhtimine, seadme juhtsümbolid
NAK, 15Negatiivne tunnustus, ma ei kinnita.
SYN, 16Sünkroonimine. Sünkroonimise sümbol
ETB, 17Tekstiploki lõpp, tekstiploki lõpp
CAN, 18Tühista, tühistab varem üle kantud
EM, 19Keskmise lõpp
SUB, 1AAsendaja, asendaja.
Paigutatakse sümboli asemele, mille tähendus edastamise ajal kadus või rikutiESC, 1B
Põgenemise juhtimise järjestusFS, 1C
Faili eraldaja, faili eraldajaGS, 1D
Grupi eraldajaRS, 1E
Kirje eraldaja, kirje eraldajaUSA, 1F
Üksuse eraldajaDEL, 7F

Kustuta, kustuta viimane märk.

Excel for Office 365 Word for Office 365 Outlook for Office 365 PowerPoint for Office 365 Publisher for Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Word Visio Standard 20619 Excel 20619int 2061 16 2013 Kirjastus 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 20 7 Outlook 20 2010 Visio 20 2010 07 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Less

Selles artiklis: Sisestage dokumenti ASCII- või Unicode-märk

Kui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil.

Märkused:

ASCII-märkide sisestamine ASCII-märgi sisestamiseks vajutage ja hoidke tähekoodi sisestamise ajal all klahvi ALT. Näiteks kraadisümboli (º) sisestamiseks vajutage ja hoidke all klahvi ALT, seejärel sisestage 0176.

numbriklahvistik

Numbrite sisestamiseks kasutage põhiklaviatuuri numbrite asemel numbriklahvistikku. Kui teil on vaja numbriklahvistikul numbreid sisestada, veenduge, et NUMBRILUKKU indikaator põleks.

Unicode'i tähemärkide sisestamine Unicode'i märgi sisestamiseks sisestage märgikood ja seejärel vajutage ALT klahvid

ja X. Näiteks dollari sümboli ($) sisestamiseks sisestage 0024 ja vajutage järjestikku ALT ja X Kõigi Unicode-märgikoodide kohta vaadake . Tähtis: mõned Microsofti programmid

Kui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil.

    Kui pärast ALT+X vajutamist kuvatakse vale Unicode'i märk, valige õige kood ja vajutage uuesti ALT+X.

    Lisaks tuleb enne koodi sisestada "U+". Näiteks kui sisestate "1U+B5" ja vajutate ALT+X, kuvatakse tekst "1µ" ja kui sisestate "1B5" ja vajutate ALT+X, kuvatakse sümbol "Ƶ".

Sümbolitabeli kasutamine

Märgistabel on Microsoft Windowsi sisseehitatud programm, mis võimaldab teil vaadata valitud fondi jaoks saadaolevaid märke.

Sümbolitabeli abil saate kopeerida üksikud tegelased või märkide rühma lõikepuhvrisse ja kleepige need mis tahes programmi, mis toetab nende märkide kuvamist. Sümbolitabeli avamine

    Windows 10-s sisestage tegumiriba otsingukasti sõna "sümbol" ja valige otsingutulemustest sümbolite tabel.

    Windows 8-s sisestage sõna "märk" aadressil avakuva ja valige otsingutulemustest sümbolite tabel.

    Operatsioonisüsteemis Windows 7 klõpsake nuppu Start, valige Kõik programmid, Tarvikud, Süsteemitööriistad ja seejärel klõpsake nuppu Märkide kaart.

Tähemärgid on grupeeritud fondi järgi. Sobiva märgistiku valimiseks klõpsake fondiloendil. Sümboli valimiseks klõpsake seda ja seejärel nuppu Vali. Sümboli sisestamiseks klõpsake nuppu paremklõps hiired õige koht dokumendis ja valige Kleebi.

Sageli kasutatavad märgikoodid

Täielik nimekiri tähemärke, vaadake oma arvutis, ASCII märgikooditabelit või Unicode'i märgitabeleid, mis on korraldatud komplekti järgi.

Glyph

Glyph

Valuuta

Juriidilised sümbolid

Matemaatilised sümbolid

Murrud

Kirjavahemärgid ja murdesümbolid

Kuju sümbolid

Tavaliselt kasutatavad diakriitilised koodid

Glüüfide ja vastavate koodide täieliku loendi leiate siit.

Glyph

Glyph

Mitteprinditavad ASCII juhtmärgid

Märgid, mida kasutati mõne kontrollimiseks välisseadmed, näiteks printerid, sisse ASCII tabel on numbritega 0-31. Näiteks lehekülje sööda/uue lehe märk on number 12. See märk annab printerile käsu liikuda järgmise lehe algusesse.

Mitteprinditavate ASCII juhtmärkide tabel

Kümnendarv

Sign

Kümnendarv

Sign

Andmekanali vabastamine

Pealkirja algus

Esimene seadme juhtkood

Teksti algus

Teine seadme juhtimiskood

Teksti lõpp

Kolmanda seadme juhtkood

Edastamise lõpp

Neljas seadme juhtimiskood

viieharuline

Negatiivne kinnitus

Kinnitus

Sünkroonne edastusrežiim

Piiks

Edastatud andmeploki lõpp

Horisontaalne tabel

Meedia lõpp

Reavahetus/uus rida

Asendussümbol

Vertikaalne vahekaart

ületada

Lehe tõlge/uus leht

Kaksteist

Faili eraldaja

Vankri tagastus

Grupi eraldaja

Nihutage ilma bitte salvestamata

Kirje eraldaja

Bitti säilitav nihe

viisteist

Andmete eraldaja

Igal arvutil on oma märkide komplekt, mida see rakendab. See komplekt sisaldab 26 kapitali ja väiketähti, numbrid ja eritegelased(punkt, tühik jne). Täisarvudeks teisendatuna nimetatakse sümboleid koodideks. Standardid töötati välja selleks, et arvutitel oleks samad koodikomplektid.

ASCII standard

ASCII (American Standard Code for Information Interchange) on Ameerika standardkood teabevahetuseks. Igal ASCII märgil on 7 bitti, seega maksimaalne arv tähemärki - 128 (tabel 1). Koodid 0 kuni 1F on juhtmärgid, mida ei prindita. Andmete edastamiseks on vaja palju mitteprinditavaid ASCII-märke. Näiteks võib teade koosneda päise alguse märgist SOH, päisest endast ja teksti alguse märgist STX, tekstist endast ja tekstilõpu märgist ETX ning edastuse lõpu märgist tegelane EOT. Võrgu kaudu edastatakse aga andmeid pakettidena, mis ise vastutavad edastuse alguse ja lõpu eest. Seega ei kasutata peaaegu kunagi mitteprinditavaid märke.

Tabel 1 – ASCII kooditabel

Number Käsu tähendus Number Käsu tähendus
0 NUL Nullkursor 10 DLE Väljumine ülekandesüsteemist
1 SOH pealkirja algus 11 DC1 Seadmehaldus
2 STX Teksti algus 12 DC2 Seadmehaldus
3 ETX Teksti lõpp 13 DC3 Seadmehaldus
4 EOT Edastamise lõpp 14 DC4 Seadmehaldus
5 ACK Taotlus 15 N.A.K. Vastuvõtu mittekinnitamine
6 BEL Vastuvõtmise kinnitus 16 SYN Lihtne
7 B.S. Kellukese sümbol 17 ETB Edastusploki lõpp
8 HT Astuge tagasi 18 CAN Mark
9 LF Horisontaalne tabel 19 E.M. Meedia lõpp
A VT Reavahetus 1A SUB Alamindeks
B FF Vertikaalne vahekaart 1B ESC Välju
C CR Lehekülje tõlge 1C FS Faili eraldaja
D NII Vankri tagastus 1D G.S. Grupi eraldaja
E S.I. Lülituge lisaregistrisse 1E R.S. Kirje eraldaja
S.I. Lülituge standardkorpusele 1F USA Mooduli eraldaja
Numbrisümbol Numbrisümbol Numbrisümbol Number Sümbol Number Sümbol Numbrisümbol
20 ruumi 30 0 40 @ 50 P 60 . 70 lk
21 ! 31 1 41 A 51 K 61 a 71 q
22 32 2 42 B 52 R 62 b 72 r
23 # 33 3 43 C 53 S 63 c 73 s
24 φ 34 4 44 D 54 T 64 d 74 t
25 % 35 5 45 E 55 JA 65 e 75 Ja
26 & 36 6 46 F 56 V 66 f 76 v
27 37 7 47 G 57 W 67 g 77 w
28 ( 38 8 48 H 58 X 68 h 78 x
29 ) 39 9 49 I 59 Y 69 i 70 y
2A 3A ; 4A J 5A Z 6A j 7A z
2B + 3B ; 4B K 5B [ 6B k 7B {
2C 3C < 4C L 5C \ 6C l 7C |
2D 3D = 4D M 5D ] 6D m 7D }
2E 3E > 4E N 5E 6E n 7E ~
2F / 3F g 4F O 5F _ 6F o 7F DEL
Unicode'i standard

Eelmine kodeering töötab hästi inglise keel teiste keelte jaoks pole see aga mugav. Näiteks sisse saksa keel seal on umluudid ja prantsuse keeles ülaindeksid. Mõnes keeles on täiesti erinevad tähestikud. Esimene katse ASCII laiendamiseks oli IS646, mis laiendas eelmist kodeeringut täiendava 128 tähemärgi võrra. Lisati ladina tähed kriipsu ja diakriitikaga ning sai nime – ladina 1. Järgmine katse oli IS 8859 – mis sisaldas koodilehte. Prooviti ka pikendada, kuid see polnud universaalne. Loodi UNICODE-kodeering (on 10646). Kodeeringu idee on määrata igale märgile üks konstantne 16-bitine väärtus, mida nimetatakse koodiosutiks. Kokku on 65536 osutit. Ruumi säästmiseks kasutasime koodide 0 -255 jaoks Latin-1, muutes ASII hõlpsalt UNICODE-iks. See standard lahendas palju probleeme, kuid mitte kõiki. Seoses uute sõnade tulekuga, näiteks jaapani keele jaoks, on vaja terminite arvu suurendada umbes 20 tuhande võrra.

Nagu teate, salvestab arvuti teavet binaarne, mis kujutab seda ühtede ja nullide jadana. Teabe tõlkimiseks inimesele sobivasse vormi asendatakse iga kordumatu numbrijada kuvamisel vastava sümboliga.

Üks süsteeme binaarkoodide korreleerimiseks trükitud ja kontrollmärkidega on

Tänasel arengutasemel arvutitehnoloogia kasutaja ei pea teadma iga konkreetse märgi koodi. Siiski üldine arusaam See, kuidas kodeerimine toimub, on äärmiselt kasulik ja mõne kategooria spetsialistide jaoks isegi vajalik.

ASCII loomine

Kodeering töötati algselt välja 1963. aastal ja seejärel uuendati kaks korda 25 aasta jooksul.

Algses versioonis sisaldas ASCII märgitabel 128 tähemärki. Hiljem ilmus laiendatud versioon, kus salvestati esimesed 128 tähemärki ja varem puudunud märgid määrati koodidele, milles oli kaasatud kaheksas bit.

Aastate jooksul see kodeering oli maailma populaarseim. 2006. aastal asus liidripositsioonile Latin 1252 ja 2007. aasta lõpust tänapäevani on Unicode kindlalt liidripositsiooni hoidnud.

ASCII arvutiesitus

Igal ASCII märgil on enda kood, mis koosneb 8 märgist, mis tähistavad nulli või ühte. Minimaalne arv selles esituses on null (kaheksa nulli kahendsüsteemis), mis on tabeli esimese elemendi kood.

Kaks tabelis olevat koodi olid reserveeritud standardse US-ASCII ja selle riikliku variandi vahel vahetamiseks.

Pärast seda, kui ASCII hakkas sisaldama mitte 128, vaid 256 tähemärki, sai laialt levinud kodeerimisvariant, milles tabeli algversioon salvestati esimeses 128 koodis 8. bitiga nulliga. Tabeli ülemisse poolde olid talletatud rahvuslikud kirjalikud märgid (positsioonid 128-255).

Kasutaja ei pea ASCII märgikoode otse teadma. Arendajale tarkvara Tavaliselt piisab elemendi numbri teadmisest tabelis, et vajadusel kahendsüsteemi abil selle kood arvutada.

vene keel

Pärast kodeeringu väljatöötamist skandinaavia keelte, hiina, korea, kreeka jne jaoks 70ndate alguses hakkas ta looma oma versiooni Nõukogude Liit. Peagi töötati välja 8-bitise kodeeringu versioon nimega KOI8, mis säilitas esimesed 128 ASCII märgikoodi ja eraldas sama arvu positsioone rahvusliku tähestiku tähtede ja lisamärkide jaoks.

Enne Unicode'i kasutuselevõttu domineeris KOI8 Venemaa Interneti-segmendis. Kodeerimisvalikud olid nii vene kui ka ukraina tähestiku jaoks.

ASCII probleemid

Kuna elementide arv isegi laiendatud tabelis ei ületanud 256, ei olnud võimalik ühte kodeeringusse mahutada mitut erinevat skripti. 90ndatel ilmnes Runetis "crocozyabr" probleem, kui vene ASCII tähemärkidega trükitud tekste kuvati valesti.

Probleemiks oli koodi mittevastavus erinevaid valikuid ASCII üksteisele. Meenutagem, et positsioonidel 128-255 võisid paikneda erinevad märgid ning ühe kirillitsa kodeeringu muutmisel teiseks asendati teksti kõik tähed teistega, millel on identne number erinevas kodeeringu versioonis.

Praegune olek

Unicode'i tulekuga hakkas ASCII populaarsus järsult langema.

Selle põhjuseks on asjaolu, et uus kodeering võimaldas mahutada peaaegu kõigi kirjakeelte tähemärke. Sel juhul vastavad esimesed 128 ASCII märki samadele Unicode'i tähemärkidele.

2000. aastal oli ASCII kõige populaarsem kodeering Internetis ja seda kasutati 60% Google'i indekseeritud veebilehtedel. 2012. aastaks oli selliste lehtede osakaal langenud 17%-ni ning populaarseima kodeeringu asemele tuli Unicode (UTF-8).

Seega on ASCII oluline osa ajaloost infotehnoloogia selle kasutamine tulevikus tundub siiski vähetõotav.