Kutsutakse välja märkide kogum, millega tekst on kirjutatud tähestik.
Tähemärkide arv tähestikus on selle võimsus.
Infohulga määramise valem: N=2b,
kus N on tähestiku aste (märkide arv),
b – bittide arv (sümboli infokaal).
256 tähemärki mahutav tähestik mahutab peaaegu kõik vajalikud märgid. Seda tähestikku nimetatakse piisav.
Sest 256 = 2 8, siis on 1 märgi kaal 8 bitti.
Mõõtühikule 8 bitti anti nimi 1 bait:
1 bait = 8 bitti.
Iga tähemärgi binaarkood arvutitekstis võtab 1 baidi mälu.
Kuidas tekstiteavet arvutimälus esitatakse?Bait-baitilise märgikodeeringu mugavus on ilmne, kuna bait on mälu väikseim adresseeritav osa ja seetõttu pääseb protsessor teksti töötlemisel igale märgile eraldi juurde. Teisest küljest on 256 tähemärki üsna piisav arv, et esindada väga erinevat sümboolset teavet.
Nüüd tekib küsimus, milline kaheksabitine binaarne kood sobitada iga tähemärki.On selge, et see on tingimuslik, võite välja mõelda palju kodeerimismeetodeid.
Kõik arvutitähestiku märgid on nummerdatud vahemikus 0 kuni 255. Iga number vastab kaheksabitisele kahendkoodile vahemikus 00000000 kuni 11111111. See kood on lihtsalt tähemärgi seerianumber kahendsüsteem Arvestus.
Tabel, milles kõik arvutitähestiku märgid on üksteisele määratud seerianumbrid, nimetatakse kodeerimistabeliks.Sest erinevat tüüpi Arvutid kasutavad erinevaid kodeerimistabeleid.
Tabelist on saanud personaalarvutite rahvusvaheline standard ASCII(loe Aski) (Ameerika standardkood teabevahetuseks).
ASCII kooditabel on jagatud kaheks osaks.
Vaid tabeli esimene pool on rahvusvaheline standard, s.o. sümbolid numbritega alates 0 (00000000), kuni 127 (01111111).
ASCII kodeeringu tabeli struktuurSeerianumber | Kood | Sümbol |
0 - 31 | 00000000 - 00011111 | Sümboleid numbritega 0 kuni 31 nimetatakse tavaliselt juhtsümboliteks. |
32 - 127 | 00100000 - 01111111 | Tabeli standardosa (inglise keeles). See hõlmab väiketähti ja suured tähed ladina tähestik, kümnendkohad, kirjavahemärgid, igasugused sulud, kaubanduslikud ja muud sümbolid. |
128 - 255 | 10000000 - 11111111 | Tabeli alternatiivne osa (vene). |
Juhin teie tähelepanu asjaolule, et kodeerimistabelis asuvad tähed (suur- ja väiketähed) tähestikuline järjekord, ja numbrid on järjestatud kasvavas järjekorras. Sellist leksikograafilise korra järgimist sümbolite paigutusel nimetatakse tähestiku järjestikuse kodeerimise põhimõtteks.
Vene tähestiku tähtede puhul järgitakse ka järjestikuse kodeerimise põhimõtet.
ASCII kooditabeli teine poolKahjuks on praegu viis erinevat kirillitsa kodeeringut (KOI8-R, Windows. MS-DOS, Macintosh ja ISO). Seetõttu tekivad sageli probleemid venekeelse teksti ülekandmisel ühest arvutist teise, ühest tarkvarasüsteem teisele.
Kronoloogiliselt oli üks esimesi standardeid vene tähtede kodeerimiseks arvutites KOI8 ("Informatsioonivahetuskood, 8-bitine"). Seda kodeeringut kasutati 70ndatel ES-i arvutiseeria arvutites ja alates 80ndate keskpaigast hakati seda kasutama esimestes venestatud versioonides. operatsioonisüsteemi UNIX.
Alates 90ndate algusest, MS DOS operatsioonisüsteemi domineerimise ajast, jääb alles CP866 kodeering ("CP" tähendab "koodilehte", "koodilehte").
Arvutid Apple tegutseb operatsioonisaali kontrolli all Mac süsteemid OS, kasutage nende enda Maci kodeeringut.
Lisaks on Rahvusvaheline Standardiorganisatsioon (ISO) heaks kiitnud vene keele standardiks veel ühe kodeeringu nimega ISO 8859-5.
Kõige tavalisem praegu kasutatav kodeering on Microsoft Windows, lühend CP1251.
Alates 90ndate lõpust on märgikodeeringu standardimise probleem lahendatud uue rahvusvaheline standard mida nimetatakse Unicode. See on 16-bitine kodeering, st. see eraldab iga märgi jaoks 2 baiti mälu. Loomulikult suurendab see hõivatud mälu mahtu 2 korda. Aga selline kooditabel võimaldab lisada kuni 65536 tähemärki. Täielik spetsifikatsioon Unicode'i standard hõlmab kõiki olemasolevaid, väljasurnud ja kunstlikult loodud tähestikke maailmas, samuti palju matemaatilisi, muusikalisi, keemilisi ja muid sümboleid.
Proovime kasutada ASCII tabelit, et kujutada ette, millised sõnad arvuti mälus välja näevad. Sõnade sisemine esitus arvutimälusMõnikord juhtub, et teisest arvutist saadud vene tähestiku tähtedest koosnevat teksti ei saa lugeda - monitori ekraanil on näha mingisugune “abrakadabra”. See juhtub seetõttu, et arvutid kasutavad vene keele jaoks erinevat märgikodeeringut.
dets | Hex | Sümbol | dets | Hex | Sümbol | |
000 | 00 | spetsialist. NOP | 128 | 80 | Ђ | |
001 | 01 | spetsialist. SOH | 129 | 81 | Ѓ | |
002 | 02 | spetsialist. STX | 130 | 82 | ‚ | |
003 | 03 | spetsialist. ETX | 131 | 83 | ѓ | |
004 | 04 | spetsialist. EOT | 132 | 84 | „ | |
005 | 05 | spetsialist. ENQ | 133 | 85 | … | |
006 | 06 | spetsialist. ACK | 134 | 86 | † | |
007 | 07 | spetsialist. BEL | 135 | 87 | ‡ | |
008 | 08 | spetsialist. B.S. | 136 | 88 | € | |
009 | 09 | spetsialist. TAB | 137 | 89 | ‰ | |
010 | 0A | spetsialist. LF | 138 | 8A | Љ | |
011 | 0B | spetsialist. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | spetsialist. FF | 140 | 8C | Њ | |
013 | 0D | spetsialist. CR | 141 | 8D | Ќ | |
014 | 0E | spetsialist. NII | 142 | 8E | Ћ | |
015 | 0F | spetsialist. S.I. | 143 | 8F | Џ | |
016 | 10 | spetsialist. DLE | 144 | 90 | ђ | |
017 | 11 | spetsialist. DC1 | 145 | 91 | ‘ | |
018 | 12 | spetsialist. DC2 | 146 | 92 | ’ | |
019 | 13 | spetsialist. DC3 | 147 | 93 | “ | |
020 | 14 | spetsialist. DC4 | 148 | 94 | ” | |
021 | 15 | spetsialist. N.A.K. | 149 | 95 | ||
022 | 16 | spetsialist. SYN | 150 | 96 | – | |
023 | 17 | spetsialist. ETB | 151 | 97 | — | |
024 | 18 | spetsialist. CAN | 152 | 98 | ||
025 | 19 | spetsialist. E.M. | 153 | 99 | ™ | |
026 | 1A | spetsialist. SUB | 154 | 9A | љ | |
027 | 1B | spetsialist. ESC | 155 | 9B | › | |
028 | 1C | spetsialist. FS | 156 | 9C | њ | |
029 | 1D | spetsialist. G.S. | 157 | 9D | ќ | |
030 | 1E | spetsialist. R.S. | 158 | 9E | ћ | |
031 | 1F | spetsialist. USA | 159 | 9F | џ | |
032 | 20 | sidur SP (kosmos) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Yo | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | A.A. | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | A.C. | ¬ | |
045 | 2D | - | 173 | AD | | |
046 | 2E | . | 174 | A.E. | ® | |
047 | 2F | / | 175 | A.F. | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | e | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | B.A. | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | B.C. | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | OLE | ѕ | |
063 | 3F | ? | 191 | B.F. | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | IN | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | JA | |
071 | 47 | G | 199 | C7 | Z | |
072 | 48 | H | 200 | C8 | JA | |
073 | 49 | I | 201 | C9 | Y | |
074 | 4A | J | 202 | C.A. | TO | |
075 | 4B | K | 203 | C.B. | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | N | |
078 | 4E | N | 206 | C.E. | KOHTA | |
079 | 4F | O | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | K | 209 | D1 | KOOS | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | U | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | U | 213 | D5 | X | |
086 | 56 | V | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | Sh | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | D.A. | Kommersant | |
091 | 5B | [ | 219 | D.B. | Y | |
092 | 5C | \ | 220 | DC | b | |
093 | 5D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | Yu | |
095 | 5F | _ | 223 | DF | I | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | a | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | V | |
099 | 63 | c | 227 | E3 | G | |
100 | 64 | d | 228 | E4 | d | |
101 | 65 | e | 229 | E5 | e | |
102 | 66 | f | 230 | E6 | ja | |
103 | 67 | g | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | Ja | |
105 | 69 | i | 233 | E9 | th | |
106 | 6A | j | 234 | E.A. | To | |
107 | 6B | k | 235 | E.B. | l | |
108 | 6C | l | 236 | E.C. | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | E.E. | O | |
111 | 6F | o | 239 | EF | n | |
112 | 70 | lk | 240 | F0 | r | |
113 | 71 | q | 241 | F1 | Koos | |
114 | 72 | r | 242 | F2 | T | |
115 | 73 | s | 243 | F3 | juures | |
116 | 74 | t | 244 | F4 | f | |
117 | 75 | u | 245 | F5 | X | |
118 | 76 | v | 246 | F6 | ts | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | x | 248 | F8 | w | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | F.A. | ъ | |
123 | 7B | { | 251 | FB | s | |
124 | 7C | | | 252 | F.C. | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | yu | |
127 | 7F | Spetsialist. DEL | 255 | FF | I |
Eri(juht)märkide kirjeldus Tuleb märkida, et algselt kasutati ASCII tabeli juhtmärke andmevahetuse tagamiseks teletüüpi teel, andmete sisestamiseks perfolindilt ja välisseadmete lihtsaks juhtimiseks.
Praegu ei kanna enamik ASCII tabeli juhtmärke enam seda koormust ja neid saab kasutada muudel eesmärkidel.
NULL, 00 | Null, tühi |
SOH, 01 | Rubriigi algus |
STX, 02 | Teksti algus, teksti algus. |
ETX, 03 | TEKSTI lõpp, teksti lõpp |
EOT, 04 | Edastamise lõpp, edastuse lõpp |
ENQ, 05 | Küsige. Palun kinnita |
AK, 06 | Tunnustus. kinnitan |
BEL, 07 | Bell, helista |
BS, 08 | Backspace, mine ühe tähemärgi võrra tagasi |
TAB, 09 | Vahekaart, horisontaalne vahekaart |
LF, 0A | Reavahetus, reavahetus. Tänapäeval tähistatakse seda enamikus programmeerimiskeeltes kui \n |
VT, 0B | Vertikaalne tabel, vertikaalne tabel. |
FF, 0C | Vormivoog, lehevoog, uus leht |
CR, 0D | Käru tagasi, vankri tagasi. Tänapäeval tähistatakse seda enamikus programmeerimiskeeltes kui \r |
SO,0E | Shift Out, muutke prindiseadme tindiriba värvi |
SI,0F | Shift In, tagastab prindiseadmes oleva tindiriba värvi tagasi |
DLE, 10 | Data Link Escape, lülitades kanali andmeedastusse |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Seadme juhtimine, seadme juhtsümbolid |
NAK, 15 | Negatiivne tunnustus, ma ei kinnita. |
SYN, 16 | Sünkroonimine. Sünkroonimise sümbol |
ETB, 17 | Tekstiploki lõpp, tekstiploki lõpp |
CAN, 18 | Tühista, tühistab varem üle kantud |
EM, 19 | Keskmise lõpp |
SUB, 1A | Asendaja, asendaja. |
Paigutatakse sümboli asemele, mille tähendus edastamise ajal kadus või rikuti | ESC, 1B |
Põgenemise juhtimise järjestus | FS, 1C |
Faili eraldaja, faili eraldaja | GS, 1D |
Grupi eraldaja | RS, 1E |
Kirje eraldaja, kirje eraldaja | USA, 1F |
Üksuse eraldaja | DEL, 7F |
Kustuta, kustuta viimane märk.
Excel for Office 365 Word for Office 365 Outlook for Office 365 PowerPoint for Office 365 Publisher for Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Word Visio Standard 20619 Excel 20619int 2061 16 2013 Kirjastus 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 20 7 Outlook 20 2010 Visio 20 2010 07 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 LessSelles artiklis: Sisestage dokumenti ASCII- või Unicode-märk
Kui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil.
Märkused:ASCII-märkide sisestamine ASCII-märgi sisestamiseks vajutage ja hoidke tähekoodi sisestamise ajal all klahvi ALT. Näiteks kraadisümboli (º) sisestamiseks vajutage ja hoidke all klahvi ALT, seejärel sisestage 0176.
numbriklahvistik
Numbrite sisestamiseks kasutage põhiklaviatuuri numbrite asemel numbriklahvistikku. Kui teil on vaja numbriklahvistikul numbreid sisestada, veenduge, et NUMBRILUKKU indikaator põleks.Unicode'i tähemärkide sisestamine Unicode'i märgi sisestamiseks sisestage märgikood ja seejärel vajutage ALT klahvid
ja X. Näiteks dollari sümboli ($) sisestamiseks sisestage 0024 ja vajutage järjestikku ALT ja X Kõigi Unicode-märgikoodide kohta vaadake . Tähtis: mõned Microsofti programmid
Kui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil.
Kui pärast ALT+X vajutamist kuvatakse vale Unicode'i märk, valige õige kood ja vajutage uuesti ALT+X.
Lisaks tuleb enne koodi sisestada "U+". Näiteks kui sisestate "1U+B5" ja vajutate ALT+X, kuvatakse tekst "1µ" ja kui sisestate "1B5" ja vajutate ALT+X, kuvatakse sümbol "Ƶ".
Märgistabel on Microsoft Windowsi sisseehitatud programm, mis võimaldab teil vaadata valitud fondi jaoks saadaolevaid märke.
Sümbolitabeli abil saate kopeerida üksikud tegelased või märkide rühma lõikepuhvrisse ja kleepige need mis tahes programmi, mis toetab nende märkide kuvamist. Sümbolitabeli avamine
Windows 10-s sisestage tegumiriba otsingukasti sõna "sümbol" ja valige otsingutulemustest sümbolite tabel.
Windows 8-s sisestage sõna "märk" aadressil avakuva ja valige otsingutulemustest sümbolite tabel.
Operatsioonisüsteemis Windows 7 klõpsake nuppu Start, valige Kõik programmid, Tarvikud, Süsteemitööriistad ja seejärel klõpsake nuppu Märkide kaart.
Tähemärgid on grupeeritud fondi järgi. Sobiva märgistiku valimiseks klõpsake fondiloendil. Sümboli valimiseks klõpsake seda ja seejärel nuppu Vali. Sümboli sisestamiseks klõpsake nuppu paremklõps hiired õige koht dokumendis ja valige Kleebi.
Sageli kasutatavad märgikoodidTäielik nimekiri tähemärke, vaadake oma arvutis, ASCII märgikooditabelit või Unicode'i märgitabeleid, mis on korraldatud komplekti järgi.
Valuuta |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Juriidilised sümbolid |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Murrud |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kirjavahemärgid ja murdesümbolid |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kuju sümbolid |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Tavaliselt kasutatavad diakriitilised koodid Glüüfide ja vastavate koodide täieliku loendi leiate siit.
|
Igal arvutil on oma märkide komplekt, mida see rakendab. See komplekt sisaldab 26 kapitali ja väiketähti, numbrid ja eritegelased(punkt, tühik jne). Täisarvudeks teisendatuna nimetatakse sümboleid koodideks. Standardid töötati välja selleks, et arvutitel oleks samad koodikomplektid.
ASCII standardASCII (American Standard Code for Information Interchange) on Ameerika standardkood teabevahetuseks. Igal ASCII märgil on 7 bitti, seega maksimaalne arv tähemärki - 128 (tabel 1). Koodid 0 kuni 1F on juhtmärgid, mida ei prindita. Andmete edastamiseks on vaja palju mitteprinditavaid ASCII-märke. Näiteks võib teade koosneda päise alguse märgist SOH, päisest endast ja teksti alguse märgist STX, tekstist endast ja tekstilõpu märgist ETX ning edastuse lõpu märgist tegelane EOT. Võrgu kaudu edastatakse aga andmeid pakettidena, mis ise vastutavad edastuse alguse ja lõpu eest. Seega ei kasutata peaaegu kunagi mitteprinditavaid märke.
Tabel 1 – ASCII kooditabel
0 | NUL | Nullkursor | 10 | DLE | Väljumine ülekandesüsteemist |
1 | SOH | pealkirja algus | 11 | DC1 | Seadmehaldus |
2 | STX | Teksti algus | 12 | DC2 | Seadmehaldus |
3 | ETX | Teksti lõpp | 13 | DC3 | Seadmehaldus |
4 | EOT | Edastamise lõpp | 14 | DC4 | Seadmehaldus |
5 | ACK | Taotlus | 15 | N.A.K. | Vastuvõtu mittekinnitamine |
6 | BEL | Vastuvõtmise kinnitus | 16 | SYN | Lihtne |
7 | B.S. | Kellukese sümbol | 17 | ETB | Edastusploki lõpp |
8 | HT | Astuge tagasi | 18 | CAN | Mark |
9 | LF | Horisontaalne tabel | 19 | E.M. | Meedia lõpp |
A | VT | Reavahetus | 1A | SUB | Alamindeks |
B | FF | Vertikaalne vahekaart | 1B | ESC | Välju |
C | CR | Lehekülje tõlge | 1C | FS | Faili eraldaja |
D | NII | Vankri tagastus | 1D | G.S. | Grupi eraldaja |
E | S.I. | Lülituge lisaregistrisse | 1E | R.S. | Kirje eraldaja |
S.I. | Lülituge standardkorpusele | 1F | USA | Mooduli eraldaja |
20 | ruumi | 30 | 0 | 40 | @ | 50 | P | 60 | . | 70 | lk |
21 | ! | 31 | 1 | 41 | A | 51 | K | 61 | a | 71 | q |
22 | ‘ | 32 | 2 | 42 | B | 52 | R | 62 | b | 72 | r |
23 | # | 33 | 3 | 43 | C | 53 | S | 63 | c | 73 | s |
24 | φ | 34 | 4 | 44 | D | 54 | T | 64 | d | 74 | t |
25 | % | 35 | 5 | 45 | E | 55 | JA | 65 | e | 75 | Ja |
26 | & | 36 | 6 | 46 | F | 56 | V | 66 | f | 76 | v |
27 | ‘ | 37 | 7 | 47 | G | 57 | W | 67 | g | 77 | w |
28 | ( | 38 | 8 | 48 | H | 58 | X | 68 | h | 78 | x |
29 | ) | 39 | 9 | 49 | I | 59 | Y | 69 | i | 70 | y |
2A | ‘ | 3A | ; | 4A | J | 5A | Z | 6A | j | 7A | z |
2B | + | 3B | ; | 4B | K | 5B | [ | 6B | k | 7B | { |
2C | ‘ | 3C | < | 4C | L | 5C | \ | 6C | l | 7C | | |
2D | — | 3D | = | 4D | M | 5D | ] | 6D | m | 7D | } |
2E | 3E | > | 4E | N | 5E | — | 6E | n | 7E | ~ | |
2F | / | 3F | g | 4F | O | 5F | _ | 6F | o | 7F | DEL |
Eelmine kodeering töötab hästi inglise keel teiste keelte jaoks pole see aga mugav. Näiteks sisse saksa keel seal on umluudid ja prantsuse keeles ülaindeksid. Mõnes keeles on täiesti erinevad tähestikud. Esimene katse ASCII laiendamiseks oli IS646, mis laiendas eelmist kodeeringut täiendava 128 tähemärgi võrra. Lisati ladina tähed kriipsu ja diakriitikaga ning sai nime – ladina 1. Järgmine katse oli IS 8859 – mis sisaldas koodilehte. Prooviti ka pikendada, kuid see polnud universaalne. Loodi UNICODE-kodeering (on 10646). Kodeeringu idee on määrata igale märgile üks konstantne 16-bitine väärtus, mida nimetatakse koodiosutiks. Kokku on 65536 osutit. Ruumi säästmiseks kasutasime koodide 0 -255 jaoks Latin-1, muutes ASII hõlpsalt UNICODE-iks. See standard lahendas palju probleeme, kuid mitte kõiki. Seoses uute sõnade tulekuga, näiteks jaapani keele jaoks, on vaja terminite arvu suurendada umbes 20 tuhande võrra.
Nagu teate, salvestab arvuti teavet binaarne, mis kujutab seda ühtede ja nullide jadana. Teabe tõlkimiseks inimesele sobivasse vormi asendatakse iga kordumatu numbrijada kuvamisel vastava sümboliga.
Üks süsteeme binaarkoodide korreleerimiseks trükitud ja kontrollmärkidega on
Tänasel arengutasemel arvutitehnoloogia kasutaja ei pea teadma iga konkreetse märgi koodi. Siiski üldine arusaam See, kuidas kodeerimine toimub, on äärmiselt kasulik ja mõne kategooria spetsialistide jaoks isegi vajalik.
ASCII loomineKodeering töötati algselt välja 1963. aastal ja seejärel uuendati kaks korda 25 aasta jooksul.
Algses versioonis sisaldas ASCII märgitabel 128 tähemärki. Hiljem ilmus laiendatud versioon, kus salvestati esimesed 128 tähemärki ja varem puudunud märgid määrati koodidele, milles oli kaasatud kaheksas bit.
Aastate jooksul see kodeering oli maailma populaarseim. 2006. aastal asus liidripositsioonile Latin 1252 ja 2007. aasta lõpust tänapäevani on Unicode kindlalt liidripositsiooni hoidnud.
ASCII arvutiesitusIgal ASCII märgil on enda kood, mis koosneb 8 märgist, mis tähistavad nulli või ühte. Minimaalne arv selles esituses on null (kaheksa nulli kahendsüsteemis), mis on tabeli esimese elemendi kood.
Kaks tabelis olevat koodi olid reserveeritud standardse US-ASCII ja selle riikliku variandi vahel vahetamiseks.
Pärast seda, kui ASCII hakkas sisaldama mitte 128, vaid 256 tähemärki, sai laialt levinud kodeerimisvariant, milles tabeli algversioon salvestati esimeses 128 koodis 8. bitiga nulliga. Tabeli ülemisse poolde olid talletatud rahvuslikud kirjalikud märgid (positsioonid 128-255).
Kasutaja ei pea ASCII märgikoode otse teadma. Arendajale tarkvara Tavaliselt piisab elemendi numbri teadmisest tabelis, et vajadusel kahendsüsteemi abil selle kood arvutada.
vene keelPärast kodeeringu väljatöötamist skandinaavia keelte, hiina, korea, kreeka jne jaoks 70ndate alguses hakkas ta looma oma versiooni Nõukogude Liit. Peagi töötati välja 8-bitise kodeeringu versioon nimega KOI8, mis säilitas esimesed 128 ASCII märgikoodi ja eraldas sama arvu positsioone rahvusliku tähestiku tähtede ja lisamärkide jaoks.
Enne Unicode'i kasutuselevõttu domineeris KOI8 Venemaa Interneti-segmendis. Kodeerimisvalikud olid nii vene kui ka ukraina tähestiku jaoks.
ASCII probleemidKuna elementide arv isegi laiendatud tabelis ei ületanud 256, ei olnud võimalik ühte kodeeringusse mahutada mitut erinevat skripti. 90ndatel ilmnes Runetis "crocozyabr" probleem, kui vene ASCII tähemärkidega trükitud tekste kuvati valesti.
Probleemiks oli koodi mittevastavus erinevaid valikuid ASCII üksteisele. Meenutagem, et positsioonidel 128-255 võisid paikneda erinevad märgid ning ühe kirillitsa kodeeringu muutmisel teiseks asendati teksti kõik tähed teistega, millel on identne number erinevas kodeeringu versioonis.
Praegune olekUnicode'i tulekuga hakkas ASCII populaarsus järsult langema.
Selle põhjuseks on asjaolu, et uus kodeering võimaldas mahutada peaaegu kõigi kirjakeelte tähemärke. Sel juhul vastavad esimesed 128 ASCII märki samadele Unicode'i tähemärkidele.
2000. aastal oli ASCII kõige populaarsem kodeering Internetis ja seda kasutati 60% Google'i indekseeritud veebilehtedel. 2012. aastaks oli selliste lehtede osakaal langenud 17%-ni ning populaarseima kodeeringu asemele tuli Unicode (UTF-8).
Seega on ASCII oluline osa ajaloost infotehnoloogia selle kasutamine tulevikus tundub siiski vähetõotav.