Igal arvutil on oma tähemärkide komplekt, mida see rakendab. See komplekt sisaldab 26 suur- ja väiketähte, numbreid ja erimärke (punkt, tühik jne). Täisarvudeks teisendatuna nimetatakse sümboleid koodideks. Standardid töötati välja selleks, et arvutitel oleks samad koodikomplektid.
ASCII standardASCII (American Standard Code for Information Interchange) on Ameerika standardkood teabevahetuseks. Igal ASCII märgil on 7 bitti, seega on maksimaalne märkide arv 128 (tabel 1). Koodid 0 kuni 1F on juhtmärgid, mida ei prindita. Andmete edastamiseks on vaja palju mitteprinditavaid ASCII-märke. Näiteks võib sõnum koosneda päise alguse märgist SOH, päisest endast ja teksti alguse märgist STX, tekstist endast ja tekstilõpu märgist ETX ning edastuse lõpu märgist tegelane EOT. Võrgu kaudu edastatakse aga andmeid pakettidena, mis ise vastutavad edastuse alguse ja lõpu eest. Seega ei kasutata peaaegu kunagi mitteprinditavaid märke.
Tabel 1 – ASCII kooditabel
0 | NUL | Nullkursor | 10 | DLE | Väljumine ülekandesüsteemist |
1 | SOH | pealkirja algus | 11 | DC1 | Seadmehaldus |
2 | STX | Teksti algus | 12 | DC2 | Seadmehaldus |
3 | ETX | Teksti lõpp | 13 | DC3 | Seadmehaldus |
4 | EOT | Edastamise lõpp | 14 | DC4 | Seadmehaldus |
5 | ACK | Taotlus | 15 | N.A.K. | Vastuvõtu mittekinnitamine |
6 | BEL | Vastuvõtmise kinnitus | 16 | SYN | Lihtne |
7 | B.S. | Kellukese sümbol | 17 | ETB | Edastusploki lõpp |
8 | HT | Astu tagasi | 18 | SAAB | Mark |
9 | LF | Horisontaalne tabel | 19 | E.M. | Meedia lõpp |
A | VT | Rea tõlkimine | 1A | SUB | Alamindeks |
B | FF | Vertikaalne vahekaart | 1B | ESC | Välju |
C | CR | Lehekülje tõlge | 1C | FS | Faili eraldaja |
D | NII | Vankri tagastus | 1D | G.S. | Grupi eraldaja |
E | S.I. | Lülituge lisaregistrisse | 1E | R.S. | Kirje eraldaja |
S.I. | Lülituge standardkorpusele | 1F | USA | Mooduli eraldaja |
20 | ruumi | 30 | 0 | 40 | @ | 50 | P | 60 | . | 70 | lk |
21 | ! | 31 | 1 | 41 | A | 51 | K | 61 | a | 71 | q |
22 | ‘ | 32 | 2 | 42 | B | 52 | R | 62 | b | 72 | r |
23 | # | 33 | 3 | 43 | C | 53 | S | 63 | c | 73 | s |
24 | φ | 34 | 4 | 44 | D | 54 | T | 64 | d | 74 | t |
25 | % | 35 | 5 | 45 | E | 55 | JA | 65 | e | 75 | Ja |
26 | & | 36 | 6 | 46 | F | 56 | V | 66 | f | 76 | v |
27 | ‘ | 37 | 7 | 47 | G | 57 | W | 67 | g | 77 | w |
28 | ( | 38 | 8 | 48 | H | 58 | X | 68 | h | 78 | x |
29 | ) | 39 | 9 | 49 | I | 59 | Y | 69 | i | 70 | y |
2A | ‘ | 3A | ; | 4A | J | 5A | Z | 6A | j | 7A | z |
2B | + | 3B | ; | 4B | K | 5B | [ | 6B | k | 7B | { |
2C | ‘ | 3C | < | 4C | L | 5C | \ | 6C | l | 7C | | |
2D | — | 3D | = | 4D | M | 5D | ] | 6D | m | 7D | } |
2E | 3E | > | 4E | N | 5E | — | 6E | n | 7E | ~ | |
2F | / | 3F | g | 4F | O | 5F | _ | 6F | o | 7F | DEL |
Eelmine kodeering on suurepärane inglise keele jaoks, kuid see pole mugav teiste keelte jaoks. Näiteks saksa keeles on umluudid ja prantsuse keeles ülaindeksid. Mõnes keeles on täiesti erinevad tähestikud. Esimene katse ASCII laiendamiseks oli IS646, mis laiendas eelmist kodeeringut täiendava 128 tähemärgi võrra. Lisati ladina tähed koos kriipsude ja diakriitikaga ning sai nime – ladina 1. Järgmine katse oli IS 8859 – mis sisaldas koodilehte. Prooviti ka pikendada, kuid see polnud universaalne. Loodi UNICODE-kodeering (on 10646). Kodeeringu idee on määrata igale märgile üks konstantne 16-bitine väärtus, mida nimetatakse koodiosutiks. Kokku on 65536 osutit. Ruumi säästmiseks kasutasime koodide 0 -255 jaoks Latin-1, muutes ASII hõlpsalt UNICODE-iks. See standard lahendas palju probleeme, kuid mitte kõiki. Seoses uute sõnade tulekuga, näiteks jaapani keele jaoks, on vaja terminite arvu suurendada umbes 20 tuhande võrra.
Tähemärgi ülekateBS (backspace) märk võimaldab printeril printida ühe märgi teise peale. ASCII võimaldas tähtedele diakriitikat lisada järgmiselt, näiteks:
- a BS "→ á
- a BS ` → à
- a BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → с
Märkus: vanemate fontide puhul tõmmati apostroof " vasakule kaldu ja tilde ~ nihutati üles, nii et need sobisid lihtsalt terava ja peal oleva tilde rolliga.
Kui märgi peale kantakse sama märk, on tulemuseks rasvane fondiefekt ja kui märgi peale on allajoonitud, on tulemuseks allajoonitud tekst.
- a BS a → a
- aBS_→ a
Märkus: seda kasutatakse näiteks mehe abisüsteemis.
Riiklikud ASCII variandidISO 646 (ECMA-6) standard lubab @ [ \ ] ^ ` ( | ) ~ asemele panna rahvusmärgid. Lisaks saab £ asetada # kohale ja ¤ saab paigutada $ kohale. See süsteem sobib hästi Euroopa keelte jaoks, kus on vaja vaid mõnda lisamärki. ASCII versiooni ilma rahvusmärkideta nimetatakse US-ASCII või "rahvusvaheliseks viiteversiooniks".
Seejärel osutus mugavamaks kasutada 8-bitiseid kodeeringuid (koodilehti), kus kooditabeli alumise poole (0-127) hõivavad US-ASCII märgid ja ülemise poole (128-255) lisamärkide, sealhulgas rahvusmärkide komplekti järgi. Seega kasutati ASCII tabeli ülemist poolt enne Unicode'i laialdast kasutuselevõttu aktiivselt lokaliseeritud märkide, kohaliku keele tähtede tähistamiseks. Ühtse standardi puudumine kirillitsa märkide paigutamiseks ASCII tabelisse põhjustas palju probleeme kodeeringutega (KOI-8, Windows-1251 jt). Ka teised mitteladina kirjadega keeled kannatasid mitme erineva kodeeringu all.
NUL | SOM | EOA | EOM | EQT | W.R.U. | RU | KELLU | BKSP | HT | LF | VT | FF | CR | NII | S.I. |
DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ERR | SYNC | L.E.M. | S 0 | S 1 | S 2 | S 3 | S 4 | S 5 | S 6 | S 7 |
TÜHI | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
P | K | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ← | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
lk | q | r | s | t | u | v | w | x | y | z | ESC | DEL |
Nendes arvutites, kus minimaalne adresseeritav mäluühik oli 36-bitine sõna, kasutati algselt 6-bitiseid märke (1 sõna = 6 märki). Pärast ASCII-le üleminekut hakkasid sellised arvutid ühes sõnas sisaldama kas 5 seitsmebitist märki (1 bitt jäi ekstra) või 4 üheksabitist märki.
ASCII koode kasutatakse ka selleks, et määrata, millist klahvi programmeerimise ajal vajutatakse. Tavalise QWERTY-klaviatuuri puhul näeb kooditabel välja järgmine:
[8-bitised kodeeringud: ASCII, KOI-8R ja CP1251] Esimesed USA-s loodud kodeerimistabelid ei kasutanud kaheksandat bitti baidis. Tekst esitati baitide jadana, kuid kaheksandat bitti ei arvestatud (seda kasutati ametlikel eesmärkidel). ASCII tabel (American Standard Code for Information Interchange) on muutunud üldtunnustatud standardiks. ASCII tabeli 32 esimest tähemärki (00 kuni 1F) kasutati mitteprinditavate märkide jaoks. Need olid mõeldud printimisseadme jms juhtimiseks. Ülejäänud - 20 kuni 7F - on tavalised (prinditavad) märgid. Tabel 1 – ASCII kodeering
Nagu on lihtne näha, sisaldab see kodeering ainult ladina tähti ja neid, mida kasutatakse inglise keeles. Samuti on aritmeetika- ja muud teenindussümbolid. Kuid pole ei vene tähti ega isegi spetsiaalseid ladina tähti saksa või prantsuse jaoks. Seda on lihtne seletada – kodeering töötati välja spetsiaalselt Ameerika standardina. Kui kogu maailmas hakati kasutama arvuteid, tuli kodeerida ka teisi märke. Selleks otsustati igas baidis kasutada kaheksandat bitti. See tegi kättesaadavaks veel 128 väärtust (80 kuni FF), mida sai kasutada märkide kodeerimiseks. Esimene kaheksabitistest tabelitest - laiendatud ASCII (Extended ASCII) - sisaldas ladina tähemärkide erinevaid variante, mida kasutatakse mõnes Lääne-Euroopa keeles. See sisaldas ka muid täiendavaid sümboleid, sealhulgas pseudograafiat. Pseudograafilised märgid võimaldavad teil kuvada ekraanil ainult tekstimärke, et luua graafikat. Näiteks failihaldusprogramm FAR Manager töötab pseudograafia abil. Laiendatud ASCII tabelis ei olnud vene tähti. Venemaa (endine NSVL) ja teised riigid lõid oma kodeeringud, mis võimaldasid 8-bitistes tekstifailides esitada konkreetseid "rahvuslikke" märke - poola ja tšehhi keele ladina tähti, kirillitsat (sh vene tähed) ja muid tähestike. Kõigis laialt levinud kodeeringutes on esimesed 127 märki (st baidi väärtus kaheksanda bitiga 0-ga) samad, mis ASCII. Seega töötab ASCII-fail mõlemas neist kodeeringutest; Inglise keele tähed on esindatud samamoodi. ISO organisatsioon (International Standardization Organisation) on võtnud kasutusele ISO 8859 standardite rühma. See määratleb 8-bitised kodeeringud erinevatele keelerühmadele. Seega on ISO 8859-1 laiendatud ASCII tabel USA ja Lääne-Euroopa jaoks. Ja ISO 8859-5 on tabel kirillitsa tähestiku jaoks (sh vene keeles). Kuid ajaloolistel põhjustel ei juurdunud ISO 8859-5 kodeering. Tegelikult kasutatakse vene keele jaoks järgmisi kodeeringuid: Koodileht 866 (CP866), teise nimega "DOS", teise nimega "alternatiivne GOST-kodeering". Laialdaselt kasutusel kuni 90ndate keskpaigani; nüüd kasutatakse piiratud määral. Internetis tekstide levitamiseks praktiliselt ei kasutata. CP866 peamiseks eeliseks oli pseudograafiliste märkide säilimine samades kohtades, mis Extended ASCII puhul; seetõttu võiksid välismaised tekstiprogrammid, näiteks kuulus Norton Commander, töötada ilma muudatusteta. CP866 kasutatakse nüüd tekstiakendes või täisekraani tekstirežiimis töötavate Windowsi programmide jaoks, sealhulgas FAR Manager. CP866 tekstid on viimastel aastatel olnud üsna haruldased (aga seda kasutatakse Windowsis venekeelsete failinimede kodeerimiseks). Seetõttu peatume üksikasjalikumalt kahel teisel kodeeringul - KOI-8R ja CP1251. Nagu näete, on CP1251 kodeerimistabelis vene tähed järjestatud tähestikulises järjekorras (erandiks on siiski täht E). Selline paigutus muudab arvutiprogrammide tähestikulise järjestuse sortimise väga lihtsaks. Kuid KOI-8R-is tundub vene tähtede järjekord juhuslik. Aga tegelikult ei ole. Paljudes vanemates programmides läks 8. bitt teksti töötlemisel või edastamisel kaduma. (Nüüd on sellised programmid praktiliselt "väljasurnud", kuid 80ndate lõpus - 90ndate alguses olid need laialt levinud). 8-bitisest väärtusest 7-bitise väärtuse saamiseks lahutage kõige olulisemast numbrist 8; näiteks E1 muutub 61-ks. Nüüd võrrelge KOI-8R ASCII tabeliga (tabel 1). Leiate, et venekeelsed tähed on ladina tähtedega selges vastavuses. Kui kaheksas bitt kaob, muutuvad väikesed vene tähed suurteks ladina tähtedeks ja suured vene tähed väikesteks ladina tähtedeks. Niisiis, E1 KOI-8-s on vene "A", samas kui 61 ASCII-s on ladina täht "a". Niisiis võimaldab KOI-8 säilitada venekeelse teksti loetavust, kui 8. bitt kaob. "Tere kõigile" muutub "pRIWET WSEM". Viimasel ajal on määrava tähtsuse kaotanud nii tähemärkide järjekord kodeerimistabelis kui ka loetavus koos 8. biti kadumisega. Kaasaegsete arvutite kaheksas bitt ei lähe edastuse ega töötlemise ajal kaotsi. Ja tähestikuline sortimine toimub kodeeringut arvesse võttes, mitte lihtsalt koode võrreldes. (Muide, CP1251 koodid ei ole täielikult tähestikulises järjekorras - E-täht pole omal kohal). Kuna on kaks levinud kodeeringut, näete Internetiga töötamisel (post, veebisaitide sirvimine) mõnikord venekeelse teksti asemel mõttetut tähtede komplekti. Näiteks "MINA OLEN SBYUFEMHEL". Need on lihtsalt sõnad "respektiga"; kuid need olid kodeeritud CP1251 kodeeringus ja arvuti dekodeeris teksti KOI-8 tabeli abil. Kui samad sõnad, vastupidi, kodeeritaks KOI-8-sse ja arvuti dekodeeriks teksti vastavalt tabelile CP1251, oleks tulemuseks “U HCHBTSEOYEN”. Mõnikord juhtub, et arvuti dešifreerib venekeelseid tähti, kasutades tabelit, mis pole mõeldud vene keele jaoks. Siis ilmub vene tähtede asemele mõttetu sümbolite kogum (näiteks Ida-Euroopa keelte ladina tähed); neid nimetatakse sageli "krokosübradeks". Enamikul juhtudel saavad kaasaegsed programmid Interneti-dokumentide (e-kirjade ja veebilehtede) kodeeringu määramisega iseseisvalt hakkama. Kuid mõnikord nad "tõrjuvad" ja siis näete kummalisi vene tähtede jada või "krokozyabry". Reeglina piisab sellises olukorras reaalse teksti kuvamiseks ekraanil kodeeringu käsitsi valimisest programmimenüüs. Selle artikli jaoks kasutati teavet lehelt http://open-office.edusite.ru/TextProcessor/p5aa1.html. Saidilt võetud materjal:
Eri(juht)märkide kirjeldus Tuleb märkida, et algselt kasutati ASCII tabeli juhtmärke teletüüpi teel andmevahetuse tagamiseks, perfolindilt andmete sisestamiseks ja välisseadmete lihtsaks juhtimiseks. Praegu ei kanna enamus ASCII tabeli juhtmärke enam seda koormust ja neid saab kasutada muudel eesmärkidel.
Excel for Office 365 Word for Office 365 Outlook for Office 365 PowerPoint for Office 365 Publisher for Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Word Visio Standard 20619int Excel 20619int 2061 16 2013 Kirjastus 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 20 7 Outlook 20 2010 Visio 20 2010 07 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Less Selles artiklis: Sisestage dokumenti ASCII- või Unicode-märkKui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil. Märkused: ASCII-märkide sisestamineASCII-märgi sisestamiseks vajutage ja hoidke tähekoodi sisestamise ajal all klahvi ALT. Näiteks kraadisümboli (º) sisestamiseks vajutage ja hoidke all klahvi ALT, seejärel sisestage numbriklahvistikul 0176. Numbrite sisestamiseks kasutage põhiklaviatuuri numbrite asemel numbriklahvistikku. Kui teil on vaja numbriklahvistikul numbreid sisestada, veenduge, et NUMBRILUKKU indikaator põleks. Unicode'i tähemärkide sisestamineUnicode'i märgi sisestamiseks sisestage märgikood, seejärel vajutage ALT ja X. Näiteks dollari sümboli ($) sisestamiseks sisestage 0024 ning vajutage ALT ja X. Kõikide Unicode'i märgikoodide kohta vaadake . Tähtis. Mõned Microsoft Office'i programmid, nagu PowerPoint ja InfoPath, ei toeta Unicode'i koodide teisendamist tähemärkideks. Kui peate mõnda neist programmidest sisestama Unicode'i märgi, kasutage . Märkused: Kui pärast ALT+X vajutamist kuvatakse vale Unicode'i märk, valige õige kood ja vajutage uuesti ALT+X. Lisaks tuleb enne koodi sisestada "U+". Näiteks kui sisestate "1U+B5" ja vajutate ALT+X, kuvatakse tekst "1µ" ja kui sisestate "1B5" ja vajutate ALT+X, kuvatakse sümbol "Ƶ". Märgistabel on Microsoft Windowsi sisseehitatud programm, mis võimaldab teil vaadata valitud fondi jaoks saadaolevaid märke. Sümbolitabeli abil saate lõikepuhvrisse kopeerida üksikud sümbolid või sümbolite rühma ja kleepida need mis tahes programmi, mis toetab nende sümbolite kuvamist. Sümbolitabeli avamine Windows 10-s sisestage tegumiriba otsingukasti sõna "symbol" ja valige otsingutulemustest sümbolite tabel. Windows 8 puhul tippige avakuval "symbol" ja valige otsingutulemustest sümbolite tabel. Operatsioonisüsteemis Windows 7 klõpsake nuppu Start, valige Kõik programmid, Tarvikud, Süsteemitööriistad ja seejärel klõpsake nuppu Märkide kaart. Tähemärgid on grupeeritud fondi järgi. Sobiva märgistiku valimiseks klõpsake fondiloendil. Sümboli valimiseks klõpsake seda ja seejärel nuppu Vali. Sümboli sisestamiseks paremklõpsake soovitud kohta dokumendis ja valige Kleebi. Sageli kasutatavad märgikoodidTäieliku märkide loendi leiate jaotisest Arvuti, ASCII märgikooditabel või Unicode'i märgitabelid, mis on korraldatud komplekti järgi.
|