BS (backspace) märk võimaldab printeril printida ühe märgi teise peale. ASCII võimaldas tähtedele diakriitikat lisada järgmiselt, näiteks:
- a BS "→ á
- a BS ` → à
- a BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → с
Märkus: vanemate fontide puhul tõmmati apostroof " vasakule kaldu ja tilde ~ nihutati üles, nii et need sobisid lihtsalt terava ja peal oleva tilde rolliga.
Kui märgi peale kantakse sama märk, on tulemuseks paksus kirjas efekt ja kui märgi peale on allajoonitud, on tulemuseks allajoonitud tekst.
- a BS a → a
- aBS_→ a
Märkus: seda kasutatakse näiteks mehe abisüsteemis.
Riiklikud ASCII variandidISO 646 (ECMA-6) standard annab võimaluse panna @ [ \ ] ^ ` ( | ) ~ asemele rahvusmärke. Lisaks saab £ asetada # kohale ja ¤ asemele $. See süsteem sobib hästi Euroopa keelte jaoks, kus on vaja vaid mõnda lisamärki. ASCII versiooni ilma rahvusmärkideta nimetatakse US-ASCII või "rahvusvaheliseks viiteversiooniks".
Seejärel osutus mugavamaks kasutada 8-bitiseid kodeeringuid (koodilehti), kus kooditabeli alumise poole (0-127) hõivavad US-ASCII märgid ja ülemise poole (128-255) lisamärkide, sealhulgas rahvusmärkide komplekti järgi. Seega kasutati ASCII tabeli ülemist poolt enne Unicode'i laialdast kasutuselevõttu aktiivselt lokaliseeritud märkide, kohaliku keele tähtede tähistamiseks. Ühtse standardi puudumine kirillitsa märkide paigutamiseks ASCII tabelisse põhjustas palju probleeme kodeeringutega (KOI-8, Windows-1251 jt). Ka teised mitteladina kirjadega keeled kannatasid mitme erineva kodeeringu all.
NUL | SOM | EOA | EOM | EQT | W.R.U. | RU | KELLU | BKSP | HT | LF | VT | FF | CR | NII | S.I. |
DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ERR | SYNC | L.E.M. | S 0 | S 1 | S 2 | S 3 | S 4 | S 5 | S 6 | S 7 |
TÜHI | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
P | K | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ← | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
lk | q | r | s | t | u | v | w | x | y | z | ESC | DEL |
Nendes arvutites, kus minimaalne adresseeritav mäluühik oli 36-bitine sõna, kasutati algselt 6-bitiseid märke (1 sõna = 6 märki). Pärast ASCII-le üleminekut hakkasid sellised arvutid sisaldama ühes sõnas kas 5 seitsmebitist märki (1 bitt jäi ekstra) või 4 üheksabitist märki.
ASCII koode kasutatakse ka selleks, et määrata, millist klahvi programmeerimise ajal vajutatakse. Tavalise QWERTY-klaviatuuri puhul näeb kooditabel välja järgmine:
Excel for Office 365 Word for Office 365 Outlook for Office 365 PowerPoint for Office 365 Publisher for Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Word Visio Standard 20619 Excel 20619int 2061 16 2013 Kirjastus 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 20 7 Outlook 20 2010 Visio 20 2010 07 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Less Selles artiklis: Sisestage dokumenti ASCII- või Unicode-märkKui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil. Märkused: ASCII-märkide sisestamineASCII-märgi sisestamiseks vajutage ja hoidke tähekoodi sisestamise ajal all klahvi ALT. Näiteks kraadisümboli (º) sisestamiseks vajutage ja hoidke all klahvi ALT, seejärel sisestage numbriklahvistikul 0176. Numbrite sisestamiseks kasutage põhiklaviatuuri numbrite asemel numbriklahvistikku. Kui teil on vaja numbriklahvistikul numbreid sisestada, veenduge, et NUMBRILUKKU indikaator põleks. Unicode'i tähemärkide sisestamineUnicode'i märgi sisestamiseks sisestage märgikood, seejärel vajutage ALT ja X. Näiteks dollari sümboli ($) sisestamiseks sisestage 0024 ning vajutage ALT ja X. Kõikide Unicode'i märgikoodide kohta vaadake . NB! Mõned Microsoft Office'i programmid, nagu PowerPoint ja InfoPath, ei toeta Unicode'i koodide teisendamist tähemärkideks. Kui peate mõnda neist programmidest sisestama Unicode'i märgi, kasutage . Märkused: Kui pärast ALT+X vajutamist kuvatakse vale Unicode'i märk, valige õige kood ja vajutage uuesti ALT+X. Lisaks tuleb enne koodi sisestada "U+". Näiteks kui sisestate "1U+B5" ja vajutate ALT+X, kuvatakse tekst "1µ" ja kui sisestate "1B5" ja vajutate ALT+X, kuvatakse sümbol "Ƶ". Märgistabel on Microsoft Windowsi sisseehitatud programm, mis võimaldab teil vaadata valitud fondi jaoks saadaolevaid märke. Sümbolitabeli abil saate lõikepuhvrisse kopeerida üksikud sümbolid või sümbolite rühma ja kleepida need mis tahes programmi, mis toetab nende sümbolite kuvamist. Sümbolitabeli avamine Windows 10-s sisestage tegumiriba otsingukasti sõna "sümbol" ja valige otsingutulemustest sümbolite tabel. Windows 8 puhul tippige avakuval sõna "symbol" ja valige otsingutulemustest sümbolite tabel. Operatsioonisüsteemis Windows 7 klõpsake nuppu Start, valige Kõik programmid, Tarvikud, Süsteemitööriistad ja seejärel klõpsake nuppu Märkide kaart. Tähemärgid on grupeeritud fondi järgi. Sobiva märgistiku valimiseks klõpsake fondiloendil. Sümboli valimiseks klõpsake seda ja seejärel nuppu Vali. Sümboli sisestamiseks paremklõpsake soovitud kohta dokumendis ja valige Kleebi. Sageli kasutatavad märgikoodidTäieliku märkide loendi leiate jaotisest Arvuti, ASCII märgikooditabel või Unicode'i märgitabelid, mis on korraldatud komplekti järgi.
Rahvusvahelise telekommunikatsiooniliidu andmetel kasutas 2016. aastal internetti teatud regulaarsusega kolm ja pool miljardit inimest. Enamik neist isegi ei mõtle sellele, et kõik sõnumid, mida nad saadavad arvuti või mobiilsete vidinate kaudu, samuti tekstid, mida kuvatakse igasugustel monitoridel, on tegelikult 0 ja 1 kombinatsioonid. Seda teabe esitust nimetatakse kodeerimiseks. . See tagab ja hõlbustab oluliselt selle säilitamist, töötlemist ja edastamist. 1963. aastal töötati välja Ameerika ASCII kodeering, mis on käesoleva artikli teema. Teabe esitamine arvutisIga elektroonilise arvuti seisukohast on tekst üksikute märkide kogum. Nende hulka kuuluvad mitte ainult tähed, sealhulgas suurtähed, vaid ka kirjavahemärgid ja numbrid. Lisaks kasutatakse erimärke “=”, “&”, “(” ja tühikuid. Teksti moodustavate märkide komplekti nimetatakse tähestikuks ja nende arvu kardinaalsuseks (tähistatakse kui N). Selle määramiseks kasutatakse avaldist N = 2^b, kus b on bittide arv või konkreetse sümboli teabe kaal. On tõestatud, et 256 tähemärki mahutav tähestik suudab esindada kõiki vajalikke märke. Kuna 256 tähistab kahe kaheksandat astet, on iga märgi kaal 8 bitti. 8-bitist mõõtühikut nimetatakse 1 baidiks, seega on tavaks öelda, et arvutisse salvestatud tekstis olev suvaline märk võtab ühe baidi mälu. Kuidas kodeerimine toimub?Kõik tekstid sisestatakse personaalarvuti mällu klaviatuuriklahvide abil, millele kirjutatakse numbrid, tähed, kirjavahemärgid ja muud sümbolid. Need kantakse RAM-i kahendkoodina, st iga märk on seotud inimestele tuttava kümnendkoodiga vahemikus 0 kuni 255, mis vastab kahendkoodile - 00000000 kuni 11111111. Bait-baitiline märgikodeering võimaldab tekstitöötlust teostaval protsessoril igale märgile eraldi juurde pääseda. Samal ajal on 256 tähemärki täiesti piisav igasuguse sümboolse teabe esitamiseks. ASCII märgikodeeringSee lühend inglise keeles tähistab teabevahetuse koodi. Juba arvutistamise koidikul sai selgeks, et teabe kodeerimiseks on võimalik välja pakkuda väga erinevaid viise. Teabe edastamiseks ühest arvutist teise oli aga vaja välja töötada ühtne standard. Nii ilmus 1963. aastal USA-s ASCII kodeeringutabel. Selles on arvuti tähestiku mis tahes sümbol seotud selle seerianumbriga binaarses esituses. ASCII-d kasutati algselt ainult USA-s ja hiljem sai sellest personaalarvutite rahvusvaheline standard. ASCII koodid on jagatud kaheks osaks. Rahvusvaheliseks standardiks peetakse ainult selle tabeli esimest poolt. See sisaldab märke seerianumbritega 0 (kodeeritud kui 00000000) kuni 127 (kodeeritud 01111111).
Tabelis on kodeeringud suurtähtedega ja järgnevad üksteisele tähestikulises järjekorras ning numbrid kasvavas järjekorras. See põhimõte jääb vene tähestiku puhul samaks. JuhtmärgidASCII kodeeringutabel loodi algselt teabe vastuvõtmiseks ja edastamiseks pikka aega kasutamata seadme, näiteks teletaibi kaudu. Sellega seoses lisati märgikomplekti mitteprinditavad märgid, mida kasutati selle seadme juhtimiseks käskudena. Sarnaseid käske kasutati sellistes arvutieelsetes sõnumsidemeetodites nagu morsekood jne. Kõige tavalisem teletüüpi märk on NUL (00). Seda kasutatakse tänapäevalgi enamikus programmeerimiskeeltes rea lõpu tähistamiseks. Kus kasutatakse ASCII-kodeeringut?Ameerika standardkoodi pole vaja ainult klaviatuuril tekstiteabe sisestamiseks. Seda kasutatakse ka graafikas. Eelkõige esindavad ASCII Art Makeris erinevate laienduste kujutised ASCII-märkide spektrit. Selliseid tooteid on kahte tüüpi: need, mis täidavad graafiliste redaktorite funktsiooni, teisendades pildid tekstiks, ja need, mis teisendavad "joonised" ASCII-graafikaks. Näiteks kuulus emotikon on kodeeringusümboli suurepärane näide. ASCII-d saab kasutada ka HTML-dokumendi loomisel. Sel juhul saab sisestada teatud tähemärkide komplekti ning lehte vaadates ilmub ekraanile sellele koodile vastav sümbol. ASCII on vajalik ka mitmekeelsete veebisaitide loomiseks, kuna märgid, mis ei sisaldu konkreetses riiklikus tabelis, asendatakse ASCII koodidega. Mõned funktsioonidAlgselt kasutati ASCII-d tekstiteabe kodeerimiseks, kasutades 7-bitist (üks jäeti tühjaks), kuid tänapäeval töötab see 8-bitisena. Üleval ja all asuvates veergudes asuvad tähed erinevad üksteisest ainult ühe biti poolest. See vähendab oluliselt auditi keerukust. ASCII kasutamine Microsoft Office'isVajadusel saab seda tüüpi tekstiteabe kodeeringut kasutada Microsofti tekstiredaktorites, nagu Notepad ja Office Word. Sel juhul ei pruugi te siiski tippimisel mõnda funktsiooni kasutada. Näiteks ei saa te kasutada paksus kirjas teksti, kuna ASCII-kodeering säilitab ainult teabe tähenduse, ignoreerides selle üldist välimust ja vormi. StandardimineISO organisatsioon on vastu võtnud ISO 8859 standardid. See rühm määratleb erinevate keelerühmade jaoks kaheksabitised kodeeringud. Täpsemalt on ISO 8859-1 laiendatud ASCII tabel Ameerika Ühendriikide ja Lääne-Euroopa riikide jaoks. Ja ISO 8859-5 on tabel, mida kasutatakse kirillitsa tähestiku, sealhulgas vene keele jaoks. Mitmetel ajaloolistel põhjustel kasutati ISO 8859-5 standardit väga lühikest aega. Vene keele jaoks on praegu kasutusel järgmised kodeeringud:
Esimese CP866 standardi peamine eelis oli pseudograafiliste märkide säilitamine samadel positsioonidel nagu laiendatud ASCII-s. See võimaldas ilma muudatusteta käivitada välismaal valmistatud tekstiprogramme, näiteks kuulsat Norton Commanderit. Praegu kasutatakse CP866 Windowsi jaoks loodud programmide jaoks, mis töötavad täisekraani tekstirežiimis või tekstiakendes, sealhulgas FAR Manager. CP866 kodeeringus kirjutatud arvutitekstid on tänapäeval üsna haruldased, kuid Windowsis kasutatakse venekeelsete failinimede jaoks just seda. "Unicode"Praegu on see kodeering kõige laialdasemalt kasutatav. Unicode'i koodid on jagatud piirkondadeks. Esimene (U+0000 kuni U+007F) sisaldab ASCII-märke koos koodidega. Sellele järgnevad erinevate rahvuskirjade märgialad, samuti kirjavahemärgid ja tehnilised sümbolid. Lisaks on mõned Unicode'i koodid reserveeritud juhuks, kui tulevikus on vaja uusi märke lisada. Nüüd teate, et ASCII-s on iga märk 8 nulli ja ühe kombinatsioonina. Mittespetsialistidele võib see teave tunduda ebavajalik ja ebahuvitav, kuid kas te ei taha teada, mis teie arvuti "ajus" toimub?! Igal arvutil on oma märkide komplekt, mida see rakendab. See komplekt sisaldab 26 suur- ja väiketähte, numbreid ja erimärke (punkt, tühik jne). Täisarvudeks teisendatuna nimetatakse sümboleid koodideks. Standardid töötati välja selleks, et arvutitel oleks samad koodikomplektid. ASCII standardASCII (American Standard Code for Information Interchange) on Ameerika standardkood teabevahetuseks. Igal ASCII märgil on 7 bitti, seega on maksimaalne märkide arv 128 (tabel 1). Koodid 0 kuni 1F on juhtmärgid, mida ei prindita. Andmete edastamiseks on vaja palju mitteprinditavaid ASCII-märke. Näiteks võib teade koosneda päise alguse märgist SOH, päisest endast ja teksti alguse märgist STX, tekstist endast ja tekstilõpu märgist ETX ning edastuse lõpu märgist tegelane EOT. Võrgu kaudu edastatakse aga andmeid pakettidena, mis ise vastutavad edastuse alguse ja lõpu eest. Seega ei kasutata peaaegu kunagi mitteprinditavaid märke. Tabel 1 – ASCII kooditabel
Eelmine kodeering sobib inglise keele jaoks, kuid see pole mugav teiste keelte jaoks. Näiteks saksa keeles on umluudid ja prantsuse keeles ülaindeksid. Mõnes keeles on täiesti erinevad tähestikud. Esimene katse ASCII laiendamiseks oli IS646, mis laiendas eelmist kodeeringut täiendava 128 tähemärgi võrra. Lisati ladina tähed koos kriipsude ja diakriitikaga ning sai nime – ladina 1. Järgmine katse oli IS 8859 – mis sisaldas koodilehte. Prooviti ka pikendada, kuid see polnud universaalne. Loodi UNICODE-kodeering (on 10646). Kodeeringu idee on määrata igale märgile üks konstantne 16-bitine väärtus, mida nimetatakse koodiosutiks. Kokku on 65536 osutit. Ruumi säästmiseks kasutasime koodide 0 -255 jaoks Latin-1, muutes ASII hõlpsalt UNICODE-iks. See standard lahendas palju probleeme, kuid mitte kõiki. Seoses uute sõnade tulekuga, näiteks jaapani keele jaoks, on vaja terminite arvu suurendada umbes 20 tuhande võrra.
Eri(juht)märkide kirjeldus Tuleb märkida, et algselt kasutati ASCII tabeli juhtmärke andmevahetuse tagamiseks teletüüpi teel, andmete sisestamiseks perfolindilt ja välisseadmete lihtsaks juhtimiseks. Praegu ei kanna enamik ASCII tabeli juhtmärke enam seda koormust ja neid saab kasutada muudel eesmärkidel.
|