ascii pseudograafilised koodid. ASCII-kodeering (Ameerika standardkood teabevahetuseks) - ladina tähestiku põhiteksti kodeering

Kutsutakse välja märkide kogum, millega tekst on kirjutatud tähestik.

Tähemärkide arv tähestikus on selle võimsus.

Infohulga määramise valem: N=2b,

kus N on tähestiku aste (märkide arv),

b – bittide arv (sümboli infokaal).

256 tähemärki mahutav tähestik mahutab peaaegu kõik vajalikud märgid. Seda tähestikku nimetatakse piisav.

Sest 256 = 2 8, siis on 1 märgi kaal 8 bitti.

Mõõtühikule 8 bitti anti nimi 1 bait:

1 bait = 8 bitti.

Iga tähemärgi binaarkood arvutitekstis võtab 1 baidi mälu.

Kuidas tekstiteavet arvutimälus esitatakse?

Bait-baitilise märgikodeeringu mugavus on ilmne, kuna bait on mälu väikseim adresseeritav osa ja seetõttu pääseb protsessor teksti töötlemisel igale märgile eraldi juurde. Teisest küljest on 256 tähemärki üsna piisav arv, et esindada väga erinevat sümboolset teavet.

Nüüd tekib küsimus, milline kaheksabitine binaarne kood sobitada iga tähemärki.

On selge, et see on tingimuslik, võite välja mõelda palju kodeerimismeetodeid.

Kõik arvutitähestiku märgid on nummerdatud vahemikus 0 kuni 255. Iga number vastab kaheksabitisele kahendkoodile vahemikus 00000000 kuni 11111111. See kood on lihtsalt tähemärgi seerianumber kahendsüsteem Arvestus.

Tabel, milles kõik arvutitähestiku märgid on üksteisele määratud seerianumbrid, nimetatakse kodeerimistabeliks.

Sest erinevat tüüpi Arvutid kasutavad erinevaid kodeerimistabeleid.

Tabelist on saanud personaalarvutite rahvusvaheline standard ASCII(loe Aski) (Ameerika standardkood teabevahetuseks).

ASCII kooditabel on jagatud kaheks osaks.

Vaid tabeli esimene pool on rahvusvaheline standard, s.o. sümbolid numbritega alates 0 (00000000), kuni 127 (01111111).

ASCII kodeeringu tabeli struktuur

Seerianumber	Kood	Sümbol
0 - 31	00000000 - 00011111	Sümboleid numbritega 0 kuni 31 nimetatakse tavaliselt juhtsümboliteks. Nende ülesanne on juhtida teksti ekraanil kuvamise või printimise protsessi, helisignaali andmist, teksti märgistamist jne.
32 - 127	00100000 - 01111111	Tabeli standardosa (inglise keeles). See hõlmab väiketähti ja suured tähed ladina tähestik, kümnendkohad, kirjavahemärgid, igasugused sulud, kaubanduslikud ja muud sümbolid. Märk 32 on tühik, st. tühi koht tekstis. Kõik teised peegelduvad teatud märkide kaudu.
128 - 255	10000000 - 11111111	Tabeli alternatiivne osa (vene). ASCII kooditabeli teisel poolel, mida nimetatakse koodileheks (128 koodi, alates 10000000 ja lõpetades numbriga 11111111), võivad olla erinevad valikud, igal valikul on oma number. Koodilehte kasutatakse peamiselt muude rahvuslike tähestike kui ladina tähestiku mahutamiseks. Vene rahvusliku kodeeringu puhul paigutatakse sellesse tabeli ossa vene tähestiku märgid.

ASCII kooditabeli esimene pool

Juhin teie tähelepanu asjaolule, et kodeerimistabelis asuvad tähed (suur- ja väiketähed) tähestikuline järjekord, ja numbrid on järjestatud kasvavas järjekorras. Sellist leksikograafilise korra järgimist sümbolite paigutusel nimetatakse tähestiku järjestikuse kodeerimise põhimõtteks.

Vene tähestiku tähtede puhul järgitakse ka järjestikuse kodeerimise põhimõtet.

ASCII kooditabeli teine pool

Kahjuks on praegu viis erinevat kirillitsa kodeeringut (KOI8-R, Windows. MS-DOS, Macintosh ja ISO). Seetõttu tekivad sageli probleemid venekeelse teksti ülekandmisel ühest arvutist teise, ühest tarkvarasüsteem teisele.

Kronoloogiliselt oli üks esimesi standardeid vene tähtede kodeerimiseks arvutites KOI8 ("Informatsioonivahetuskood, 8-bitine"). Seda kodeeringut kasutati 70ndatel ES-i arvutiseeria arvutites ja alates 80ndate keskpaigast hakati seda kasutama esimestes venestatud versioonides. operatsioonisüsteemi UNIX.

Alates 90ndate algusest, MS DOS operatsioonisüsteemi domineerimise ajast, jääb alles CP866 kodeering ("CP" tähendab "koodilehte", "koodilehte").

Arvutid Apple tegutseb operatsioonisaali kontrolli all Mac süsteemid OS, kasutage nende enda Maci kodeeringut.

Lisaks on Rahvusvaheline Standardiorganisatsioon (ISO) heaks kiitnud vene keele standardiks veel ühe kodeeringu nimega ISO 8859-5.

Kõige tavalisem praegu kasutatav kodeering on Microsoft Windows, lühend CP1251.

Alates 90ndate lõpust on märgikodeeringu standardimise probleem lahendatud uue rahvusvaheline standard mida nimetatakse Unicode. See on 16-bitine kodeering, st. see eraldab iga märgi jaoks 2 baiti mälu. Loomulikult suurendab see hõivatud mälu mahtu 2 korda. Aga selline kooditabel võimaldab lisada kuni 65536 tähemärki. Täielik spetsifikatsioon Unicode'i standard hõlmab kõiki olemasolevaid, väljasurnud ja kunstlikult loodud tähestikke maailmas, samuti palju matemaatilisi, muusikalisi, keemilisi ja muid sümboleid.

Proovime kasutada ASCII tabelit, et kujutada ette, millised sõnad arvuti mälus välja näevad. Sõnade sisemine esitus arvutimälus

Mõnikord juhtub, et teisest arvutist saadud vene tähestiku tähtedest koosnevat teksti ei saa lugeda - monitori ekraanil on näha mingisugune “abrakadabra”. See juhtub seetõttu, et arvutid kasutavad vene keele jaoks erinevat märgikodeeringut.

dets	Hex	Sümbol	dets	Hex	Sümbol
000	00	spetsialist. NOP	128	80	Ђ
001	01	spetsialist. SOH	129	81	Ѓ
002	02	spetsialist. STX	130	82	‚
003	03	spetsialist. ETX	131	83	ѓ
004	04	spetsialist. EOT	132	84	„
005	05	spetsialist. ENQ	133	85	…
006	06	spetsialist. ACK	134	86	†
007	07	spetsialist. BEL	135	87	‡
008	08	spetsialist. B.S.	136	88	€
009	09	spetsialist. TAB	137	89	‰
010	0A	spetsialist. LF	138	8A	Љ
011	0B	spetsialist. VT	139	8B	‹ ‹
012	0C	spetsialist. FF	140	8C	Њ
013	0D	spetsialist. CR	141	8D	Ќ
014	0E	spetsialist. NII	142	8E	Ћ
015	0F	spetsialist. S.I.	143	8F	Џ
016	10	spetsialist. DLE	144	90	ђ
017	11	spetsialist. DC1	145	91	‘
018	12	spetsialist. DC2	146	92	’
019	13	spetsialist. DC3	147	93	“
020	14	spetsialist. DC4	148	94	”
021	15	spetsialist. N.A.K.	149	95
022	16	spetsialist. SYN	150	96	–
023	17	spetsialist. ETB	151	97	—
024	18	spetsialist. CAN	152	98
025	19	spetsialist. E.M.	153	99	™
026	1A	spetsialist. SUB	154	9A	љ
027	1B	spetsialist. ESC	155	9B	›
028	1C	spetsialist. FS	156	9C	њ
029	1D	spetsialist. G.S.	157	9D	ќ
030	1E	spetsialist. R.S.	158	9E	ћ
031	1F	spetsialist. USA	159	9F	џ
032	20	sidur SP (kosmos)	160	A0
033	21	!	161	A1	Ў
034	22	"	162	A2	ў
035	23	#	163	A3	Ћ
036	24	$	164	A4	¤
037	25	%	165	A5	Ґ
038	26	&	166	A6	¦
039	27	"	167	A7	§
040	28	(	168	A8	Yo
041	29	)	169	A9	©
042	2A	*	170	A.A.	Є
043	2B	+	171	AB	«
044	2C	,	172	A.C.	¬
045	2D	-	173	AD
046	2E	.	174	A.E.	®
047	2F	/	175	A.F.	Ї
048	30	0	176	B0	°
049	31	1	177	B1	±
050	32	2	178	B2	І
051	33	3	179	B3	і
052	34	4	180	B4	ґ
053	35	5	181	B5	µ
054	36	6	182	B6	¶
055	37	7	183	B7	·
056	38	8	184	B8	e
057	39	9	185	B9	№
058	3A	:	186	B.A.	є
059	3B	;	187	BB	»
060	3C	<	188	B.C.	ј
061	3D	=	189	BD	Ѕ
062	3E	>	190	OLE	ѕ
063	3F	?	191	B.F.	ї
064	40	@	192	C0	A
065	41	A	193	C1	B
066	42	B	194	C2	IN
067	43	C	195	C3	G
068	44	D	196	C4	D
069	45	E	197	C5	E
070	46	F	198	C6	JA
071	47	G	199	C7	Z
072	48	H	200	C8	JA
073	49	I	201	C9	Y
074	4A	J	202	C.A.	TO
075	4B	K	203	C.B.	L
076	4C	L	204	CC	M
077	4D	M	205	CD	N
078	4E	N	206	C.E.	KOHTA
079	4F	O	207	CF	P
080	50	P	208	D0	R
081	51	K	209	D1	KOOS
082	52	R	210	D2	T
083	53	S	211	D3	U
084	54	T	212	D4	F
085	55	U	213	D5	X
086	56	V	214	D6	C
087	57	W	215	D7	H
088	58	X	216	D8	Sh
089	59	Y	217	D9	SCH
090	5A	Z	218	D.A.	Kommersant
091	5B	[	219	D.B.	Y
092	5C	\	220	DC	b
093	5D	]	221	DD	E
094	5E	^	222	DE	Yu
095	5F	_	223	DF	I
096	60	`	224	E0	A
097	61	a	225	E1	b
098	62	b	226	E2	V
099	63	c	227	E3	G
100	64	d	228	E4	d
101	65	e	229	E5	e
102	66	f	230	E6	ja
103	67	g	231	E7	h
104	68	h	232	E8	Ja
105	69	i	233	E9	th
106	6A	j	234	E.A.	To
107	6B	k	235	E.B.	l
108	6C	l	236	E.C.	m
109	6D	m	237	ED	n
110	6E	n	238	E.E.	O
111	6F	o	239	EF	n
112	70	lk	240	F0	r
113	71	q	241	F1	Koos
114	72	r	242	F2	T
115	73	s	243	F3	juures
116	74	t	244	F4	f
117	75	u	245	F5	X
118	76	v	246	F6	ts
119	77	w	247	F7	h
120	78	x	248	F8	w
121	79	y	249	F9	sch
122	7A	z	250	F.A.	ъ
123	7B	{	251	FB	s
124	7C	\|	252	F.C.	b
125	7D	}	253	FD	uh
126	7E	~	254	F.E.	yu
127	7F	Spetsialist. DEL	255	FF	I

ASCII Windowsi märgikooditabel.
Eri(juht)märkide kirjeldus Tuleb märkida, et algselt kasutati ASCII tabeli juhtmärke andmevahetuse tagamiseks teletüüpi teel, andmete sisestamiseks perfolindilt ja välisseadmete lihtsaks juhtimiseks.
Praegu ei kanna enamik ASCII tabeli juhtmärke enam seda koormust ja neid saab kasutada muudel eesmärkidel. Koodi kirjeldus

NULL, 00	Null, tühi
SOH, 01	Rubriigi algus
STX, 02	Teksti algus, teksti algus.
ETX, 03	TEKSTI lõpp, teksti lõpp
EOT, 04	Edastamise lõpp, edastuse lõpp
ENQ, 05	Küsige. Palun kinnita
AK, 06	Tunnustus. kinnitan
BEL, 07	Bell, helista
BS, 08	Backspace, mine ühe tähemärgi võrra tagasi
TAB, 09	Vahekaart, horisontaalne vahekaart
LF, 0A	Reavahetus, reavahetus. Tänapäeval tähistatakse seda enamikus programmeerimiskeeltes kui \n
VT, 0B	Vertikaalne tabel, vertikaalne tabel.
FF, 0C	Vormivoog, lehevoog, uus leht
CR, 0D	Käru tagasi, vankri tagasi. Tänapäeval tähistatakse seda enamikus programmeerimiskeeltes kui \r
SO,0E	Shift Out, muutke prindiseadme tindiriba värvi
SI,0F	Shift In, tagastab prindiseadmes oleva tindiriba värvi tagasi
DLE, 10	Data Link Escape, lülitades kanali andmeedastusse
DC1, 11 DC2, 12 DC3, 13 DC4, 14	Seadme juhtimine, seadme juhtsümbolid
NAK, 15	Negatiivne tunnustus, ma ei kinnita.
SYN, 16	Sünkroonimine. Sünkroonimise sümbol
ETB, 17	Tekstiploki lõpp, tekstiploki lõpp
CAN, 18	Tühista, tühistab varem üle kantud
EM, 19	Keskmise lõpp
SUB, 1A	Asendaja, asendaja.
Paigutatakse sümboli asemele, mille tähendus edastamise ajal kadus või rikuti	ESC, 1B
Põgenemise juhtimise järjestus	FS, 1C
Faili eraldaja, faili eraldaja	GS, 1D
Grupi eraldaja	RS, 1E
Kirje eraldaja, kirje eraldaja	USA, 1F
Üksuse eraldaja	DEL, 7F

Kustuta, kustuta viimane märk.

Excel for Office 365 Word for Office 365 Outlook for Office 365 PowerPoint for Office 365 Publisher for Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Word Visio Standard 20619 Excel 20619int 2061 16 2013 Kirjastus 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 20 7 Outlook 20 2010 Visio 20 2010 07 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Less

Selles artiklis: Sisestage dokumenti ASCII- või Unicode-märk

Kui teil on vaja sisestada vaid mõned erimärgid või sümbolid, saate kasutada kiirklahve. ASCII-märkide loendi leiate järgmistest tabelitest või artiklist Rahvuslike tähestike sisestamine kiirklahvide abil.

Märkused:

ASCII-märkide sisestamine ASCII-märgi sisestamiseks vajutage ja hoidke tähekoodi sisestamise ajal all klahvi ALT. Näiteks kraadisümboli (º) sisestamiseks vajutage ja hoidke all klahvi ALT, seejärel sisestage 0176.

numbriklahvistik

Numbrite sisestamiseks kasutage põhiklaviatuuri numbrite asemel numbriklahvistikku. Kui teil on vaja numbriklahvistikul numbreid sisestada, veenduge, et NUMBRILUKKU indikaator põleks.

Unicode'i tähemärkide sisestamine Unicode'i märgi sisestamiseks sisestage märgikood ja seejärel vajutage ALT klahvid

ja X. Näiteks dollari sümboli ($) sisestamiseks sisestage 0024 ja vajutage järjestikku ALT ja X Kõigi Unicode-märgikoodide kohta vaadake . Tähtis: mõned Microsofti programmid

Kui pärast ALT+X vajutamist kuvatakse vale Unicode'i märk, valige õige kood ja vajutage uuesti ALT+X.

Lisaks tuleb enne koodi sisestada "U+". Näiteks kui sisestate "1U+B5" ja vajutate ALT+X, kuvatakse tekst "1µ" ja kui sisestate "1B5" ja vajutate ALT+X, kuvatakse sümbol "Ƶ".

Sümbolitabeli kasutamine

Märgistabel on Microsoft Windowsi sisseehitatud programm, mis võimaldab teil vaadata valitud fondi jaoks saadaolevaid märke.

Sümbolitabeli abil saate kopeerida üksikud tegelased või märkide rühma lõikepuhvrisse ja kleepige need mis tahes programmi, mis toetab nende märkide kuvamist. Sümbolitabeli avamine

Windows 10-s sisestage tegumiriba otsingukasti sõna "sümbol" ja valige otsingutulemustest sümbolite tabel.

Windows 8-s sisestage sõna "märk" aadressil avakuva ja valige otsingutulemustest sümbolite tabel.

Operatsioonisüsteemis Windows 7 klõpsake nuppu Start, valige Kõik programmid, Tarvikud, Süsteemitööriistad ja seejärel klõpsake nuppu Märkide kaart.

Tähemärgid on grupeeritud fondi järgi. Sobiva märgistiku valimiseks klõpsake fondiloendil. Sümboli valimiseks klõpsake seda ja seejärel nuppu Vali. Sümboli sisestamiseks klõpsake nuppu paremklõps hiired õige koht dokumendis ja valige Kleebi.

Sageli kasutatavad märgikoodid

Täielik nimekiri tähemärke, vaadake oma arvutis, ASCII märgikooditabelit või Unicode'i märgitabeleid, mis on korraldatud komplekti järgi.

Glyph

Valuuta

Juriidilised sümbolid

Matemaatilised sümbolid

Murrud

Kirjavahemärgid ja murdesümbolid

Kuju sümbolid

Tavaliselt kasutatavad diakriitilised koodid

Glüüfide ja vastavate koodide täieliku loendi leiate siit.

Glyph

Mitteprinditavad ASCII juhtmärgid

Märgid, mida kasutati mõne kontrollimiseks välisseadmed, näiteks printerid, sisse ASCII tabel on numbritega 0-31. Näiteks lehekülje sööda/uue lehe märk on number 12. See märk annab printerile käsu liikuda järgmise lehe algusesse.

Mitteprinditavate ASCII juhtmärkide tabel

Kümnendarv	Sign	Kümnendarv	Sign
		Andmekanali vabastamine
Pealkirja algus		Esimene seadme juhtkood
Teksti algus		Teine seadme juhtimiskood
Teksti lõpp		Kolmanda seadme juhtkood
Edastamise lõpp		Neljas seadme juhtimiskood
	viieharuline	Negatiivne kinnitus
Kinnitus		Sünkroonne edastusrežiim
Piiks		Edastatud andmeploki lõpp

Horisontaalne tabel		Meedia lõpp
Reavahetus/uus rida		Asendussümbol
Vertikaalne vahekaart			ületada
Lehe tõlge/uus leht	Kaksteist	Faili eraldaja
Vankri tagastus		Grupi eraldaja
Nihutage ilma bitte salvestamata		Kirje eraldaja
Bitti säilitav nihe	viisteist	Andmete eraldaja

Igal arvutil on oma märkide komplekt, mida see rakendab. See komplekt sisaldab 26 kapitali ja väiketähti, numbrid ja eritegelased(punkt, tühik jne). Täisarvudeks teisendatuna nimetatakse sümboleid koodideks. Standardid töötati välja selleks, et arvutitel oleks samad koodikomplektid.

ASCII standard

ASCII (American Standard Code for Information Interchange) on Ameerika standardkood teabevahetuseks. Igal ASCII märgil on 7 bitti, seega maksimaalne arv tähemärki - 128 (tabel 1). Koodid 0 kuni 1F on juhtmärgid, mida ei prindita. Andmete edastamiseks on vaja palju mitteprinditavaid ASCII-märke. Näiteks võib teade koosneda päise alguse märgist SOH, päisest endast ja teksti alguse märgist STX, tekstist endast ja tekstilõpu märgist ETX ning edastuse lõpu märgist tegelane EOT. Võrgu kaudu edastatakse aga andmeid pakettidena, mis ise vastutavad edastuse alguse ja lõpu eest. Seega ei kasutata peaaegu kunagi mitteprinditavaid märke.

Tabel 1 – ASCII kooditabel

Number Käsu tähendus Number Käsu tähendus

0	NUL	Nullkursor	10	DLE	Väljumine ülekandesüsteemist
1	SOH	pealkirja algus	11	DC1	Seadmehaldus
2	STX	Teksti algus	12	DC2	Seadmehaldus
3	ETX	Teksti lõpp	13	DC3	Seadmehaldus
4	EOT	Edastamise lõpp	14	DC4	Seadmehaldus
5	ACK	Taotlus	15	N.A.K.	Vastuvõtu mittekinnitamine
6	BEL	Vastuvõtmise kinnitus	16	SYN	Lihtne
7	B.S.	Kellukese sümbol	17	ETB	Edastusploki lõpp
8	HT	Astuge tagasi	18	CAN	Mark
9	LF	Horisontaalne tabel	19	E.M.	Meedia lõpp
A	VT	Reavahetus	1A	SUB	Alamindeks
B	FF	Vertikaalne vahekaart	1B	ESC	Välju
C	CR	Lehekülje tõlge	1C	FS	Faili eraldaja
D	NII	Vankri tagastus	1D	G.S.	Grupi eraldaja
E	S.I.	Lülituge lisaregistrisse	1E	R.S.	Kirje eraldaja
	S.I.	Lülituge standardkorpusele	1F	USA	Mooduli eraldaja

Numbrisümbol Numbrisümbol Numbrisümbol Number Sümbol Number Sümbol Numbrisümbol

20	ruumi	30	0	40	@	50	P	60	.	70	lk
21	!	31	1	41	A	51	K	61	a	71	q
22	‘	32	2	42	B	52	R	62	b	72	r
23	#	33	3	43	C	53	S	63	c	73	s
24	φ	34	4	44	D	54	T	64	d	74	t
25	%	35	5	45	E	55	JA	65	e	75	Ja
26	&	36	6	46	F	56	V	66	f	76	v
27	‘	37	7	47	G	57	W	67	g	77	w
28	(	38	8	48	H	58	X	68	h	78	x
29	)	39	9	49	I	59	Y	69	i	70	y
2A	‘	3A	;	4A	J	5A	Z	6A	j	7A	z
2B	+	3B	;	4B	K	5B	[	6B	k	7B	{
2C	‘	3C	<	4C	L	5C	\	6C	l	7C	\|
2D	—	3D	=	4D	M	5D	]	6D	m	7D	}
2E		3E	>	4E	N	5E	—	6E	n	7E	~
2F	/	3F	g	4F	O	5F	_	6F	o	7F	DEL

Unicode'i standard

Eelmine kodeering töötab hästi inglise keel teiste keelte jaoks pole see aga mugav. Näiteks sisse saksa keel seal on umluudid ja prantsuse keeles ülaindeksid. Mõnes keeles on täiesti erinevad tähestikud. Esimene katse ASCII laiendamiseks oli IS646, mis laiendas eelmist kodeeringut täiendava 128 tähemärgi võrra. Lisati ladina tähed kriipsu ja diakriitikaga ning sai nime – ladina 1. Järgmine katse oli IS 8859 – mis sisaldas koodilehte. Prooviti ka pikendada, kuid see polnud universaalne. Loodi UNICODE-kodeering (on 10646). Kodeeringu idee on määrata igale märgile üks konstantne 16-bitine väärtus, mida nimetatakse koodiosutiks. Kokku on 65536 osutit. Ruumi säästmiseks kasutasime koodide 0 -255 jaoks Latin-1, muutes ASII hõlpsalt UNICODE-iks. See standard lahendas palju probleeme, kuid mitte kõiki. Seoses uute sõnade tulekuga, näiteks jaapani keele jaoks, on vaja terminite arvu suurendada umbes 20 tuhande võrra.

Nagu teate, salvestab arvuti teavet binaarne, mis kujutab seda ühtede ja nullide jadana. Teabe tõlkimiseks inimesele sobivasse vormi asendatakse iga kordumatu numbrijada kuvamisel vastava sümboliga.

Üks süsteeme binaarkoodide korreleerimiseks trükitud ja kontrollmärkidega on

Tänasel arengutasemel arvutitehnoloogia kasutaja ei pea teadma iga konkreetse märgi koodi. Siiski üldine arusaam See, kuidas kodeerimine toimub, on äärmiselt kasulik ja mõne kategooria spetsialistide jaoks isegi vajalik.

ASCII loomine

Kodeering töötati algselt välja 1963. aastal ja seejärel uuendati kaks korda 25 aasta jooksul.

Algses versioonis sisaldas ASCII märgitabel 128 tähemärki. Hiljem ilmus laiendatud versioon, kus salvestati esimesed 128 tähemärki ja varem puudunud märgid määrati koodidele, milles oli kaasatud kaheksas bit.

Aastate jooksul see kodeering oli maailma populaarseim. 2006. aastal asus liidripositsioonile Latin 1252 ja 2007. aasta lõpust tänapäevani on Unicode kindlalt liidripositsiooni hoidnud.

ASCII arvutiesitus

Igal ASCII märgil on enda kood, mis koosneb 8 märgist, mis tähistavad nulli või ühte. Minimaalne arv selles esituses on null (kaheksa nulli kahendsüsteemis), mis on tabeli esimese elemendi kood.

Kaks tabelis olevat koodi olid reserveeritud standardse US-ASCII ja selle riikliku variandi vahel vahetamiseks.

Pärast seda, kui ASCII hakkas sisaldama mitte 128, vaid 256 tähemärki, sai laialt levinud kodeerimisvariant, milles tabeli algversioon salvestati esimeses 128 koodis 8. bitiga nulliga. Tabeli ülemisse poolde olid talletatud rahvuslikud kirjalikud märgid (positsioonid 128-255).

Kasutaja ei pea ASCII märgikoode otse teadma. Arendajale tarkvara Tavaliselt piisab elemendi numbri teadmisest tabelis, et vajadusel kahendsüsteemi abil selle kood arvutada.

vene keel

Pärast kodeeringu väljatöötamist skandinaavia keelte, hiina, korea, kreeka jne jaoks 70ndate alguses hakkas ta looma oma versiooni Nõukogude Liit. Peagi töötati välja 8-bitise kodeeringu versioon nimega KOI8, mis säilitas esimesed 128 ASCII märgikoodi ja eraldas sama arvu positsioone rahvusliku tähestiku tähtede ja lisamärkide jaoks.

Enne Unicode'i kasutuselevõttu domineeris KOI8 Venemaa Interneti-segmendis. Kodeerimisvalikud olid nii vene kui ka ukraina tähestiku jaoks.

ASCII probleemid

Kuna elementide arv isegi laiendatud tabelis ei ületanud 256, ei olnud võimalik ühte kodeeringusse mahutada mitut erinevat skripti. 90ndatel ilmnes Runetis "crocozyabr" probleem, kui vene ASCII tähemärkidega trükitud tekste kuvati valesti.

Probleemiks oli koodi mittevastavus erinevaid valikuid ASCII üksteisele. Meenutagem, et positsioonidel 128-255 võisid paikneda erinevad märgid ning ühe kirillitsa kodeeringu muutmisel teiseks asendati teksti kõik tähed teistega, millel on identne number erinevas kodeeringu versioonis.

Praegune olek

Unicode'i tulekuga hakkas ASCII populaarsus järsult langema.

Selle põhjuseks on asjaolu, et uus kodeering võimaldas mahutada peaaegu kõigi kirjakeelte tähemärke. Sel juhul vastavad esimesed 128 ASCII märki samadele Unicode'i tähemärkidele.

2000. aastal oli ASCII kõige populaarsem kodeering Internetis ja seda kasutati 60% Google'i indekseeritud veebilehtedel. 2012. aastaks oli selliste lehtede osakaal langenud 17%-ni ning populaarseima kodeeringu asemele tuli Unicode (UTF-8).

Seega on ASCII oluline osa ajaloost infotehnoloogia selle kasutamine tulevikus tundub siiski vähetõotav.