സ്റ്റാൻഡേർഡ് കോഡ് പട്ടിക. ടെക്സ്റ്റ് വിവരങ്ങൾ എൻകോഡുചെയ്യുന്നു

[8-ബിറ്റ് എൻകോഡിംഗുകൾ: ASCII, KOI-8R, CP1251] യുണൈറ്റഡ് സ്റ്റേറ്റ്സിൽ സൃഷ്ടിച്ച ആദ്യത്തെ എൻകോഡിംഗ് ടേബിളുകൾ ഒരു ബൈറ്റിൽ എട്ടാമത്തെ ബിറ്റ് ഉപയോഗിച്ചിരുന്നില്ല. ബൈറ്റുകളുടെ ഒരു ശ്രേണിയായി വാചകം പ്രതിനിധീകരിച്ചു, എന്നാൽ എട്ടാമത്തെ ബിറ്റ് കണക്കിലെടുക്കുന്നില്ല (അത് ഔദ്യോഗിക ആവശ്യങ്ങൾക്കായി ഉപയോഗിച്ചു).

പട്ടിക പൊതുവായി അംഗീകരിക്കപ്പെട്ട ഒരു മാനദണ്ഡമായി മാറിയിരിക്കുന്നു ആസ്കി(അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇൻ്റർചേഞ്ച്). ASCII പട്ടികയിലെ ആദ്യത്തെ 32 പ്രതീകങ്ങൾ (00 മുതൽ 1F വരെ) അച്ചടിക്കാത്ത പ്രതീകങ്ങൾക്കായി ഉപയോഗിച്ചു. ഒരു പ്രിൻ്റിംഗ് ഉപകരണം മുതലായവ നിയന്ത്രിക്കുന്നതിനാണ് അവ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്. ബാക്കിയുള്ളവ - 20 മുതൽ 7F വരെ - സാധാരണ (പ്രിൻ്റ് ചെയ്യാവുന്ന) പ്രതീകങ്ങളാണ്.

പട്ടിക 1 - ASCII എൻകോഡിംഗ്

ഡിസംബർ	ഹെക്സ്	ഒക്ടോ	ചാർ	വിവരണം
0	0	000		ശൂന്യം
1	1	001		തലക്കെട്ടിൻ്റെ തുടക്കം
2	2	002		വാചകത്തിൻ്റെ തുടക്കം
3	3	003		വാചകത്തിൻ്റെ അവസാനം
4	4	004		പ്രക്ഷേപണത്തിൻ്റെ അവസാനം
5	5	005		അന്വേഷണം
6	6	006		അംഗീകരിക്കുക
7	7	007		മണി
8	8	010		ബാക്ക്സ്പേസ്
9	9	011		തിരശ്ചീന ടാബ്
10	എ	012		പുതിയ വര
11	ബി	013		ലംബ ടാബ്
12	സി	014		പുതിയ പേജ്
13	ഡി	015		വണ്ടി മടക്കം
14	ഇ	016		പുറത്തേക്ക് മാറ്റുക
15	എഫ്	017		മാറ്റുക
16	10	020		ഡാറ്റ ലിങ്ക് രക്ഷപ്പെടൽ
17	11	021		ഉപകരണ നിയന്ത്രണം 1
18	12	022		ഉപകരണ നിയന്ത്രണം 2
19	13	023		ഉപകരണ നിയന്ത്രണം 3
20	14	024		ഉപകരണ നിയന്ത്രണം 4
21	15	025		നെഗറ്റീവ് അംഗീകാരം
22	16	026		സിൻക്രണസ് നിഷ്‌ക്രിയം
23	17	027		ട്രാൻസ് അവസാനം. തടയുക
24	18	030		റദ്ദാക്കുക
25	19	031		ഇടത്തരം അവസാനം
26	1എ	032		പകരക്കാരൻ
27	1B	033		എസ്കേപ്പ്
28	1C	034		ഫയൽ സെപ്പറേറ്റർ
29	1D	035		ഗ്രൂപ്പ് സെപ്പറേറ്റർ
30	1ഇ	036		റെക്കോർഡ് സെപ്പറേറ്റർ
31	1F	037		യൂണിറ്റ് സെപ്പറേറ്റർ
32	20	040		സ്ഥലം
33	21	041	!
34	22	042	"
35	23	043	#
36	24	044	$
37	25	045	%
38	26	046	&
39	27	047	"
40	28	050	(
41	29	051	)
42	2A	052	*
43	2B	053	+
44	2C	054	,
45	2D	055	-
46	2E	056	.
47	2F	057	/
48	30	060	0
49	31	061	1
50	32	062	2
51	33	063	3
52	34	064	4
53	35	065	5
54	36	066	6
55	37	067	7
56	38	070	8
57	39	071	9
58	3A	072	:
59	3B	073	;
60	3C	074	<
61	3D	075	=
62	3E	076	>
63	3F	077	?

ഡിസംബർ	ഹെക്സ്	ഒക്ടോ	ചാർ
64	40	100	@
65	41	101	എ
66	42	102	ബി
67	43	103	സി
68	44	104	ഡി
69	45	105	ഇ
70	46	106	എഫ്
71	47	107	ജി
72	48	110	എച്ച്
73	49	111	ഐ
74	4A	112	ജെ
75	4B	113	കെ
76	4C	114	എൽ
77	4D	115	എം
78	4E	116	എൻ
79	4F	117	ഒ
80	50	120	പി
81	51	121	ക്യു
82	52	122	ആർ
83	53	123	എസ്
84	54	124	ടി
85	55	125	യു
86	56	126	വി
87	57	127	ഡബ്ല്യു
88	58	130	എക്സ്
89	59	131	വൈ
90	5A	132	Z
91	5B	133	[
92	5C	134	\
93	5D	135	]
94	5E	136	^
95	5F	137	_
96	60	140	`
97	61	141	എ
98	62	142	ബി
99	63	143	സി
100	64	144	ഡി
101	65	145	ഇ
102	66	146	എഫ്
103	67	147	ജി
104	68	150	എച്ച്
105	69	151	ഐ
106	6A	152	ജെ
107	6B	153	കെ
108	6C	154	എൽ
109	6D	155	എം
110	6E	156	എൻ
111	6F	157	ഒ
112	70	160	പി
113	71	161	q
114	72	162	ആർ
115	73	163	എസ്
116	74	164	ടി
117	75	165	യു
118	76	166	വി
119	77	167	w
120	78	170	x
121	79	171	വൈ
122	7A	172	z
123	7B	173	{
124	7C	174	\|
125	7D	175	}
126	7E	176	~
127	7F	177	DEL

നിങ്ങൾക്ക് എളുപ്പത്തിൽ കാണാനാകുന്നതുപോലെ, ഈ എൻകോഡിംഗിൽ ലാറ്റിൻ അക്ഷരങ്ങളും ഇംഗ്ലീഷ് ഭാഷയിൽ ഉപയോഗിക്കുന്നവയും മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ. ഗണിതവും മറ്റ് സേവന ചിഹ്നങ്ങളും ഉണ്ട്. എന്നാൽ റഷ്യൻ അക്ഷരങ്ങളോ ജർമ്മനിനോ ഫ്രഞ്ചോ ആയ പ്രത്യേക ലാറ്റിൻ അക്ഷരങ്ങളോ ഇല്ല. ഇത് വിശദീകരിക്കാൻ എളുപ്പമാണ് - എൻകോഡിംഗ് പ്രത്യേകമായി ഒരു അമേരിക്കൻ സ്റ്റാൻഡേർഡ് ആയി വികസിപ്പിച്ചെടുത്തതാണ്. ലോകമെമ്പാടും കമ്പ്യൂട്ടറുകൾ ഉപയോഗിക്കാൻ തുടങ്ങിയപ്പോൾ, മറ്റ് പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യേണ്ടതുണ്ട്.

ഇത് ചെയ്യുന്നതിന്, ഓരോ ബൈറ്റിലും എട്ടാമത്തെ ബിറ്റ് ഉപയോഗിക്കാൻ തീരുമാനിച്ചു. ഇത് പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യാൻ ഉപയോഗിക്കാവുന്ന 128 മൂല്യങ്ങൾ കൂടി (80 മുതൽ FF വരെ) ലഭ്യമാക്കി. എട്ട്-ബിറ്റ് പട്ടികകളിൽ ആദ്യത്തേത് "വിപുലീകരിച്ച ASCII" ( വിപുലീകരിച്ച ASCII) - പടിഞ്ഞാറൻ യൂറോപ്പിലെ ചില ഭാഷകളിൽ ഉപയോഗിക്കുന്ന ലാറ്റിൻ അക്ഷരങ്ങളുടെ വിവിധ വകഭേദങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. സ്യൂഡോഗ്രാഫിക്സ് ഉൾപ്പെടെയുള്ള മറ്റ് അധിക ചിഹ്നങ്ങളും ഇതിൽ അടങ്ങിയിരിക്കുന്നു.

സ്‌ക്രീനിൽ ടെക്‌സ്‌റ്റ് പ്രതീകങ്ങൾ മാത്രം പ്രദർശിപ്പിച്ചുകൊണ്ട് ഗ്രാഫിക്‌സിൻ്റെ ചില സമാനതകൾ നൽകാൻ സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങൾ നിങ്ങളെ അനുവദിക്കുന്നു. ഉദാഹരണത്തിന്, ഫയൽ മാനേജ്മെൻ്റ് പ്രോഗ്രാം FAR മാനേജർ സ്യൂഡോഗ്രാഫിക്സ് ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു.

എക്സ്റ്റെൻഡഡ് ASCII പട്ടികയിൽ റഷ്യൻ അക്ഷരങ്ങളൊന്നും ഉണ്ടായിരുന്നില്ല. റഷ്യയും (മുമ്പ് യുഎസ്എസ്ആർ) മറ്റ് രാജ്യങ്ങളും സ്വന്തം എൻകോഡിംഗുകൾ സൃഷ്ടിച്ചു, അത് 8-ബിറ്റ് ടെക്സ്റ്റ് ഫയലുകളിൽ നിർദ്ദിഷ്ട "ദേശീയ" പ്രതീകങ്ങളെ പ്രതിനിധീകരിക്കുന്നത് സാധ്യമാക്കി - പോളിഷ്, ചെക്ക് ഭാഷകളുടെ ലാറ്റിൻ അക്ഷരങ്ങൾ, സിറിലിക് (റഷ്യൻ അക്ഷരങ്ങൾ ഉൾപ്പെടെ) മറ്റ് അക്ഷരമാലകൾ.

വ്യാപകമായ എല്ലാ എൻകോഡിംഗുകളിലും, ആദ്യത്തെ 127 പ്രതീകങ്ങൾ (അതായത്, എട്ടാമത്തെ ബിറ്റ് 0 ന് തുല്യമായ ബൈറ്റ് മൂല്യം) ASCII- യ്ക്ക് തുല്യമാണ്. അതിനാൽ ഒരു ASCII ഫയൽ ഈ രണ്ട് എൻകോഡിംഗുകളിലും പ്രവർത്തിക്കുന്നു; ഇംഗ്ലീഷ് ഭാഷയിലെ അക്ഷരങ്ങൾ അതേ രീതിയിൽ പ്രതിനിധീകരിക്കുന്നു.

സംഘടന ഐഎസ്ഒ(ഇൻ്റർനാഷണൽ സ്റ്റാൻഡേർഡൈസേഷൻ ഓർഗനൈസേഷൻ) ഒരു കൂട്ടം മാനദണ്ഡങ്ങൾ സ്വീകരിച്ചു ISO 8859. വ്യത്യസ്ത ഭാഷാ ഗ്രൂപ്പുകൾക്കുള്ള 8-ബിറ്റ് എൻകോഡിംഗുകൾ ഇത് നിർവ്വചിക്കുന്നു. അതിനാൽ, ഐഎസ്ഒ 8859-1 യുഎസ്എയ്ക്കും പടിഞ്ഞാറൻ യൂറോപ്പിനുമുള്ള ഒരു വിപുലീകൃത ASCII പട്ടികയാണ്. കൂടാതെ ISO 8859-5 സിറിലിക് അക്ഷരമാലയ്ക്കുള്ള ഒരു പട്ടികയാണ് (റഷ്യൻ ഉൾപ്പെടെ).

എന്നിരുന്നാലും, ചരിത്രപരമായ കാരണങ്ങളാൽ, ISO 8859-5 എൻകോഡിംഗ് റൂട്ട് എടുത്തില്ല. വാസ്തവത്തിൽ, റഷ്യൻ ഭാഷയ്ക്കായി ഇനിപ്പറയുന്ന എൻകോഡിംഗുകൾ ഉപയോഗിക്കുന്നു:

കോഡ് പേജ് 866 ( CP866), അല്ലെങ്കിൽ "ഡോസ്", അല്ലെങ്കിൽ "ഇതര GOST എൻകോഡിംഗ്". 90-കളുടെ പകുതി വരെ വ്യാപകമായി ഉപയോഗിച്ചു; ഇപ്പോൾ പരിമിതമായ അളവിൽ ഉപയോഗിക്കുന്നു. ഇൻ്റർനെറ്റിൽ ടെക്സ്റ്റുകൾ വിതരണം ചെയ്യാൻ പ്രായോഗികമായി ഉപയോഗിക്കുന്നില്ല.
- KOI-8. 70-80 കളിൽ വികസിപ്പിച്ചെടുത്തു. റഷ്യൻ ഇൻ്റർനെറ്റിൽ ഇമെയിൽ സന്ദേശങ്ങൾ കൈമാറുന്നതിനുള്ള പൊതുവായി അംഗീകരിക്കപ്പെട്ട ഒരു മാനദണ്ഡമാണിത്. ലിനക്സ് ഉൾപ്പെടെയുള്ള യുണിക്സ് കുടുംബത്തിൻ്റെ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിലും ഇത് വ്യാപകമായി ഉപയോഗിക്കുന്നു. റഷ്യൻ ഭാഷയ്ക്കായി രൂപകൽപ്പന ചെയ്ത KOI-8 പതിപ്പിനെ വിളിക്കുന്നു KOI-8R; മറ്റ് സിറിലിക് ഭാഷകൾക്ക് പതിപ്പുകളുണ്ട് (ഉദാഹരണത്തിന്, KOI8-U ഉക്രേനിയൻ ഭാഷയുടെ ഒരു പതിപ്പാണ്).
- കോഡ് പേജ് 1251, CP1251,വിൻഡോസ്-1251. വിൻഡോസിൽ റഷ്യൻ ഭാഷയെ പിന്തുണയ്ക്കുന്നതിനായി മൈക്രോസോഫ്റ്റ് വികസിപ്പിച്ചെടുത്തത്.

CP866-ൻ്റെ പ്രധാന നേട്ടം, എക്സ്റ്റെൻഡഡ് ASCII-ൽ ഉള്ള അതേ സ്ഥലങ്ങളിൽ കപട-ഗ്രാഫിക്സ് പ്രതീകങ്ങളുടെ സംരക്ഷണമായിരുന്നു; അതിനാൽ, വിദേശ ടെക്സ്റ്റ് പ്രോഗ്രാമുകൾ, ഉദാഹരണത്തിന്, പ്രശസ്തമായ നോർട്ടൺ കമാൻഡർ, മാറ്റങ്ങളില്ലാതെ പ്രവർത്തിക്കാൻ കഴിയും. CP866 ഇപ്പോൾ ടെക്സ്റ്റ് വിൻഡോകളിലോ FAR മാനേജർ ഉൾപ്പെടെയുള്ള ഫുൾ-സ്ക്രീൻ ടെക്സ്റ്റ് മോഡിലോ പ്രവർത്തിക്കുന്ന വിൻഡോസ് പ്രോഗ്രാമുകൾക്കായി ഉപയോഗിക്കുന്നു.

സമീപ വർഷങ്ങളിൽ CP866 ലെ ടെക്‌സ്‌റ്റുകൾ വളരെ വിരളമാണ് (എന്നാൽ വിൻഡോസിൽ റഷ്യൻ ഫയൽ നാമങ്ങൾ എൻകോഡ് ചെയ്യാൻ ഇത് ഉപയോഗിക്കുന്നു). അതിനാൽ, KOI-8R, CP1251 എന്നീ രണ്ട് എൻകോഡിംഗുകളിൽ ഞങ്ങൾ കൂടുതൽ വിശദമായി സംസാരിക്കും.

നിങ്ങൾക്ക് കാണാനാകുന്നതുപോലെ, CP1251 എൻകോഡിംഗ് പട്ടികയിൽ, റഷ്യൻ അക്ഷരങ്ങൾ അക്ഷരമാലാക്രമത്തിൽ ക്രമീകരിച്ചിരിക്കുന്നു (എന്നിരുന്നാലും, E എന്ന അക്ഷരം ഒഴികെ). ഈ ക്രമീകരണം കമ്പ്യൂട്ടർ പ്രോഗ്രാമുകൾ അക്ഷരമാലാക്രമത്തിൽ അടുക്കുന്നത് വളരെ എളുപ്പമാക്കുന്നു.

എന്നാൽ KOI-8R ൽ റഷ്യൻ അക്ഷരങ്ങളുടെ ക്രമം ക്രമരഹിതമായി തോന്നുന്നു. എന്നാൽ യഥാർത്ഥത്തിൽ അങ്ങനെയല്ല.

പല പഴയ പ്രോഗ്രാമുകളിലും, ടെക്സ്റ്റ് പ്രോസസ്സ് ചെയ്യുമ്പോൾ അല്ലെങ്കിൽ ട്രാൻസ്മിറ്റ് ചെയ്യുമ്പോൾ 8-ാമത്തെ ബിറ്റ് നഷ്ടപ്പെട്ടു. (ഇപ്പോൾ അത്തരം പ്രോഗ്രാമുകൾ പ്രായോഗികമായി "വംശനാശം സംഭവിച്ചു", എന്നാൽ 80 കളുടെ അവസാനത്തിൽ - 90 കളുടെ തുടക്കത്തിൽ അവ വ്യാപകമായിരുന്നു). 8-ബിറ്റ് മൂല്യത്തിൽ നിന്ന് 7-ബിറ്റ് മൂല്യം ലഭിക്കുന്നതിന്, ഏറ്റവും പ്രധാനപ്പെട്ട അക്കത്തിൽ നിന്ന് 8 കുറയ്ക്കുക; ഉദാഹരണത്തിന്, E1 61 ആയി മാറുന്നു.

ഇപ്പോൾ ASCII പട്ടികയുമായി KOI-8R താരതമ്യം ചെയ്യുക (പട്ടിക 1). റഷ്യൻ അക്ഷരങ്ങൾ ലാറ്റിൻ അക്ഷരങ്ങളുമായി വ്യക്തമായ കത്തിടപാടുകളിൽ സ്ഥാപിച്ചിരിക്കുന്നത് നിങ്ങൾ കണ്ടെത്തും. എട്ടാമത്തെ ബിറ്റ് അപ്രത്യക്ഷമായാൽ, ചെറിയ റഷ്യൻ അക്ഷരങ്ങൾ വലിയക്ഷരങ്ങളായ ലാറ്റിൻ അക്ഷരങ്ങളും വലിയക്ഷരത്തിലുള്ള റഷ്യൻ അക്ഷരങ്ങൾ ചെറിയക്ഷരം ലാറ്റിൻ അക്ഷരങ്ങളും ആയി മാറുന്നു. അതിനാൽ, KOI-8 ലെ E1 റഷ്യൻ "A" ആണ്, ASCII ൽ 61 എന്നത് ലാറ്റിൻ "a" ആണ്.

അതിനാൽ, 8-ാമത്തെ ബിറ്റ് നഷ്‌ടപ്പെടുമ്പോൾ റഷ്യൻ വാചകത്തിൻ്റെ വായനാക്ഷമത നിലനിർത്താൻ KOI-8 നിങ്ങളെ അനുവദിക്കുന്നു. "എല്ലാവർക്കും ഹലോ" എന്നത് "pRIWET WSEM" ആയി മാറുന്നു.

അടുത്തിടെ, എൻകോഡിംഗ് ടേബിളിലെ അക്ഷരങ്ങളുടെ അക്ഷരമാലാ ക്രമത്തിനും എട്ടാമത്തെ ബിറ്റ് നഷ്‌ടമായതോടെ വായനാക്ഷമതയ്ക്കും അവയുടെ നിർണായക പ്രാധാന്യം നഷ്ടപ്പെട്ടു. ആധുനിക കമ്പ്യൂട്ടറുകളിലെ എട്ടാമത്തെ ബിറ്റ് ട്രാൻസ്മിഷൻ അല്ലെങ്കിൽ പ്രോസസ്സിംഗ് സമയത്ത് നഷ്ടപ്പെടുന്നില്ല. എൻകോഡിംഗ് കണക്കിലെടുത്താണ് അക്ഷരമാല ക്രമപ്പെടുത്തൽ നടത്തുന്നത്, അല്ലാതെ കോഡുകൾ താരതമ്യം ചെയ്തല്ല. (വഴിയിൽ, CP1251 കോഡുകൾ പൂർണ്ണമായും അക്ഷരമാലാക്രമത്തിൽ ക്രമീകരിച്ചിട്ടില്ല - E എന്ന അക്ഷരം അതിൻ്റെ സ്ഥാനത്ത് ഇല്ല).

രണ്ട് സാധാരണ എൻകോഡിംഗുകൾ ഉള്ളതിനാൽ, ഇൻ്റർനെറ്റിൽ (മെയിൽ, ബ്രൗസിംഗ് വെബ് സൈറ്റുകൾ) പ്രവർത്തിക്കുമ്പോൾ, റഷ്യൻ വാചകത്തിന് പകരം നിങ്ങൾക്ക് ചിലപ്പോൾ അർത്ഥശൂന്യമായ അക്ഷരങ്ങൾ കാണാൻ കഴിയും. ഉദാഹരണത്തിന്, "ഞാൻ SBYUFEMHEL ആണ്." ഇവ "ബഹുമാനത്തോടെ" എന്ന വാക്കുകൾ മാത്രമാണ്; എന്നാൽ അവ CP1251 എൻകോഡിംഗിൽ എൻകോഡ് ചെയ്യപ്പെടുകയും KOI-8 പട്ടിക ഉപയോഗിച്ച് കമ്പ്യൂട്ടർ ടെക്സ്റ്റ് ഡീകോഡ് ചെയ്യുകയും ചെയ്തു. അതേ വാക്കുകൾ, നേരെമറിച്ച്, KOI-8-ൽ എൻകോഡ് ചെയ്യുകയും കമ്പ്യൂട്ടർ CP1251 പട്ടിക അനുസരിച്ച് ടെക്സ്റ്റ് ഡീകോഡ് ചെയ്യുകയും ചെയ്താൽ, ഫലം "U HCHBTSEOYEN" ആയിരിക്കും.

റഷ്യൻ ഭാഷയ്‌ക്കായി ഉദ്ദേശിക്കാത്ത ഒരു പട്ടിക ഉപയോഗിച്ച് ഒരു കമ്പ്യൂട്ടർ റഷ്യൻ ഭാഷാ അക്ഷരങ്ങൾ മനസ്സിലാക്കുന്നത് ചിലപ്പോൾ സംഭവിക്കുന്നു. തുടർന്ന്, റഷ്യൻ അക്ഷരങ്ങൾക്ക് പകരം, അർത്ഥമില്ലാത്ത ഒരു കൂട്ടം ചിഹ്നങ്ങൾ പ്രത്യക്ഷപ്പെടുന്നു (ഉദാഹരണത്തിന്, കിഴക്കൻ യൂറോപ്യൻ ഭാഷകളുടെ ലാറ്റിൻ അക്ഷരങ്ങൾ); അവയെ പലപ്പോഴും "ക്രോക്കോസിബ്രകൾ" എന്ന് വിളിക്കുന്നു.

മിക്ക കേസുകളിലും, ഇൻ്റർനെറ്റ് ഡോക്യുമെൻ്റുകളുടെ (ഇമെയിലുകളും വെബ് പേജുകളും) എൻകോഡിംഗുകൾ സ്വതന്ത്രമായി നിർണ്ണയിക്കുന്നത് ആധുനിക പ്രോഗ്രാമുകൾ കൈകാര്യം ചെയ്യുന്നു. എന്നാൽ ചിലപ്പോൾ അവർ "മിസ്ഫയർ", തുടർന്ന് നിങ്ങൾക്ക് റഷ്യൻ അക്ഷരങ്ങളുടെ അല്ലെങ്കിൽ "ക്രോകോസിയാബ്രി" വിചിത്രമായ ക്രമങ്ങൾ കാണാൻ കഴിയും. ചട്ടം പോലെ, അത്തരമൊരു സാഹചര്യത്തിൽ, സ്ക്രീനിൽ യഥാർത്ഥ വാചകം പ്രദർശിപ്പിക്കുന്നതിന്, പ്രോഗ്രാം മെനുവിൽ സ്വമേധയാ എൻകോഡിംഗ് തിരഞ്ഞെടുക്കാൻ മതിയാകും.

ഈ ലേഖനത്തിനായി http://open-office.edusite.ru/TextProcessor/p5aa1.html എന്ന പേജിൽ നിന്നുള്ള വിവരങ്ങൾ ഉപയോഗിച്ചു.

സൈറ്റിൽ നിന്ന് എടുത്ത മെറ്റീരിയൽ:

നിങ്ങൾക്കറിയാവുന്നതുപോലെ, ഒരു കമ്പ്യൂട്ടർ ബൈനറി രൂപത്തിൽ വിവരങ്ങൾ സംഭരിക്കുന്നു, അത് ഒന്നിൻ്റെയും പൂജ്യങ്ങളുടെയും ഒരു ശ്രേണിയായി പ്രതിനിധീകരിക്കുന്നു. മനുഷ്യ ഗ്രഹണത്തിന് സൗകര്യപ്രദമായ ഒരു രൂപത്തിലേക്ക് വിവരങ്ങൾ വിവർത്തനം ചെയ്യുന്നതിന്, ഓരോ അക്കങ്ങളുടെ അദ്വിതീയ ശ്രേണിയും പ്രദർശിപ്പിക്കുമ്പോൾ അതിൻ്റെ അനുബന്ധ ചിഹ്നം ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു.

ബൈനറി കോഡുകളെ അച്ചടിച്ചതും നിയന്ത്രിക്കുന്നതുമായ പ്രതീകങ്ങളുമായി പരസ്പരബന്ധിതമാക്കുന്നതിനുള്ള സംവിധാനങ്ങളിലൊന്നാണ്

കമ്പ്യൂട്ടർ സാങ്കേതികവിദ്യയുടെ വികസനത്തിൻ്റെ നിലവിലെ തലത്തിൽ, ഓരോ നിർദ്ദിഷ്ട പ്രതീകത്തിൻ്റെയും കോഡ് ഉപയോക്താവിന് അറിയേണ്ടതില്ല. എന്നിരുന്നാലും, കോഡിംഗ് എങ്ങനെയാണ് നടപ്പിലാക്കുന്നത് എന്നതിനെക്കുറിച്ചുള്ള പൊതുവായ ധാരണ വളരെ ഉപയോഗപ്രദമാണ്, കൂടാതെ ചില വിഭാഗങ്ങളിലെ സ്പെഷ്യലിസ്റ്റുകൾക്ക് അത് ആവശ്യമാണ്.

ASCII സൃഷ്ടിക്കുന്നു

എൻകോഡിംഗ് യഥാർത്ഥത്തിൽ 1963 ൽ വികസിപ്പിച്ചെടുത്തു, തുടർന്ന് 25 വർഷത്തിനിടെ രണ്ടുതവണ അപ്ഡേറ്റ് ചെയ്തു.

യഥാർത്ഥ പതിപ്പിൽ, ASCII പ്രതീക പട്ടികയിൽ 128 പ്രതീകങ്ങൾ ഉൾപ്പെടുന്നു; പിന്നീട് ഒരു വിപുലീകൃത പതിപ്പ് പ്രത്യക്ഷപ്പെട്ടു, അവിടെ ആദ്യത്തെ 128 പ്രതീകങ്ങൾ സംരക്ഷിച്ചു, മുമ്പ് കാണാതായ പ്രതീകങ്ങൾ എട്ടാമത്തെ ബിറ്റ് ഉൾപ്പെട്ട കോഡുകളിലേക്ക് നിയോഗിക്കപ്പെട്ടു.

വർഷങ്ങളോളം, ഈ എൻകോഡിംഗ് ലോകത്തിലെ ഏറ്റവും ജനപ്രിയമായിരുന്നു. 2006-ൽ, ലാറ്റിൻ 1252 മുൻനിര സ്ഥാനത്തെത്തി, 2007 അവസാനം മുതൽ ഇന്നുവരെ, യൂണികോഡ് മുൻനിര സ്ഥാനം നിലനിർത്തി.

ASCII-യുടെ കമ്പ്യൂട്ടർ പ്രാതിനിധ്യം

ഓരോ ASCII പ്രതീകത്തിനും അതിൻ്റേതായ കോഡ് ഉണ്ട്, അതിൽ പൂജ്യത്തെയോ ഒന്നിനെയോ പ്രതിനിധീകരിക്കുന്ന 8 പ്രതീകങ്ങൾ അടങ്ങിയിരിക്കുന്നു. ഈ പ്രാതിനിധ്യത്തിലെ ഏറ്റവും കുറഞ്ഞ സംഖ്യ പൂജ്യമാണ് (ബൈനറി സിസ്റ്റത്തിലെ എട്ട് പൂജ്യങ്ങൾ), ഇത് പട്ടികയിലെ ആദ്യ മൂലകത്തിൻ്റെ കോഡാണ്.

സ്റ്റാൻഡേർഡ് US-ASCII-യും അതിൻ്റെ ദേശീയ വേരിയൻ്റും തമ്മിൽ മാറുന്നതിന് പട്ടികയിലെ രണ്ട് കോഡുകൾ കരുതിവച്ചിരിക്കുന്നു.

ASCII 128 അല്ല, 256 പ്രതീകങ്ങൾ ഉൾപ്പെടുത്താൻ തുടങ്ങിയതിനുശേഷം, ഒരു എൻകോഡിംഗ് വേരിയൻ്റ് വ്യാപകമായി, അതിൽ പട്ടികയുടെ യഥാർത്ഥ പതിപ്പ് 8-ാമത്തെ ബിറ്റ് പൂജ്യത്തോടെ ആദ്യത്തെ 128 കോഡുകളിൽ സംഭരിച്ചു. ദേശീയ ലിഖിത പ്രതീകങ്ങൾ പട്ടികയുടെ മുകൾ പകുതിയിൽ സൂക്ഷിച്ചിരിക്കുന്നു (സ്ഥാനങ്ങൾ 128-255).

ഉപയോക്താവിന് ASCII പ്രതീക കോഡുകൾ നേരിട്ട് അറിയേണ്ടതില്ല. ആവശ്യമെങ്കിൽ ബൈനറി സിസ്റ്റം ഉപയോഗിച്ച് അതിൻ്റെ കോഡ് കണക്കാക്കാൻ ഒരു സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർക്ക് സാധാരണയായി പട്ടികയിലെ എലമെൻ്റ് നമ്പർ മാത്രമേ അറിയൂ.

റഷ്യന് ഭാഷ

70-കളുടെ തുടക്കത്തിൽ സ്കാൻഡിനേവിയൻ ഭാഷകൾ, ചൈനീസ്, കൊറിയൻ, ഗ്രീക്ക് മുതലായവയ്ക്കുള്ള എൻകോഡിംഗുകൾ വികസിപ്പിച്ചതിനുശേഷം, സോവിയറ്റ് യൂണിയൻ സ്വന്തം പതിപ്പ് സൃഷ്ടിക്കാൻ തുടങ്ങി. താമസിയാതെ, KOI8 എന്ന 8-ബിറ്റ് എൻകോഡിംഗിൻ്റെ ഒരു പതിപ്പ് വികസിപ്പിച്ചെടുത്തു, ആദ്യത്തെ 128 ASCII പ്രതീക കോഡുകൾ സംരക്ഷിക്കുകയും ദേശീയ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾക്കും അധിക പ്രതീകങ്ങൾക്കും തുല്യമായ സ്ഥാനങ്ങൾ നൽകുകയും ചെയ്തു.

യൂണികോഡ് അവതരിപ്പിക്കുന്നതിന് മുമ്പ്, ഇൻ്റർനെറ്റിൻ്റെ റഷ്യൻ വിഭാഗത്തിൽ KOI8 ആധിപത്യം പുലർത്തിയിരുന്നു. റഷ്യൻ, ഉക്രേനിയൻ അക്ഷരമാലയ്ക്ക് എൻകോഡിംഗ് ഓപ്ഷനുകൾ ഉണ്ടായിരുന്നു.

ആസ്കി പ്രശ്നങ്ങൾ

വിപുലീകരിച്ച പട്ടികയിൽ പോലും മൂലകങ്ങളുടെ എണ്ണം 256 കവിയാത്തതിനാൽ, ഒരു എൻകോഡിംഗിൽ നിരവധി വ്യത്യസ്ത സ്ക്രിപ്റ്റുകൾ ഉൾക്കൊള്ളാനുള്ള സാധ്യതയില്ല. 90 കളിൽ, റഷ്യൻ ASCII അക്ഷരങ്ങളിൽ ടൈപ്പ് ചെയ്ത ടെക്സ്റ്റുകൾ തെറ്റായി പ്രദർശിപ്പിച്ചപ്പോൾ Runet-ൽ "crocozyabr" പ്രശ്നം പ്രത്യക്ഷപ്പെട്ടു.

വ്യത്യസ്ത ASCII കോഡുകൾ പരസ്പരം പൊരുത്തപ്പെടാത്തതായിരുന്നു പ്രശ്നം. വിവിധ പ്രതീകങ്ങൾ 128-255 സ്ഥാനങ്ങളിൽ സ്ഥിതിചെയ്യാമെന്നും ഒരു സിറിലിക് എൻകോഡിംഗ് മറ്റൊന്നിലേക്ക് മാറ്റുമ്പോൾ, വാചകത്തിൻ്റെ എല്ലാ അക്ഷരങ്ങളും എൻകോഡിംഗിൻ്റെ മറ്റൊരു പതിപ്പിൽ സമാനമായ സംഖ്യയുള്ള മറ്റുള്ളവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുമെന്നും നമുക്ക് ഓർമ്മിക്കാം.

നിലവിലുള്ള അവസ്ഥ

യൂണികോഡിൻ്റെ വരവോടെ ആസ്കിയുടെ ജനപ്രീതി കുത്തനെ കുറയാൻ തുടങ്ങി.

മിക്കവാറും എല്ലാ ലിഖിത ഭാഷകളിൽ നിന്നുമുള്ള പ്രതീകങ്ങൾ ഉൾക്കൊള്ളാൻ പുതിയ എൻകോഡിംഗ് സാധ്യമാക്കിയതാണ് ഇതിന് കാരണം. ഈ സാഹചര്യത്തിൽ, ആദ്യത്തെ 128 ASCII പ്രതീകങ്ങൾ യൂണിക്കോഡിലെ അതേ പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു.

2000-ൽ, ഇൻറർനെറ്റിലെ ഏറ്റവും ജനപ്രിയമായ എൻകോഡിംഗായിരുന്നു ASCII, ഗൂഗിൾ സൂചികയിലാക്കിയ 60% വെബ് പേജുകളിലും ഇത് ഉപയോഗിച്ചിരുന്നു. 2012 ആയപ്പോഴേക്കും അത്തരം പേജുകളുടെ വിഹിതം 17% ആയി കുറഞ്ഞു, യൂണികോഡ് (UTF-8) ഏറ്റവും ജനപ്രിയമായ എൻകോഡിംഗിൻ്റെ സ്ഥാനത്ത് എത്തി.

അതിനാൽ, വിവരസാങ്കേതികവിദ്യയുടെ ചരിത്രത്തിൻ്റെ ഒരു പ്രധാന ഭാഗമാണ് ASCII, എന്നാൽ ഭാവിയിൽ അതിൻ്റെ ഉപയോഗം വിട്ടുവീഴ്ചയില്ലാത്തതായി തോന്നുന്നു.

ഇൻ്റർനാഷണൽ ടെലികമ്മ്യൂണിക്കേഷൻ യൂണിയൻ പറയുന്നതനുസരിച്ച്, 2016 ൽ മൂന്നര ബില്യൺ ആളുകൾ കുറച്ച് ക്രമമായി ഇൻ്റർനെറ്റ് ഉപയോഗിച്ചു. പിസി അല്ലെങ്കിൽ മൊബൈൽ ഗാഡ്‌ജെറ്റുകൾ വഴി അയയ്‌ക്കുന്ന സന്ദേശങ്ങളും എല്ലാത്തരം മോണിറ്ററുകളിലും പ്രദർശിപ്പിച്ചിരിക്കുന്ന ടെക്‌സ്‌റ്റുകളും യഥാർത്ഥത്തിൽ 0, 1 എന്നിവയുടെ സംയോജനമാണെന്ന് അവരിൽ ഭൂരിഭാഗവും ചിന്തിക്കുന്നില്ല. ഈ വിവരങ്ങളുടെ പ്രാതിനിധ്യത്തെ എൻകോഡിംഗ് എന്ന് വിളിക്കുന്നു. . ഇത് അതിൻ്റെ സംഭരണം, സംസ്കരണം, പ്രക്ഷേപണം എന്നിവ ഉറപ്പാക്കുകയും സുഗമമാക്കുകയും ചെയ്യുന്നു. 1963-ൽ, അമേരിക്കൻ ASCII എൻകോഡിംഗ് വികസിപ്പിച്ചെടുത്തു, അത് ഈ ലേഖനത്തിൻ്റെ വിഷയമാണ്.

ഒരു കമ്പ്യൂട്ടറിൽ വിവരങ്ങൾ അവതരിപ്പിക്കുന്നു

ഏതൊരു ഇലക്ട്രോണിക് കമ്പ്യൂട്ടറിൻ്റെയും വീക്ഷണകോണിൽ നിന്ന്, ടെക്സ്റ്റ് എന്നത് വ്യക്തിഗത പ്രതീകങ്ങളുടെ ഒരു കൂട്ടമാണ്. വലിയ അക്ഷരങ്ങൾ ഉൾപ്പെടെയുള്ള അക്ഷരങ്ങൾ മാത്രമല്ല, വിരാമചിഹ്നങ്ങളും അക്കങ്ങളും ഇതിൽ ഉൾപ്പെടുന്നു. കൂടാതെ, പ്രത്യേക പ്രതീകങ്ങൾ "=", "&", "(" എന്നിവയും സ്പെയ്സുകളും ഉപയോഗിക്കുന്നു.

വാചകം നിർമ്മിക്കുന്ന പ്രതീകങ്ങളുടെ കൂട്ടത്തെ അക്ഷരമാല എന്നും അവയുടെ സംഖ്യയെ കാർഡിനാലിറ്റി എന്നും വിളിക്കുന്നു (N എന്ന് സൂചിപ്പിച്ചിരിക്കുന്നു). ഇത് നിർണ്ണയിക്കാൻ, N = 2^b എന്ന പദപ്രയോഗം ഉപയോഗിക്കുന്നു, ഇവിടെ b എന്നത് ബിറ്റുകളുടെ എണ്ണം അല്ലെങ്കിൽ ഒരു പ്രത്യേക ചിഹ്നത്തിൻ്റെ വിവര ഭാരമാണ്.

256 പ്രതീകങ്ങളുടെ ശേഷിയുള്ള ഒരു അക്ഷരമാലയ്ക്ക് ആവശ്യമായ എല്ലാ പ്രതീകങ്ങളെയും പ്രതിനിധീകരിക്കാൻ കഴിയുമെന്ന് തെളിയിക്കപ്പെട്ടിട്ടുണ്ട്.

256 എന്നത് രണ്ടിൻ്റെ എട്ടാമത്തെ ശക്തിയെ പ്രതിനിധീകരിക്കുന്നതിനാൽ, ഓരോ പ്രതീകത്തിൻ്റെയും ഭാരം 8 ബിറ്റുകളാണ്.

8 ബിറ്റുകളുടെ ഒരു യൂണിറ്റിനെ 1 ബൈറ്റ് എന്ന് വിളിക്കുന്നു, അതിനാൽ കമ്പ്യൂട്ടറിൽ സംഭരിച്ചിരിക്കുന്ന വാചകത്തിലെ ഏത് പ്രതീകവും ഒരു ബൈറ്റ് മെമ്മറി എടുക്കുമെന്ന് പറയുന്നത് പതിവാണ്.

കോഡിംഗ് എങ്ങനെയാണ് ചെയ്യുന്നത്?

അക്കങ്ങൾ, അക്ഷരങ്ങൾ, വിരാമചിഹ്നങ്ങൾ, മറ്റ് ചിഹ്നങ്ങൾ എന്നിവ എഴുതിയ കീബോർഡ് കീകൾ ഉപയോഗിച്ച് ഏതെങ്കിലും പാഠങ്ങൾ ഒരു വ്യക്തിഗത കമ്പ്യൂട്ടറിൻ്റെ മെമ്മറിയിലേക്ക് പ്രവേശിക്കുന്നു. അവ ബൈനറി കോഡിൽ റാമിലേക്ക് മാറ്റുന്നു, അതായത് ഓരോ പ്രതീകവും മനുഷ്യർക്ക് പരിചിതമായ ഒരു ദശാംശ കോഡുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു, 0 മുതൽ 255 വരെ, ഇത് ഒരു ബൈനറി കോഡുമായി യോജിക്കുന്നു - 00000000 മുതൽ 11111111 വരെ.

ബൈറ്റ്-ബൈറ്റ് പ്രതീക എൻകോഡിംഗ് ടെക്സ്റ്റ് പ്രോസസ്സിംഗ് നടത്തുന്ന പ്രോസസ്സറിനെ ഓരോ പ്രതീകവും വ്യക്തിഗതമായി ആക്സസ് ചെയ്യാൻ അനുവദിക്കുന്നു. അതേ സമയം, ഏതെങ്കിലും പ്രതീകാത്മക വിവരങ്ങളെ പ്രതിനിധീകരിക്കാൻ 256 പ്രതീകങ്ങൾ മതിയാകും.

ASCII പ്രതീക എൻകോഡിംഗ്

ഇംഗ്ലീഷിലെ ഈ ചുരുക്കെഴുത്ത് വിവര കൈമാറ്റത്തിനുള്ള കോഡിനെ സൂചിപ്പിക്കുന്നു.

കമ്പ്യൂട്ടർവൽക്കരണത്തിൻ്റെ ആരംഭത്തിൽ പോലും, വിവരങ്ങൾ എൻകോഡ് ചെയ്യുന്നതിന് വൈവിധ്യമാർന്ന മാർഗങ്ങൾ കൊണ്ടുവരാൻ കഴിയുമെന്ന് വ്യക്തമായി. എന്നിരുന്നാലും, ഒരു കമ്പ്യൂട്ടറിൽ നിന്ന് മറ്റൊന്നിലേക്ക് വിവരങ്ങൾ കൈമാറുന്നതിന്, ഒരു ഏകീകൃത നിലവാരം വികസിപ്പിക്കേണ്ടത് ആവശ്യമാണ്. അതിനാൽ, 1963-ൽ, ASCII എൻകോഡിംഗ് ടേബിൾ യുഎസ്എയിൽ പ്രത്യക്ഷപ്പെട്ടു. അതിൽ, കമ്പ്യൂട്ടർ അക്ഷരമാലയുടെ ഏത് ചിഹ്നവും ബൈനറി പ്രാതിനിധ്യത്തിൽ അതിൻ്റെ സീരിയൽ നമ്പറുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. ASCII യഥാർത്ഥത്തിൽ യുണൈറ്റഡ് സ്റ്റേറ്റ്സിൽ മാത്രമാണ് ഉപയോഗിച്ചിരുന്നത്, പിന്നീട് പിസികളുടെ അന്താരാഷ്ട്ര നിലവാരമായി മാറി.

ASCII കോഡുകൾ 2 ഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്നു. ഈ പട്ടികയുടെ ആദ്യ പകുതി മാത്രമാണ് അന്താരാഷ്ട്ര നിലവാരമായി കണക്കാക്കുന്നത്. 0 (00000000 ആയി കോഡ് ചെയ്‌തത്) മുതൽ 127 (01111111 കോഡ് ചെയ്‌തത്) വരെയുള്ള സീരിയൽ നമ്പറുകളുള്ള പ്രതീകങ്ങൾ ഇതിൽ ഉൾപ്പെടുന്നു.

സീരിയൽ നമ്പർ	ASCII ടെക്സ്റ്റ് എൻകോഡിംഗ്	ചിഹ്നം
	0000 0000 - 0001 1111	0 മുതൽ 31 വരെയുള്ള N ഉള്ള പ്രതീകങ്ങളെ നിയന്ത്രണ പ്രതീകങ്ങൾ എന്ന് വിളിക്കുന്നു. ഒരു മോണിറ്ററിലോ പ്രിൻ്റിംഗ് ഉപകരണത്തിലോ വാചകം പ്രദർശിപ്പിക്കുക, ശബ്ദ സിഗ്നൽ നൽകുക തുടങ്ങിയവയുടെ പ്രക്രിയ "മാനേജ് ചെയ്യുക" എന്നതാണ് അവരുടെ പ്രവർത്തനം.
	0010 0000 - 0111 1111	N മുതൽ 32 മുതൽ 127 വരെയുള്ള പ്രതീകങ്ങൾ (പട്ടികയുടെ സ്റ്റാൻഡേർഡ് ഭാഗം) - ലാറ്റിൻ അക്ഷരമാലയുടെ വലിയ, ചെറിയ അക്ഷരങ്ങൾ, പത്താം അക്കങ്ങൾ, വിരാമചിഹ്നങ്ങൾ, കൂടാതെ വിവിധ ബ്രാക്കറ്റുകൾ, വാണിജ്യ, മറ്റ് ചിഹ്നങ്ങൾ. 32 എന്ന പ്രതീകം ഒരു ഇടത്തെ പ്രതിനിധീകരിക്കുന്നു.
	1000 0000 - 1111 1111	128 മുതൽ 255 വരെയുള്ള N ഉള്ള പ്രതീകങ്ങൾക്ക് (പട്ടികയുടെ അല്ലെങ്കിൽ കോഡ് പേജിൻ്റെ ഇതര ഭാഗം) വ്യത്യസ്ത വകഭേദങ്ങൾ ഉണ്ടാകാം, അവയിൽ ഓരോന്നിനും അതിൻ്റേതായ സംഖ്യയുണ്ട്. ലാറ്റിനിൽ നിന്ന് വ്യത്യസ്തമായ ദേശീയ അക്ഷരമാലകൾ വ്യക്തമാക്കാൻ കോഡ് പേജ് ഉപയോഗിക്കുന്നു. പ്രത്യേകിച്ചും, റഷ്യൻ പ്രതീകങ്ങൾക്കായി ASCII എൻകോഡിംഗ് നടത്തുന്നത് അതിൻ്റെ സഹായത്തോടെയാണ്.

പട്ടികയിൽ, എൻകോഡിംഗുകൾ വലിയക്ഷരമാക്കി അക്ഷരമാലാക്രമത്തിൽ പരസ്പരം പിന്തുടരുന്നു, അക്കങ്ങൾ ആരോഹണ ക്രമത്തിലാണ്. റഷ്യൻ അക്ഷരമാലയ്ക്ക് ഈ തത്വം സമാനമാണ്.

പ്രതീകങ്ങൾ നിയന്ത്രിക്കുക

ASCII എൻകോഡിംഗ് ടേബിൾ യഥാർത്ഥത്തിൽ ഒരു ടെലിടൈപ്പ് പോലെയുള്ള ദീർഘകാലമായി ഉപയോഗിക്കാത്ത ഒരു ഉപകരണം വഴി വിവരങ്ങൾ സ്വീകരിക്കുന്നതിനും കൈമാറുന്നതിനുമായി സൃഷ്ടിച്ചതാണ്. ഇക്കാര്യത്തിൽ, ഈ ഉപകരണം നിയന്ത്രിക്കുന്നതിനുള്ള കമാൻഡുകളായി ഉപയോഗിച്ചിരിക്കുന്ന പ്രതീക സെറ്റിൽ അച്ചടിക്കാനാവാത്ത പ്രതീകങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. മോഴ്സ് കോഡ് മുതലായ പ്രീ-കമ്പ്യൂട്ടർ സന്ദേശമയയ്ക്കൽ രീതികളിലും സമാനമായ കമാൻഡുകൾ ഉപയോഗിച്ചിരുന്നു.

ഏറ്റവും സാധാരണമായ ടെലിടൈപ്പ് പ്രതീകം NUL (00) ആണ്. ഒരു വരിയുടെ അവസാനം സൂചിപ്പിക്കുന്നതിന് മിക്ക പ്രോഗ്രാമിംഗ് ഭാഷകളിലും ഇത് ഇന്നും ഉപയോഗിക്കുന്നു.

ASCII എൻകോഡിംഗ് എവിടെയാണ് ഉപയോഗിക്കുന്നത്?

കീബോർഡിൽ ടെക്സ്റ്റ് വിവരങ്ങൾ നൽകുന്നതിന് മാത്രമല്ല അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ആവശ്യമാണ്. ഗ്രാഫിക്സിലും ഇത് ഉപയോഗിക്കുന്നു. പ്രത്യേകിച്ചും, ASCII ആർട്ട് മേക്കറിൽ, വിവിധ വിപുലീകരണങ്ങളുടെ ചിത്രങ്ങൾ ASCII പ്രതീകങ്ങളുടെ ഒരു സ്പെക്ട്രത്തെ പ്രതിനിധീകരിക്കുന്നു.

അത്തരം ഉൽപ്പന്നങ്ങളിൽ രണ്ട് തരം ഉണ്ട്: ചിത്രങ്ങളെ ടെക്സ്റ്റാക്കി മാറ്റുന്നതിലൂടെ ഗ്രാഫിക് എഡിറ്റർമാരുടെ പ്രവർത്തനം നിർവ്വഹിക്കുന്നവയും "ഡ്രോയിംഗുകൾ" ASCII ഗ്രാഫിക്സാക്കി മാറ്റുന്നവയും. ഉദാഹരണത്തിന്, പ്രശസ്തമായ ഇമോട്ടിക്കോൺ ഒരു എൻകോഡിംഗ് ചിഹ്നത്തിൻ്റെ ഒരു പ്രധാന ഉദാഹരണമാണ്.

ഒരു HTML പ്രമാണം സൃഷ്ടിക്കുമ്പോൾ ASCII ഉപയോഗിക്കാനും കഴിയും. ഈ സാഹചര്യത്തിൽ, നിങ്ങൾക്ക് ഒരു പ്രത്യേക സെറ്റ് പ്രതീകങ്ങൾ നൽകാം, പേജ് കാണുമ്പോൾ, ഈ കോഡുമായി പൊരുത്തപ്പെടുന്ന ഒരു ചിഹ്നം സ്ക്രീനിൽ ദൃശ്യമാകും.

ഒരു നിർദ്ദിഷ്‌ട ദേശീയ പട്ടികയിൽ ഉൾപ്പെടുത്താത്ത പ്രതീകങ്ങൾ ASCII കോഡുകൾ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നതിനാൽ, ബഹുഭാഷാ വെബ്‌സൈറ്റുകൾ സൃഷ്‌ടിക്കുന്നതിനും ASCII ആവശ്യമാണ്.

ചില സവിശേഷതകൾ

7 ബിറ്റുകൾ ഉപയോഗിച്ച് ടെക്സ്റ്റ് വിവരങ്ങൾ എൻകോഡ് ചെയ്യാൻ ASCII ഉപയോഗിച്ചിരുന്നു (ഒന്ന് ശൂന്യമായി അവശേഷിക്കുന്നു), എന്നാൽ ഇന്ന് ഇത് 8 ബിറ്റുകളായി പ്രവർത്തിക്കുന്നു.

മുകളിലും താഴെയുമുള്ള നിരകളിൽ സ്ഥിതിചെയ്യുന്ന അക്ഷരങ്ങൾ ഒരൊറ്റ ബിറ്റിൽ മാത്രം പരസ്പരം വ്യത്യാസപ്പെട്ടിരിക്കുന്നു. ഇത് ഓഡിറ്റിൻ്റെ സങ്കീർണ്ണതയെ ഗണ്യമായി കുറയ്ക്കുന്നു.

Microsoft Office-ൽ ASCII ഉപയോഗിക്കുന്നു

ആവശ്യമെങ്കിൽ, നോട്ട്പാഡ്, ഓഫീസ് വേഡ് തുടങ്ങിയ മൈക്രോസോഫ്റ്റ് ടെക്സ്റ്റ് എഡിറ്ററുകളിൽ ഇത്തരത്തിലുള്ള ടെക്സ്റ്റ് വിവര എൻകോഡിംഗ് ഉപയോഗിക്കാം. എന്നിരുന്നാലും, ഈ സാഹചര്യത്തിൽ ടൈപ്പ് ചെയ്യുമ്പോൾ നിങ്ങൾക്ക് ചില ഫംഗ്ഷനുകൾ ഉപയോഗിക്കാൻ കഴിഞ്ഞേക്കില്ല. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് ബോൾഡ് ടെക്‌സ്‌റ്റ് ഉപയോഗിക്കാൻ കഴിയില്ല, കാരണം ASCII എൻകോഡിംഗ് വിവരങ്ങളുടെ പൊതുവായ രൂപവും രൂപവും അവഗണിച്ച് അതിൻ്റെ അർത്ഥം മാത്രം സംരക്ഷിക്കുന്നു.

സ്റ്റാൻഡേർഡൈസേഷൻ

ISO ഓർഗനൈസേഷൻ ISO 8859 മാനദണ്ഡങ്ങൾ സ്വീകരിച്ചു. ഈ ഗ്രൂപ്പ് വിവിധ ഭാഷാ ഗ്രൂപ്പുകൾക്കായി എട്ട്-ബിറ്റ് എൻകോഡിംഗുകൾ നിർവചിക്കുന്നു. പ്രത്യേകിച്ചും, ഐഎസ്ഒ 8859-1 എന്നത് യുണൈറ്റഡ് സ്റ്റേറ്റ്സിനും പടിഞ്ഞാറൻ യൂറോപ്യൻ രാജ്യങ്ങൾക്കും വേണ്ടിയുള്ള ഒരു വിപുലീകൃത ASCII പട്ടികയാണ്. കൂടാതെ റഷ്യൻ ഭാഷ ഉൾപ്പെടെയുള്ള സിറിലിക് അക്ഷരമാലയ്ക്കായി ഉപയോഗിക്കുന്ന ഒരു പട്ടികയാണ് ISO 8859-5.

ചരിത്രപരമായ നിരവധി കാരണങ്ങളാൽ, ISO 8859-5 നിലവാരം വളരെ കുറച്ച് സമയത്തേക്ക് ഉപയോഗിച്ചു.

റഷ്യൻ ഭാഷയ്ക്കായി, ഇനിപ്പറയുന്ന എൻകോഡിംഗുകൾ യഥാർത്ഥത്തിൽ ഇപ്പോൾ ഉപയോഗിക്കുന്നു:

CP866 (കോഡ് പേജ് 866) അല്ലെങ്കിൽ ഡോസ്,ഇതിനെ പലപ്പോഴും ഇതര GOST എൻകോഡിംഗ് എന്ന് വിളിക്കുന്നു. കഴിഞ്ഞ നൂറ്റാണ്ടിൻ്റെ 90-കളുടെ പകുതി വരെ ഇത് സജീവമായി ഉപയോഗിച്ചിരുന്നു. ഇപ്പോൾ ഇത് പ്രായോഗികമായി ഉപയോഗിക്കുന്നില്ല.
KOI-8. 1970-കളിലും 80-കളിലും എൻകോഡിംഗ് വികസിപ്പിച്ചെടുത്തു, നിലവിൽ RuNet-ലെ ഇമെയിൽ സന്ദേശങ്ങൾക്കുള്ള പൊതുവായി അംഗീകരിക്കപ്പെട്ട മാനദണ്ഡമാണിത്. ലിനക്സ് ഉൾപ്പെടെയുള്ള യുണിക്സ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിൽ ഇത് വ്യാപകമായി ഉപയോഗിക്കുന്നു. KOI-8 ൻ്റെ "റഷ്യൻ" പതിപ്പിനെ KOI-8R എന്ന് വിളിക്കുന്നു. കൂടാതെ, ഉക്രേനിയൻ പോലുള്ള മറ്റ് സിറിലിക് ഭാഷകൾക്ക് പതിപ്പുകളുണ്ട്.
കോഡ് പേജ് 1251 (CP 1251, വിൻഡോസ് - 1251).വിൻഡോസ് പരിതസ്ഥിതിയിൽ റഷ്യൻ ഭാഷയ്ക്ക് പിന്തുണ നൽകുന്നതിനായി മൈക്രോസോഫ്റ്റ് വികസിപ്പിച്ചെടുത്തത്.

ആദ്യത്തെ CP866 സ്റ്റാൻഡേർഡിൻ്റെ പ്രധാന നേട്ടം എക്സ്റ്റെൻഡഡ് ASCII-ൽ ഉള്ള അതേ സ്ഥാനങ്ങളിൽ സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങളുടെ സംരക്ഷണമായിരുന്നു. പ്രസിദ്ധമായ നോർട്ടൺ കമാൻഡർ പോലുള്ള വിദേശ നിർമ്മിത ടെക്സ്റ്റ് പ്രോഗ്രാമുകൾ പരിഷ്ക്കരണങ്ങളില്ലാതെ പ്രവർത്തിപ്പിക്കാൻ ഇത് സാധ്യമാക്കി. നിലവിൽ, പൂർണ്ണ സ്‌ക്രീൻ ടെക്‌സ്‌റ്റ് മോഡിലോ FAR മാനേജർ ഉൾപ്പെടെയുള്ള ടെക്‌സ്‌റ്റ് വിൻഡോകളിലോ പ്രവർത്തിക്കുന്ന വിൻഡോസിനായി വികസിപ്പിച്ച പ്രോഗ്രാമുകൾക്കായി CP866 ഉപയോഗിക്കുന്നു.

CP866 എൻകോഡിംഗിൽ എഴുതിയ കമ്പ്യൂട്ടർ ടെക്‌സ്‌റ്റുകൾ ഈ ദിവസങ്ങളിൽ വളരെ വിരളമാണ്, എന്നാൽ ഇത് വിൻഡോസിൽ റഷ്യൻ ഫയൽ നാമങ്ങൾക്കായി ഉപയോഗിക്കുന്ന ഒന്നാണ്.

"യൂണികോഡ്"

ഇപ്പോൾ, ഈ എൻകോഡിംഗാണ് ഏറ്റവും വ്യാപകമായി ഉപയോഗിക്കുന്നത്. യൂണികോഡ് കോഡുകൾ ഏരിയകളായി തിരിച്ചിരിക്കുന്നു. ആദ്യത്തേതിൽ (U+0000 മുതൽ U+007F വരെ) കോഡുകളുള്ള ASCII പ്രതീകങ്ങൾ ഉൾപ്പെടുന്നു. ഇതിനെ തുടർന്ന് വിവിധ ദേശീയ ലിപികളുടെ പ്രതീക മേഖലകളും വിരാമചിഹ്നങ്ങളും സാങ്കേതിക ചിഹ്നങ്ങളും. കൂടാതെ, ഭാവിയിൽ പുതിയ പ്രതീകങ്ങൾ ഉൾപ്പെടുത്തേണ്ട ആവശ്യമുണ്ടെങ്കിൽ ചില യൂണികോഡ് കോഡുകൾ റിസർവ് ചെയ്തിരിക്കുന്നു.

ASCII-ൽ, ഓരോ പ്രതീകവും 8 പൂജ്യങ്ങളുടെയും ഒന്നിൻ്റെയും സംയോജനമായാണ് പ്രതിനിധീകരിക്കുന്നതെന്ന് ഇപ്പോൾ നിങ്ങൾക്കറിയാം. സ്പെഷ്യലിസ്റ്റുകൾ അല്ലാത്തവർക്ക്, ഈ വിവരങ്ങൾ അനാവശ്യവും താൽപ്പര്യമില്ലാത്തതുമായി തോന്നിയേക്കാം, എന്നാൽ നിങ്ങളുടെ പിസിയുടെ "തലച്ചോറിൽ" എന്താണ് സംഭവിക്കുന്നതെന്ന് അറിയാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നില്ലേ?!

വഴിയിൽ, ഞങ്ങളുടെ വെബ്സൈറ്റിൽ നിങ്ങൾക്ക് ഓൺലൈൻ കോഡ് കാൽക്കുലേറ്റർ ഉപയോഗിച്ച് ഏത് ടെക്സ്റ്റും ഡെസിമൽ, ഹെക്സാഡെസിമൽ, ബൈനറി കോഡുകളായി പരിവർത്തനം ചെയ്യാൻ കഴിയും.

ASCII പട്ടിക

ASCII (അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇൻ്റർചേഞ്ച്)

ASCII കോഡുകളുടെ സംഗ്രഹ പട്ടിക

ASCII വിൻഡോസ് പ്രതീക കോഡ് പട്ടിക (Win-1251)

		ചിഹ്നം









		സ്പെഷ്യലിസ്റ്റ്. ടാബുലേഷൻ
		സ്പെഷ്യലിസ്റ്റ്. LF (വണ്ടി മടക്കം)


		സ്പെഷ്യലിസ്റ്റ്. CR (പുതിയ ലൈൻ)


















		ക്ലച്ച് എസ്പി (സ്പേസ്)

		ചിഹ്നം

വിപുലീകരിച്ച ASCII കോഡ് പട്ടിക

ഫോർമാറ്റിംഗ് ചിഹ്നങ്ങൾ.

	ബാക്ക്‌സ്‌പെയ്‌സ് (ഒരു പ്രതീകം തിരികെ നൽകുക). പ്രിൻ്റ് മെക്കാനിസം അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സർ ഒരു സ്ഥാനത്തേക്ക് പിന്നോട്ട് നീങ്ങുന്നുവെന്ന് സൂചിപ്പിക്കുന്നു.
	തിരശ്ചീന ടാബുലേഷൻ. പ്രിൻ്റ് എഞ്ചിൻ്റെയോ ഡിസ്പ്ലേ കഴ്‌സറിൻ്റെയോ അടുത്ത നിർദ്ദേശിച്ച "ടാബ് സ്റ്റോപ്പിലേക്കുള്ള" ചലനത്തെ സൂചിപ്പിക്കുന്നു.
	ലൈൻ ഫീഡ്. പ്രിൻ്റ് മെക്കാനിസത്തിൻ്റെ ചലനം അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സർ അടുത്ത വരിയുടെ തുടക്കത്തിലേക്ക് (ഒരു വരി താഴേക്ക്) സൂചിപ്പിക്കുന്നു.
	ലംബമായ ടാബുലേഷൻ. പ്രിൻ്റ് എഞ്ചിൻ അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സറിൻ്റെ അടുത്ത ഗ്രൂപ്പിലെ വരികളുടെ ചലനത്തെ സൂചിപ്പിക്കുന്നു.
	ഫോം ഫീഡ്. പ്രിൻ്റ് എഞ്ചിൻ അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സർ അടുത്ത പേജ്, ഫോം അല്ലെങ്കിൽ സ്ക്രീനിൻ്റെ ആരംഭ സ്ഥാനത്തേക്കുള്ള ചലനത്തെ സൂചിപ്പിക്കുന്നു.
	വണ്ടി മടക്കം. നിലവിലെ ലൈനിൻ്റെ ഹോം (ഇടത് അറ്റത്ത്) സ്ഥാനത്തേക്ക് പ്രിൻ്റ് മെക്കാനിസത്തിൻ്റെ അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സറിൻ്റെ ചലനത്തെ സൂചിപ്പിക്കുന്നു.

ഡാറ്റ കൈമാറ്റം.

	തലക്കെട്ടിൻ്റെ തുടക്കം. ഒരു തലക്കെട്ടിൻ്റെ ആരംഭം നിർവചിക്കാൻ ഉപയോഗിക്കുന്നു, അതിൽ റൂട്ടിംഗ് വിവരങ്ങളോ വിലാസമോ അടങ്ങിയിരിക്കാം.
	വാചകത്തിൻ്റെ തുടക്കം. വാചകത്തിൻ്റെ തുടക്കവും അതേ സമയം ശീർഷകത്തിൻ്റെ അവസാനവും കാണിക്കുന്നു.
	വാചകത്തിൻ്റെ അവസാനം. STX പ്രതീകത്തിൽ ആരംഭിച്ച വാചകം അവസാനിപ്പിക്കുമ്പോൾ ബാധകമാണ്.
	അന്വേഷണം. ഒരു വിദൂര സ്റ്റേഷനിൽ നിന്ന് തിരിച്ചറിയൽ ഡാറ്റയ്ക്കുള്ള അഭ്യർത്ഥന ("നിങ്ങൾ ആരാണ്?" പോലുള്ളവ).
	അംഗീകരിക്കുക. ഡാറ്റയുടെ വിജയകരമായ സ്വീകരണത്തിൻ്റെ സ്ഥിരീകരണമായി സ്വീകരിക്കുന്ന ഉപകരണം അയച്ചയാൾക്ക് ഈ പ്രതീകം കൈമാറുന്നു.
	നെഗറ്റീവ് അംഗീകാരം. ഡാറ്റ റിസപ്ഷൻ നിരസിച്ചാൽ (പരാജയം) സ്വീകരിക്കുന്ന ഉപകരണം അയച്ചയാൾക്ക് ഈ പ്രതീകം കൈമാറുന്നു.
	സിൻക്രണസ്/നിഷ്‌ക്രിയം. സമന്വയിപ്പിച്ച ട്രാൻസ്മിഷൻ സിസ്റ്റങ്ങളിൽ ഉപയോഗിക്കുന്നു. ഡാറ്റാ ട്രാൻസ്മിഷൻ ഇല്ലെങ്കിൽ, സിൻക്രൊണൈസേഷൻ ഉറപ്പാക്കാൻ സിസ്റ്റം തുടർച്ചയായി SYN ചിഹ്നങ്ങൾ അയയ്ക്കുന്നു.
	ട്രാൻസ്മിഷൻ ബ്ലോക്കിൻ്റെ അവസാനം. ആശയവിനിമയ ആവശ്യങ്ങൾക്കായി ഒരു ഡാറ്റ ബ്ലോക്കിൻ്റെ അവസാനത്തെ സൂചിപ്പിക്കുന്നു. വലിയ അളവിലുള്ള ഡാറ്റയെ പ്രത്യേക ബ്ലോക്കുകളായി വിഭജിക്കാൻ ഉപയോഗിക്കുന്നു.

വിവരങ്ങൾ കൈമാറുമ്പോൾ അടയാളങ്ങൾ വിഭജിക്കുന്നു.

മറ്റ് ചിഹ്നങ്ങൾ.

	ശൂന്യം. (പ്രതീകമില്ല - ഡാറ്റയില്ല). ഡാറ്റ ഇല്ലാത്തപ്പോൾ പ്രക്ഷേപണത്തിനായി ഉപയോഗിക്കുന്നു.
	ബെൽ (കോൾ). അലാറം ഉപകരണങ്ങൾ നിയന്ത്രിക്കാൻ ഉപയോഗിക്കുന്നു.
	പുറത്തേക്ക് മാറ്റുക. SI പ്രതീകത്തിൻ്റെ വരവിനു മുമ്പുള്ള എല്ലാ തുടർന്നുള്ള കോഡ്‌വേഡുകളും ബാഹ്യ പ്രതീക സെറ്റ് അനുസരിച്ച് വ്യാഖ്യാനിക്കണമെന്ന് സൂചിപ്പിക്കുന്നു.
	ഷിഫ്റ്റ് ഇൻ. സ്റ്റാൻഡേർഡ് ക്യാരക്ടർ സെറ്റ് അനുസരിച്ച് തുടർന്നുള്ള കോഡ് കോമ്പിനേഷനുകൾ വ്യാഖ്യാനിക്കണമെന്ന് സൂചിപ്പിക്കുന്നു.
	ഡാറ്റ ലിങ്ക് എസ്കേപ്പ്. ഇനിപ്പറയുന്ന പ്രതീകങ്ങളുടെ അർത്ഥം മാറ്റുന്നു. അധിക നിയന്ത്രണത്തിനോ ബിറ്റുകളുടെ ഏകപക്ഷീയമായ സംയോജനം സംപ്രേഷണം ചെയ്യാനോ ഉപയോഗിക്കുന്നു.
DC1, DC2, DC3, DC4	ഉപകരണ നിയന്ത്രണങ്ങൾ. ഓക്സിലറി ഉപകരണങ്ങൾ പ്രവർത്തിപ്പിക്കുന്നതിനുള്ള ചിഹ്നങ്ങൾ (പ്രത്യേക പ്രവർത്തനങ്ങൾ).
	റദ്ദാക്കുക. ഒരു സന്ദേശത്തിലോ ബ്ലോക്കിലോ ഈ പ്രതീകത്തിന് മുമ്പുള്ള ഡാറ്റ അവഗണിക്കണമെന്ന് സൂചിപ്പിക്കുന്നു (സാധാരണയായി ഒരു പിശക് കണ്ടെത്തിയാൽ).
	ഇടത്തരം അവസാനം. ഒരു ടേപ്പ് അല്ലെങ്കിൽ മറ്റ് സ്റ്റോറേജ് മീഡിയത്തിൻ്റെ ഭൗതിക അവസാനം സൂചിപ്പിക്കുന്നു
	പകരക്കാരൻ. തെറ്റായ അല്ലെങ്കിൽ അസാധുവായ പ്രതീകം മാറ്റിസ്ഥാപിക്കാൻ ഉപയോഗിക്കുന്നു.
	എസ്കേപ്പ് (വിപുലീകരണം). തുടർന്നുള്ള പ്രതീകത്തിന് ഒരു ഇതര അർത്ഥമുണ്ടെന്ന് സൂചിപ്പിച്ചുകൊണ്ട് കോഡ് വികസിപ്പിക്കാൻ ഉപയോഗിക്കുന്നു.
	സ്ഥലം. പദങ്ങൾ വേർതിരിക്കുന്നതിനോ പ്രിൻ്റ് എഞ്ചിൻ നീക്കുന്നതിനോ കഴ്‌സർ ഒരു സ്ഥാനത്തേക്ക് പ്രദർശിപ്പിക്കുന്നതിനോ ഉപയോഗിക്കുന്ന പ്രിൻ്റ് ചെയ്യാത്ത പ്രതീകം.
	ഇല്ലാതാക്കുക. ഒരു സന്ദേശത്തിലെ മുമ്പത്തെ പ്രതീകം നീക്കം ചെയ്യാൻ (മായ്ക്കാൻ) ഉപയോഗിക്കുന്നു

ഓരോ കമ്പ്യൂട്ടറിനും അതിൻ്റേതായ പ്രതീകങ്ങൾ ഉണ്ട്, അത് നടപ്പിലാക്കുന്നു. ഈ സെറ്റിൽ 26 വലിയ, ചെറിയ അക്ഷരങ്ങൾ, അക്കങ്ങൾ, പ്രത്യേക പ്രതീകങ്ങൾ (ഡോട്ട്, സ്പേസ് മുതലായവ) അടങ്ങിയിരിക്കുന്നു. പൂർണ്ണസംഖ്യകളിലേക്ക് പരിവർത്തനം ചെയ്യുമ്പോൾ, ചിഹ്നങ്ങളെ കോഡുകൾ എന്ന് വിളിക്കുന്നു. കംപ്യൂട്ടറുകൾക്ക് ഒരേ കോഡുകൾ ഉണ്ടായിരിക്കുന്ന തരത്തിൽ മാനദണ്ഡങ്ങൾ വികസിപ്പിച്ചെടുത്തു.

ASCII നിലവാരം

വിവര കൈമാറ്റത്തിനുള്ള ഒരു അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡാണ് ASCII (അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇൻ്റർചേഞ്ച്). ഓരോ ASCII പ്രതീകത്തിനും 7 ബിറ്റുകൾ ഉണ്ട്, അതിനാൽ പരമാവധി പ്രതീകങ്ങളുടെ എണ്ണം 128 ആണ് (പട്ടിക 1). 0 മുതൽ 1F വരെയുള്ള കോഡുകൾ പ്രിൻ്റ് ചെയ്യാത്ത നിയന്ത്രണ പ്രതീകങ്ങളാണ്. പ്രിൻ്റ് ചെയ്യാനാവാത്ത നിരവധി ASCII പ്രതീകങ്ങൾ ഡാറ്റ കൈമാറാൻ ആവശ്യമാണ്. ഉദാഹരണത്തിന്, ഒരു സന്ദേശത്തിൽ സ്റ്റാർട്ട്-ഓഫ്-ഹെഡർ പ്രതീകം SOH, ഹെഡർ തന്നെയും ടെക്‌സ്‌റ്റ് സ്റ്റാർട്ട് ഓഫ് ടെക്‌സ്‌റ്റ് പ്രതീകം STX, ടെക്‌സ്‌റ്റ് തന്നെയും ടെക്‌സ്‌റ്റിൻ്റെ അവസാന പ്രതീകമായ ETX, എൻഡ്-ഓഫ്-ട്രാൻസ്മിഷൻ എന്നിവയും അടങ്ങിയിരിക്കാം. പ്രതീകം EOT. എന്നിരുന്നാലും, നെറ്റ്‌വർക്കിലൂടെയുള്ള ഡാറ്റ പാക്കറ്റുകളിൽ കൈമാറ്റം ചെയ്യപ്പെടുന്നു, അവ പ്രക്ഷേപണത്തിൻ്റെ തുടക്കത്തിനും അവസാനത്തിനും ഉത്തരവാദികളാണ്. അതിനാൽ അച്ചടിക്കാനാവാത്ത പ്രതീകങ്ങൾ മിക്കവാറും ഉപയോഗിക്കില്ല.

പട്ടിക 1 - ASCII കോഡ് പട്ടിക

നമ്പർ	ടീം	അർത്ഥം	നമ്പർ	ടീം	അർത്ഥം
0	NUL	നൾ പോയിൻ്റർ	10	DLE	ട്രാൻസ്മിഷൻ സിസ്റ്റത്തിൽ നിന്ന് പുറത്തുകടക്കുക
1	SOH	ശീർഷകത്തിൻ്റെ തുടക്കം	11	DC1	ഉപകരണ മാനേജ്മെൻ്റ്
2	എസ്.ടി.എക്സ്	വാചകത്തിൻ്റെ തുടക്കം	12	DC2	ഉപകരണ മാനേജ്മെൻ്റ്
3	ETX	വാചകത്തിൻ്റെ അവസാനം	13	DC3	ഉപകരണ മാനേജ്മെൻ്റ്
4	EOT	പ്രക്ഷേപണത്തിൻ്റെ അവസാനം	14	DC4	ഉപകരണ മാനേജ്മെൻ്റ്
5	എ.സി.കെ	അഭ്യർത്ഥിക്കുക	15	എൻ.എ.കെ.	സ്വീകരണം സ്ഥിരീകരിക്കാത്തത്
6	BEL	സ്വീകാര്യത സ്ഥിരീകരണം	16	SYN	ലളിതം
7	ബി.എസ്.	മണി ചിഹ്നം	17	ഇ.ടി.ബി	ട്രാൻസ്മിഷൻ ബ്ലോക്കിൻ്റെ അവസാനം
8	HT	പിന്നോട്ട് മാറുക	18	CAN	അടയാളപ്പെടുത്തുക
9	എൽ.എഫ്	തിരശ്ചീന പട്ടിക	19	ഇ.എം.	മാധ്യമങ്ങളുടെ അവസാനം
എ	വി.ടി	വരി വിവർത്തനം	1എ	SUB	സബ്സ്ക്രിപ്റ്റ്
ബി	എഫ്.എഫ്	ലംബ ടാബ്	1B	ഇഎസ്സി	പുറത്ത്
സി	CR	പേജ് വിവർത്തനം	1C	എഫ്.എസ്	ഫയൽ സെപ്പറേറ്റർ
ഡി	SO	വണ്ടി മടക്കം	1D	ജി.എസ്.	ഗ്രൂപ്പ് സെപ്പറേറ്റർ
ഇ	എസ്.ഐ.	അധിക രജിസ്റ്ററിലേക്ക് മാറുക	1ഇ	ആർ.എസ്.	റെക്കോർഡ് സെപ്പറേറ്റർ
	എസ്.ഐ.	സാധാരണ കേസിലേക്ക് മാറുക	1F	യു.എസ്	മൊഡ്യൂൾ സെപ്പറേറ്റർ

നമ്പർ	ചിഹ്നം	നമ്പർ	ചിഹ്നം	നമ്പർ	ചിഹ്നം	നമ്പർ	ചിഹ്നം	നമ്പർ	ചിഹ്നം	നമ്പർ	ചിഹ്നം
20	സ്ഥലം	30	0	40	@	50	പി	60	.	70	പി
21	!	31	1	41	എ	51	ക്യു	61	എ	71	q
22	‘	32	2	42	ബി	52	ആർ	62	ബി	72	ആർ
23	#	33	3	43	സി	53	എസ്	63	സി	73	എസ്
24	φ	34	4	44	ഡി	54	ടി	64	ഡി	74	ടി
25	%	35	5	45	ഇ	55	ഒപ്പം	65	ഇ	75	ഒപ്പം
26	&	36	6	46	എഫ്	56	വി	66	എഫ്	76	വി
27	‘	37	7	47	ജി	57	ഡബ്ല്യു	67	ജി	77	w
28	(	38	8	48	എച്ച്	58	എക്സ്	68	എച്ച്	78	x
29	)	39	9	49	ഐ	59	വൈ	69	ഐ	70	വൈ
2A	‘	3A	;	4A	ജെ	5A	Z	6A	ജെ	7A	z
2B	+	3B	;	4B	കെ	5B	[	6B	കെ	7B	{
2C	‘	3C	<	4C	എൽ	5C	\	6C	എൽ	7C	\|
2D	—	3D	=	4D	എം	5D	]	6D	എം	7D	}
2E		3E	>	4E	എൻ	5E	—	6E	എൻ	7E	~
2F	/	3F	ജി	4F	ഒ	5F	_	6F	ഒ	7F	DEL

യൂണികോഡ് സ്റ്റാൻഡേർഡ്

മുമ്പത്തെ എൻകോഡിംഗ് ഇംഗ്ലീഷിന് മികച്ചതാണ്, എന്നാൽ മറ്റ് ഭാഷകൾക്ക് ഇത് സൗകര്യപ്രദമല്ല. ഉദാഹരണത്തിന്, ജർമ്മൻ ഭാഷയിൽ ഉംലൗട്ടുകൾ ഉണ്ട്, ഫ്രഞ്ചിൽ സൂപ്പർസ്ക്രിപ്റ്റുകൾ ഉണ്ട്. ചില ഭാഷകൾക്ക് തികച്ചും വ്യത്യസ്തമായ അക്ഷരമാലകളുണ്ട്. ASCII വിപുലീകരിക്കുന്നതിനുള്ള ആദ്യ ശ്രമം IS646 ആയിരുന്നു, ഇത് മുൻ എൻകോഡിംഗിനെ 128 പ്രതീകങ്ങൾ കൂടി വർദ്ധിപ്പിച്ചു. സ്ട്രോക്കുകളും ഡയക്രിറ്റിക്സും ഉള്ള ലാറ്റിൻ അക്ഷരങ്ങൾ ചേർത്തു, പേര് ലഭിച്ചു - ലാറ്റിൻ 1. അടുത്ത ശ്രമം IS 8859 ആയിരുന്നു - അതിൽ ഒരു കോഡ് പേജ് ഉണ്ടായിരുന്നു. വിപുലീകരണത്തിനുള്ള ശ്രമങ്ങളും ഉണ്ടായിരുന്നു, എന്നാൽ ഇത് സാർവത്രികമായിരുന്നില്ല. UNICODE എൻകോഡിംഗ് സൃഷ്ടിച്ചു (10646 ആണ്). എൻകോഡിംഗിൻ്റെ പിന്നിലെ ആശയം, ഓരോ പ്രതീകത്തിനും ഒരൊറ്റ സ്ഥിരമായ 16-ബിറ്റ് മൂല്യം നൽകുക എന്നതാണ്, അതിനെ വിളിക്കുന്നത് - കോഡ് പോയിൻ്റർ. മൊത്തത്തിൽ 65536 പോയിൻ്ററുകൾ ഉണ്ട്. സ്ഥലം ലാഭിക്കുന്നതിന്, 0 -255 കോഡുകൾക്കായി ഞങ്ങൾ ലാറ്റിൻ-1 ഉപയോഗിച്ചു, ASII UNICODE-ലേക്ക് എളുപ്പത്തിൽ മാറ്റുന്നു. ഈ മാനദണ്ഡം നിരവധി പ്രശ്നങ്ങൾ പരിഹരിച്ചു, പക്ഷേ എല്ലാം അല്ല. പുതിയ വാക്കുകളുടെ വരവ് കാരണം, ഉദാഹരണത്തിന്, ജാപ്പനീസ് ഭാഷയ്ക്ക്, പദങ്ങളുടെ എണ്ണം ഏകദേശം 20 ആയിരം വർദ്ധിപ്പിക്കേണ്ടത് ആവശ്യമാണ്.ബ്രെയ്ലി ഉൾപ്പെടുത്തേണ്ടതും ആവശ്യമാണ്.