സ്റ്റാൻഡേർഡ് കോഡ് പട്ടിക. ടെക്സ്റ്റ് വിവരങ്ങൾ എൻകോഡുചെയ്യുന്നു

[8-ബിറ്റ് എൻകോഡിംഗുകൾ: ASCII, KOI-8R, CP1251] യുണൈറ്റഡ് സ്റ്റേറ്റ്സിൽ സൃഷ്ടിച്ച ആദ്യത്തെ എൻകോഡിംഗ് ടേബിളുകൾ ഒരു ബൈറ്റിൽ എട്ടാമത്തെ ബിറ്റ് ഉപയോഗിച്ചിരുന്നില്ല. ബൈറ്റുകളുടെ ഒരു ശ്രേണിയായി വാചകം പ്രതിനിധീകരിച്ചു, എന്നാൽ എട്ടാമത്തെ ബിറ്റ് കണക്കിലെടുക്കുന്നില്ല (അത് ഔദ്യോഗിക ആവശ്യങ്ങൾക്കായി ഉപയോഗിച്ചു).

പട്ടിക പൊതുവായി അംഗീകരിക്കപ്പെട്ട ഒരു മാനദണ്ഡമായി മാറിയിരിക്കുന്നു ആസ്കി(അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇൻ്റർചേഞ്ച്). ASCII പട്ടികയിലെ ആദ്യത്തെ 32 പ്രതീകങ്ങൾ (00 മുതൽ 1F വരെ) അച്ചടിക്കാത്ത പ്രതീകങ്ങൾക്കായി ഉപയോഗിച്ചു. ഒരു പ്രിൻ്റിംഗ് ഉപകരണം മുതലായവ നിയന്ത്രിക്കുന്നതിനാണ് അവ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്. ബാക്കിയുള്ളവ - 20 മുതൽ 7F വരെ - സാധാരണ (പ്രിൻ്റ് ചെയ്യാവുന്ന) പ്രതീകങ്ങളാണ്.

പട്ടിക 1 - ASCII എൻകോഡിംഗ്

ഡിസംബർഹെക്സ്ഒക്ടോചാർവിവരണം
0 0 000 ശൂന്യം
1 1 001 തലക്കെട്ടിൻ്റെ തുടക്കം
2 2 002 വാചകത്തിൻ്റെ തുടക്കം
3 3 003 വാചകത്തിൻ്റെ അവസാനം
4 4 004 പ്രക്ഷേപണത്തിൻ്റെ അവസാനം
5 5 005 അന്വേഷണം
6 6 006 അംഗീകരിക്കുക
7 7 007 മണി
8 8 010 ബാക്ക്സ്പേസ്
9 9 011 തിരശ്ചീന ടാബ്
10 012 പുതിയ വര
11 ബി 013 ലംബ ടാബ്
12 സി 014 പുതിയ പേജ്
13 ഡി 015 വണ്ടി മടക്കം
14 016 പുറത്തേക്ക് മാറ്റുക
15 എഫ് 017 മാറ്റുക
16 10 020 ഡാറ്റ ലിങ്ക് രക്ഷപ്പെടൽ
17 11 021 ഉപകരണ നിയന്ത്രണം 1
18 12 022 ഉപകരണ നിയന്ത്രണം 2
19 13 023 ഉപകരണ നിയന്ത്രണം 3
20 14 024 ഉപകരണ നിയന്ത്രണം 4
21 15 025 നെഗറ്റീവ് അംഗീകാരം
22 16 026 സിൻക്രണസ് നിഷ്‌ക്രിയം
23 17 027 ട്രാൻസ് അവസാനം. തടയുക
24 18 030 റദ്ദാക്കുക
25 19 031 ഇടത്തരം അവസാനം
26 1എ 032 പകരക്കാരൻ
27 1B 033 എസ്കേപ്പ്
28 1C 034 ഫയൽ സെപ്പറേറ്റർ
29 1D 035 ഗ്രൂപ്പ് സെപ്പറേറ്റർ
30 1ഇ 036 റെക്കോർഡ് സെപ്പറേറ്റർ
31 1F 037 യൂണിറ്റ് സെപ്പറേറ്റർ
32 20 040 സ്ഥലം
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2A 052 *
43 2B 053 +
44 2C 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3A 072 :
59 3B 073 ;
60 3C 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
ഡിസംബർഹെക്സ്ഒക്ടോചാർ
64 40 100 @
65 41 101
66 42 102 ബി
67 43 103 സി
68 44 104 ഡി
69 45 105
70 46 106 എഫ്
71 47 107 ജി
72 48 110 എച്ച്
73 49 111
74 4A 112 ജെ
75 4B 113 കെ
76 4C 114 എൽ
77 4D 115 എം
78 4E 116 എൻ
79 4F 117
80 50 120 പി
81 51 121 ക്യു
82 52 122 ആർ
83 53 123 എസ്
84 54 124 ടി
85 55 125 യു
86 56 126 വി
87 57 127 ഡബ്ല്യു
88 58 130 എക്സ്
89 59 131 വൈ
90 5A 132 Z
91 5B 133 [
92 5C 134 \
93 5D 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141
98 62 142 ബി
99 63 143 സി
100 64 144 ഡി
101 65 145
102 66 146 എഫ്
103 67 147 ജി
104 68 150 എച്ച്
105 69 151
106 6A 152 ജെ
107 6B 153 കെ
108 6C 154 എൽ
109 6D 155 എം
110 6E 156 എൻ
111 6F 157
112 70 160 പി
113 71 161 q
114 72 162 ആർ
115 73 163 എസ്
116 74 164 ടി
117 75 165 യു
118 76 166 വി
119 77 167 w
120 78 170 x
121 79 171 വൈ
122 7A 172 z
123 7B 173 {
124 7C 174 |
125 7D 175 }
126 7E 176 ~
127 7F 177 DEL

നിങ്ങൾക്ക് എളുപ്പത്തിൽ കാണാനാകുന്നതുപോലെ, ഈ എൻകോഡിംഗിൽ ലാറ്റിൻ അക്ഷരങ്ങളും ഇംഗ്ലീഷ് ഭാഷയിൽ ഉപയോഗിക്കുന്നവയും മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ. ഗണിതവും മറ്റ് സേവന ചിഹ്നങ്ങളും ഉണ്ട്. എന്നാൽ റഷ്യൻ അക്ഷരങ്ങളോ ജർമ്മനിനോ ഫ്രഞ്ചോ ആയ പ്രത്യേക ലാറ്റിൻ അക്ഷരങ്ങളോ ഇല്ല. ഇത് വിശദീകരിക്കാൻ എളുപ്പമാണ് - എൻകോഡിംഗ് പ്രത്യേകമായി ഒരു അമേരിക്കൻ സ്റ്റാൻഡേർഡ് ആയി വികസിപ്പിച്ചെടുത്തതാണ്. ലോകമെമ്പാടും കമ്പ്യൂട്ടറുകൾ ഉപയോഗിക്കാൻ തുടങ്ങിയപ്പോൾ, മറ്റ് പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യേണ്ടതുണ്ട്.

ഇത് ചെയ്യുന്നതിന്, ഓരോ ബൈറ്റിലും എട്ടാമത്തെ ബിറ്റ് ഉപയോഗിക്കാൻ തീരുമാനിച്ചു. ഇത് പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യാൻ ഉപയോഗിക്കാവുന്ന 128 മൂല്യങ്ങൾ കൂടി (80 മുതൽ FF വരെ) ലഭ്യമാക്കി. എട്ട്-ബിറ്റ് പട്ടികകളിൽ ആദ്യത്തേത് "വിപുലീകരിച്ച ASCII" ( വിപുലീകരിച്ച ASCII) - പടിഞ്ഞാറൻ യൂറോപ്പിലെ ചില ഭാഷകളിൽ ഉപയോഗിക്കുന്ന ലാറ്റിൻ അക്ഷരങ്ങളുടെ വിവിധ വകഭേദങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. സ്യൂഡോഗ്രാഫിക്സ് ഉൾപ്പെടെയുള്ള മറ്റ് അധിക ചിഹ്നങ്ങളും ഇതിൽ അടങ്ങിയിരിക്കുന്നു.

സ്‌ക്രീനിൽ ടെക്‌സ്‌റ്റ് പ്രതീകങ്ങൾ മാത്രം പ്രദർശിപ്പിച്ചുകൊണ്ട് ഗ്രാഫിക്‌സിൻ്റെ ചില സമാനതകൾ നൽകാൻ സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങൾ നിങ്ങളെ അനുവദിക്കുന്നു. ഉദാഹരണത്തിന്, ഫയൽ മാനേജ്മെൻ്റ് പ്രോഗ്രാം FAR മാനേജർ സ്യൂഡോഗ്രാഫിക്സ് ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു.

എക്സ്റ്റെൻഡഡ് ASCII പട്ടികയിൽ റഷ്യൻ അക്ഷരങ്ങളൊന്നും ഉണ്ടായിരുന്നില്ല. റഷ്യയും (മുമ്പ് യുഎസ്എസ്ആർ) മറ്റ് രാജ്യങ്ങളും സ്വന്തം എൻകോഡിംഗുകൾ സൃഷ്ടിച്ചു, അത് 8-ബിറ്റ് ടെക്സ്റ്റ് ഫയലുകളിൽ നിർദ്ദിഷ്ട "ദേശീയ" പ്രതീകങ്ങളെ പ്രതിനിധീകരിക്കുന്നത് സാധ്യമാക്കി - പോളിഷ്, ചെക്ക് ഭാഷകളുടെ ലാറ്റിൻ അക്ഷരങ്ങൾ, സിറിലിക് (റഷ്യൻ അക്ഷരങ്ങൾ ഉൾപ്പെടെ) മറ്റ് അക്ഷരമാലകൾ.

വ്യാപകമായ എല്ലാ എൻകോഡിംഗുകളിലും, ആദ്യത്തെ 127 പ്രതീകങ്ങൾ (അതായത്, എട്ടാമത്തെ ബിറ്റ് 0 ന് തുല്യമായ ബൈറ്റ് മൂല്യം) ASCII- യ്ക്ക് തുല്യമാണ്. അതിനാൽ ഒരു ASCII ഫയൽ ഈ രണ്ട് എൻകോഡിംഗുകളിലും പ്രവർത്തിക്കുന്നു; ഇംഗ്ലീഷ് ഭാഷയിലെ അക്ഷരങ്ങൾ അതേ രീതിയിൽ പ്രതിനിധീകരിക്കുന്നു.

സംഘടന ഐഎസ്ഒ(ഇൻ്റർനാഷണൽ സ്റ്റാൻഡേർഡൈസേഷൻ ഓർഗനൈസേഷൻ) ഒരു കൂട്ടം മാനദണ്ഡങ്ങൾ സ്വീകരിച്ചു ISO 8859. വ്യത്യസ്ത ഭാഷാ ഗ്രൂപ്പുകൾക്കുള്ള 8-ബിറ്റ് എൻകോഡിംഗുകൾ ഇത് നിർവ്വചിക്കുന്നു. അതിനാൽ, ഐഎസ്ഒ 8859-1 യുഎസ്എയ്ക്കും പടിഞ്ഞാറൻ യൂറോപ്പിനുമുള്ള ഒരു വിപുലീകൃത ASCII പട്ടികയാണ്. കൂടാതെ ISO 8859-5 സിറിലിക് അക്ഷരമാലയ്ക്കുള്ള ഒരു പട്ടികയാണ് (റഷ്യൻ ഉൾപ്പെടെ).

എന്നിരുന്നാലും, ചരിത്രപരമായ കാരണങ്ങളാൽ, ISO 8859-5 എൻകോഡിംഗ് റൂട്ട് എടുത്തില്ല. വാസ്തവത്തിൽ, റഷ്യൻ ഭാഷയ്ക്കായി ഇനിപ്പറയുന്ന എൻകോഡിംഗുകൾ ഉപയോഗിക്കുന്നു:

കോഡ് പേജ് 866 ( CP866), അല്ലെങ്കിൽ "ഡോസ്", അല്ലെങ്കിൽ "ഇതര GOST എൻകോഡിംഗ്". 90-കളുടെ പകുതി വരെ വ്യാപകമായി ഉപയോഗിച്ചു; ഇപ്പോൾ പരിമിതമായ അളവിൽ ഉപയോഗിക്കുന്നു. ഇൻ്റർനെറ്റിൽ ടെക്സ്റ്റുകൾ വിതരണം ചെയ്യാൻ പ്രായോഗികമായി ഉപയോഗിക്കുന്നില്ല.
- KOI-8. 70-80 കളിൽ വികസിപ്പിച്ചെടുത്തു. റഷ്യൻ ഇൻ്റർനെറ്റിൽ ഇമെയിൽ സന്ദേശങ്ങൾ കൈമാറുന്നതിനുള്ള പൊതുവായി അംഗീകരിക്കപ്പെട്ട ഒരു മാനദണ്ഡമാണിത്. ലിനക്സ് ഉൾപ്പെടെയുള്ള യുണിക്സ് കുടുംബത്തിൻ്റെ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിലും ഇത് വ്യാപകമായി ഉപയോഗിക്കുന്നു. റഷ്യൻ ഭാഷയ്ക്കായി രൂപകൽപ്പന ചെയ്ത KOI-8 പതിപ്പിനെ വിളിക്കുന്നു KOI-8R; മറ്റ് സിറിലിക് ഭാഷകൾക്ക് പതിപ്പുകളുണ്ട് (ഉദാഹരണത്തിന്, KOI8-U ഉക്രേനിയൻ ഭാഷയുടെ ഒരു പതിപ്പാണ്).
- കോഡ് പേജ് 1251, CP1251,വിൻഡോസ്-1251. വിൻഡോസിൽ റഷ്യൻ ഭാഷയെ പിന്തുണയ്ക്കുന്നതിനായി മൈക്രോസോഫ്റ്റ് വികസിപ്പിച്ചെടുത്തത്.

CP866-ൻ്റെ പ്രധാന നേട്ടം, എക്സ്റ്റെൻഡഡ് ASCII-ൽ ഉള്ള അതേ സ്ഥലങ്ങളിൽ കപട-ഗ്രാഫിക്സ് പ്രതീകങ്ങളുടെ സംരക്ഷണമായിരുന്നു; അതിനാൽ, വിദേശ ടെക്സ്റ്റ് പ്രോഗ്രാമുകൾ, ഉദാഹരണത്തിന്, പ്രശസ്തമായ നോർട്ടൺ കമാൻഡർ, മാറ്റങ്ങളില്ലാതെ പ്രവർത്തിക്കാൻ കഴിയും. CP866 ഇപ്പോൾ ടെക്സ്റ്റ് വിൻഡോകളിലോ FAR മാനേജർ ഉൾപ്പെടെയുള്ള ഫുൾ-സ്ക്രീൻ ടെക്സ്റ്റ് മോഡിലോ പ്രവർത്തിക്കുന്ന വിൻഡോസ് പ്രോഗ്രാമുകൾക്കായി ഉപയോഗിക്കുന്നു.

സമീപ വർഷങ്ങളിൽ CP866 ലെ ടെക്‌സ്‌റ്റുകൾ വളരെ വിരളമാണ് (എന്നാൽ വിൻഡോസിൽ റഷ്യൻ ഫയൽ നാമങ്ങൾ എൻകോഡ് ചെയ്യാൻ ഇത് ഉപയോഗിക്കുന്നു). അതിനാൽ, KOI-8R, CP1251 എന്നീ രണ്ട് എൻകോഡിംഗുകളിൽ ഞങ്ങൾ കൂടുതൽ വിശദമായി സംസാരിക്കും.



നിങ്ങൾക്ക് കാണാനാകുന്നതുപോലെ, CP1251 എൻകോഡിംഗ് പട്ടികയിൽ, റഷ്യൻ അക്ഷരങ്ങൾ അക്ഷരമാലാക്രമത്തിൽ ക്രമീകരിച്ചിരിക്കുന്നു (എന്നിരുന്നാലും, E എന്ന അക്ഷരം ഒഴികെ). ഈ ക്രമീകരണം കമ്പ്യൂട്ടർ പ്രോഗ്രാമുകൾ അക്ഷരമാലാക്രമത്തിൽ അടുക്കുന്നത് വളരെ എളുപ്പമാക്കുന്നു.

എന്നാൽ KOI-8R ൽ റഷ്യൻ അക്ഷരങ്ങളുടെ ക്രമം ക്രമരഹിതമായി തോന്നുന്നു. എന്നാൽ യഥാർത്ഥത്തിൽ അങ്ങനെയല്ല.

പല പഴയ പ്രോഗ്രാമുകളിലും, ടെക്സ്റ്റ് പ്രോസസ്സ് ചെയ്യുമ്പോൾ അല്ലെങ്കിൽ ട്രാൻസ്മിറ്റ് ചെയ്യുമ്പോൾ 8-ാമത്തെ ബിറ്റ് നഷ്ടപ്പെട്ടു. (ഇപ്പോൾ അത്തരം പ്രോഗ്രാമുകൾ പ്രായോഗികമായി "വംശനാശം സംഭവിച്ചു", എന്നാൽ 80 കളുടെ അവസാനത്തിൽ - 90 കളുടെ തുടക്കത്തിൽ അവ വ്യാപകമായിരുന്നു). 8-ബിറ്റ് മൂല്യത്തിൽ നിന്ന് 7-ബിറ്റ് മൂല്യം ലഭിക്കുന്നതിന്, ഏറ്റവും പ്രധാനപ്പെട്ട അക്കത്തിൽ നിന്ന് 8 കുറയ്ക്കുക; ഉദാഹരണത്തിന്, E1 61 ആയി മാറുന്നു.

ഇപ്പോൾ ASCII പട്ടികയുമായി KOI-8R താരതമ്യം ചെയ്യുക (പട്ടിക 1). റഷ്യൻ അക്ഷരങ്ങൾ ലാറ്റിൻ അക്ഷരങ്ങളുമായി വ്യക്തമായ കത്തിടപാടുകളിൽ സ്ഥാപിച്ചിരിക്കുന്നത് നിങ്ങൾ കണ്ടെത്തും. എട്ടാമത്തെ ബിറ്റ് അപ്രത്യക്ഷമായാൽ, ചെറിയ റഷ്യൻ അക്ഷരങ്ങൾ വലിയക്ഷരങ്ങളായ ലാറ്റിൻ അക്ഷരങ്ങളും വലിയക്ഷരത്തിലുള്ള റഷ്യൻ അക്ഷരങ്ങൾ ചെറിയക്ഷരം ലാറ്റിൻ അക്ഷരങ്ങളും ആയി മാറുന്നു. അതിനാൽ, KOI-8 ലെ E1 റഷ്യൻ "A" ആണ്, ASCII ൽ 61 എന്നത് ലാറ്റിൻ "a" ആണ്.

അതിനാൽ, 8-ാമത്തെ ബിറ്റ് നഷ്‌ടപ്പെടുമ്പോൾ റഷ്യൻ വാചകത്തിൻ്റെ വായനാക്ഷമത നിലനിർത്താൻ KOI-8 നിങ്ങളെ അനുവദിക്കുന്നു. "എല്ലാവർക്കും ഹലോ" എന്നത് "pRIWET WSEM" ആയി മാറുന്നു.

അടുത്തിടെ, എൻകോഡിംഗ് ടേബിളിലെ അക്ഷരങ്ങളുടെ അക്ഷരമാലാ ക്രമത്തിനും എട്ടാമത്തെ ബിറ്റ് നഷ്‌ടമായതോടെ വായനാക്ഷമതയ്ക്കും അവയുടെ നിർണായക പ്രാധാന്യം നഷ്ടപ്പെട്ടു. ആധുനിക കമ്പ്യൂട്ടറുകളിലെ എട്ടാമത്തെ ബിറ്റ് ട്രാൻസ്മിഷൻ അല്ലെങ്കിൽ പ്രോസസ്സിംഗ് സമയത്ത് നഷ്ടപ്പെടുന്നില്ല. എൻകോഡിംഗ് കണക്കിലെടുത്താണ് അക്ഷരമാല ക്രമപ്പെടുത്തൽ നടത്തുന്നത്, അല്ലാതെ കോഡുകൾ താരതമ്യം ചെയ്തല്ല. (വഴിയിൽ, CP1251 കോഡുകൾ പൂർണ്ണമായും അക്ഷരമാലാക്രമത്തിൽ ക്രമീകരിച്ചിട്ടില്ല - E എന്ന അക്ഷരം അതിൻ്റെ സ്ഥാനത്ത് ഇല്ല).

രണ്ട് സാധാരണ എൻകോഡിംഗുകൾ ഉള്ളതിനാൽ, ഇൻ്റർനെറ്റിൽ (മെയിൽ, ബ്രൗസിംഗ് വെബ് സൈറ്റുകൾ) പ്രവർത്തിക്കുമ്പോൾ, റഷ്യൻ വാചകത്തിന് പകരം നിങ്ങൾക്ക് ചിലപ്പോൾ അർത്ഥശൂന്യമായ അക്ഷരങ്ങൾ കാണാൻ കഴിയും. ഉദാഹരണത്തിന്, "ഞാൻ SBYUFEMHEL ആണ്." ഇവ "ബഹുമാനത്തോടെ" എന്ന വാക്കുകൾ മാത്രമാണ്; എന്നാൽ അവ CP1251 എൻകോഡിംഗിൽ എൻകോഡ് ചെയ്യപ്പെടുകയും KOI-8 പട്ടിക ഉപയോഗിച്ച് കമ്പ്യൂട്ടർ ടെക്സ്റ്റ് ഡീകോഡ് ചെയ്യുകയും ചെയ്തു. അതേ വാക്കുകൾ, നേരെമറിച്ച്, KOI-8-ൽ എൻകോഡ് ചെയ്യുകയും കമ്പ്യൂട്ടർ CP1251 പട്ടിക അനുസരിച്ച് ടെക്സ്റ്റ് ഡീകോഡ് ചെയ്യുകയും ചെയ്താൽ, ഫലം "U HCHBTSEOYEN" ആയിരിക്കും.

റഷ്യൻ ഭാഷയ്‌ക്കായി ഉദ്ദേശിക്കാത്ത ഒരു പട്ടിക ഉപയോഗിച്ച് ഒരു കമ്പ്യൂട്ടർ റഷ്യൻ ഭാഷാ അക്ഷരങ്ങൾ മനസ്സിലാക്കുന്നത് ചിലപ്പോൾ സംഭവിക്കുന്നു. തുടർന്ന്, റഷ്യൻ അക്ഷരങ്ങൾക്ക് പകരം, അർത്ഥമില്ലാത്ത ഒരു കൂട്ടം ചിഹ്നങ്ങൾ പ്രത്യക്ഷപ്പെടുന്നു (ഉദാഹരണത്തിന്, കിഴക്കൻ യൂറോപ്യൻ ഭാഷകളുടെ ലാറ്റിൻ അക്ഷരങ്ങൾ); അവയെ പലപ്പോഴും "ക്രോക്കോസിബ്രകൾ" എന്ന് വിളിക്കുന്നു.

മിക്ക കേസുകളിലും, ഇൻ്റർനെറ്റ് ഡോക്യുമെൻ്റുകളുടെ (ഇമെയിലുകളും വെബ് പേജുകളും) എൻകോഡിംഗുകൾ സ്വതന്ത്രമായി നിർണ്ണയിക്കുന്നത് ആധുനിക പ്രോഗ്രാമുകൾ കൈകാര്യം ചെയ്യുന്നു. എന്നാൽ ചിലപ്പോൾ അവർ "മിസ്ഫയർ", തുടർന്ന് നിങ്ങൾക്ക് റഷ്യൻ അക്ഷരങ്ങളുടെ അല്ലെങ്കിൽ "ക്രോകോസിയാബ്രി" വിചിത്രമായ ക്രമങ്ങൾ കാണാൻ കഴിയും. ചട്ടം പോലെ, അത്തരമൊരു സാഹചര്യത്തിൽ, സ്ക്രീനിൽ യഥാർത്ഥ വാചകം പ്രദർശിപ്പിക്കുന്നതിന്, പ്രോഗ്രാം മെനുവിൽ സ്വമേധയാ എൻകോഡിംഗ് തിരഞ്ഞെടുക്കാൻ മതിയാകും.

ഈ ലേഖനത്തിനായി http://open-office.edusite.ru/TextProcessor/p5aa1.html എന്ന പേജിൽ നിന്നുള്ള വിവരങ്ങൾ ഉപയോഗിച്ചു.

സൈറ്റിൽ നിന്ന് എടുത്ത മെറ്റീരിയൽ:

നിങ്ങൾക്കറിയാവുന്നതുപോലെ, ഒരു കമ്പ്യൂട്ടർ ബൈനറി രൂപത്തിൽ വിവരങ്ങൾ സംഭരിക്കുന്നു, അത് ഒന്നിൻ്റെയും പൂജ്യങ്ങളുടെയും ഒരു ശ്രേണിയായി പ്രതിനിധീകരിക്കുന്നു. മനുഷ്യ ഗ്രഹണത്തിന് സൗകര്യപ്രദമായ ഒരു രൂപത്തിലേക്ക് വിവരങ്ങൾ വിവർത്തനം ചെയ്യുന്നതിന്, ഓരോ അക്കങ്ങളുടെ അദ്വിതീയ ശ്രേണിയും പ്രദർശിപ്പിക്കുമ്പോൾ അതിൻ്റെ അനുബന്ധ ചിഹ്നം ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നു.

ബൈനറി കോഡുകളെ അച്ചടിച്ചതും നിയന്ത്രിക്കുന്നതുമായ പ്രതീകങ്ങളുമായി പരസ്പരബന്ധിതമാക്കുന്നതിനുള്ള സംവിധാനങ്ങളിലൊന്നാണ്

കമ്പ്യൂട്ടർ സാങ്കേതികവിദ്യയുടെ വികസനത്തിൻ്റെ നിലവിലെ തലത്തിൽ, ഓരോ നിർദ്ദിഷ്ട പ്രതീകത്തിൻ്റെയും കോഡ് ഉപയോക്താവിന് അറിയേണ്ടതില്ല. എന്നിരുന്നാലും, കോഡിംഗ് എങ്ങനെയാണ് നടപ്പിലാക്കുന്നത് എന്നതിനെക്കുറിച്ചുള്ള പൊതുവായ ധാരണ വളരെ ഉപയോഗപ്രദമാണ്, കൂടാതെ ചില വിഭാഗങ്ങളിലെ സ്പെഷ്യലിസ്റ്റുകൾക്ക് അത് ആവശ്യമാണ്.

ASCII സൃഷ്ടിക്കുന്നു

എൻകോഡിംഗ് യഥാർത്ഥത്തിൽ 1963 ൽ വികസിപ്പിച്ചെടുത്തു, തുടർന്ന് 25 വർഷത്തിനിടെ രണ്ടുതവണ അപ്ഡേറ്റ് ചെയ്തു.

യഥാർത്ഥ പതിപ്പിൽ, ASCII പ്രതീക പട്ടികയിൽ 128 പ്രതീകങ്ങൾ ഉൾപ്പെടുന്നു; പിന്നീട് ഒരു വിപുലീകൃത പതിപ്പ് പ്രത്യക്ഷപ്പെട്ടു, അവിടെ ആദ്യത്തെ 128 പ്രതീകങ്ങൾ സംരക്ഷിച്ചു, മുമ്പ് കാണാതായ പ്രതീകങ്ങൾ എട്ടാമത്തെ ബിറ്റ് ഉൾപ്പെട്ട കോഡുകളിലേക്ക് നിയോഗിക്കപ്പെട്ടു.

വർഷങ്ങളോളം, ഈ എൻകോഡിംഗ് ലോകത്തിലെ ഏറ്റവും ജനപ്രിയമായിരുന്നു. 2006-ൽ, ലാറ്റിൻ 1252 മുൻനിര സ്ഥാനത്തെത്തി, 2007 അവസാനം മുതൽ ഇന്നുവരെ, യൂണികോഡ് മുൻനിര സ്ഥാനം നിലനിർത്തി.

ASCII-യുടെ കമ്പ്യൂട്ടർ പ്രാതിനിധ്യം

ഓരോ ASCII പ്രതീകത്തിനും അതിൻ്റേതായ കോഡ് ഉണ്ട്, അതിൽ പൂജ്യത്തെയോ ഒന്നിനെയോ പ്രതിനിധീകരിക്കുന്ന 8 പ്രതീകങ്ങൾ അടങ്ങിയിരിക്കുന്നു. ഈ പ്രാതിനിധ്യത്തിലെ ഏറ്റവും കുറഞ്ഞ സംഖ്യ പൂജ്യമാണ് (ബൈനറി സിസ്റ്റത്തിലെ എട്ട് പൂജ്യങ്ങൾ), ഇത് പട്ടികയിലെ ആദ്യ മൂലകത്തിൻ്റെ കോഡാണ്.

സ്റ്റാൻഡേർഡ് US-ASCII-യും അതിൻ്റെ ദേശീയ വേരിയൻ്റും തമ്മിൽ മാറുന്നതിന് പട്ടികയിലെ രണ്ട് കോഡുകൾ കരുതിവച്ചിരിക്കുന്നു.

ASCII 128 അല്ല, 256 പ്രതീകങ്ങൾ ഉൾപ്പെടുത്താൻ തുടങ്ങിയതിനുശേഷം, ഒരു എൻകോഡിംഗ് വേരിയൻ്റ് വ്യാപകമായി, അതിൽ പട്ടികയുടെ യഥാർത്ഥ പതിപ്പ് 8-ാമത്തെ ബിറ്റ് പൂജ്യത്തോടെ ആദ്യത്തെ 128 കോഡുകളിൽ സംഭരിച്ചു. ദേശീയ ലിഖിത പ്രതീകങ്ങൾ പട്ടികയുടെ മുകൾ പകുതിയിൽ സൂക്ഷിച്ചിരിക്കുന്നു (സ്ഥാനങ്ങൾ 128-255).

ഉപയോക്താവിന് ASCII പ്രതീക കോഡുകൾ നേരിട്ട് അറിയേണ്ടതില്ല. ആവശ്യമെങ്കിൽ ബൈനറി സിസ്റ്റം ഉപയോഗിച്ച് അതിൻ്റെ കോഡ് കണക്കാക്കാൻ ഒരു സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർക്ക് സാധാരണയായി പട്ടികയിലെ എലമെൻ്റ് നമ്പർ മാത്രമേ അറിയൂ.

റഷ്യന് ഭാഷ

70-കളുടെ തുടക്കത്തിൽ സ്കാൻഡിനേവിയൻ ഭാഷകൾ, ചൈനീസ്, കൊറിയൻ, ഗ്രീക്ക് മുതലായവയ്ക്കുള്ള എൻകോഡിംഗുകൾ വികസിപ്പിച്ചതിനുശേഷം, സോവിയറ്റ് യൂണിയൻ സ്വന്തം പതിപ്പ് സൃഷ്ടിക്കാൻ തുടങ്ങി. താമസിയാതെ, KOI8 എന്ന 8-ബിറ്റ് എൻകോഡിംഗിൻ്റെ ഒരു പതിപ്പ് വികസിപ്പിച്ചെടുത്തു, ആദ്യത്തെ 128 ASCII പ്രതീക കോഡുകൾ സംരക്ഷിക്കുകയും ദേശീയ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾക്കും അധിക പ്രതീകങ്ങൾക്കും തുല്യമായ സ്ഥാനങ്ങൾ നൽകുകയും ചെയ്തു.

യൂണികോഡ് അവതരിപ്പിക്കുന്നതിന് മുമ്പ്, ഇൻ്റർനെറ്റിൻ്റെ റഷ്യൻ വിഭാഗത്തിൽ KOI8 ആധിപത്യം പുലർത്തിയിരുന്നു. റഷ്യൻ, ഉക്രേനിയൻ അക്ഷരമാലയ്ക്ക് എൻകോഡിംഗ് ഓപ്ഷനുകൾ ഉണ്ടായിരുന്നു.

ആസ്കി പ്രശ്നങ്ങൾ

വിപുലീകരിച്ച പട്ടികയിൽ പോലും മൂലകങ്ങളുടെ എണ്ണം 256 കവിയാത്തതിനാൽ, ഒരു എൻകോഡിംഗിൽ നിരവധി വ്യത്യസ്ത സ്ക്രിപ്റ്റുകൾ ഉൾക്കൊള്ളാനുള്ള സാധ്യതയില്ല. 90 കളിൽ, റഷ്യൻ ASCII അക്ഷരങ്ങളിൽ ടൈപ്പ് ചെയ്ത ടെക്സ്റ്റുകൾ തെറ്റായി പ്രദർശിപ്പിച്ചപ്പോൾ Runet-ൽ "crocozyabr" പ്രശ്നം പ്രത്യക്ഷപ്പെട്ടു.

വ്യത്യസ്ത ASCII കോഡുകൾ പരസ്പരം പൊരുത്തപ്പെടാത്തതായിരുന്നു പ്രശ്നം. വിവിധ പ്രതീകങ്ങൾ 128-255 സ്ഥാനങ്ങളിൽ സ്ഥിതിചെയ്യാമെന്നും ഒരു സിറിലിക് എൻകോഡിംഗ് മറ്റൊന്നിലേക്ക് മാറ്റുമ്പോൾ, വാചകത്തിൻ്റെ എല്ലാ അക്ഷരങ്ങളും എൻകോഡിംഗിൻ്റെ മറ്റൊരു പതിപ്പിൽ സമാനമായ സംഖ്യയുള്ള മറ്റുള്ളവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുമെന്നും നമുക്ക് ഓർമ്മിക്കാം.

നിലവിലുള്ള അവസ്ഥ

യൂണികോഡിൻ്റെ വരവോടെ ആസ്കിയുടെ ജനപ്രീതി കുത്തനെ കുറയാൻ തുടങ്ങി.

മിക്കവാറും എല്ലാ ലിഖിത ഭാഷകളിൽ നിന്നുമുള്ള പ്രതീകങ്ങൾ ഉൾക്കൊള്ളാൻ പുതിയ എൻകോഡിംഗ് സാധ്യമാക്കിയതാണ് ഇതിന് കാരണം. ഈ സാഹചര്യത്തിൽ, ആദ്യത്തെ 128 ASCII പ്രതീകങ്ങൾ യൂണിക്കോഡിലെ അതേ പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു.

2000-ൽ, ഇൻറർനെറ്റിലെ ഏറ്റവും ജനപ്രിയമായ എൻകോഡിംഗായിരുന്നു ASCII, ഗൂഗിൾ സൂചികയിലാക്കിയ 60% വെബ് പേജുകളിലും ഇത് ഉപയോഗിച്ചിരുന്നു. 2012 ആയപ്പോഴേക്കും അത്തരം പേജുകളുടെ വിഹിതം 17% ആയി കുറഞ്ഞു, യൂണികോഡ് (UTF-8) ഏറ്റവും ജനപ്രിയമായ എൻകോഡിംഗിൻ്റെ സ്ഥാനത്ത് എത്തി.

അതിനാൽ, വിവരസാങ്കേതികവിദ്യയുടെ ചരിത്രത്തിൻ്റെ ഒരു പ്രധാന ഭാഗമാണ് ASCII, എന്നാൽ ഭാവിയിൽ അതിൻ്റെ ഉപയോഗം വിട്ടുവീഴ്ചയില്ലാത്തതായി തോന്നുന്നു.

ഇൻ്റർനാഷണൽ ടെലികമ്മ്യൂണിക്കേഷൻ യൂണിയൻ പറയുന്നതനുസരിച്ച്, 2016 ൽ മൂന്നര ബില്യൺ ആളുകൾ കുറച്ച് ക്രമമായി ഇൻ്റർനെറ്റ് ഉപയോഗിച്ചു. പിസി അല്ലെങ്കിൽ മൊബൈൽ ഗാഡ്‌ജെറ്റുകൾ വഴി അയയ്‌ക്കുന്ന സന്ദേശങ്ങളും എല്ലാത്തരം മോണിറ്ററുകളിലും പ്രദർശിപ്പിച്ചിരിക്കുന്ന ടെക്‌സ്‌റ്റുകളും യഥാർത്ഥത്തിൽ 0, 1 എന്നിവയുടെ സംയോജനമാണെന്ന് അവരിൽ ഭൂരിഭാഗവും ചിന്തിക്കുന്നില്ല. ഈ വിവരങ്ങളുടെ പ്രാതിനിധ്യത്തെ എൻകോഡിംഗ് എന്ന് വിളിക്കുന്നു. . ഇത് അതിൻ്റെ സംഭരണം, സംസ്കരണം, പ്രക്ഷേപണം എന്നിവ ഉറപ്പാക്കുകയും സുഗമമാക്കുകയും ചെയ്യുന്നു. 1963-ൽ, അമേരിക്കൻ ASCII എൻകോഡിംഗ് വികസിപ്പിച്ചെടുത്തു, അത് ഈ ലേഖനത്തിൻ്റെ വിഷയമാണ്.

ഒരു കമ്പ്യൂട്ടറിൽ വിവരങ്ങൾ അവതരിപ്പിക്കുന്നു

ഏതൊരു ഇലക്ട്രോണിക് കമ്പ്യൂട്ടറിൻ്റെയും വീക്ഷണകോണിൽ നിന്ന്, ടെക്സ്റ്റ് എന്നത് വ്യക്തിഗത പ്രതീകങ്ങളുടെ ഒരു കൂട്ടമാണ്. വലിയ അക്ഷരങ്ങൾ ഉൾപ്പെടെയുള്ള അക്ഷരങ്ങൾ മാത്രമല്ല, വിരാമചിഹ്നങ്ങളും അക്കങ്ങളും ഇതിൽ ഉൾപ്പെടുന്നു. കൂടാതെ, പ്രത്യേക പ്രതീകങ്ങൾ "=", "&", "(" എന്നിവയും സ്പെയ്സുകളും ഉപയോഗിക്കുന്നു.

വാചകം നിർമ്മിക്കുന്ന പ്രതീകങ്ങളുടെ കൂട്ടത്തെ അക്ഷരമാല എന്നും അവയുടെ സംഖ്യയെ കാർഡിനാലിറ്റി എന്നും വിളിക്കുന്നു (N എന്ന് സൂചിപ്പിച്ചിരിക്കുന്നു). ഇത് നിർണ്ണയിക്കാൻ, N = 2^b എന്ന പദപ്രയോഗം ഉപയോഗിക്കുന്നു, ഇവിടെ b എന്നത് ബിറ്റുകളുടെ എണ്ണം അല്ലെങ്കിൽ ഒരു പ്രത്യേക ചിഹ്നത്തിൻ്റെ വിവര ഭാരമാണ്.

256 പ്രതീകങ്ങളുടെ ശേഷിയുള്ള ഒരു അക്ഷരമാലയ്ക്ക് ആവശ്യമായ എല്ലാ പ്രതീകങ്ങളെയും പ്രതിനിധീകരിക്കാൻ കഴിയുമെന്ന് തെളിയിക്കപ്പെട്ടിട്ടുണ്ട്.

256 എന്നത് രണ്ടിൻ്റെ എട്ടാമത്തെ ശക്തിയെ പ്രതിനിധീകരിക്കുന്നതിനാൽ, ഓരോ പ്രതീകത്തിൻ്റെയും ഭാരം 8 ബിറ്റുകളാണ്.

8 ബിറ്റുകളുടെ ഒരു യൂണിറ്റിനെ 1 ബൈറ്റ് എന്ന് വിളിക്കുന്നു, അതിനാൽ കമ്പ്യൂട്ടറിൽ സംഭരിച്ചിരിക്കുന്ന വാചകത്തിലെ ഏത് പ്രതീകവും ഒരു ബൈറ്റ് മെമ്മറി എടുക്കുമെന്ന് പറയുന്നത് പതിവാണ്.

കോഡിംഗ് എങ്ങനെയാണ് ചെയ്യുന്നത്?

അക്കങ്ങൾ, അക്ഷരങ്ങൾ, വിരാമചിഹ്നങ്ങൾ, മറ്റ് ചിഹ്നങ്ങൾ എന്നിവ എഴുതിയ കീബോർഡ് കീകൾ ഉപയോഗിച്ച് ഏതെങ്കിലും പാഠങ്ങൾ ഒരു വ്യക്തിഗത കമ്പ്യൂട്ടറിൻ്റെ മെമ്മറിയിലേക്ക് പ്രവേശിക്കുന്നു. അവ ബൈനറി കോഡിൽ റാമിലേക്ക് മാറ്റുന്നു, അതായത് ഓരോ പ്രതീകവും മനുഷ്യർക്ക് പരിചിതമായ ഒരു ദശാംശ കോഡുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു, 0 മുതൽ 255 വരെ, ഇത് ഒരു ബൈനറി കോഡുമായി യോജിക്കുന്നു - 00000000 മുതൽ 11111111 വരെ.

ബൈറ്റ്-ബൈറ്റ് പ്രതീക എൻകോഡിംഗ് ടെക്സ്റ്റ് പ്രോസസ്സിംഗ് നടത്തുന്ന പ്രോസസ്സറിനെ ഓരോ പ്രതീകവും വ്യക്തിഗതമായി ആക്സസ് ചെയ്യാൻ അനുവദിക്കുന്നു. അതേ സമയം, ഏതെങ്കിലും പ്രതീകാത്മക വിവരങ്ങളെ പ്രതിനിധീകരിക്കാൻ 256 പ്രതീകങ്ങൾ മതിയാകും.

ASCII പ്രതീക എൻകോഡിംഗ്

ഇംഗ്ലീഷിലെ ഈ ചുരുക്കെഴുത്ത് വിവര കൈമാറ്റത്തിനുള്ള കോഡിനെ സൂചിപ്പിക്കുന്നു.

കമ്പ്യൂട്ടർവൽക്കരണത്തിൻ്റെ ആരംഭത്തിൽ പോലും, വിവരങ്ങൾ എൻകോഡ് ചെയ്യുന്നതിന് വൈവിധ്യമാർന്ന മാർഗങ്ങൾ കൊണ്ടുവരാൻ കഴിയുമെന്ന് വ്യക്തമായി. എന്നിരുന്നാലും, ഒരു കമ്പ്യൂട്ടറിൽ നിന്ന് മറ്റൊന്നിലേക്ക് വിവരങ്ങൾ കൈമാറുന്നതിന്, ഒരു ഏകീകൃത നിലവാരം വികസിപ്പിക്കേണ്ടത് ആവശ്യമാണ്. അതിനാൽ, 1963-ൽ, ASCII എൻകോഡിംഗ് ടേബിൾ യുഎസ്എയിൽ പ്രത്യക്ഷപ്പെട്ടു. അതിൽ, കമ്പ്യൂട്ടർ അക്ഷരമാലയുടെ ഏത് ചിഹ്നവും ബൈനറി പ്രാതിനിധ്യത്തിൽ അതിൻ്റെ സീരിയൽ നമ്പറുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. ASCII യഥാർത്ഥത്തിൽ യുണൈറ്റഡ് സ്റ്റേറ്റ്സിൽ മാത്രമാണ് ഉപയോഗിച്ചിരുന്നത്, പിന്നീട് പിസികളുടെ അന്താരാഷ്ട്ര നിലവാരമായി മാറി.

ASCII കോഡുകൾ 2 ഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്നു. ഈ പട്ടികയുടെ ആദ്യ പകുതി മാത്രമാണ് അന്താരാഷ്ട്ര നിലവാരമായി കണക്കാക്കുന്നത്. 0 (00000000 ആയി കോഡ് ചെയ്‌തത്) മുതൽ 127 (01111111 കോഡ് ചെയ്‌തത്) വരെയുള്ള സീരിയൽ നമ്പറുകളുള്ള പ്രതീകങ്ങൾ ഇതിൽ ഉൾപ്പെടുന്നു.

സീരിയൽ നമ്പർ

ASCII ടെക്സ്റ്റ് എൻകോഡിംഗ്

ചിഹ്നം

0000 0000 - 0001 1111

0 മുതൽ 31 വരെയുള്ള N ഉള്ള പ്രതീകങ്ങളെ നിയന്ത്രണ പ്രതീകങ്ങൾ എന്ന് വിളിക്കുന്നു. ഒരു മോണിറ്ററിലോ പ്രിൻ്റിംഗ് ഉപകരണത്തിലോ വാചകം പ്രദർശിപ്പിക്കുക, ശബ്ദ സിഗ്നൽ നൽകുക തുടങ്ങിയവയുടെ പ്രക്രിയ "മാനേജ് ചെയ്യുക" എന്നതാണ് അവരുടെ പ്രവർത്തനം.

0010 0000 - 0111 1111

N മുതൽ 32 മുതൽ 127 വരെയുള്ള പ്രതീകങ്ങൾ (പട്ടികയുടെ സ്റ്റാൻഡേർഡ് ഭാഗം) - ലാറ്റിൻ അക്ഷരമാലയുടെ വലിയ, ചെറിയ അക്ഷരങ്ങൾ, പത്താം അക്കങ്ങൾ, വിരാമചിഹ്നങ്ങൾ, കൂടാതെ വിവിധ ബ്രാക്കറ്റുകൾ, വാണിജ്യ, മറ്റ് ചിഹ്നങ്ങൾ. 32 എന്ന പ്രതീകം ഒരു ഇടത്തെ പ്രതിനിധീകരിക്കുന്നു.

1000 0000 - 1111 1111

128 മുതൽ 255 വരെയുള്ള N ഉള്ള പ്രതീകങ്ങൾക്ക് (പട്ടികയുടെ അല്ലെങ്കിൽ കോഡ് പേജിൻ്റെ ഇതര ഭാഗം) വ്യത്യസ്ത വകഭേദങ്ങൾ ഉണ്ടാകാം, അവയിൽ ഓരോന്നിനും അതിൻ്റേതായ സംഖ്യയുണ്ട്. ലാറ്റിനിൽ നിന്ന് വ്യത്യസ്തമായ ദേശീയ അക്ഷരമാലകൾ വ്യക്തമാക്കാൻ കോഡ് പേജ് ഉപയോഗിക്കുന്നു. പ്രത്യേകിച്ചും, റഷ്യൻ പ്രതീകങ്ങൾക്കായി ASCII എൻകോഡിംഗ് നടത്തുന്നത് അതിൻ്റെ സഹായത്തോടെയാണ്.

പട്ടികയിൽ, എൻകോഡിംഗുകൾ വലിയക്ഷരമാക്കി അക്ഷരമാലാക്രമത്തിൽ പരസ്പരം പിന്തുടരുന്നു, അക്കങ്ങൾ ആരോഹണ ക്രമത്തിലാണ്. റഷ്യൻ അക്ഷരമാലയ്ക്ക് ഈ തത്വം സമാനമാണ്.

പ്രതീകങ്ങൾ നിയന്ത്രിക്കുക

ASCII എൻകോഡിംഗ് ടേബിൾ യഥാർത്ഥത്തിൽ ഒരു ടെലിടൈപ്പ് പോലെയുള്ള ദീർഘകാലമായി ഉപയോഗിക്കാത്ത ഒരു ഉപകരണം വഴി വിവരങ്ങൾ സ്വീകരിക്കുന്നതിനും കൈമാറുന്നതിനുമായി സൃഷ്ടിച്ചതാണ്. ഇക്കാര്യത്തിൽ, ഈ ഉപകരണം നിയന്ത്രിക്കുന്നതിനുള്ള കമാൻഡുകളായി ഉപയോഗിച്ചിരിക്കുന്ന പ്രതീക സെറ്റിൽ അച്ചടിക്കാനാവാത്ത പ്രതീകങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. മോഴ്സ് കോഡ് മുതലായ പ്രീ-കമ്പ്യൂട്ടർ സന്ദേശമയയ്ക്കൽ രീതികളിലും സമാനമായ കമാൻഡുകൾ ഉപയോഗിച്ചിരുന്നു.

ഏറ്റവും സാധാരണമായ ടെലിടൈപ്പ് പ്രതീകം NUL (00) ആണ്. ഒരു വരിയുടെ അവസാനം സൂചിപ്പിക്കുന്നതിന് മിക്ക പ്രോഗ്രാമിംഗ് ഭാഷകളിലും ഇത് ഇന്നും ഉപയോഗിക്കുന്നു.

ASCII എൻകോഡിംഗ് എവിടെയാണ് ഉപയോഗിക്കുന്നത്?

കീബോർഡിൽ ടെക്സ്റ്റ് വിവരങ്ങൾ നൽകുന്നതിന് മാത്രമല്ല അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ആവശ്യമാണ്. ഗ്രാഫിക്സിലും ഇത് ഉപയോഗിക്കുന്നു. പ്രത്യേകിച്ചും, ASCII ആർട്ട് മേക്കറിൽ, വിവിധ വിപുലീകരണങ്ങളുടെ ചിത്രങ്ങൾ ASCII പ്രതീകങ്ങളുടെ ഒരു സ്പെക്ട്രത്തെ പ്രതിനിധീകരിക്കുന്നു.

അത്തരം ഉൽപ്പന്നങ്ങളിൽ രണ്ട് തരം ഉണ്ട്: ചിത്രങ്ങളെ ടെക്സ്റ്റാക്കി മാറ്റുന്നതിലൂടെ ഗ്രാഫിക് എഡിറ്റർമാരുടെ പ്രവർത്തനം നിർവ്വഹിക്കുന്നവയും "ഡ്രോയിംഗുകൾ" ASCII ഗ്രാഫിക്സാക്കി മാറ്റുന്നവയും. ഉദാഹരണത്തിന്, പ്രശസ്തമായ ഇമോട്ടിക്കോൺ ഒരു എൻകോഡിംഗ് ചിഹ്നത്തിൻ്റെ ഒരു പ്രധാന ഉദാഹരണമാണ്.

ഒരു HTML പ്രമാണം സൃഷ്ടിക്കുമ്പോൾ ASCII ഉപയോഗിക്കാനും കഴിയും. ഈ സാഹചര്യത്തിൽ, നിങ്ങൾക്ക് ഒരു പ്രത്യേക സെറ്റ് പ്രതീകങ്ങൾ നൽകാം, പേജ് കാണുമ്പോൾ, ഈ കോഡുമായി പൊരുത്തപ്പെടുന്ന ഒരു ചിഹ്നം സ്ക്രീനിൽ ദൃശ്യമാകും.

ഒരു നിർദ്ദിഷ്‌ട ദേശീയ പട്ടികയിൽ ഉൾപ്പെടുത്താത്ത പ്രതീകങ്ങൾ ASCII കോഡുകൾ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്നതിനാൽ, ബഹുഭാഷാ വെബ്‌സൈറ്റുകൾ സൃഷ്‌ടിക്കുന്നതിനും ASCII ആവശ്യമാണ്.

ചില സവിശേഷതകൾ

7 ബിറ്റുകൾ ഉപയോഗിച്ച് ടെക്സ്റ്റ് വിവരങ്ങൾ എൻകോഡ് ചെയ്യാൻ ASCII ഉപയോഗിച്ചിരുന്നു (ഒന്ന് ശൂന്യമായി അവശേഷിക്കുന്നു), എന്നാൽ ഇന്ന് ഇത് 8 ബിറ്റുകളായി പ്രവർത്തിക്കുന്നു.

മുകളിലും താഴെയുമുള്ള നിരകളിൽ സ്ഥിതിചെയ്യുന്ന അക്ഷരങ്ങൾ ഒരൊറ്റ ബിറ്റിൽ മാത്രം പരസ്പരം വ്യത്യാസപ്പെട്ടിരിക്കുന്നു. ഇത് ഓഡിറ്റിൻ്റെ സങ്കീർണ്ണതയെ ഗണ്യമായി കുറയ്ക്കുന്നു.

Microsoft Office-ൽ ASCII ഉപയോഗിക്കുന്നു

ആവശ്യമെങ്കിൽ, നോട്ട്പാഡ്, ഓഫീസ് വേഡ് തുടങ്ങിയ മൈക്രോസോഫ്റ്റ് ടെക്സ്റ്റ് എഡിറ്ററുകളിൽ ഇത്തരത്തിലുള്ള ടെക്സ്റ്റ് വിവര എൻകോഡിംഗ് ഉപയോഗിക്കാം. എന്നിരുന്നാലും, ഈ സാഹചര്യത്തിൽ ടൈപ്പ് ചെയ്യുമ്പോൾ നിങ്ങൾക്ക് ചില ഫംഗ്ഷനുകൾ ഉപയോഗിക്കാൻ കഴിഞ്ഞേക്കില്ല. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് ബോൾഡ് ടെക്‌സ്‌റ്റ് ഉപയോഗിക്കാൻ കഴിയില്ല, കാരണം ASCII എൻകോഡിംഗ് വിവരങ്ങളുടെ പൊതുവായ രൂപവും രൂപവും അവഗണിച്ച് അതിൻ്റെ അർത്ഥം മാത്രം സംരക്ഷിക്കുന്നു.

സ്റ്റാൻഡേർഡൈസേഷൻ

ISO ഓർഗനൈസേഷൻ ISO 8859 മാനദണ്ഡങ്ങൾ സ്വീകരിച്ചു. ഈ ഗ്രൂപ്പ് വിവിധ ഭാഷാ ഗ്രൂപ്പുകൾക്കായി എട്ട്-ബിറ്റ് എൻകോഡിംഗുകൾ നിർവചിക്കുന്നു. പ്രത്യേകിച്ചും, ഐഎസ്ഒ 8859-1 എന്നത് യുണൈറ്റഡ് സ്റ്റേറ്റ്സിനും പടിഞ്ഞാറൻ യൂറോപ്യൻ രാജ്യങ്ങൾക്കും വേണ്ടിയുള്ള ഒരു വിപുലീകൃത ASCII പട്ടികയാണ്. കൂടാതെ റഷ്യൻ ഭാഷ ഉൾപ്പെടെയുള്ള സിറിലിക് അക്ഷരമാലയ്ക്കായി ഉപയോഗിക്കുന്ന ഒരു പട്ടികയാണ് ISO 8859-5.

ചരിത്രപരമായ നിരവധി കാരണങ്ങളാൽ, ISO 8859-5 നിലവാരം വളരെ കുറച്ച് സമയത്തേക്ക് ഉപയോഗിച്ചു.

റഷ്യൻ ഭാഷയ്ക്കായി, ഇനിപ്പറയുന്ന എൻകോഡിംഗുകൾ യഥാർത്ഥത്തിൽ ഇപ്പോൾ ഉപയോഗിക്കുന്നു:

  • CP866 (കോഡ് പേജ് 866) അല്ലെങ്കിൽ ഡോസ്,ഇതിനെ പലപ്പോഴും ഇതര GOST എൻകോഡിംഗ് എന്ന് വിളിക്കുന്നു. കഴിഞ്ഞ നൂറ്റാണ്ടിൻ്റെ 90-കളുടെ പകുതി വരെ ഇത് സജീവമായി ഉപയോഗിച്ചിരുന്നു. ഇപ്പോൾ ഇത് പ്രായോഗികമായി ഉപയോഗിക്കുന്നില്ല.
  • KOI-8. 1970-കളിലും 80-കളിലും എൻകോഡിംഗ് വികസിപ്പിച്ചെടുത്തു, നിലവിൽ RuNet-ലെ ഇമെയിൽ സന്ദേശങ്ങൾക്കുള്ള പൊതുവായി അംഗീകരിക്കപ്പെട്ട മാനദണ്ഡമാണിത്. ലിനക്സ് ഉൾപ്പെടെയുള്ള യുണിക്സ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിൽ ഇത് വ്യാപകമായി ഉപയോഗിക്കുന്നു. KOI-8 ൻ്റെ "റഷ്യൻ" പതിപ്പിനെ KOI-8R എന്ന് വിളിക്കുന്നു. കൂടാതെ, ഉക്രേനിയൻ പോലുള്ള മറ്റ് സിറിലിക് ഭാഷകൾക്ക് പതിപ്പുകളുണ്ട്.
  • കോഡ് പേജ് 1251 (CP 1251, വിൻഡോസ് - 1251).വിൻഡോസ് പരിതസ്ഥിതിയിൽ റഷ്യൻ ഭാഷയ്ക്ക് പിന്തുണ നൽകുന്നതിനായി മൈക്രോസോഫ്റ്റ് വികസിപ്പിച്ചെടുത്തത്.

ആദ്യത്തെ CP866 സ്റ്റാൻഡേർഡിൻ്റെ പ്രധാന നേട്ടം എക്സ്റ്റെൻഡഡ് ASCII-ൽ ഉള്ള അതേ സ്ഥാനങ്ങളിൽ സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങളുടെ സംരക്ഷണമായിരുന്നു. പ്രസിദ്ധമായ നോർട്ടൺ കമാൻഡർ പോലുള്ള വിദേശ നിർമ്മിത ടെക്സ്റ്റ് പ്രോഗ്രാമുകൾ പരിഷ്ക്കരണങ്ങളില്ലാതെ പ്രവർത്തിപ്പിക്കാൻ ഇത് സാധ്യമാക്കി. നിലവിൽ, പൂർണ്ണ സ്‌ക്രീൻ ടെക്‌സ്‌റ്റ് മോഡിലോ FAR മാനേജർ ഉൾപ്പെടെയുള്ള ടെക്‌സ്‌റ്റ് വിൻഡോകളിലോ പ്രവർത്തിക്കുന്ന വിൻഡോസിനായി വികസിപ്പിച്ച പ്രോഗ്രാമുകൾക്കായി CP866 ഉപയോഗിക്കുന്നു.

CP866 എൻകോഡിംഗിൽ എഴുതിയ കമ്പ്യൂട്ടർ ടെക്‌സ്‌റ്റുകൾ ഈ ദിവസങ്ങളിൽ വളരെ വിരളമാണ്, എന്നാൽ ഇത് വിൻഡോസിൽ റഷ്യൻ ഫയൽ നാമങ്ങൾക്കായി ഉപയോഗിക്കുന്ന ഒന്നാണ്.

"യൂണികോഡ്"

ഇപ്പോൾ, ഈ എൻകോഡിംഗാണ് ഏറ്റവും വ്യാപകമായി ഉപയോഗിക്കുന്നത്. യൂണികോഡ് കോഡുകൾ ഏരിയകളായി തിരിച്ചിരിക്കുന്നു. ആദ്യത്തേതിൽ (U+0000 മുതൽ U+007F വരെ) കോഡുകളുള്ള ASCII പ്രതീകങ്ങൾ ഉൾപ്പെടുന്നു. ഇതിനെ തുടർന്ന് വിവിധ ദേശീയ ലിപികളുടെ പ്രതീക മേഖലകളും വിരാമചിഹ്നങ്ങളും സാങ്കേതിക ചിഹ്നങ്ങളും. കൂടാതെ, ഭാവിയിൽ പുതിയ പ്രതീകങ്ങൾ ഉൾപ്പെടുത്തേണ്ട ആവശ്യമുണ്ടെങ്കിൽ ചില യൂണികോഡ് കോഡുകൾ റിസർവ് ചെയ്തിരിക്കുന്നു.

ASCII-ൽ, ഓരോ പ്രതീകവും 8 പൂജ്യങ്ങളുടെയും ഒന്നിൻ്റെയും സംയോജനമായാണ് പ്രതിനിധീകരിക്കുന്നതെന്ന് ഇപ്പോൾ നിങ്ങൾക്കറിയാം. സ്പെഷ്യലിസ്റ്റുകൾ അല്ലാത്തവർക്ക്, ഈ വിവരങ്ങൾ അനാവശ്യവും താൽപ്പര്യമില്ലാത്തതുമായി തോന്നിയേക്കാം, എന്നാൽ നിങ്ങളുടെ പിസിയുടെ "തലച്ചോറിൽ" എന്താണ് സംഭവിക്കുന്നതെന്ന് അറിയാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നില്ലേ?!

വഴിയിൽ, ഞങ്ങളുടെ വെബ്സൈറ്റിൽ നിങ്ങൾക്ക് ഓൺലൈൻ കോഡ് കാൽക്കുലേറ്റർ ഉപയോഗിച്ച് ഏത് ടെക്സ്റ്റും ഡെസിമൽ, ഹെക്സാഡെസിമൽ, ബൈനറി കോഡുകളായി പരിവർത്തനം ചെയ്യാൻ കഴിയും.

ASCII പട്ടിക

ASCII (അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇൻ്റർചേഞ്ച്)

ASCII കോഡുകളുടെ സംഗ്രഹ പട്ടിക

ASCII വിൻഡോസ് പ്രതീക കോഡ് പട്ടിക (Win-1251)

ചിഹ്നം

സ്പെഷ്യലിസ്റ്റ്. ടാബുലേഷൻ

സ്പെഷ്യലിസ്റ്റ്. LF (വണ്ടി മടക്കം)

സ്പെഷ്യലിസ്റ്റ്. CR (പുതിയ ലൈൻ)

ക്ലച്ച് എസ്പി (സ്പേസ്)

ചിഹ്നം

വിപുലീകരിച്ച ASCII കോഡ് പട്ടിക

ഫോർമാറ്റിംഗ് ചിഹ്നങ്ങൾ.

ബാക്ക്‌സ്‌പെയ്‌സ് (ഒരു പ്രതീകം തിരികെ നൽകുക). പ്രിൻ്റ് മെക്കാനിസം അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സർ ഒരു സ്ഥാനത്തേക്ക് പിന്നോട്ട് നീങ്ങുന്നുവെന്ന് സൂചിപ്പിക്കുന്നു.

തിരശ്ചീന ടാബുലേഷൻ. പ്രിൻ്റ് എഞ്ചിൻ്റെയോ ഡിസ്പ്ലേ കഴ്‌സറിൻ്റെയോ അടുത്ത നിർദ്ദേശിച്ച "ടാബ് സ്റ്റോപ്പിലേക്കുള്ള" ചലനത്തെ സൂചിപ്പിക്കുന്നു.

ലൈൻ ഫീഡ്. പ്രിൻ്റ് മെക്കാനിസത്തിൻ്റെ ചലനം അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സർ അടുത്ത വരിയുടെ തുടക്കത്തിലേക്ക് (ഒരു വരി താഴേക്ക്) സൂചിപ്പിക്കുന്നു.

ലംബമായ ടാബുലേഷൻ. പ്രിൻ്റ് എഞ്ചിൻ അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സറിൻ്റെ അടുത്ത ഗ്രൂപ്പിലെ വരികളുടെ ചലനത്തെ സൂചിപ്പിക്കുന്നു.

ഫോം ഫീഡ്. പ്രിൻ്റ് എഞ്ചിൻ അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സർ അടുത്ത പേജ്, ഫോം അല്ലെങ്കിൽ സ്ക്രീനിൻ്റെ ആരംഭ സ്ഥാനത്തേക്കുള്ള ചലനത്തെ സൂചിപ്പിക്കുന്നു.

വണ്ടി മടക്കം. നിലവിലെ ലൈനിൻ്റെ ഹോം (ഇടത് അറ്റത്ത്) സ്ഥാനത്തേക്ക് പ്രിൻ്റ് മെക്കാനിസത്തിൻ്റെ അല്ലെങ്കിൽ ഡിസ്പ്ലേ കഴ്സറിൻ്റെ ചലനത്തെ സൂചിപ്പിക്കുന്നു.

ഡാറ്റ കൈമാറ്റം.

തലക്കെട്ടിൻ്റെ തുടക്കം. ഒരു തലക്കെട്ടിൻ്റെ ആരംഭം നിർവചിക്കാൻ ഉപയോഗിക്കുന്നു, അതിൽ റൂട്ടിംഗ് വിവരങ്ങളോ വിലാസമോ അടങ്ങിയിരിക്കാം.

വാചകത്തിൻ്റെ തുടക്കം. വാചകത്തിൻ്റെ തുടക്കവും അതേ സമയം ശീർഷകത്തിൻ്റെ അവസാനവും കാണിക്കുന്നു.

വാചകത്തിൻ്റെ അവസാനം. STX പ്രതീകത്തിൽ ആരംഭിച്ച വാചകം അവസാനിപ്പിക്കുമ്പോൾ ബാധകമാണ്.

അന്വേഷണം. ഒരു വിദൂര സ്റ്റേഷനിൽ നിന്ന് തിരിച്ചറിയൽ ഡാറ്റയ്ക്കുള്ള അഭ്യർത്ഥന ("നിങ്ങൾ ആരാണ്?" പോലുള്ളവ).

അംഗീകരിക്കുക. ഡാറ്റയുടെ വിജയകരമായ സ്വീകരണത്തിൻ്റെ സ്ഥിരീകരണമായി സ്വീകരിക്കുന്ന ഉപകരണം അയച്ചയാൾക്ക് ഈ പ്രതീകം കൈമാറുന്നു.

നെഗറ്റീവ് അംഗീകാരം. ഡാറ്റ റിസപ്ഷൻ നിരസിച്ചാൽ (പരാജയം) സ്വീകരിക്കുന്ന ഉപകരണം അയച്ചയാൾക്ക് ഈ പ്രതീകം കൈമാറുന്നു.

സിൻക്രണസ്/നിഷ്‌ക്രിയം. സമന്വയിപ്പിച്ച ട്രാൻസ്മിഷൻ സിസ്റ്റങ്ങളിൽ ഉപയോഗിക്കുന്നു. ഡാറ്റാ ട്രാൻസ്മിഷൻ ഇല്ലെങ്കിൽ, സിൻക്രൊണൈസേഷൻ ഉറപ്പാക്കാൻ സിസ്റ്റം തുടർച്ചയായി SYN ചിഹ്നങ്ങൾ അയയ്ക്കുന്നു.

ട്രാൻസ്മിഷൻ ബ്ലോക്കിൻ്റെ അവസാനം. ആശയവിനിമയ ആവശ്യങ്ങൾക്കായി ഒരു ഡാറ്റ ബ്ലോക്കിൻ്റെ അവസാനത്തെ സൂചിപ്പിക്കുന്നു. വലിയ അളവിലുള്ള ഡാറ്റയെ പ്രത്യേക ബ്ലോക്കുകളായി വിഭജിക്കാൻ ഉപയോഗിക്കുന്നു.

വിവരങ്ങൾ കൈമാറുമ്പോൾ അടയാളങ്ങൾ വിഭജിക്കുന്നു.

മറ്റ് ചിഹ്നങ്ങൾ.

ശൂന്യം. (പ്രതീകമില്ല - ഡാറ്റയില്ല). ഡാറ്റ ഇല്ലാത്തപ്പോൾ പ്രക്ഷേപണത്തിനായി ഉപയോഗിക്കുന്നു.

ബെൽ (കോൾ). അലാറം ഉപകരണങ്ങൾ നിയന്ത്രിക്കാൻ ഉപയോഗിക്കുന്നു.

പുറത്തേക്ക് മാറ്റുക. SI പ്രതീകത്തിൻ്റെ വരവിനു മുമ്പുള്ള എല്ലാ തുടർന്നുള്ള കോഡ്‌വേഡുകളും ബാഹ്യ പ്രതീക സെറ്റ് അനുസരിച്ച് വ്യാഖ്യാനിക്കണമെന്ന് സൂചിപ്പിക്കുന്നു.

ഷിഫ്റ്റ് ഇൻ. സ്റ്റാൻഡേർഡ് ക്യാരക്ടർ സെറ്റ് അനുസരിച്ച് തുടർന്നുള്ള കോഡ് കോമ്പിനേഷനുകൾ വ്യാഖ്യാനിക്കണമെന്ന് സൂചിപ്പിക്കുന്നു.

ഡാറ്റ ലിങ്ക് എസ്കേപ്പ്. ഇനിപ്പറയുന്ന പ്രതീകങ്ങളുടെ അർത്ഥം മാറ്റുന്നു. അധിക നിയന്ത്രണത്തിനോ ബിറ്റുകളുടെ ഏകപക്ഷീയമായ സംയോജനം സംപ്രേഷണം ചെയ്യാനോ ഉപയോഗിക്കുന്നു.

DC1, DC2, DC3, DC4

ഉപകരണ നിയന്ത്രണങ്ങൾ. ഓക്സിലറി ഉപകരണങ്ങൾ പ്രവർത്തിപ്പിക്കുന്നതിനുള്ള ചിഹ്നങ്ങൾ (പ്രത്യേക പ്രവർത്തനങ്ങൾ).

റദ്ദാക്കുക. ഒരു സന്ദേശത്തിലോ ബ്ലോക്കിലോ ഈ പ്രതീകത്തിന് മുമ്പുള്ള ഡാറ്റ അവഗണിക്കണമെന്ന് സൂചിപ്പിക്കുന്നു (സാധാരണയായി ഒരു പിശക് കണ്ടെത്തിയാൽ).

ഇടത്തരം അവസാനം. ഒരു ടേപ്പ് അല്ലെങ്കിൽ മറ്റ് സ്റ്റോറേജ് മീഡിയത്തിൻ്റെ ഭൗതിക അവസാനം സൂചിപ്പിക്കുന്നു

പകരക്കാരൻ. തെറ്റായ അല്ലെങ്കിൽ അസാധുവായ പ്രതീകം മാറ്റിസ്ഥാപിക്കാൻ ഉപയോഗിക്കുന്നു.

എസ്കേപ്പ് (വിപുലീകരണം). തുടർന്നുള്ള പ്രതീകത്തിന് ഒരു ഇതര അർത്ഥമുണ്ടെന്ന് സൂചിപ്പിച്ചുകൊണ്ട് കോഡ് വികസിപ്പിക്കാൻ ഉപയോഗിക്കുന്നു.

സ്ഥലം. പദങ്ങൾ വേർതിരിക്കുന്നതിനോ പ്രിൻ്റ് എഞ്ചിൻ നീക്കുന്നതിനോ കഴ്‌സർ ഒരു സ്ഥാനത്തേക്ക് പ്രദർശിപ്പിക്കുന്നതിനോ ഉപയോഗിക്കുന്ന പ്രിൻ്റ് ചെയ്യാത്ത പ്രതീകം.

ഇല്ലാതാക്കുക. ഒരു സന്ദേശത്തിലെ മുമ്പത്തെ പ്രതീകം നീക്കം ചെയ്യാൻ (മായ്ക്കാൻ) ഉപയോഗിക്കുന്നു

ഓരോ കമ്പ്യൂട്ടറിനും അതിൻ്റേതായ പ്രതീകങ്ങൾ ഉണ്ട്, അത് നടപ്പിലാക്കുന്നു. ഈ സെറ്റിൽ 26 വലിയ, ചെറിയ അക്ഷരങ്ങൾ, അക്കങ്ങൾ, പ്രത്യേക പ്രതീകങ്ങൾ (ഡോട്ട്, സ്പേസ് മുതലായവ) അടങ്ങിയിരിക്കുന്നു. പൂർണ്ണസംഖ്യകളിലേക്ക് പരിവർത്തനം ചെയ്യുമ്പോൾ, ചിഹ്നങ്ങളെ കോഡുകൾ എന്ന് വിളിക്കുന്നു. കംപ്യൂട്ടറുകൾക്ക് ഒരേ കോഡുകൾ ഉണ്ടായിരിക്കുന്ന തരത്തിൽ മാനദണ്ഡങ്ങൾ വികസിപ്പിച്ചെടുത്തു.

ASCII നിലവാരം

വിവര കൈമാറ്റത്തിനുള്ള ഒരു അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡാണ് ASCII (അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇൻ്റർചേഞ്ച്). ഓരോ ASCII പ്രതീകത്തിനും 7 ബിറ്റുകൾ ഉണ്ട്, അതിനാൽ പരമാവധി പ്രതീകങ്ങളുടെ എണ്ണം 128 ആണ് (പട്ടിക 1). 0 മുതൽ 1F വരെയുള്ള കോഡുകൾ പ്രിൻ്റ് ചെയ്യാത്ത നിയന്ത്രണ പ്രതീകങ്ങളാണ്. പ്രിൻ്റ് ചെയ്യാനാവാത്ത നിരവധി ASCII പ്രതീകങ്ങൾ ഡാറ്റ കൈമാറാൻ ആവശ്യമാണ്. ഉദാഹരണത്തിന്, ഒരു സന്ദേശത്തിൽ സ്റ്റാർട്ട്-ഓഫ്-ഹെഡർ പ്രതീകം SOH, ഹെഡർ തന്നെയും ടെക്‌സ്‌റ്റ് സ്റ്റാർട്ട് ഓഫ് ടെക്‌സ്‌റ്റ് പ്രതീകം STX, ടെക്‌സ്‌റ്റ് തന്നെയും ടെക്‌സ്‌റ്റിൻ്റെ അവസാന പ്രതീകമായ ETX, എൻഡ്-ഓഫ്-ട്രാൻസ്മിഷൻ എന്നിവയും അടങ്ങിയിരിക്കാം. പ്രതീകം EOT. എന്നിരുന്നാലും, നെറ്റ്‌വർക്കിലൂടെയുള്ള ഡാറ്റ പാക്കറ്റുകളിൽ കൈമാറ്റം ചെയ്യപ്പെടുന്നു, അവ പ്രക്ഷേപണത്തിൻ്റെ തുടക്കത്തിനും അവസാനത്തിനും ഉത്തരവാദികളാണ്. അതിനാൽ അച്ചടിക്കാനാവാത്ത പ്രതീകങ്ങൾ മിക്കവാറും ഉപയോഗിക്കില്ല.

പട്ടിക 1 - ASCII കോഡ് പട്ടിക

നമ്പർ ടീം അർത്ഥം നമ്പർ ടീം അർത്ഥം
0 NUL നൾ പോയിൻ്റർ 10 DLE ട്രാൻസ്മിഷൻ സിസ്റ്റത്തിൽ നിന്ന് പുറത്തുകടക്കുക
1 SOH ശീർഷകത്തിൻ്റെ തുടക്കം 11 DC1 ഉപകരണ മാനേജ്മെൻ്റ്
2 എസ്.ടി.എക്സ് വാചകത്തിൻ്റെ തുടക്കം 12 DC2 ഉപകരണ മാനേജ്മെൻ്റ്
3 ETX വാചകത്തിൻ്റെ അവസാനം 13 DC3 ഉപകരണ മാനേജ്മെൻ്റ്
4 EOT പ്രക്ഷേപണത്തിൻ്റെ അവസാനം 14 DC4 ഉപകരണ മാനേജ്മെൻ്റ്
5 എ.സി.കെ അഭ്യർത്ഥിക്കുക 15 എൻ.എ.കെ. സ്വീകരണം സ്ഥിരീകരിക്കാത്തത്
6 BEL സ്വീകാര്യത സ്ഥിരീകരണം 16 SYN ലളിതം
7 ബി.എസ്. മണി ചിഹ്നം 17 ഇ.ടി.ബി ട്രാൻസ്മിഷൻ ബ്ലോക്കിൻ്റെ അവസാനം
8 HT പിന്നോട്ട് മാറുക 18 CAN അടയാളപ്പെടുത്തുക
9 എൽ.എഫ് തിരശ്ചീന പട്ടിക 19 ഇ.എം. മാധ്യമങ്ങളുടെ അവസാനം
വി.ടി വരി വിവർത്തനം 1എ SUB സബ്സ്ക്രിപ്റ്റ്
ബി എഫ്.എഫ് ലംബ ടാബ് 1B ഇഎസ്സി പുറത്ത്
സി CR പേജ് വിവർത്തനം 1C എഫ്.എസ് ഫയൽ സെപ്പറേറ്റർ
ഡി SO വണ്ടി മടക്കം 1D ജി.എസ്. ഗ്രൂപ്പ് സെപ്പറേറ്റർ
എസ്.ഐ. അധിക രജിസ്റ്ററിലേക്ക് മാറുക 1ഇ ആർ.എസ്. റെക്കോർഡ് സെപ്പറേറ്റർ
എസ്.ഐ. സാധാരണ കേസിലേക്ക് മാറുക 1F യു.എസ് മൊഡ്യൂൾ സെപ്പറേറ്റർ
നമ്പർ ചിഹ്നം നമ്പർ ചിഹ്നം നമ്പർ ചിഹ്നം നമ്പർ ചിഹ്നം നമ്പർ ചിഹ്നം നമ്പർ ചിഹ്നം
20 സ്ഥലം 30 0 40 @ 50 പി 60 . 70 പി
21 ! 31 1 41 51 ക്യു 61 71 q
22 32 2 42 ബി 52 ആർ 62 ബി 72 ആർ
23 # 33 3 43 സി 53 എസ് 63 സി 73 എസ്
24 φ 34 4 44 ഡി 54 ടി 64 ഡി 74 ടി
25 % 35 5 45 55 ഒപ്പം 65 75 ഒപ്പം
26 & 36 6 46 എഫ് 56 വി 66 എഫ് 76 വി
27 37 7 47 ജി 57 ഡബ്ല്യു 67 ജി 77 w
28 ( 38 8 48 എച്ച് 58 എക്സ് 68 എച്ച് 78 x
29 ) 39 9 49 59 വൈ 69 70 വൈ
2A 3A ; 4A ജെ 5A Z 6A ജെ 7A z
2B + 3B ; 4B കെ 5B [ 6B കെ 7B {
2C 3C < 4C എൽ 5C \ 6C എൽ 7C |
2D 3D = 4D എം 5D ] 6D എം 7D }
2E 3E > 4E എൻ 5E 6E എൻ 7E ~
2F / 3F ജി 4F 5F _ 6F 7F DEL

യൂണികോഡ് സ്റ്റാൻഡേർഡ്

മുമ്പത്തെ എൻകോഡിംഗ് ഇംഗ്ലീഷിന് മികച്ചതാണ്, എന്നാൽ മറ്റ് ഭാഷകൾക്ക് ഇത് സൗകര്യപ്രദമല്ല. ഉദാഹരണത്തിന്, ജർമ്മൻ ഭാഷയിൽ ഉംലൗട്ടുകൾ ഉണ്ട്, ഫ്രഞ്ചിൽ സൂപ്പർസ്ക്രിപ്റ്റുകൾ ഉണ്ട്. ചില ഭാഷകൾക്ക് തികച്ചും വ്യത്യസ്തമായ അക്ഷരമാലകളുണ്ട്. ASCII വിപുലീകരിക്കുന്നതിനുള്ള ആദ്യ ശ്രമം IS646 ആയിരുന്നു, ഇത് മുൻ എൻകോഡിംഗിനെ 128 പ്രതീകങ്ങൾ കൂടി വർദ്ധിപ്പിച്ചു. സ്ട്രോക്കുകളും ഡയക്രിറ്റിക്സും ഉള്ള ലാറ്റിൻ അക്ഷരങ്ങൾ ചേർത്തു, പേര് ലഭിച്ചു - ലാറ്റിൻ 1. അടുത്ത ശ്രമം IS 8859 ആയിരുന്നു - അതിൽ ഒരു കോഡ് പേജ് ഉണ്ടായിരുന്നു. വിപുലീകരണത്തിനുള്ള ശ്രമങ്ങളും ഉണ്ടായിരുന്നു, എന്നാൽ ഇത് സാർവത്രികമായിരുന്നില്ല. UNICODE എൻകോഡിംഗ് സൃഷ്ടിച്ചു (10646 ആണ്). എൻകോഡിംഗിൻ്റെ പിന്നിലെ ആശയം, ഓരോ പ്രതീകത്തിനും ഒരൊറ്റ സ്ഥിരമായ 16-ബിറ്റ് മൂല്യം നൽകുക എന്നതാണ്, അതിനെ വിളിക്കുന്നത് - കോഡ് പോയിൻ്റർ. മൊത്തത്തിൽ 65536 പോയിൻ്ററുകൾ ഉണ്ട്. സ്ഥലം ലാഭിക്കുന്നതിന്, 0 -255 കോഡുകൾക്കായി ഞങ്ങൾ ലാറ്റിൻ-1 ഉപയോഗിച്ചു, ASII UNICODE-ലേക്ക് എളുപ്പത്തിൽ മാറ്റുന്നു. ഈ മാനദണ്ഡം നിരവധി പ്രശ്നങ്ങൾ പരിഹരിച്ചു, പക്ഷേ എല്ലാം അല്ല. പുതിയ വാക്കുകളുടെ വരവ് കാരണം, ഉദാഹരണത്തിന്, ജാപ്പനീസ് ഭാഷയ്ക്ക്, പദങ്ങളുടെ എണ്ണം ഏകദേശം 20 ആയിരം വർദ്ധിപ്പിക്കേണ്ടത് ആവശ്യമാണ്.ബ്രെയ്ലി ഉൾപ്പെടുത്തേണ്ടതും ആവശ്യമാണ്.