Jedwali la kanuni za kawaida. Maelezo ya maandishi ya kusimba

[Usimbaji wa biti 8: ASCII, KOI-8R na CP1251] Majedwali ya kwanza ya usimbaji yaliyoundwa Marekani hayakutumia biti ya nane kwa baiti. Maandishi yaliwakilishwa kama mlolongo wa baiti, lakini biti ya nane haikuzingatiwa (ilitumiwa kwa madhumuni rasmi).

Jedwali limekuwa kiwango kinachokubalika kwa ujumla ASCII(Msimbo Wastani wa Marekani wa Kubadilishana Habari). Herufi 32 za kwanza za jedwali la ASCII (00 hadi 1F) zilitumika kwa herufi zisizochapisha. Ziliundwa kudhibiti kifaa cha uchapishaji, nk. Zilizobaki - kutoka 20 hadi 7F - ni herufi za kawaida (zinazoweza kuchapishwa).

Jedwali 1 - usimbaji wa ASCII

DesHexOktCharMaelezo
0 0 000 null
1 1 001 kuanza kwa kichwa
2 2 002 mwanzo wa maandishi
3 3 003 mwisho wa maandishi
4 4 004 mwisho wa maambukizi
5 5 005 uchunguzi
6 6 006 Tambua
7 7 007 kengele
8 8 010 nafasi ya nyuma
9 9 011 kichupo cha mlalo
10 A 012 mstari mpya
11 B 013 kichupo cha wima
12 C 014 ukurasa mpya
13 D 015 kurudi kwa gari
14 E 016 kuhama nje
15 F 017 kuhama katika
16 10 020 kutoroka kwa kiungo cha data
17 11 021 udhibiti wa kifaa 1
18 12 022 udhibiti wa kifaa 2
19 13 023 udhibiti wa kifaa 3
20 14 024 udhibiti wa kifaa 4
21 15 025 kukiri hasi
22 16 026 uvivu wa synchronous
23 17 027 mwisho wa trans. kuzuia
24 18 030 ghairi
25 19 031 mwisho wa kati
26 1A 032 mbadala
27 1B 033 kutoroka
28 1C 034 kitenganishi cha faili
29 1D 035 kitenganishi cha kikundi
30 1E 036 kitenganishi cha rekodi
31 1F 037 kitenganishi cha kitengo
32 20 040 nafasi
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2A 052 *
43 2B 053 +
44 2C 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3A 072 :
59 3B 073 ;
60 3C 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
DesHexOktChar
64 40 100 @
65 41 101 A
66 42 102 B
67 43 103 C
68 44 104 D
69 45 105 E
70 46 106 F
71 47 107 G
72 48 110 H
73 49 111 I
74 4A 112 J
75 4B 113 K
76 4C 114 L
77 4D 115 M
78 4E 116 N
79 4F 117 O
80 50 120 P
81 51 121 Q
82 52 122 R
83 53 123 S
84 54 124 T
85 55 125 U
86 56 126 V
87 57 127 W
88 58 130 X
89 59 131 Y
90 5A 132 Z
91 5B 133 [
92 5C 134 \
93 5D 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141 a
98 62 142 b
99 63 143 c
100 64 144 d
101 65 145 e
102 66 146 f
103 67 147 g
104 68 150 h
105 69 151 i
106 6A 152 j
107 6B 153 k
108 6C 154 l
109 6D 155 m
110 6E 156 n
111 6F 157 o
112 70 160 uk
113 71 161 q
114 72 162 r
115 73 163 s
116 74 164 t
117 75 165 u
118 76 166 v
119 77 167 w
120 78 170 x
121 79 171 y
122 7A 172 z
123 7B 173 {
124 7C 174 |
125 7D 175 }
126 7E 176 ~
127 7F 177 DEL

Kama unavyoona kwa urahisi, usimbaji huu una herufi za Kilatini pekee, na zile zinazotumika katika lugha ya Kiingereza. Pia kuna alama za hesabu na huduma zingine. Lakini hakuna herufi za Kirusi, wala hata zile za Kilatini maalum kwa Kijerumani au Kifaransa. Hili ni rahisi kuelezea - ​​usimbaji ulitengenezwa mahsusi kama kiwango cha Amerika. Kompyuta zilipoanza kutumika ulimwenguni kote, wahusika wengine walihitaji kusimba.

Ili kufanya hivyo, iliamuliwa kutumia kidogo ya nane katika kila byte. Hii ilifanya thamani 128 zaidi kupatikana (kutoka 80 hadi FF) ambazo zinaweza kutumika kusimba herufi. Jedwali la kwanza kati ya nane ni "ASCII iliyopanuliwa" ( ASCII iliyopanuliwa) - ilijumuisha anuwai anuwai za herufi za Kilatini zinazotumiwa katika lugha zingine za Uropa Magharibi. Pia ilikuwa na alama nyingine za ziada, ikiwa ni pamoja na pseudographics.

Herufi za uwongo hukuruhusu kutoa mfano fulani wa michoro kwa kuonyesha herufi za maandishi pekee kwenye skrini. Kwa mfano, programu ya usimamizi wa faili Meneja wa FAR hufanya kazi kwa kutumia pseudographics.

Hakukuwa na herufi za Kirusi kwenye jedwali la ASCII Iliyoongezwa. Urusi (zamani USSR) na nchi zingine ziliunda usimbaji wao wenyewe ambao ulifanya iwezekane kuwakilisha herufi maalum za "kitaifa" katika faili za maandishi-8 - herufi za Kilatini za lugha za Kipolishi na Kicheki, Kisirili (pamoja na herufi za Kirusi) na alfabeti zingine.

Katika usimbaji wote ambao umeenea, herufi 127 za kwanza (yaani, thamani ya baiti na biti ya nane sawa na 0) ni sawa na ASCII. Kwa hivyo faili ya ASCII inafanya kazi katika mojawapo ya usimbaji huu; Herufi za lugha ya Kiingereza zinawakilishwa kwa njia ile ile.

Shirika ISO(Shirika la Kimataifa la Viwango) lilipitisha kundi la viwango ISO 8859. Inafafanua usimbaji wa 8-bit kwa vikundi tofauti vya lugha. Kwa hivyo, ISO 8859-1 ni jedwali la ASCII Iliyoongezwa kwa Marekani na Ulaya Magharibi. Na ISO 8859-5 ni jedwali la alfabeti ya Cyrillic (ikiwa ni pamoja na Kirusi).

Hata hivyo, kwa sababu za kihistoria, usimbaji wa ISO 8859-5 haukuchukua mizizi. Kwa kweli, encodings zifuatazo hutumiwa kwa lugha ya Kirusi:

Kanuni Ukurasa 866 ( CP866), aka "DOS", aka "usimbaji mbadala wa GOST". Inatumika sana hadi katikati ya miaka ya 90; sasa inatumika kwa kiwango kidogo. Kivitendo haitumiki kwa kusambaza maandishi kwenye mtandao.
- KOI-8. Iliyoundwa katika miaka ya 70-80. Ni kiwango kinachokubalika kwa ujumla cha kutuma ujumbe wa barua pepe kwenye mtandao wa Kirusi. Pia hutumiwa sana katika mifumo ya uendeshaji ya familia ya Unix, ikiwa ni pamoja na Linux. Toleo la KOI-8, iliyoundwa kwa Kirusi, linaitwa KOI-8R; Kuna matoleo ya lugha zingine za Cyrillic (kwa mfano, KOI8-U ni toleo la lugha ya Kiukreni).
- Kanuni Ukurasa 1251, CP1251,Windows-1251. Iliyoundwa na Microsoft kusaidia lugha ya Kirusi katika Windows.

Faida kuu ya CP866 ilikuwa uhifadhi wa wahusika wa picha za uwongo katika maeneo sawa na katika ASCII Iliyoongezwa; kwa hiyo, mipango ya maandishi ya kigeni, kwa mfano, Kamanda maarufu wa Norton, inaweza kufanya kazi bila mabadiliko. CP866 sasa inatumika kwa programu za Windows zinazoendeshwa katika madirisha ya maandishi au hali ya maandishi ya skrini nzima, pamoja na Kidhibiti cha FAR.

Maandishi katika CP866 yamekuwa nadra sana katika miaka ya hivi karibuni (lakini hutumiwa kusimba majina ya faili za Kirusi katika Windows). Kwa hiyo, tutakaa kwa undani zaidi juu ya encodings nyingine mbili - KOI-8R na CP1251.



Kama unaweza kuona, katika jedwali la encoding la CP1251, barua za Kirusi zimepangwa kwa utaratibu wa alfabeti (isipokuwa, hata hivyo, ya barua E). Mpangilio huu hufanya iwe rahisi sana kwa programu za kompyuta kupanga kwa alfabeti.

Lakini katika KOI-8R utaratibu wa barua za Kirusi unaonekana bila mpangilio. Lakini kwa kweli sivyo.

Katika programu nyingi za zamani, biti ya 8 ilipotea wakati wa kuchakata au kusambaza maandishi. (Sasa programu kama hizo "zimetoweka", lakini mwishoni mwa miaka ya 80 - mapema miaka ya 90 zilienea). Ili kupata thamani ya biti-7 kutoka kwa thamani ya 8-bit, toa tu 8 kutoka kwa tarakimu muhimu zaidi; kwa mfano, E1 inakuwa 61.

Sasa linganisha KOI-8R na jedwali la ASCII (Jedwali 1). Utapata kwamba herufi za Kirusi zimewekwa katika mawasiliano ya wazi na zile za Kilatini. Ikiwa sehemu ya nane itatoweka, herufi ndogo za Kirusi zinageuka kuwa herufi kubwa za Kilatini, na herufi kubwa za Kirusi zinageuka kuwa herufi ndogo za Kilatini. Kwa hivyo, E1 katika KOI-8 ni Kirusi "A", wakati 61 katika ASCII ni Kilatini "a".

Kwa hiyo, KOI-8 inakuwezesha kudumisha usomaji wa maandishi ya Kirusi wakati bit 8 inapotea. "Hujambo kila mtu" inakuwa "pRIWET WSEM".

Hivi majuzi, mpangilio wa herufi katika jedwali la usimbaji na usomaji na upotezaji wa biti ya 8 umepoteza umuhimu wao thabiti. Kidogo cha nane katika kompyuta za kisasa hazipotee wakati wa maambukizi au usindikaji. Na upangaji wa kialfabeti unafanywa kwa kuzingatia usimbaji, na si kwa kulinganisha tu misimbo. (Kwa njia, kanuni za CP1251 hazipangwa kabisa kwa alfabeti - barua E haipo mahali pake).

Kutokana na ukweli kwamba kuna encodings mbili za kawaida, wakati wa kufanya kazi na mtandao (barua, kuvinjari Tovuti), wakati mwingine unaweza kuona seti isiyo na maana ya barua badala ya maandishi ya Kirusi. Kwa mfano, “MIMI NI SBYUFEMHEL.” Haya ni maneno tu "kwa heshima"; lakini zilisimbwa katika usimbaji wa CP1251, na kompyuta ikasimbua maandishi kwa kutumia jedwali la KOI-8. Ikiwa maneno sawa, kinyume chake, yamesimbwa katika KOI-8, na kompyuta ikaamua maandishi kulingana na jedwali la CP1251, matokeo yatakuwa "U HCHBTSEOYEN".

Wakati mwingine hutokea kwamba kompyuta inafafanua barua za lugha ya Kirusi kwa kutumia meza isiyokusudiwa kwa lugha ya Kirusi. Kisha, badala ya barua za Kirusi, seti isiyo na maana ya alama inaonekana (kwa mfano, barua za Kilatini za lugha za Mashariki ya Ulaya); mara nyingi huitwa "crocozybras".

Mara nyingi, mipango ya kisasa inakabiliana na kuamua encodings ya nyaraka za mtandao (barua pepe na kurasa za Wavuti) kwa kujitegemea. Lakini wakati mwingine "huota vibaya", na kisha unaweza kuona mlolongo wa ajabu wa herufi za Kirusi au "krokozyabry". Kama sheria, katika hali kama hiyo, ili kuonyesha maandishi halisi kwenye skrini, inatosha kuchagua usimbuaji kwa mikono kwenye menyu ya programu.

Taarifa kutoka kwa ukurasa http://open-office.edusite.ru/TextProcessor/p5aa1.html ilitumiwa kwa makala hii.

Nyenzo zilizochukuliwa kutoka kwa wavuti:

Kama unavyojua, kompyuta huhifadhi habari katika mfumo wa binary, inayowakilisha kama mlolongo wa moja na sufuri. Ili kutafsiri habari katika fomu inayofaa kwa mtazamo wa mwanadamu, kila mlolongo wa kipekee wa nambari hubadilishwa na ishara inayolingana inapoonyeshwa.

Mojawapo ya mifumo ya kuunganisha misimbo ya binary na herufi zilizochapishwa na kudhibiti ni

Katika kiwango cha sasa cha maendeleo ya teknolojia ya kompyuta, mtumiaji hatakiwi kujua kanuni za kila tabia maalum. Walakini, uelewa wa jumla wa jinsi uwekaji misimbo unafanywa ni muhimu sana, na kwa aina fulani za wataalam, hata ni muhimu.

Kutengeneza ASCII

Usimbaji ulianzishwa hapo awali mnamo 1963 na kisha kusasishwa mara mbili kwa kipindi cha miaka 25.

Katika toleo la asili, jedwali la wahusika wa ASCII lilijumuisha herufi 128; baadaye toleo lililopanuliwa lilionekana, ambapo herufi 128 za kwanza zilihifadhiwa, na herufi zilizokosekana hapo awali zilipewa nambari na sehemu ya nane iliyohusika.

Kwa miaka mingi, encoding hii ilikuwa maarufu zaidi duniani. Mnamo 2006, Kilatini 1252 ilichukua nafasi ya kuongoza, na kutoka mwisho wa 2007 hadi sasa, Unicode imeshikilia nafasi ya kuongoza.

Uwakilishi wa kompyuta wa ASCII

Kila herufi ya ASCII ina msimbo wake, unaojumuisha herufi 8 zinazowakilisha sifuri au moja. Nambari ya chini katika uwakilishi huu ni sifuri (zero nane katika mfumo wa binary), ambayo ni msimbo wa kipengele cha kwanza kwenye jedwali.

Misimbo miwili kwenye jedwali ilihifadhiwa kwa kubadili kati ya kawaida ya US-ASCII na lahaja yake ya kitaifa.

Baada ya ASCII kuanza kujumuisha sio 128, lakini herufi 256, lahaja ya usimbuaji ilienea, ambayo toleo la asili la jedwali lilihifadhiwa katika nambari 128 za kwanza na sifuri ya 8. Herufi zilizoandikwa za kitaifa zilihifadhiwa katika nusu ya juu ya jedwali (nafasi 128-255).

Mtumiaji haitaji kujua nambari za herufi za ASCII moja kwa moja. Msanidi programu kwa kawaida anahitaji tu kujua nambari ya kipengele kwenye jedwali ili kukokotoa msimbo wake kwa kutumia mfumo wa jozi ikiwa ni lazima.

Lugha ya Kirusi

Baada ya maendeleo ya encodings kwa lugha za Scandinavia, Kichina, Kikorea, Kigiriki, nk katika miaka ya 70 ya mapema, Umoja wa Kisovyeti ulianza kuunda toleo lake. Hivi karibuni, toleo la usimbaji wa 8-bit linaloitwa KOI8 lilitengenezwa, kuhifadhi nambari za kwanza za herufi 128 za ASCII na kutenga idadi sawa ya nafasi kwa herufi za alfabeti ya kitaifa na herufi za ziada.

Kabla ya kuanzishwa kwa Unicode, KOI8 ilitawala sehemu ya Kirusi ya mtandao. Kulikuwa na chaguzi za usimbaji kwa alfabeti ya Kirusi na Kiukreni.

matatizo ya ASCII

Kwa kuwa idadi ya vipengele hata katika meza iliyopanuliwa haikuzidi 256, hakukuwa na uwezekano wa kuzingatia maandiko kadhaa tofauti katika encoding moja. Katika miaka ya 90, tatizo la "crocozyabr" lilionekana kwenye Runet, wakati maandiko yaliyoandikwa katika wahusika wa Kirusi ASCII yalionyeshwa vibaya.

Shida ilikuwa kwamba nambari tofauti za ASCII hazikulingana. Hebu tukumbuke kwamba wahusika mbalimbali wanaweza kuwa katika nafasi 128-255, na wakati wa kubadilisha encoding moja ya Cyrillic hadi nyingine, barua zote za maandishi zilibadilishwa na wengine kuwa na nambari inayofanana katika toleo tofauti la encoding.

Hali ya sasa

Pamoja na ujio wa Unicode, umaarufu wa ASCII ulianza kupungua sana.

Sababu ya hii iko katika ukweli kwamba encoding mpya ilifanya iwezekane kuchukua wahusika kutoka karibu lugha zote zilizoandikwa. Katika kesi hii, herufi 128 za kwanza za ASCII zinalingana na herufi sawa katika Unicode.

Mnamo mwaka wa 2000, ASCII ilikuwa usimbaji maarufu zaidi kwenye Mtandao na ilitumiwa kwenye 60% ya kurasa za wavuti zilizoorodheshwa na Google. Kufikia 2012, sehemu ya kurasa kama hizo ilikuwa imeshuka hadi 17%, na Unicode (UTF-8) ilichukua nafasi ya encoding maarufu zaidi.

Kwa hivyo, ASCII ni sehemu muhimu ya historia ya teknolojia ya habari, lakini matumizi yake katika siku zijazo inaonekana kuwa hayana matumaini.

Kulingana na Muungano wa Kimataifa wa Mawasiliano, mwaka wa 2016, watu bilioni tatu na nusu walitumia Intaneti kwa ukawaida. Wengi wao hawafikirii hata juu ya ukweli kwamba ujumbe wowote wanaotuma kupitia PC au gadgets za simu, pamoja na maandishi ambayo yanaonyeshwa kwenye kila aina ya wachunguzi, kwa kweli ni mchanganyiko wa 0 na 1. Uwakilishi huu wa habari unaitwa encoding. . Inahakikisha na kuwezesha sana uhifadhi wake, usindikaji na maambukizi. Mnamo 1963, encoding ya Amerika ya ASCII ilitengenezwa, ambayo ndio mada ya nakala hii.

Kuwasilisha habari kwenye kompyuta

Kutoka kwa mtazamo wa kompyuta yoyote ya elektroniki, maandishi ni seti ya wahusika binafsi. Hizi ni pamoja na sio barua tu, ikiwa ni pamoja na zile kuu, lakini pia alama za punctuation na nambari. Kwa kuongeza, wahusika maalum "=", "&", "(" na nafasi hutumiwa.

Seti ya herufi zinazounda maandishi huitwa alfabeti, na nambari yao inaitwa kadinali (inayoonyeshwa kama N). Kuamua, usemi N = 2 ^ b hutumiwa, ambapo b ni idadi ya bits au uzito wa habari wa ishara fulani.

Imethibitishwa kuwa alfabeti yenye uwezo wa herufi 256 inaweza kuwakilisha wahusika wote muhimu.

Kwa kuwa 256 inawakilisha nguvu ya 8 ya mbili, uzito wa kila mhusika ni biti 8.

Kitengo cha kipimo cha bits 8 kinaitwa 1 byte, kwa hiyo ni desturi kusema kwamba tabia yoyote katika maandishi yaliyohifadhiwa kwenye kompyuta huchukua byte moja ya kumbukumbu.

Jinsi gani usimbaji unafanywa?

Maandishi yoyote yanaingizwa kwenye kumbukumbu ya kompyuta binafsi kwa kutumia funguo za kibodi ambazo nambari, barua, alama za punctuation na alama nyingine zimeandikwa. Zinahamishiwa kwa RAM kwa nambari ya binary, i.e. kila herufi inahusishwa na nambari ya decimal inayojulikana kwa wanadamu, kutoka 0 hadi 255, ambayo inalingana na nambari ya binary - kutoka 00000000 hadi 11111111.

Usimbaji wa herufi ya Byte huruhusu kichakataji kinachofanya uchakataji wa maandishi kufikia kila herufi kivyake. Wakati huo huo, herufi 256 zinatosha kuwakilisha habari yoyote ya mfano.

Usimbaji wa herufi ya ASCII

Kifupi hiki kwa Kiingereza kinasimamia msimbo wa kubadilishana habari.

Hata mwanzoni mwa utumiaji wa kompyuta, ilionekana wazi kuwa inawezekana kuja na njia nyingi za kusimba habari. Hata hivyo, ili kuhamisha habari kutoka kwa kompyuta moja hadi nyingine, ilikuwa ni lazima kuendeleza kiwango cha umoja. Kwa hiyo, mwaka wa 1963, meza ya encoding ya ASCII ilionekana Marekani. Ndani yake, ishara yoyote ya alfabeti ya kompyuta inahusishwa na nambari yake ya serial katika uwakilishi wa binary. Awali ASCII ilitumika tu nchini Marekani na baadaye ikawa kiwango cha kimataifa cha Kompyuta.

Nambari za ASCII zimegawanywa katika sehemu 2. Nusu ya kwanza tu ya jedwali hili inachukuliwa kuwa kiwango cha kimataifa. Inajumuisha herufi zilizo na nambari za mfululizo kutoka 0 (iliyowekwa kama 00000000) hadi 127 (iliyowekwa 01111111).

Nambari ya serial

Usimbaji wa maandishi ya ASCII

Alama

0000 0000 - 0001 1111

Herufi zilizo na N kutoka 0 hadi 31 huitwa herufi za kudhibiti. Kazi yao ni "kusimamia" mchakato wa kuonyesha maandishi kwenye kufuatilia au kifaa cha uchapishaji, kutoa ishara ya sauti, nk.

0010 0000 - 0111 1111

Wahusika kutoka N kutoka 32 hadi 127 (sehemu ya kawaida ya meza) - barua za juu na ndogo za alfabeti ya Kilatini, tarakimu ya 10, alama za punctuation, pamoja na mabano mbalimbali, alama za biashara na nyingine. Mhusika 32 anawakilisha nafasi.

1000 0000 - 1111 1111

Herufi zilizo na N kutoka 128 hadi 255 (sehemu mbadala ya jedwali au ukurasa wa msimbo) zinaweza kuwa na vibadala tofauti, ambavyo kila kimoja kina nambari yake. Ukurasa wa msimbo hutumika kubainisha alfabeti za kitaifa ambazo ni tofauti na Kilatini. Hasa, ni kwa msaada wake kwamba encoding ya ASCII kwa wahusika wa Kirusi inafanywa.

Katika jedwali, usimbaji ni herufi kubwa na hufuatana kwa mpangilio wa alfabeti, na nambari ziko katika mpangilio wa kupanda. Kanuni hii inabakia sawa kwa alfabeti ya Kirusi.

Dhibiti wahusika

Jedwali la usimbaji la ASCII liliundwa awali kwa ajili ya kupokea na kusambaza taarifa kupitia kifaa ambacho hakijatumika kwa muda mrefu, kama vile aina ya simu. Katika suala hili, herufi zisizoweza kuchapishwa zilijumuishwa kwenye seti ya herufi, zinazotumiwa kama amri kudhibiti kifaa hiki. Amri zinazofanana zilitumika katika njia za kutuma ujumbe za kabla ya kompyuta kama nambari ya Morse, nk.

Tabia ya kawaida ya teletype ni NUL (00). Bado inatumika leo katika lugha nyingi za programu ili kuonyesha mwisho wa mstari.

Usimbaji wa ASCII unatumika wapi?

Msimbo wa Kawaida wa Marekani hauhitajiki tu kwa kuingiza maelezo ya maandishi kwenye kibodi. Pia hutumiwa katika graphics. Hasa, katika Muumba wa Sanaa wa ASCII, picha za upanuzi mbalimbali zinawakilisha wigo wa wahusika wa ASCII.

Kuna aina mbili za bidhaa hizo: wale wanaofanya kazi ya wahariri wa picha kwa kubadilisha picha kwenye maandishi na wale wanaobadilisha "michoro" kwenye graphics za ASCII. Kwa mfano, kikaragosi maarufu ni mfano mkuu wa ishara ya usimbaji.

ASCII pia inaweza kutumika wakati wa kuunda hati ya HTML. Katika kesi hii, unaweza kuingiza seti fulani ya wahusika, na wakati wa kutazama ukurasa, ishara inayofanana na msimbo huu itaonekana kwenye skrini.

ASCII pia inahitajika kwa kuunda tovuti za lugha nyingi, kwani herufi ambazo hazijajumuishwa kwenye jedwali maalum la kitaifa hubadilishwa na nambari za ASCII.

Baadhi ya vipengele

Hapo awali ASCII ilitumiwa kusimba maelezo ya maandishi kwa kutumia biti 7 (moja iliachwa wazi), lakini leo inafanya kazi kama biti 8.

Herufi ziko kwenye nguzo ziko juu na chini hutofautiana kwa sehemu moja tu. Hii inapunguza kwa kiasi kikubwa utata wa ukaguzi.

Kutumia ASCII katika Ofisi ya Microsoft

Ikibidi, aina hii ya usimbaji wa maelezo ya maandishi inaweza kutumika katika vihariri vya maandishi vya Microsoft kama vile Notepad na Office Word. Hata hivyo, huenda usiweze kutumia vipengele vingine unapoandika katika kesi hii. Kwa mfano, hutaweza kutumia maandishi mazito kwa sababu usimbaji wa ASCII huhifadhi tu maana ya maelezo, ukipuuza mwonekano na umbo lake la jumla.

Kuweka viwango

Shirika la ISO limepitisha viwango vya ISO 8859. Kundi hili linafafanua usimbaji wa biti nane kwa vikundi vya lugha tofauti. Hasa, ISO 8859-1 ni Jedwali Lililoongezwa la ASCII kwa Marekani na nchi za Ulaya Magharibi. Na ISO 8859-5 ni jedwali linalotumika kwa alfabeti ya Cyrillic, pamoja na lugha ya Kirusi.

Kwa sababu kadhaa za kihistoria, kiwango cha ISO 8859-5 kilitumika kwa muda mfupi sana.

Kwa lugha ya Kirusi, usimbaji ufuatao unatumika kwa sasa:

  • CP866 (Code Ukurasa 866) au DOS, ambayo mara nyingi huitwa encoding mbadala ya GOST. Ilitumika kikamilifu hadi katikati ya miaka ya 90 ya karne iliyopita. Kwa sasa ni kivitendo haitumiki.
  • KOI-8. Usimbaji ulianzishwa katika miaka ya 1970 na 80, na kwa sasa ndio kiwango kinachokubalika kwa jumla cha ujumbe wa barua pepe kwenye RuNet. Inatumika sana katika mifumo ya uendeshaji ya Unix, ikiwa ni pamoja na Linux. Toleo la "Kirusi" la KOI-8 linaitwa KOI-8R. Kwa kuongezea, kuna matoleo ya lugha zingine za Kicyrillic, kama vile Kiukreni.
  • Kanuni Ukurasa 1251 (CP 1251, Windows - 1251). Iliyoundwa na Microsoft kutoa msaada kwa lugha ya Kirusi katika mazingira ya Windows.

Faida kuu ya kiwango cha kwanza cha CP866 ilikuwa uhifadhi wa wahusika wa pseudographic katika nafasi sawa na katika ASCII Iliyoongezwa. Hii ilifanya iwezekane kuendesha programu za maandishi zilizotengenezwa na wageni, kama vile Kamanda maarufu wa Norton, bila marekebisho. Hivi sasa, CP866 inatumika kwa programu zilizotengenezwa kwa Windows zinazoendeshwa katika hali ya maandishi ya skrini nzima au kwenye madirisha ya maandishi, pamoja na Kidhibiti cha FAR.

Maandishi ya kompyuta yaliyoandikwa katika encoding CP866 ni nadra kabisa siku hizi, lakini ndiyo ambayo hutumiwa kwa majina ya faili za Kirusi katika Windows.

"Unicode"

Kwa sasa, encoding hii ndiyo inayotumiwa sana. Nambari za Unicode zimegawanywa katika maeneo. Ya kwanza (U+0000 hadi U+007F) inajumuisha herufi za ASCII zilizo na misimbo. Hii inafuatwa na maeneo ya wahusika wa hati mbalimbali za kitaifa, pamoja na alama za uakifishaji na alama za kiufundi. Kwa kuongeza, baadhi ya nambari za Unicode zimehifadhiwa ikiwa kuna haja ya kujumuisha wahusika wapya katika siku zijazo.

Sasa unajua kuwa katika ASCII, kila herufi inawakilishwa kama mchanganyiko wa sufuri 8 na zile. Kwa wasio wataalamu, habari hii inaweza kuonekana kuwa ya lazima na isiyovutia, lakini hutaki kujua nini kinaendelea "katika akili" za PC yako?!

Kwa njia, kwenye tovuti yetu unaweza kubadilisha maandishi yoyote kuwa decimal, hexadecimal, msimbo wa binary kwa kutumia Kikokotoo cha Msimbo wa Mtandaoni.

Jedwali la ASCII

ASCII (Msimbo Wastani wa Marekani wa Kubadilishana Habari)

Jedwali la muhtasari wa misimbo ya ASCII

Jedwali la Msimbo wa Tabia ya Windows ASCII (Win-1251)

Alama

mtaalamu. Tabulation

mtaalamu. LF (Kurudi kwa Gari)

mtaalamu. CR (Mstari Mpya)

clutch SP (Nafasi)

Alama

Jedwali Lililopanuliwa la Msimbo wa ASCII

Uumbizaji wa alama.

Backspace (Rudisha herufi moja). Inaonyesha kuwa utaratibu wa kuchapisha au kishale cha kuonyesha kinarudi nyuma katika nafasi moja.

Tabulation Mlalo. Inaonyesha msogeo wa injini ya kuchapisha au kielekezi cha kuonyesha hadi "kiacha kichupo" kinachofuata kilichowekwa.

Mlisho wa mstari. Inaonyesha mwendo wa utaratibu wa kuchapisha au mshale wa kuonyesha hadi mwanzo wa mstari unaofuata (chini ya mstari mmoja).

Uhesabuji Wima. Inaonyesha mwendo wa injini ya kuchapisha au kielekezi cha kuonyesha kwa kundi linalofuata la mistari.

Mlisho wa Fomu. Inaonyesha mwendo wa injini ya kuchapisha au kielekezi cha kuonyesha hadi mahali pa kuanzia la ukurasa unaofuata, fomu au skrini.

Kurudi kwa Gari. Inaonyesha kusogea kwa utaratibu wa kuchapisha au kielekezi cha kuonyesha kwenye nafasi ya nyumbani (kushoto kabisa) ya mstari wa sasa.

Uhamisho wa data.

Kuanza kwa Kichwa. Inatumika kufafanua mwanzo wa kichwa, ambacho kinaweza kuwa na maelezo ya uelekezaji au anwani.

Mwanzo wa Maandishi. Inaonyesha mwanzo wa maandishi na wakati huo huo mwisho wa kichwa.

Mwisho wa Maandishi. Hutumika wakati wa kumalizia maandishi yaliyoanza na herufi STX.

Uchunguzi. Ombi la data ya utambulisho (kama vile "Wewe ni nani?") kutoka kwa kituo cha mbali.

Tambua. Kifaa kinachopokea hutuma herufi hii kwa mtumaji kama uthibitisho wa kufanikiwa kupokea data.

Makubaliano Hasi. Kifaa kinachopokea hutuma herufi hii kwa mtumaji iwapo kutakuwa na kunyimwa (kushindwa) kupokea data.

Inasawazisha/Kutofanya kazi. Inatumika katika mifumo ya maambukizi iliyosawazishwa. Wakati hakuna utumaji data, mfumo hutuma mara kwa mara alama za SYN ili kuhakikisha ulandanishi.

Mwisho wa Kizuizi cha Usambazaji. Inaonyesha mwisho wa kizuizi cha data kwa madhumuni ya mawasiliano. Inatumika kugawanya idadi kubwa ya data katika vizuizi tofauti.

Kugawanya alama wakati wa kusambaza habari.

Alama zingine.

Null. (Hakuna mhusika - hakuna data). Inatumika kwa usambazaji wakati hakuna data.

Kengele (Piga simu). Inatumika kudhibiti vifaa vya kengele.

Shift Out. Inaonyesha kuwa maneno yote ya msimbo yanayofuata lazima yafasiriwe kulingana na herufi ya nje iliyowekwa kabla ya kuwasili kwa herufi ya SI.

Shift In. Inaonyesha kuwa michanganyiko ya misimbo inayofuata lazima itafsiriwe kulingana na seti ya kawaida ya herufi.

Data Link Escape. Kubadilisha maana ya wahusika wafuatao. Inatumika kwa udhibiti wa ziada au kwa kusambaza mchanganyiko wa kiholela wa bits.

DC1, DC2, DC3, DC4

Vidhibiti vya Kifaa. Alama za uendeshaji wa vifaa vya msaidizi (kazi maalum).

Ghairi. Inaonyesha kwamba data inayotangulia herufi hii katika ujumbe au kizuizi inapaswa kupuuzwa (kawaida ikiwa hitilafu imegunduliwa).

Mwisho wa Kati. Inaonyesha mwisho halisi wa tepi au njia nyingine ya kuhifadhi

Mbadala. Inatumika kuchukua nafasi ya herufi yenye makosa au batili.

Kutoroka (Upanuzi). Hutumika kupanua msimbo kwa kuashiria kuwa mhusika anayefuata ana maana mbadala.

Nafasi. Herufi isiyochapisha inayotumiwa kutenganisha maneno au kusogeza injini ya kuchapisha au kiteuzi cha kuonyesha mbele nafasi moja.

Futa. Inatumika kuondoa (kufuta) herufi iliyotangulia kwenye ujumbe

Kila kompyuta ina seti yake ya wahusika ambayo inatekeleza. Seti hii ina herufi 26 za juu na ndogo, nambari na herufi maalum (nukta, nafasi, n.k.). Inapobadilishwa kuwa nambari kamili, alama huitwa misimbo. Viwango vilitengenezwa ili kompyuta iwe na seti sawa za kanuni.

Kiwango cha ASCII

ASCII (Msimbo Wastani wa Marekani wa Kubadilishana Habari) ni msimbo wa kawaida wa Marekani wa kubadilishana taarifa. Kila herufi ya ASCII ina biti 7, kwa hivyo idadi ya juu ya herufi ni 128 (Jedwali 1). Misimbo 0 hadi 1F ni herufi za udhibiti ambazo hazijachapishwa. Herufi nyingi za ASCII zisizoweza kuchapishwa zinahitajika ili kusambaza data. Kwa mfano, ujumbe unaweza kujumuisha herufi ya mwanzo ya kichwa SOH, kichwa chenyewe na herufi ya mwanzo ya maandishi STX, maandishi yenyewe na herufi ya mwisho ya maandishi ETX, na mwisho wa uwasilishaji. tabia EOT. Hata hivyo, data juu ya mtandao hupitishwa katika pakiti, ambazo wenyewe zinawajibika kwa mwanzo na mwisho wa maambukizi. Kwa hivyo herufi zisizoweza kuchapishwa karibu hazitumiwi kamwe.

Jedwali 1 - Jedwali la msimbo wa ASCII

Nambari Timu Maana Nambari Timu Maana
0 NUL Kielekezi tupu 10 DLE Ondoka kutoka kwa mfumo wa usambazaji
1 SOH mwanzo wa kichwa 11 DC1 Usimamizi wa kifaa
2 STX Mwanzo wa maandishi 12 DC2 Usimamizi wa kifaa
3 ETX Mwisho wa maandishi 13 DC3 Usimamizi wa kifaa
4 EOT Mwisho wa maambukizi 14 DC4 Usimamizi wa kifaa
5 ACK Ombi 15 N.A.K. Kutokuwa na uthibitisho wa mapokezi
6 BEL Uthibitisho wa kukubalika 16 SYN Rahisi
7 B.S. Alama ya kengele 17 ETB Mwisho wa kizuizi cha maambukizi
8 HT Rudi nyuma 18 INAWEZA Weka alama
9 LF Jedwali la usawa 19 E.M. Mwisho wa media
A VT Tafsiri ya mstari 1A SUB Usajili
B FF Kichupo cha wima 1B ESC Utgång
C CR Tafsiri ya ukurasa 1C FS Kitenganisha faili
D HIVYO Kurudi kwa gari 1D G.S. Kitenganishi cha kikundi
E S.I. Badilisha hadi rejista ya ziada 1E R.S. Kitenganishi cha rekodi
S.I. Badili hadi kipochi cha kawaida 1F Marekani Kitenganishi cha moduli
Nambari Alama Nambari Alama Nambari Alama Nambari Alama Nambari Alama Nambari Alama
20 nafasi 30 0 40 @ 50 P 60 . 70 uk
21 ! 31 1 41 A 51 Q 61 a 71 q
22 32 2 42 B 52 R 62 b 72 r
23 # 33 3 43 C 53 S 63 c 73 s
24 φ 34 4 44 D 54 T 64 d 74 t
25 % 35 5 45 E 55 NA 65 e 75 Na
26 & 36 6 46 F 56 V 66 f 76 v
27 37 7 47 G 57 W 67 g 77 w
28 ( 38 8 48 H 58 X 68 h 78 x
29 ) 39 9 49 I 59 Y 69 i 70 y
2A 3A ; 4A J 5A Z 6A j 7A z
2B + 3B ; 4B K 5B [ 6B k 7B {
2C 3C < 4C L 5C \ 6C l 7C |
2D 3D = 4D M 5D ] 6D m 7D }
2E 3E > 4E N 5E 6E n 7E ~
2F / 3F g 4F O 5F _ 6F o 7F DEL

Kiwango cha Unicode

Usimbaji uliotangulia ni sawa kwa Kiingereza, lakini haufai kwa lugha zingine. Kwa mfano, Kijerumani kina umlauts, na Kifaransa kina maandishi makuu. Lugha zingine zina alfabeti tofauti kabisa. Jaribio la kwanza la kupanua ASCII lilikuwa IS646, ambayo ilipanua usimbaji uliopita kwa herufi 128 za ziada. Barua za Kilatini zilizo na viboko na diacritics ziliongezwa, na kupokea jina - Kilatini 1. Jaribio lililofuata lilikuwa IS 8859 - ambalo lilikuwa na ukurasa wa msimbo. Pia kulikuwa na majaribio ya upanuzi, lakini hii haikuwa ya ulimwengu wote. Usimbaji wa UNICODE uliundwa (ni 10646). Wazo nyuma ya usimbuaji ni kugawa kila mhusika thamani moja ya mara kwa mara ya 16-bit, ambayo inaitwa - kiashiria cha kanuni. Kwa jumla kuna viashiria 65536. Ili kuokoa nafasi, tulitumia Kilatini-1 kwa misimbo 0 -255, tukibadilisha ASII kuwa UNICODE kwa urahisi. Kiwango hiki kilitatua matatizo mengi, lakini sio yote. Kutokana na kuwasili kwa maneno mapya, kwa mfano, kwa lugha ya Kijapani, ni muhimu kuongeza idadi ya maneno kwa karibu elfu 20. Pia ni muhimu kuingiza braille.