Kama unavyojua, kompyuta huhifadhi habari ndani binary, ikiwakilisha kama mlolongo wa moja na sufuri. Ili kutafsiri habari katika fomu inayofaa kwa mtazamo wa mwanadamu, kila mlolongo wa kipekee wa nambari hubadilishwa na ishara inayolingana inapoonyeshwa.
Mojawapo ya mifumo ya kuunganisha misimbo ya binary na herufi zilizochapishwa na kudhibiti ni
Katika ngazi ya leo ya maendeleo teknolojia ya kompyuta mtumiaji hatakiwi kujua msimbo wa kila mhusika maalum. Hata hivyo uelewa wa jumla jinsi uwekaji rekodi unafanywa ni muhimu sana, na kwa aina zingine za wataalam ni muhimu.
Kutengeneza ASCIIUsimbaji ulianzishwa hapo awali mnamo 1963 na kisha kusasishwa mara mbili kwa kipindi cha miaka 25.
Katika toleo la asili, meza Wahusika wa ASCII ilijumuisha herufi 128, baadaye toleo la kupanuliwa lilionekana, ambapo herufi 128 za kwanza zilihifadhiwa, na herufi zilizokosekana hapo awali zilipewa nambari na sehemu ya nane iliyohusika.
Kwa miaka mingi usimbaji huu ilikuwa maarufu zaidi duniani. Mnamo 2006, Kilatini 1252 ilichukua nafasi ya kuongoza, na kutoka mwisho wa 2007 hadi sasa, Unicode imeshikilia nafasi ya kuongoza.
Uwakilishi wa kompyuta wa ASCIIKila mhusika wa ASCII anayo kanuni mwenyewe, inayojumuisha herufi 8 zinazowakilisha sifuri au moja. Nambari ya chini zaidi katika uwakilishi huu ni sifuri (sifuri nane ndani mfumo wa binary), ambayo ni msimbo wa kipengele cha kwanza kwenye jedwali.
Misimbo miwili kwenye jedwali ilihifadhiwa kwa kubadili kati ya kawaida ya US-ASCII na lahaja yake ya kitaifa.
Baada ya ASCII kuanza kujumuisha sio 128, lakini herufi 256, lahaja ya usimbuaji ilienea, ambayo toleo la asili la jedwali lilihifadhiwa katika nambari 128 za kwanza na sifuri ya 8. Herufi zilizoandikwa za kitaifa zilihifadhiwa katika nusu ya juu ya jedwali (nafasi 128-255).
Mtumiaji haitaji kujua nambari za herufi za ASCII moja kwa moja. Kwa msanidi programu Kawaida ni ya kutosha kujua idadi ya kipengele kwenye meza ili, ikiwa ni lazima, kuhesabu msimbo wake kwa kutumia mfumo wa binary.
Lugha ya KirusiBaada ya kuendeleza encodings kwa lugha za Skandinavia, Kichina, Kikorea, Kigiriki, nk katika miaka ya mapema ya 70, alianza kuunda toleo lake mwenyewe. Umoja wa Soviet. Hivi karibuni, toleo la usimbaji wa 8-bit linaloitwa KOI8 lilitengenezwa, kuhifadhi nambari za kwanza za herufi 128 za ASCII na kutenga idadi sawa ya nafasi za herufi za alfabeti ya kitaifa na herufi za ziada.
Kabla ya kuanzishwa kwa Unicode, KOI8 ilitawala sehemu ya Kirusi ya mtandao. Kulikuwa na chaguzi za usimbaji kwa alfabeti ya Kirusi na Kiukreni.
matatizo ya ASCIIKwa kuwa idadi ya vipengele hata katika meza iliyopanuliwa haikuzidi 256, hakukuwa na uwezekano wa kuzingatia maandiko kadhaa tofauti katika encoding moja. Katika miaka ya 90, tatizo la "crocozyabr" lilionekana kwenye Runet, wakati maandiko yaliyoandikwa katika wahusika wa Kirusi ASCII yalionyeshwa vibaya.
Shida ilikuwa kwamba nambari tofauti za ASCII hazikulingana. Hebu tukumbuke kwamba wahusika mbalimbali wanaweza kuwa katika nafasi 128-255, na wakati wa kubadilisha encoding moja ya Cyrillic hadi nyingine, barua zote za maandishi zilibadilishwa na wengine kuwa na nambari inayofanana katika toleo tofauti la encoding.
Hali ya sasaPamoja na ujio wa Unicode, umaarufu wa ASCII ulianza kupungua sana.
Sababu ya hii iko katika ukweli kwamba encoding mpya ilifanya iwezekane kuchukua wahusika kutoka karibu lugha zote zilizoandikwa. Katika kesi hii, herufi 128 za kwanza za ASCII zinalingana na herufi sawa katika Unicode.
Mnamo mwaka wa 2000, ASCII ilikuwa usimbaji maarufu zaidi kwenye Mtandao na ilitumiwa kwenye 60% ya kurasa za wavuti zilizoorodheshwa na Google. Kufikia 2012, sehemu ya kurasa kama hizo ilikuwa imeshuka hadi 17%, na Unicode (UTF-8) ilichukua nafasi ya encoding maarufu zaidi.
Kwa hivyo ASCII ni sehemu muhimu ya historia teknolojia ya habari, hata hivyo, matumizi yake katika siku zijazo yanaonekana kutokuahidi.
Des | Hex | Alama | Des | Hex | Alama | |
000 | 00 | mtaalamu. HAPANA | 128 | 80 | Ђ | |
001 | 01 | mtaalamu. SOH | 129 | 81 | Ѓ | |
002 | 02 | mtaalamu. STX | 130 | 82 | ‚ | |
003 | 03 | mtaalamu. ETX | 131 | 83 | ѓ | |
004 | 04 | mtaalamu. EOT | 132 | 84 | „ | |
005 | 05 | mtaalamu. ENQ | 133 | 85 | … | |
006 | 06 | mtaalamu. ACK | 134 | 86 | † | |
007 | 07 | mtaalamu. BEL | 135 | 87 | ‡ | |
008 | 08 | mtaalamu. B.S. | 136 | 88 | € | |
009 | 09 | mtaalamu. TAB | 137 | 89 | ‰ | |
010 | 0A | mtaalamu. LF | 138 | 8A | Љ | |
011 | 0B | mtaalamu. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | mtaalamu. FF | 140 | 8C | Њ | |
013 | 0D | mtaalamu. CR | 141 | 8D | Ќ | |
014 | 0E | mtaalamu. HIVYO | 142 | 8E | Ћ | |
015 | 0F | mtaalamu. S.I. | 143 | 8F | Џ | |
016 | 10 | mtaalamu. DLE | 144 | 90 | ђ | |
017 | 11 | mtaalamu. DC1 | 145 | 91 | ‘ | |
018 | 12 | mtaalamu. DC2 | 146 | 92 | ’ | |
019 | 13 | mtaalamu. DC3 | 147 | 93 | “ | |
020 | 14 | mtaalamu. DC4 | 148 | 94 | ” | |
021 | 15 | mtaalamu. N.A.K. | 149 | 95 | ||
022 | 16 | mtaalamu. SYN | 150 | 96 | – | |
023 | 17 | mtaalamu. ETB | 151 | 97 | — | |
024 | 18 | mtaalamu. INAWEZA | 152 | 98 | ||
025 | 19 | mtaalamu. E.M. | 153 | 99 | ™ | |
026 | 1A | mtaalamu. SUB | 154 | 9A | љ | |
027 | 1B | mtaalamu. ESC | 155 | 9B | › | |
028 | 1C | mtaalamu. FS | 156 | 9C | њ | |
029 | 1D | mtaalamu. G.S. | 157 | 9D | ќ | |
030 | 1E | mtaalamu. R.S. | 158 | 9E | ћ | |
031 | 1F | mtaalamu. Marekani | 159 | 9F | џ | |
032 | 20 | clutch SP (Nafasi) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Yo | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | A.A. | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | A.C. | ¬ | |
045 | 2D | - | 173 | AD | | |
046 | 2E | . | 174 | A.E. | ® | |
047 | 2F | / | 175 | A.F. | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | e | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | B.A. | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | B.C. | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | KUWA | ѕ | |
063 | 3F | ? | 191 | B.F. | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | KATIKA | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | NA | |
071 | 47 | G | 199 | C7 | Z | |
072 | 48 | H | 200 | C8 | NA | |
073 | 49 | I | 201 | C9 | Y | |
074 | 4A | J | 202 | C.A. | KWA | |
075 | 4B | K | 203 | C.B. | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | N | |
078 | 4E | N | 206 | C.E. | KUHUSU | |
079 | 4F | O | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | NA | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | U | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | U | 213 | D5 | X | |
086 | 56 | V | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | Sh | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | D.A. | Kommersant | |
091 | 5B | [ | 219 | D.B. | Y | |
092 | 5C | \ | 220 | DC | b | |
093 | 5D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | YU | |
095 | 5F | _ | 223 | DF | I | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | a | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | V | |
099 | 63 | c | 227 | E3 | G | |
100 | 64 | d | 228 | E4 | d | |
101 | 65 | e | 229 | E5 | e | |
102 | 66 | f | 230 | E6 | na | |
103 | 67 | g | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | Na | |
105 | 69 | i | 233 | E9 | th | |
106 | 6A | j | 234 | E.A. | Kwa | |
107 | 6B | k | 235 | E.B. | l | |
108 | 6C | l | 236 | E.C. | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | E.E. | O | |
111 | 6F | o | 239 | EF | P | |
112 | 70 | uk | 240 | F0 | R | |
113 | 71 | q | 241 | F1 | Na | |
114 | 72 | r | 242 | F2 | T | |
115 | 73 | s | 243 | F3 | katika | |
116 | 74 | t | 244 | F4 | f | |
117 | 75 | u | 245 | F5 | X | |
118 | 76 | v | 246 | F6 | ts | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | x | 248 | F8 | w | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | F.A. | ъ | |
123 | 7B | { | 251 | FB | s | |
124 | 7C | | | 252 | F.C. | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Mtaalamu. DEL | 255 | FF | I |
Ufafanuzi wa wahusika maalum (udhibiti) Ikumbukwe kwamba awali wahusika wa udhibiti wa meza ya ASCII walitumiwa ili kuhakikisha kubadilishana data kupitia teletype, kuingia kwa data kutoka kwa mkanda uliopigwa na kwa udhibiti rahisi wa vifaa vya nje.
Hivi sasa, vibambo vingi vya udhibiti wa jedwali la ASCII havibebi tena mzigo huu na vinaweza kutumika kwa madhumuni mengine.
NUL, 00 | Null, tupu |
SOH, 01 | Kuanza kwa kichwa |
STX, 02 | Mwanzo wa maandishi, mwanzo wa maandishi. |
ETX, 03 | Mwisho wa maandishi, mwisho wa maandishi |
EOT, 04 | Mwisho wa Usambazaji |
ENQ, 05 | Uliza. Tafadhali hakikisha |
ACK, 06 | Shukrani. Nathibitisha |
BEL, 07 | Kengele, piga simu |
BA, 08 | Backspace, kurudi nyuma tabia moja |
TAB, 09 | Kichupo, kichupo cha mlalo |
LF, 0A | Line Feed, line feed. Siku hizi katika lugha nyingi za programu inaonyeshwa kama \n |
VT, 0B | Kichupo Wima, jedwali la wima. |
FF, 0C | Mlisho wa Fomu, malisho ya ukurasa, ukurasa mpya |
CR, 0D | Kurudi kwa gari, kurudi kwa gari. Siku hizi katika lugha nyingi za programu inaonyeshwa kama \r |
SO,0E | Shift Out, badilisha rangi ya utepe wa wino kwenye kifaa cha uchapishaji |
SI, 0F | Shift In, rudisha rangi ya utepe wa wino kwenye kifaa cha uchapishaji |
DLE, 10 | Data Link Escape, kubadilisha chaneli hadi upitishaji data |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Udhibiti wa Kifaa, alama za udhibiti wa kifaa |
NAK, 15 | Kukiri Hasi, sithibitishi. |
SYN, 16 | Usawazishaji. Alama ya ulandanishi |
ETB, 17 | Mwisho wa Kizuizi cha Maandishi, mwisho wa kizuizi cha maandishi |
UNAWEZA, 18 | Ghairi, kughairiwa kwa iliyotumwa hapo awali |
EM, 19 | Mwisho wa Kati |
SUB, 1A | Mbadala, mbadala. Imewekwa mahali pa ishara ambayo maana yake ilipotea au kupotoshwa wakati wa maambukizi |
ESC, 1B | Mlolongo wa Udhibiti wa Escape |
FS, 1C | Kitenganishi cha Faili, kitenganishi cha faili |
GS, 1D | Kitenganishi cha Kikundi |
RS, 1E | Kitenganishi cha Rekodi, kitenganishi cha rekodi |
Marekani, 1F | Kitenganishi cha Kitengo |
DEL, 7F | Futa, futa herufi ya mwisho. |
Unicode (Unicode kwa Kiingereza) ni kiwango cha usimbaji wa herufi. Kwa ufupi, hii ni jedwali la mawasiliano kati ya herufi za maandishi (herufi, alama za uakifishaji) na nambari za binary. Kompyuta inaelewa tu mlolongo wa zero na wale. Ili kujua ni nini hasa inapaswa kuonyesha kwenye skrini, ni muhimu kugawa kila ishara yake mwenyewe nambari ya kipekee. Katika miaka ya themanini, wahusika walikuwa encoded katika byte moja, yaani, bits nane (kila kidogo ni 0 au 1). Kwa hivyo, ikawa kwamba meza moja (aka encoding au kuweka) inaweza kubeba herufi 256 tu. Hii inaweza isitoshe hata kwa lugha moja. Kwa hiyo, encodings nyingi tofauti zilionekana, machafuko ambayo mara nyingi yalisababisha ukweli kwamba badala ya maandishi yanayosomeka viumbe vidogo vya ajabu vilionekana. Inahitajika kiwango kimoja, ambayo ndio Unicode ikawa. Usimbaji unaotumika zaidi ni UTF-8 (Unicode Transformation Format), ambayo hutumia baiti 1 hadi 4 kuwakilisha herufi.
AlamaHerufi katika jedwali la Unicode zimehesabiwa nambari za hexadecimal. Kwa mfano, Cyrillic herufi kubwa M imeteuliwa U+041C. Hii ina maana kwamba inasimama kwenye makutano ya safu mlalo 041 na safu wima C. Unaweza kuinakili kwa urahisi na kisha kuibandika mahali fulani. Ili usichunguze orodha ya kilomita nyingi, unapaswa kutumia utafutaji. Unapoenda kwenye ukurasa wa alama, utaona nambari yake kwenye Unicode na jinsi ilivyoandikwa fonti tofauti. Unaweza kuingiza ishara yenyewe kwenye upau wa kutafutia, hata kama mraba umechorwa badala yake, angalau ili kujua ilikuwa ni nini. Pia, kwenye tovuti hii kuna seti maalum (na random) za icons zinazofanana, zilizokusanywa kutoka sehemu tofauti, kwa urahisi wa matumizi.
Kiwango cha Unicode ni cha kimataifa. Inajumuisha wahusika kutoka karibu hati zote za ulimwengu. Ikiwa ni pamoja na zile ambazo hazitumiki tena. Hieroglyphs za Misri, runes za Kijerumani, maandishi ya Mayan, cuneiform na alfabeti za majimbo ya kale. Uteuzi wa mizani na vipimo, nukuu za muziki, na dhana za hisabati pia huwasilishwa.
Unicode Consortium yenyewe haizuii herufi mpya. Picha hizo ambazo hupata matumizi yao katika jamii huongezwa kwenye meza. Kwa mfano, ishara ya ruble ilitumika kikamilifu kwa miaka sita kabla ya kuongezwa kwa Unicode. Picha za Emoji (vikaragosi) pia zilitumika kwa mara ya kwanza nchini Japani kabla ya kujumuishwa katika usimbaji. Na hapa alama za biashara, na nembo za kampuni hazijaongezwa hata kidogo. Hata zile za kawaida kama tufaha au bendera ya Windows. Hadi sasa, takriban herufi elfu 120 zimesimbwa katika toleo la 8.0.
Excel for Office 365 Word for Office 365 Outlook for Office 365 PowerPoint for Office 365 Publisher for Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio9 Outlook 1 Excel 201 Power 201 PowerPoint 201 16 2013 Mchapishaji 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 20100 Outlook 2 Publisher 2 Word 20 07 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Chini
Katika nakala hii: Ingiza herufi ya ASCII au Unicode kwenye hatiIkiwa unahitaji tu kuingiza herufi chache maalum au alama, unaweza kutumia mikato ya kibodi. Kwa orodha ya herufi za ASCII, angalia majedwali yafuatayo au makala Kuweka Alfabeti za Kitaifa Kwa Kutumia Njia za Mkato za Kibodi.
Vidokezo:
Kuingiza herufi za ASCIIKuingiza herufi ya ASCII, bonyeza na ushikilie kitufe cha ALT unapoingiza msimbo wa herufi. Kwa mfano, ili kuingiza alama ya digrii (º), bonyeza na ushikilie kitufe cha ALT, kisha chapa 0176 kwenye vitufe vya nambari.
Ili kuingiza nambari, tumia vitufe vya nambari badala ya nambari kwenye kibodi kuu. Ikiwa unahitaji kuingiza nambari kwenye vitufe vya nambari, hakikisha kuwa kiashiria NUM LOCK kimewashwa.
Kuingiza Herufi za UnicodeKuingiza herufi ya Unicode, weka msimbo wa herufi, kisha ubonyeze Vifunguo vya ALT na X. Kwa mfano, ili kuingiza alama ya dola ($), ingiza 0024 na ubonyeze ALT na X kwa mlolongo Kwa misimbo yote ya herufi ya Unicode, ona.
Muhimu: Baadhi Programu za Microsoft Ofisi, kama vile PowerPoint na InfoPath, haitumii kubadilisha misimbo ya Unicode kuwa herufi. Ikiwa unahitaji kuingiza herufi ya Unicode katika mojawapo ya programu hizi, tumia .
Vidokezo:
Ikiwa herufi isiyo sahihi ya Unicode itaonekana baada ya kubofya ALT+X, chagua msimbo sahihi, kisha ubonyeze ALT+X tena.
Kwa kuongeza, lazima uweke "U+" kabla ya msimbo. Kwa mfano, ukiingiza "1U+B5" na ubonyeze ALT+X, maandishi "1µ" yataonyeshwa, na ukiingiza "1B5" na ubonyeze ALT+X, ishara "Ƶ" itaonyeshwa.
Jedwali la ishara ni programu iliyojengwa ndani Microsoft Windows, ambayo hukuruhusu kutazama herufi zinazopatikana kwa fonti iliyochaguliwa.
Kwa kutumia jedwali la alama unaweza kunakili wahusika binafsi au kikundi cha wahusika kwenye ubao wa kunakili na ubandike kwenye programu yoyote inayoauni kuonyesha herufi hizi. Kufungua jedwali la ishara
Katika Windows 10, ingiza neno "ishara" kwenye kisanduku cha utaftaji kwenye barani ya kazi na uchague jedwali la ishara kutoka kwa matokeo ya utaftaji.
Katika Windows 8, ingiza neno "tabia" kwenye skrini ya nyumbani na uchague jedwali la alama kutoka kwa matokeo ya utaftaji.
Katika Windows 7, bofya kitufe cha Anza, chagua Programu Zote, Vifaa, Vyombo vya Mfumo, kisha ubofye Ramani ya Tabia.
Herufi zimepangwa kulingana na fonti. Bofya orodha ya fonti ili kuchagua seti inayofaa ya herufi. Ili kuchagua ishara, bofya, kisha ubofye kitufe cha Chagua. Ili kuingiza ishara, bofya bonyeza kulia panya Mahali pazuri kwenye hati na uchague Bandika.
Misimbo ya herufi inayotumika mara kwa maraOrodha kamili herufi, tazama kwenye kompyuta yako, jedwali la msimbo wa herufi ASCII, au jedwali za herufi za Unicode zilizopangwa kwa seti.
Sarafu |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Alama za kisheria |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sehemu |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Alama za uakifishaji na lahaja |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Alama za umbo |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Misimbo ya diacritics inayotumika kwa kawaida Kwa orodha kamili ya glyphs na misimbo inayolingana, ona.
|
[Usimbaji wa biti 8: ASCII, KOI-8R na CP1251] Majedwali ya kwanza ya usimbaji yaliyoundwa Marekani hayakutumia biti ya nane kwa baiti. Maandishi yaliwakilishwa kama mlolongo wa baiti, lakini biti ya nane haikuzingatiwa (ilitumiwa kwa madhumuni rasmi).
Jedwali la ASCII ( Kiwango cha Marekani Msimbo wa Kubadilishana Habari). Herufi 32 za kwanza za jedwali la ASCII (00 hadi 1F) zilitumika kwa herufi zisizochapisha. Ziliundwa kudhibiti kifaa cha uchapishaji, nk. Zilizobaki - kutoka 20 hadi 7F - ni herufi za kawaida (zinazoweza kuchapishwa).
Jedwali 1 - Usimbaji wa ASCII
|
|
Kama ni rahisi kuona, katika usimbaji huu pekee barua, na zile zinazotumika kwa Kiingereza. Pia kuna alama za hesabu na huduma zingine. Lakini hakuna herufi za Kirusi, wala hata zile za Kilatini maalum kwa Kijerumani au Kifaransa. Hii ni rahisi kuelezea - encoding ilitengenezwa sawasawa Kiwango cha Amerika. Kompyuta zilipoanza kutumika ulimwenguni kote, wahusika wengine walihitaji kusimba.
Ili kufanya hivyo, iliamuliwa kutumia kidogo ya nane katika kila byte. Hii ilifanya thamani 128 zaidi kupatikana (kutoka 80 hadi FF) ambazo zinaweza kutumika kusimba herufi. Jedwali la kwanza la biti nane - "ASCII iliyopanuliwa" ( Iliyoongezwa ASCII) - imejumuishwa. chaguzi mbalimbali Wahusika Kilatini kutumika katika baadhi ya lugha za Ulaya Magharibi. Pia ilikuwa na alama nyingine za ziada, ikiwa ni pamoja na pseudographics.
Vibambo vya uwongo vinaruhusu, kwa kuonyesha pekee wahusika wa maandishi, toa mwonekano fulani wa michoro. Kutumia pseudographics, kwa mfano, mpango wa udhibiti hufanya kazi Faili za FAR Meneja.
Hakukuwa na herufi za Kirusi kwenye jedwali la ASCII Iliyoongezwa. Urusi (zamani USSR) na nchi zingine ziliunda usimbaji wao wenyewe ambao ulifanya iwezekane kuwakilisha herufi maalum za "kitaifa" katika faili za maandishi-8 - herufi za Kilatini za lugha za Kipolishi na Kicheki, Kisirili (pamoja na herufi za Kirusi) na alfabeti zingine.
Katika usimbaji wote ambao umeenea, herufi 127 za kwanza (yaani, thamani ya baiti na biti ya nane sawa na 0) ni sawa na ASCII. Kwa hivyo faili ya ASCII inafanya kazi katika mojawapo ya usimbaji huu; barua kwa Kingereza zinawasilishwa kwa usawa.
ISO (Shirika la Viwango la Kimataifa) lilikubali kundi hilo Viwango vya ISO 8859. Inafafanua usimbaji wa 8-bit kwa makundi mbalimbali lugha. Kwa hivyo, ISO 8859-1 ni jedwali la ASCII Iliyoongezwa kwa Marekani na Ulaya Magharibi. Na ISO 8859-5 ni jedwali la alfabeti ya Cyrillic (ikiwa ni pamoja na Kirusi).
Hata hivyo, kwa sababu za kihistoria, usimbaji wa ISO 8859-5 haukuchukua mizizi. Kwa kweli, encodings zifuatazo hutumiwa kwa lugha ya Kirusi:
Ukurasa wa 866 wa Msimbo (CP866), aka "DOS", aka "usimbaji mbadala wa GOST". Inatumika sana hadi katikati ya miaka ya 90; sasa inatumika kwa kiwango kidogo. Kivitendo haitumiki kwa kusambaza maandishi kwenye mtandao.
- KOI-8. Iliyoundwa katika miaka ya 70-80. Ni kiwango kinachokubalika kwa ujumla cha kutuma ujumbe wa barua ndani Mtandao wa Kirusi. Pia hutumika sana katika mifumo ya uendeshaji Familia ya Unix, ikiwa ni pamoja na Linux. Toleo la lugha ya Kirusi la KOI-8 linaitwa KOI-8R; Kuna matoleo ya lugha zingine za Cyrillic (kwa mfano, KOI8-U ni toleo la lugha ya Kiukreni).
- Ukurasa wa Msimbo 1251, CP1251, Windows-1251. Imetengenezwa na Microsoft kusaidia lugha ya Kirusi katika Windows.
Faida kuu ya CP866 ilikuwa uhifadhi wa wahusika wa picha za uwongo katika maeneo sawa na katika ASCII Iliyoongezwa; kwa hivyo, za kigeni zinaweza kufanya kazi bila mabadiliko programu za maandishi, kwa mfano, Kamanda maarufu wa Norton. Siku hizi CP866 inatumika kwa programu za Windows zinazoingia madirisha ya maandishi au katika hali ya maandishi ya skrini nzima, ikijumuisha Kidhibiti cha FAR.
Maandishi katika CP866 miaka iliyopita ni nadra sana (lakini hutumiwa kusimba majina ya faili za Kirusi katika Windows). Kwa hiyo, tutakaa kwa undani zaidi juu ya encodings nyingine mbili - KOI-8R na CP1251.
Kama unaweza kuona, katika jedwali la encoding la CP1251, barua za Kirusi zimepangwa kwa utaratibu wa alfabeti (isipokuwa, hata hivyo, ya barua E). Shukrani kwa eneo hili programu za kompyuta Ni rahisi sana kupanga alfabeti.
Lakini katika KOI-8R utaratibu wa barua za Kirusi unaonekana bila mpangilio. Lakini kwa kweli sivyo.
Katika programu nyingi za zamani, biti ya 8 ilipotea wakati wa kuchakata au kusambaza maandishi. (Sasa programu kama hizo "zimetoweka", lakini mwishoni mwa miaka ya 80 - mapema miaka ya 90 zilienea). Ili kupata thamani ya biti-7 kutoka kwa thamani ya 8-bit, toa tu 8 kutoka kwa tarakimu muhimu zaidi; kwa mfano, E1 inakuwa 61.
Sasa linganisha KOI-8R na Jedwali la ASCII(Jedwali 1). Utapata kwamba herufi za Kirusi zimewekwa katika mawasiliano ya wazi na zile za Kilatini. Ikiwa sehemu ya nane itatoweka, herufi ndogo za Kirusi zinageuka kuwa herufi kubwa za Kilatini, na herufi kubwa za Kirusi zinageuka kuwa herufi ndogo za Kilatini. Kwa hivyo, E1 katika KOI-8 ni Kirusi "A", wakati 61 katika ASCII ni Kilatini "a".
Kwa hiyo, KOI-8 inakuwezesha kudumisha usomaji wa maandishi ya Kirusi wakati bit 8 inapotea. "Hujambo kila mtu" inakuwa "pRIWET WSEM".
KATIKA Hivi majuzi Na mpangilio wa alfabeti Mpangilio wa wahusika katika jedwali la encoding, na usomaji na upotezaji wa 8, umepoteza umuhimu wao wa kuamua. Biti ya nane ndani kompyuta za kisasa haipotei wakati wa maambukizi au usindikaji. Na upangaji wa alfabeti unafanywa kwa kuzingatia encoding, na sio kulinganisha rahisi kanuni (Kwa njia, kanuni za CP1251 hazipangwa kabisa kwa alfabeti - barua E haipo mahali pake).
Kutokana na ukweli kwamba kuna encodings mbili za kawaida, wakati wa kufanya kazi na mtandao (barua, kuvinjari Tovuti), wakati mwingine unaweza kuona seti isiyo na maana ya barua badala ya maandishi ya Kirusi. Kwa mfano, “MIMI NI SBYUFEMHEL.” Haya ni maneno tu "kwa heshima"; lakini zilisimbwa katika usimbaji wa CP1251, na kompyuta ikasimbua maandishi kwa kutumia jedwali la KOI-8. Ikiwa maneno sawa, kinyume chake, yamesimbwa katika KOI-8, na kompyuta ikaamua maandishi kulingana na jedwali la CP1251, matokeo yatakuwa "U HCHBTSEOYEN".
Wakati mwingine hutokea kwamba kompyuta decrypts Barua za Kirusi na kabisa kulingana na meza isiyokusudiwa kwa lugha ya Kirusi. Kisha, badala ya barua za Kirusi, seti isiyo na maana ya alama inaonekana (kwa mfano, barua za Kilatini za lugha za Mashariki ya Ulaya); mara nyingi huitwa "crocozybras".
Katika hali nyingi programu za kisasa kukabiliana na kuamua usimbuaji wa hati za mtandao ( barua pepe na kurasa za Wavuti) kwa kujitegemea. Lakini wakati mwingine "huota vibaya", na kisha unaweza kuona mlolongo wa ajabu wa herufi za Kirusi au "krokozyabry". Kama sheria, katika hali kama hiyo, ili kuonyesha maandishi halisi kwenye skrini, inatosha kuchagua usimbuaji kwa mikono kwenye menyu ya programu.
Taarifa kutoka kwa ukurasa http://open-office.edusite.ru/TextProcessor/p5aa1.html ilitumiwa kwa makala hii.
Nyenzo zilizochukuliwa kutoka kwa wavuti: