KOI 8 എൻകോഡിംഗിൽ എത്ര പ്രതീകങ്ങളുണ്ട്. എന്താണ് KOI8-R എൻകോഡിംഗ്, അത് എന്താണ് നൽകിയത്? അസുകയുടെ വിപുലീകൃത പതിപ്പുകൾ - സ്യൂഡോഗ്രാഫിക്സുള്ള CP866, KOI8-R എൻകോഡിംഗുകൾ

KOI8-R എൻകോഡിംഗ്

ISO 8859-5 എൻകോഡിംഗ്

ISO 8859-5

ഇതര എൻകോഡിംഗ്

"ബദൽ എൻകോഡിംഗ്"- CP437 കോഡ്‌പേജിനെ അടിസ്ഥാനമാക്കി, രണ്ടാം പകുതിയിലെ എല്ലാ നിർദ്ദിഷ്ട യൂറോപ്യൻ പ്രതീകങ്ങളും സിറിലിക്കിലേക്ക് മാറ്റി, സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങൾ കേടുകൂടാതെയിരിക്കും. അതിനാൽ, ജോലിക്കായി ടെക്സ്റ്റ് വിൻഡോകൾ ഉപയോഗിക്കുന്ന പ്രോഗ്രാമുകളുടെ രൂപം ഇത് നശിപ്പിക്കില്ല, കൂടാതെ അവയിൽ സിറിലിക് പ്രതീകങ്ങളുടെ ഉപയോഗം ഉറപ്പാക്കുകയും ചെയ്യുന്നു.

ചരിത്രപരമായി, നിരവധി ഇതര എൻകോഡിംഗ് ഓപ്ഷനുകൾ ഉണ്ടായിട്ടുണ്ട്, എന്നാൽ എല്ലാ വ്യത്യാസങ്ങളും 0xF0 - 0xFF (240-255) പ്രദേശത്തെ മാത്രം ബാധിക്കുന്നു. അവസാന സ്റ്റാൻഡേർഡ് IBM CP866 എൻകോഡിംഗ് ആയിരുന്നു, അതിനുള്ള പിന്തുണ MS-DOS പതിപ്പ് 6.22-ലേക്ക് ചേർത്തു (അതിനുമുമ്പ്, എല്ലാത്തരം "സ്വയം നിർമ്മിത" വിള്ളലുകളും ഉപയോഗിച്ചിരുന്നു. ഇതര എൻകോഡിംഗ് ഇപ്പോഴും സജീവമാണ്, ഡോസിലും OS-ലും വളരെ ജനപ്രിയമാണ്. / 2 പരിസ്ഥിതി. കൂടാതെ, FAT ഫയൽ സിസ്റ്റത്തിലെ പേരുകൾ CP866 ഇപ്പോഴും Windows NT കുടുംബത്തിലെ Russified സിസ്റ്റങ്ങളുടെ കൺസോളിൽ ഉപയോഗിക്കുന്നു.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്
8. എ 410 ബി 411 ബി 412 G 413 ഡി 414 E 415 എഫ് 416 W 417 കൂടാതെ 418 Y 419 കെ 41 എ എൽ 41 ബി എം 41 സി എച്ച് 41 ഡി ഏകദേശം 41E പി 41 എഫ്
9. R 420 സി 421 ടി 422 423 എഫ് 424 X 425 സി 426 Ch 427 SH 428 Sch 429 b 42A എസ് 42 ബി b 42c ഇ 42 ഡി യു 42ഇ എനിക്ക് 42F ആണ്
എ. ഒരു 430 b 431 432-ൽ g 433 ഡി 434 ഇ 435 f 436 s 437 കൂടാതെ 438 439 43A വരെ l 43B മീറ്റർ 43 സി n 43D ഏകദേശം 43E n 43F
ബി. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 നമ്പർ 255D ╜255C ╛255B ┐ 2510
സി. └ 2514 ┴ 2534 ┬ 252 സി ├ 251 സി ─ 2500 ┼ 253 സി നമ്പർ 255E ╟255F ╚ 255A ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256 സി ╧ 2567
ഡി. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 നമ്പർ 256B നമ്പർ 256A ┘ 2518 ┌250 സി █ 2588 ▄ 2584 ▌258C ▐ 2590 ▀ 2580
ഇ. p 440 441 മുതൽ ടി 442 443-ൽ f 444 x 445 c 446 h 447 sh 448 w 449 b 44A s 44B b 44C ഇ 44 ഡി yu 44E i 44F
എഫ്. യോ 401 യോ 451 എഫ് 404 $454 £407 457 40ഇ ¢45E °B0 ∙ 2219 B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

SO 8859-5- സിറിലിക് എഴുതുന്നതിനുള്ള ISO-8859 ശ്രേണിയിൽ നിന്നുള്ള 8-ബിറ്റ് എൻകോഡിംഗ്. റഷ്യയിൽ മിക്കവാറും ഉപയോഗിച്ചിട്ടില്ല. പൊതുവേ, ISO 8859-5 വളരെ സൗകര്യപ്രദമായ ഒരു എൻകോഡിംഗ് അല്ല, കാരണം ഡാഷുകൾ (-), ഹെറിംഗ്ബോൺ ഉദ്ധരണികൾ (""), ഡിഗ്രികൾ (°) മുതലായ ആവശ്യമായ നിരവധി പ്രതീകങ്ങൾ ഇതിന് ഇല്ല.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്
8. 80 81 82 83 84 85 86 87 88 89 8A 8B 8C 8D 8E 8F
9. 90 91 92 93 94 95 96 97 98 99 9A 9B 9C 9D 9E 9F
എ. A0 യോ 401 € 402 Ѓ 403 എഫ് 404 എസ് 405 ഐ 406 £407 £408 £409 Њ40A £40B 40 സി എ.ഡി 40ഇ Џ 40F
ബി. എ 410 ബി 411 ബി 412 G 413 ഡി 414 E 415 എഫ് 416 W 417 കൂടാതെ 418 Y 419 കെ 41 എ എൽ 41 ബി എം 41 സി എച്ച് 41 ഡി ഏകദേശം 41E പി 41 എഫ്
സി. R 420 സി 421 ടി 422 423 എഫ് 424 X 425 സി 426 Ch 427 SH 428 Sch 429 b 42A എസ് 42 ബി b 42c ഇ 42 ഡി യു 42ഇ എനിക്ക് 42F ആണ്
ഡി. ഒരു 430 b 431 432-ൽ g 433 ഡി 434 ഇ 435 f 436 s 437 കൂടാതെ 438 439 43A വരെ l 43B മീറ്റർ 43 സി n 43D ഏകദേശം 43E n 43F
ഇ. p 440 441 മുതൽ ടി 442 443-ൽ f 444 x 445 c 446 h 447 sh 448 w 449 b 44A s 44B b 44C ഇ 44 ഡി yu 44E i 44F
എഫ്. № 2116 യോ 451 $452 -453 $454 *455 ഞാൻ 456 457 $458 459 њ 45A ћ 45B ќ 45 സി § A7 ¢45E џ 45F

KOI-8 (വിവര കൈമാറ്റ കോഡ്, 8 ബിറ്റുകൾ), KOI8- കമ്പ്യൂട്ടർ സയൻസിലെ എട്ട്-ബിറ്റ് പ്രതീക എൻകോഡിംഗ് സ്റ്റാൻഡേർഡ്. സിറിലിക് അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ എൻകോഡ് ചെയ്യുന്നതിനായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു. എൻകോഡിംഗിന്റെ ഏഴ്-ബിറ്റ് പതിപ്പും ഉണ്ട് - KOI-7. KOI-7, KOI-8 എന്നിവ GOST 19768-74 ൽ വിവരിച്ചിരിക്കുന്നു (ഇപ്പോൾ അസാധുവാണ്).

KOI-8 ന്റെ ഡെവലപ്പർമാർ റഷ്യൻ അക്ഷരമാല അക്ഷരങ്ങൾ വിപുലീകരിച്ച ASCII പട്ടികയുടെ മുകളിൽ സ്ഥാപിച്ചു, അങ്ങനെ സിറിലിക് പ്രതീകങ്ങളുടെ സ്ഥാനങ്ങൾ പട്ടികയുടെ ചുവടെയുള്ള ഇംഗ്ലീഷ് അക്ഷരമാലയിലെ അവയുടെ സ്വരസൂചക എതിരാളികളുമായി പൊരുത്തപ്പെടുന്നു. ഇതിനർത്ഥം, KOI-8 ൽ എഴുതിയ വാചകത്തിൽ നിന്ന് ഓരോ പ്രതീകത്തിന്റെയും എട്ടാമത്തെ ബിറ്റ് നീക്കം ചെയ്താൽ, ലാറ്റിൻ അക്ഷരങ്ങളിൽ എഴുതിയിട്ടുണ്ടെങ്കിലും "വായിക്കാൻ കഴിയുന്ന" വാചകം ലഭിക്കും. ഉദാഹരണത്തിന്, "റഷ്യൻ ടെക്സ്റ്റ്" എന്ന വാക്കുകൾ "rUSSKIJ tEKST" ആയി മാറും. ഒരു പാർശ്വഫലമെന്ന നിലയിൽ, സിറിലിക് അക്ഷരങ്ങൾ അക്ഷരമാലാ ക്രമത്തിലായിരുന്നില്ല.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്
8. ─ 2500 │ 2502 ┌250 സി ┐ 2510 └ 2514 ┘ 2518 ├ 251 സി ┤ 2524 ┬ 252 സി ┴ 2534 ┼ 253 സി ▀ 2580 ▄ 2584 █ 2588 ▌258C ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0 ∙ 2219 √ 221A ≈ 2248 ≤ 2264 ≥ 2265 A0 ⌡ 2321 °B0 ²B2 B7 ÷ F7
എ. ═ 2550 ║ 2551 ╒ 2552 യോ 451 ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A ╛255B ╜255C നമ്പർ 255D നമ്പർ 255E
ബി. ╟255F ╠ 2560 ╡ 2561 യോ 401 ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 നമ്പർ 256A നമ്പർ 256B ╬ 256 സി © A9
സി. yu 44E ഒരു 430 b 431 c 446 ഡി 434 ഇ 435 f 444 g 433 x 445 കൂടാതെ 438 439 43A വരെ l 43B മീറ്റർ 43 സി n 43D ഏകദേശം 43E
ഡി. n 43F i 44F p 440 441 മുതൽ ടി 442 443-ൽ f 436 432-ൽ b 44C s 44B s 437 sh 448 ഇ 44 ഡി w 449 h 447 b 44A
ഇ. യു 42ഇ എ 410 ബി 411 സി 426 ഡി 414 E 415 എഫ് 424 G 413 X 425 കൂടാതെ 418 Y 419 കെ 41 എ എൽ 41 ബി എം 41 സി എച്ച് 41 ഡി ഏകദേശം 41E
എഫ്. പി 41 എഫ് എനിക്ക് 42F ആണ് R 420 സി 421 ടി 422 423 എഫ് 416 ബി 412 b 42c എസ് 42 ബി W 417 SH 428 ഇ 42 ഡി Sch 429 Ch 427 b 42A

KOI8-U എൻകോഡിംഗ് (ഉക്രേനിയൻ)

ഇന്റർനെറ്റിലെ ആദ്യത്തെ റഷ്യൻ സ്റ്റാൻഡേർഡ് എൻകോഡിംഗായി KOI-8 മാറി.

KOI-8 എൻകോഡിംഗ് ഓപ്ഷനുകളിൽ IETF നിരവധി RFC-കൾ അംഗീകരിച്ചു:

  • RFC 1489 - KOI8-R (റഷ്യൻ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ);
  • RFC 2319 - KOI8-U (ഉക്രേനിയൻ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ);
  • RFC 1345 - ISO-IR-111 (പ്രധാന ശ്രേണിയുടെ നിർവചനത്തിൽ ഒരു പിശകോടെ).

നൽകിയിരിക്കുന്ന പട്ടികകളിൽ, അക്ഷരങ്ങൾക്ക് താഴെയുള്ള അക്കങ്ങൾ അക്ഷരത്തിന്റെ ഹെക്സാഡെസിമൽ കോഡ് സൂചിപ്പിക്കുന്നു യൂണികോഡ്.

KOI8-R (റഷ്യൻ) എൻകോഡിംഗ്

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്

8.

2500

2502

250 സി

2510

2514

2518

251 സി

2524

252 സി

2534

253 സി

2580

2584

2588

258 സി

2590

9.

2591

2592

2593

2320

25A0

2219

221എ

2248

2264

2265

A0

2321
°
B0
²
B2
·
B7
÷
F7

എ.

2550

2551

2552
യോ
451

2553

2554

2555

2556

2557

2558

2559

255എ

255 ബി

255 സി

255D

255ഇ

ബി.

255F

2560

2561
യോ
401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256 സി
©
A9

സി.
യു
44ഇ

430
ബി
431
സി
446
ഡി
434

435
എഫ്
444
ജി
433
എക്സ്
445
ഒപ്പം
438
th
439
ലേക്ക്
43എ
എൽ
43B
എം
43 സി
എൻ
43D

43ഇ

ഡി.
പി
43F

44F
ആർ
440
കൂടെ
441
ടി
442
ചെയ്തത്
443
ഒപ്പം
436
വി
432
ബി
44 സി
എസ്
44B
എച്ച്
437
w
448

44D
sch
449
എച്ച്
447
ബി
44എ

ഇ.
YU
42ഇ

410
ബി
411
സി
426
ഡി
414

415
എഫ്
424
ജി
413
എക്സ്
425
ഒപ്പം
418
വൈ
419
TO
41എ
എൽ
41 ബി
എം
41 സി
എച്ച്
41D
കുറിച്ച്
41ഇ

എഫ്.
പി
41F

42F
ആർ
420
കൂടെ
421
ടി
422
ചെയ്തത്
423
ഒപ്പം
416
IN
412
ബി
42 സി
എസ്
42 ബി
Z
417
ഡബ്ല്യു
428

42D
SCH
429
എച്ച്
427
കൊമ്മേഴ്സന്റ്
42A

മറ്റ് ഓപ്ഷനുകൾ

മറ്റെല്ലാം പൊരുത്തപ്പെടുന്നതിനാൽ, പൊരുത്തപ്പെടാത്ത പട്ടിക വരികൾ മാത്രമേ കാണിക്കൂ.

എൻകോഡിംഗ് KOI8-U (റഷ്യൻ-ഉക്രേനിയൻ)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്

എ.

2550

2551

2552
യോ
451
є
454

2554
і
456
ї
457

2557

2558

2559

255എ

255 ബി
ґ
491

255D

255ഇ

ബി.

255F

2560

2561
യോ
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490

256 സി
©
A9

എൻകോഡിംഗ് KOI8-RU (റഷ്യൻ-ബെലാറഷ്യൻ-ഉക്രേനിയൻ)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്

എ.

2550

2551

2552
യോ
451
є
454

2554
і
456
ї
457

2557

2558

2559

255എ

255 ബി
ґ
491
ў
45ഇ

255ഇ

ബി.

255F

2560

2561
യോ
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490
Ў
40ഇ
©
A9

KOI8-C എൻകോഡിംഗ് (മധ്യേഷ്യ)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ә
4D9
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49എ
Ҝ
49 സി
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
എ.
A0
ђ
452
ѓ
453
യോ
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45 എ
ћ
45 ബി
ќ
45 സി
ґ
491
ў
45ഇ
џ
45F
ബി.
2116
Ђ
402
Ѓ
403
യോ
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40 എ
Ћ
40 ബി
Ќ
40 സി
Ґ
490
Ў
40ഇ
Џ
40F

KOI8-T എൻകോഡിംഗ് (താജിക്ക്)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്
8. қ
49B
ғ
493

201എ
Ғ
492

201ഇ

2026

2020

2021

2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
9. Қ
49എ

2018

2019

201 സി

201D

2022

2013
-
2014

2122

203എ
എ. ӯ
4EF
Ӯ
4EE
യോ
451
¤
A4
ӣ
4E3
¦
A6
§
A7
«
എബി
¬
എ.സി
­
എ.ഡി
®
എ.ഇ
ബി. °
B0
±
B1
²
B2
യോ
401
Ӣ
4E2

B6
·
B7

2116
»
ബി.ബി
©
A9

എൻകോഡിംഗ് KOI8-O, KOI8-S (സ്ലാവിക്, പഴയ അക്ഷരവിന്യാസം)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്

8.
Ђ
0402
Ѓ
0403
¸
00B8
ѓ
0453

201ഇ

2026

2020
§
00A7

20എസി
¨
00A8
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F

9.
ђ
0452

2018

2019

201 സി

201D

2022

2013

2014
£
00A3
·
00B7
љ
0459

203എ
њ
045A
ќ
045C
ћ
045B
џ
045F

എ.

00A0
ѵ
0475
ѣ
0463
യോ
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00AE

2122
«
00AB
ѳ
0473
ґ
0491
ў
045E
´
00B4

ബി.
°
00B0
Ѵ
0474
Ѣ
0462
യോ
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2
»
00BB
Ѳ
0472
Ґ
0490
Ў
040E
©
00A9

ISO-IR-111, KOI8-E എൻകോഡിംഗ്

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്

എ.

00A0
ђ
0452
ѓ
0453
യോ
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
­
00AD
ў
045E
џ
045F

ബി.

2116
Ђ
0402
Ѓ
0403
യോ
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F

KOI8-യൂണിഫൈഡ്, KOI8-F എൻകോഡിംഗ്

KOI8-Unified (KOI8-F) എൻകോഡിംഗ് നിർദ്ദേശിച്ചത് ഫിംഗർടിപ്പ് സോഫ്റ്റ്‌വെയർ ആണ്.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .എ .ബി .സി .ഡി .ഇ .എഫ്

8.

2500

2502

250 സി

2510

2514

2518

251 സി

2524

252 സി

2534

253 സി

2580

2584

2588

258 സി

2590

9.

2591

2018

2019

201 സി

201D

2022

2013

2014
©
00A9

2122

00A0
»
00BB
®
00AE
«
00AB
·
00B7
¤
00A4

എ.

00A0
ђ
0452
ѓ
0453
യോ
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ґ
0491
ў
045E
џ
045F

ബി.

2116
Ђ
0402
Ѓ
0403
യോ
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Ґ
0490
Ў
040E
Џ
040F

KOI-8-ന്റെ നോൺ-സിറിലിക് വകഭേദങ്ങൾ

ചില രാജ്യങ്ങളിൽ CMEAദേശീയ വകഭേദങ്ങൾക്കായി KOI-8-ന്റെ പരിഷ്‌ക്കരണങ്ങൾ സൃഷ്ടിച്ചു ലാറ്റിൻ. അടിസ്ഥാന ആശയം ഒന്നുതന്നെയായിരുന്നു - എട്ടാമത്തെ ബിറ്റ് "മുറിക്കുമ്പോൾ", വാചകം കൂടുതലോ കുറവോ മനസ്സിലാക്കാവുന്നതായിരിക്കണം.

- ശരി, ആരംഭിക്കുക! ഡോലോഖോവ് പറഞ്ഞു.
“ശരി,” പിയറി പറഞ്ഞു, അപ്പോഴും പുഞ്ചിരിച്ചു. - അത് ഭയപ്പെടുത്തുന്നുണ്ടായിരുന്നു. വളരെ എളുപ്പത്തിൽ ആരംഭിച്ച കർമ്മം ഇനി ഒന്നിനും തടയാൻ കഴിയില്ലെന്നും അത് സ്വയം മുന്നോട്ട് പോയി, ഇതിനകം തന്നെ ജനങ്ങളുടെ ഇഷ്ടത്തിനനുസരിച്ച് സ്വതന്ത്രമായി, പൂർത്തീകരിക്കേണ്ടതുണ്ടെന്നും വ്യക്തമായിരുന്നു. ഡെനിസോവ് ആദ്യമായി തടസ്സത്തിലേക്ക് വന്ന് പ്രഖ്യാപിച്ചു:
- "എതിരാളികൾ" "അനുകരിക്കാൻ" വിസമ്മതിച്ചതിനാൽ, ആരംഭിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നില്ലേ: പിസ്റ്റളുകൾ എടുത്ത്, ടി "എന്ന വാക്ക് അനുസരിച്ച് ഒത്തുചേരാൻ തുടങ്ങുക.
- ജി ... "അസ്! ടു! ടി" ഒപ്പം! ... - ഡെനിസോവ് ദേഷ്യത്തോടെ നിലവിളിച്ച് മാറിനിന്നു. കോടമഞ്ഞിൽ പരസ്പരം തിരിച്ചറിഞ്ഞുകൊണ്ട് ഇരുവരും ചവിട്ടിയ പാതകളിലൂടെ അടുത്തുകൂടെ നടന്നു. പ്രതിയോഗികൾക്ക് അവർക്കാവശ്യമുള്ളപ്പോൾ വെടിവെക്കാനുള്ള അവകാശം ഉണ്ടായിരുന്നു, തടസ്സത്തിലേക്ക് ഒത്തുചേരുന്നു. ഡോളോഖോവ് തന്റെ പിസ്റ്റൾ ഉയർത്താതെ പതുക്കെ നടന്നു, തന്റെ പ്രകാശം, തിളങ്ങുന്ന, നീലക്കണ്ണുകൾ എതിരാളിയുടെ മുഖത്തേക്ക് നോക്കി. അവന്റെ വായിൽ എപ്പോഴും എന്നപോലെ ഒരു പുഞ്ചിരിയുടെ സാദൃശ്യം ഉണ്ടായിരുന്നു.
- അതിനാൽ എനിക്ക് ആവശ്യമുള്ളപ്പോൾ - എനിക്ക് ഷൂട്ട് ചെയ്യാം! - പിയറി പറഞ്ഞു, മൂന്ന് എന്ന വാക്കിൽ, അവൻ വേഗത്തിലുള്ള ചുവടുകളോടെ മുന്നോട്ട് പോയി, അടിച്ച പാതയിൽ നിന്ന് തെറ്റി, കട്ടിയുള്ള മഞ്ഞുവീഴ്ചയിൽ നടന്നു. പിയറി പിസ്റ്റൾ പിടിച്ചു, വലതു കൈ മുന്നോട്ട് നീട്ടി, ഈ പിസ്റ്റൾ ഉപയോഗിച്ച് സ്വയം കൊല്ലുമോ എന്ന് ഭയപ്പെട്ടു. അവൻ ഉത്സാഹത്തോടെ ഇടത് കൈ പിന്നിലേക്ക് വെച്ചു, കാരണം അത് ഉപയോഗിച്ച് വലതു കൈ താങ്ങാൻ ആഗ്രഹിച്ചു, പക്ഷേ ഇത് അസാധ്യമാണെന്ന് അവനറിയാമായിരുന്നു. ആറടി നടന്ന് മഞ്ഞുവീഴ്ചയിലേക്കുള്ള വഴി തെറ്റിയ ശേഷം, പിയറി അവന്റെ കാലുകളിലേക്ക് ചുറ്റും നോക്കി, വീണ്ടും വേഗത്തിൽ ഡോലോഖോവിനെ നോക്കി, അവൻ പഠിപ്പിച്ചതുപോലെ വിരൽ വലിച്ചുകൊണ്ട് വെടിവച്ചു. ഇത്രയും ശക്തമായ ശബ്ദം പ്രതീക്ഷിക്കാതെ, പിയറി തന്റെ ഷോട്ടിൽ പതറി, എന്നിട്ട് സ്വന്തം മതിപ്പ് കണ്ട് പുഞ്ചിരിച്ച് നിർത്തി. പുക, പ്രത്യേകിച്ച് മൂടൽമഞ്ഞ്, ആദ്യം അവനെ കാണുന്നതിൽ നിന്ന് തടഞ്ഞു; എന്നാൽ അവൻ കാത്തിരുന്ന മറ്റൊരു ഷോട്ട് വന്നില്ല. ഡോളോഖോവിന്റെ തിടുക്കത്തിലുള്ള ചുവടുകൾ മാത്രം കേട്ടു, പുകയുടെ പിന്നിൽ നിന്ന് അവന്റെ രൂപം പ്രത്യക്ഷപ്പെട്ടു. ഒരു കൈകൊണ്ട് അവൻ ഇടതുവശത്ത് മുറുകെ പിടിച്ചു, മറ്റേ കൈകൊണ്ട് അവൻ താഴ്ത്തിയ പിസ്റ്റൾ മുറുകെ പിടിച്ചു. അവന്റെ മുഖം വിളറി. റോസ്തോവ് ഓടിവന്ന് അവനോട് എന്തോ പറഞ്ഞു.
- ഇല്ല ... ഇല്ല ... ടി, - ദോലോഖോവ് പല്ലുകളിലൂടെ പറഞ്ഞു, - ഇല്ല, അത് അവസാനിച്ചിട്ടില്ല, - കുറച്ച് കൂടി വീണുകിടക്കുന്ന ചുവടുകൾ വളരെ സേബറിലേക്ക് എടുത്ത്, അയാൾ അതിനടുത്തുള്ള മഞ്ഞിൽ വീണു. ഇടതുകൈ രക്തം പുരണ്ടിരുന്നു, അയാൾ അത് കോട്ടിൽ തുടച്ച് അതിൽ ചാരി കിടന്നു. അവന്റെ മുഖം വിളറി, നെറ്റി ചുളിക്കുകയും വിറയ്ക്കുകയും ചെയ്തു.
"ഇത് ഒരു ദയനീയമാണ് ..." ഡോലോഖോവ് ആരംഭിച്ചു, പക്ഷേ അയാൾക്ക് അത് ഉടനടി ഉച്ചരിക്കാൻ കഴിഞ്ഞില്ല ... "ഒരുപക്ഷേ," അവൻ ഒരു ശ്രമത്തോടെ പൂർത്തിയാക്കി. പിയറി, കഷ്ടിച്ച് കരച്ചിൽ അടക്കി, ഡോലോഖോവിലേക്ക് ഓടി, തടസ്സങ്ങളെ വേർതിരിക്കുന്ന ഇടം കടക്കാൻ പോകുകയായിരുന്നു, ഡോലോഖോവ് വിളിച്ചുപറഞ്ഞപ്പോൾ: - തടസ്സത്തിലേക്ക്! - എന്താണ് സംഭവിക്കുന്നതെന്ന് മനസിലാക്കിയ പിയറി തന്റെ സേബറിൽ നിർത്തി. 10 പടികൾ മാത്രമാണ് അവരെ വേർതിരിക്കുന്നത്. ഡോളോഖോവ് ഹിമത്തിലേക്ക് തല താഴ്ത്തി, അത്യാഗ്രഹത്തോടെ മഞ്ഞ് കടിച്ചു, തല വീണ്ടും ഉയർത്തി, സ്വയം തിരുത്തി, കാലുകൾ ഉയർത്തി, ഉറച്ച ഗുരുത്വാകർഷണ കേന്ദ്രം നോക്കി ഇരുന്നു. അവൻ തണുത്ത മഞ്ഞ് വിഴുങ്ങി, അത് വലിച്ചെടുത്തു; അവന്റെ ചുണ്ടുകൾ വിറച്ചു, പക്ഷേ ഇപ്പോഴും പുഞ്ചിരിക്കുന്നു; അവസാനം ശേഖരിച്ച ശക്തിയുടെ പ്രയത്നവും ദുരുദ്ദേശവും കൊണ്ട് അവന്റെ കണ്ണുകൾ തിളങ്ങി. അവൻ പിസ്റ്റൾ ഉയർത്തി ലക്ഷ്യമെടുത്തു.
"വശത്തേക്ക്, ഒരു പിസ്റ്റൾ ഉപയോഗിച്ച് സ്വയം മൂടുക," നെസ്വിറ്റ്സ്കി പറഞ്ഞു.
- 3ak "ope!" - സഹിക്കാൻ കഴിയാതെ ഡെനിസോവ് പോലും എതിരാളിയോട് ആക്രോശിച്ചു.
പശ്ചാത്താപത്തിന്റെയും പശ്ചാത്താപത്തിന്റെയും സൗമ്യമായ പുഞ്ചിരിയോടെ, നിസ്സഹായനായി കാലുകളും കൈകളും വിടർത്തി, വിശാലമായ നെഞ്ചുമായി ഡോളോഖോവിന്റെ മുന്നിൽ നേരിട്ട് നിന്ന് അവനെ സങ്കടത്തോടെ നോക്കി. ഡെനിസോവ്, റോസ്തോവ്, നെസ്വിറ്റ്സ്കി എന്നിവർ കണ്ണുകൾ അടച്ചു. അതേ സമയം അവർ ഡോളോഖോവിൽ നിന്ന് ഒരു വെടിയും കോപാകുലമായ നിലവിളിയും കേട്ടു.
- കഴിഞ്ഞ! - ഡോലോഖോവ് അലറി, ശക്തിയില്ലാതെ മുഖം താഴ്ത്തി മഞ്ഞിൽ കിടന്നു. പിയറി തലയിൽ മുറുകെ പിടിച്ച്, പിന്നോട്ട് തിരിഞ്ഞ് കാട്ടിലേക്ക് പോയി, പൂർണ്ണമായും മഞ്ഞുവീഴ്ചയിൽ നടന്ന് ഉച്ചത്തിൽ മനസ്സിലാക്കാൻ കഴിയാത്ത വാക്കുകൾ പറഞ്ഞു:
"മണ്ടൻ... മണ്ടൻ!" മരണം... നുണ.. - അവൻ ആവർത്തിച്ചു. നെസ്വിറ്റ്സ്കി അവനെ തടഞ്ഞു വീട്ടിലേക്ക് കൊണ്ടുപോയി.
റോസ്തോവും ഡെനിസോവും പരിക്കേറ്റ ഡോളോഖോവിനെ വഹിച്ചു.
ഡോളോഖോവ്, നിശബ്ദമായി, അടഞ്ഞ കണ്ണുകളോടെ, സ്ലീയിൽ കിടന്നു, തന്നോട് ചോദിച്ച ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാതെ; പക്ഷേ, മോസ്കോയിൽ പ്രവേശിച്ച അദ്ദേഹം പെട്ടെന്ന് തന്റെ അടുത്തേക്ക് വന്നു, പ്രയാസത്തോടെ തല ഉയർത്തി, തന്റെ അരികിൽ ഇരുന്ന റോസ്തോവിനെ കൈയ്യിൽ പിടിച്ചു. ഡോളോഖോവിന്റെ മുഖത്തിന്റെ പൂർണ്ണമായും മാറിയതും അപ്രതീക്ഷിതവുമായ ആവേശത്തോടെയുള്ള ആർദ്രമായ ഭാവം റോസ്തോവിനെ ഞെട്ടിച്ചു.
- നന്നായി? നിനക്ക് എന്തുതോന്നുന്നു? റോസ്തോവ് ചോദിച്ചു.
- മോശം! പക്ഷേ അതല്ല കാര്യം. എന്റെ സുഹൃത്ത്, - തകർന്ന ശബ്ദത്തിൽ ഡോലോഖോവ് പറഞ്ഞു, - ഞങ്ങൾ എവിടെയാണ്? ഞങ്ങൾ മോസ്കോയിലാണ്, എനിക്കറിയാം. എനിക്ക് സുഖമാണ്, പക്ഷേ ഞാൻ അവളെ കൊന്നു, അവളെ കൊന്നു ... അവൾക്ക് അത് ഉൾക്കൊള്ളാൻ കഴിയില്ല. അവൾ സഹിക്കില്ല...
- WHO? റോസ്തോവ് ചോദിച്ചു.
- എന്റെ അമ്മ. എന്റെ അമ്മ, എന്റെ മാലാഖ, എന്റെ പ്രിയപ്പെട്ട മാലാഖ, അമ്മ - ഒപ്പം ഡോലോഖോവും റോസ്തോവിന്റെ കൈ ഞെക്കി കരയാൻ തുടങ്ങി. അവൻ അൽപ്പം ശാന്തനായപ്പോൾ, താൻ അമ്മയോടൊപ്പമാണ് താമസിക്കുന്നതെന്നും അമ്മ മരിക്കുന്നത് കണ്ടാൽ അവൾക്ക് അത് സഹിക്കാൻ കഴിയില്ലെന്നും റോസ്തോവിനോട് വിശദീകരിച്ചു. അവളുടെ അടുത്ത് പോയി അവളെ തയ്യാറാക്കാൻ അവൻ റോസ്തോവിനോട് അപേക്ഷിച്ചു.
റോസ്തോവ് അസൈൻമെന്റ് നിർവ്വഹിക്കാൻ മുന്നോട്ട് പോയി, ഈ കലഹക്കാരനായ ഡോലോഖോവ് മോസ്കോയിൽ പ്രായമായ അമ്മയോടും കൂൺബാക്കഡ് സഹോദരിയോടും ഒപ്പം താമസിച്ചിരുന്നുവെന്നും ഏറ്റവും ആർദ്രമായ മകനും സഹോദരനുമായിരുന്നുവെന്ന് അദ്ദേഹം മനസ്സിലാക്കി.

പിയറി ഈയിടെയായി ഭാര്യയെ മുഖാമുഖം കാണുന്നത് വളരെ അപൂർവമായിരുന്നു. സെന്റ് പീറ്റേഴ്സ്ബർഗിലും മോസ്കോയിലും അവരുടെ വീട്ടിൽ നിരന്തരം അതിഥികൾ നിറഞ്ഞിരുന്നു. ദ്വന്ദ്വയുദ്ധത്തിന് ശേഷമുള്ള അടുത്ത രാത്രി, അവൻ പലപ്പോഴും ചെയ്തതുപോലെ, അവൻ കിടപ്പുമുറിയിൽ പോകാതെ, തന്റെ വലിയ, പിതാവിന്റെ പഠനത്തിൽ തന്നെ തുടർന്നു, അതിൽ കൗണ്ട് ബെസുഹി മരിച്ചു.
സോഫയിൽ കിടന്നുറങ്ങി, സംഭവിച്ചതെല്ലാം മറക്കാൻ അവൻ ഉറങ്ങാൻ ആഗ്രഹിച്ചു, പക്ഷേ അവന് അത് ചെയ്യാൻ കഴിഞ്ഞില്ല. അത്തരം വികാരങ്ങളുടെയും ചിന്തകളുടെയും ഓർമ്മകളുടെയും കൊടുങ്കാറ്റ് അവന്റെ ആത്മാവിൽ പെട്ടെന്ന് ഉയർന്നു, അയാൾക്ക് ഉറങ്ങാൻ മാത്രമല്ല, ഇരിക്കാനും കഴിയില്ല, സോഫയിൽ നിന്ന് ചാടി വേഗത്തിൽ ചുവടുകളോടെ മുറിക്ക് ചുറ്റും നടക്കേണ്ടിവന്നു. വിവാഹശേഷം, നഗ്നമായ തോളും ക്ഷീണിച്ച, വികാരാധീനമായ നോട്ടവുമായി അവൻ അവളെ ആദ്യമായി സങ്കൽപ്പിച്ചു, അവളുടെ അരികിൽ, അത്താഴസമയത്ത് ഡോലോഖോവിന്റെ സുന്ദരവും ധിക്കാരവും ഉറച്ച പരിഹാസവും ഉള്ള മുഖവും ഡോളോഖോവിന്റെ അതേ മുഖവും അയാൾ കണ്ടു. , തിരിഞ്ഞ് മഞ്ഞിൽ വീണപ്പോൾ വിളറി, വിറച്ചു, കഷ്ടപ്പെട്ടു.
"എന്ത് സംഭവിച്ചു? അവൻ സ്വയം ചോദിച്ചു. “ഞാൻ എന്റെ കാമുകനെ കൊന്നു, അതെ, ഞാൻ എന്റെ ഭാര്യയുടെ കാമുകനെ കൊന്നു. അതെ, അത് ആയിരുന്നു. എന്തില്നിന്ന്? ഞാൻ എങ്ങനെ അവിടെ എത്തി? "കാരണം നിങ്ങൾ അവളെ വിവാഹം കഴിച്ചു," ആന്തരിക ശബ്ദം ഉത്തരം നൽകി.
“എന്നാൽ എന്റെ തെറ്റ് എന്താണ്? അവന് ചോദിച്ചു. "അവളെ സ്നേഹിക്കാതെയാണ് നിങ്ങൾ വിവാഹം കഴിച്ചത്, നിങ്ങളെയും അവളെയും നിങ്ങൾ വഞ്ചിച്ചു എന്ന വസ്തുതയിൽ," അത്താഴത്തിന് ശേഷം വാസിലി രാജകുമാരന്റെ ആ നിമിഷം, അവനിൽ നിന്ന് പുറത്തുവരാത്ത ഈ വാക്കുകൾ പറഞ്ഞപ്പോൾ അവൻ വ്യക്തമായി സങ്കൽപ്പിച്ചു: "ജെ. നിങ്ങളുടെ ലക്ഷ്യം." [ഞാൻ നിന്നെ സ്നേഹിക്കുന്നു.] ഇതിൽ നിന്ന് എല്ലാം! എനിക്ക് അപ്പോൾ തോന്നി, അവൻ വിചാരിച്ചു, എനിക്ക് അതിന് അവകാശമില്ല എന്നല്ല എനിക്ക് അപ്പോൾ തോന്നിയത്. അങ്ങനെ അത് സംഭവിച്ചു." അവൻ മധുവിധു ഓർത്തു, ഓർത്തു നാണിച്ചു. ഒരു ദിവസം, തന്റെ വിവാഹം കഴിഞ്ഞ്, ഉച്ചയ്ക്ക് 12 മണിക്ക്, പട്ടുവസ്ത്രം ധരിച്ച ഗൗൺ ധരിച്ച്, കിടപ്പുമുറിയിൽ നിന്ന് ഓഫീസിലേക്ക് വന്നതും ഓഫീസിൽ കണ്ടതും എങ്ങനെയെന്ന ഓർമ്മയാണ് അദ്ദേഹത്തിന് പ്രത്യേകിച്ച് ഉജ്ജ്വലവും അപമാനകരവും ലജ്ജാകരവും. ബഹുമാനപൂർവ്വം തലകുനിച്ച ചീഫ് മാനേജർ, തന്റെ ഡ്രസ്സിംഗ് ഗൗണിൽ പിയറിയുടെ മുഖത്തേക്ക് നോക്കി ചെറുതായി പുഞ്ചിരിച്ചു, ഈ പുഞ്ചിരിയോടെ തന്റെ പ്രിൻസിപ്പലിന്റെ സന്തോഷത്തോട് ആദരവോടെ സഹതാപം പ്രകടിപ്പിക്കുന്നതുപോലെ.
"എത്ര തവണ ഞാൻ അവളെക്കുറിച്ച് അഭിമാനിച്ചിട്ടുണ്ട്, അവളുടെ ഗാംഭീര്യമുള്ള സൗന്ദര്യത്തിൽ, അവളുടെ ലൗകിക നയത്തിൽ അഭിമാനിക്കുന്നു," അവൻ ചിന്തിച്ചു; പീറ്റേഴ്‌സ്ബർഗിൽ നിന്ന് അവൾ സ്വീകരിച്ച തന്റെ വീടിനെക്കുറിച്ച് അയാൾ അഭിമാനിച്ചു, അവളുടെ അപ്രാപ്യതയിലും സൗന്ദര്യത്തിലും അഭിമാനിച്ചു. അപ്പോൾ ഞാൻ എന്താണ് അഭിമാനിക്കുന്നത്? ആ സമയം ഞാൻ വിചാരിച്ചു അവളെ എനിക്ക് മനസ്സിലായില്ല എന്ന്. എത്ര പ്രാവശ്യം, അവളുടെ സ്വഭാവത്തെക്കുറിച്ച് ആലോചിച്ച്, എനിക്ക് അവളെ മനസ്സിലാകാത്തത് എന്റെ തെറ്റാണെന്നും, ഈ ശാശ്വതമായ ശാന്തത, സംതൃപ്തി, മുൻ‌ഗണനകളുടെയും ആഗ്രഹങ്ങളുടെയും അഭാവം എന്നിവ എനിക്ക് മനസ്സിലായില്ലെന്നും ഞാൻ സ്വയം പറഞ്ഞു, മുഴുവൻ സൂചനയും ആ ഭയങ്കരമായ വാക്കിൽ ഉണ്ടായിരുന്നു. അവൾ ഒരു ദുഷിച്ച സ്ത്രീയായിരുന്നുവെന്ന്: സ്വയം ഈ ഭയങ്കരമായ വാക്ക്, എല്ലാം വ്യക്തമായി!
“അനറ്റോൾ അവളിൽ നിന്ന് പണം കടം വാങ്ങാൻ അവളുടെ അടുത്തേക്ക് പോയി അവളുടെ നഗ്നമായ തോളിൽ ചുംബിച്ചു. അവൾ അവന് പണം നൽകിയില്ല, പക്ഷേ അവൾ അവനെ ചുംബിക്കാൻ അനുവദിച്ചു. അവളുടെ അച്ഛൻ തമാശയായി അവളിൽ അസൂയ ഉണർത്തി; അവൾ അസൂയപ്പെടാൻ തക്ക മണ്ടനല്ലെന്ന് ശാന്തമായ പുഞ്ചിരിയോടെ പറഞ്ഞു: അവൾ ആഗ്രഹിക്കുന്നത് ചെയ്യട്ടെ, അവൾ എന്നെക്കുറിച്ച് പറഞ്ഞു. ഗര് ഭിണിയായതിന്റെ ലക്ഷണമുണ്ടോ എന്ന് ഒരിക്കല് ​​ഞാന് അവളോട് ചോദിച്ചു. അവൾ അവജ്ഞയോടെ ചിരിച്ചു, കുട്ടികളുണ്ടാകാൻ ആഗ്രഹിക്കുന്ന ഒരു വിഡ്ഢിയല്ല അവൾ, എന്നിൽ നിന്ന് അവൾക്ക് കുട്ടികൾ ഉണ്ടാകില്ല.
ഉയർന്ന പ്രഭുക്കന്മാരുടെ വലയത്തിൽ വളർന്നിട്ടും അവളുടെ പരുക്കൻ സ്വഭാവവും അവളുടെ ചിന്തകളുടെ വ്യക്തതയും അവളുടെ ഭാവങ്ങളുടെ അശ്ലീലതയും അവൻ ഓർത്തു. "ഞാൻ ഒരുതരം വിഡ്ഢിയല്ല... പോയി സ്വയം പരീക്ഷിച്ചു നോക്കൂ... allez vous promener," [പുറത്തുപോവുക,] അവൾ പറഞ്ഞു. പലപ്പോഴും, പ്രായമായവരുടെയും യുവാക്കളുടെയും സ്ത്രീകളുടെയും കണ്ണുകളിൽ അവളുടെ വിജയം നോക്കുമ്പോൾ, എന്തുകൊണ്ടാണ് താൻ അവളെ സ്നേഹിക്കാത്തതെന്ന് പിയറിന് മനസ്സിലാക്കാൻ കഴിഞ്ഞില്ല. അതെ, ഞാൻ അവളെ ഒരിക്കലും സ്നേഹിച്ചിട്ടില്ല, പിയറി സ്വയം പറഞ്ഞു; അവൾ ഒരു ദുഷിച്ച സ്ത്രീയാണെന്ന് എനിക്കറിയാമായിരുന്നു, അവൻ സ്വയം ആവർത്തിച്ചു, പക്ഷേ അത് സമ്മതിക്കാൻ അവൻ ധൈര്യപ്പെട്ടില്ല.

ഹലോ, ബ്ലോഗ് സൈറ്റിന്റെ പ്രിയ വായനക്കാർ. സൈറ്റിലും പ്രോഗ്രാമുകളിലും ക്രാക്കോസിയാബ്രുകൾ എവിടെ നിന്നാണ് വരുന്നത്, ഏത് ടെക്സ്റ്റ് എൻകോഡിംഗുകൾ നിലവിലുണ്ട്, ഏതൊക്കെ ഉപയോഗിക്കണം എന്നതിനെക്കുറിച്ച് ഇന്ന് ഞങ്ങൾ നിങ്ങളോട് സംസാരിക്കും. അടിസ്ഥാന ASCII മുതൽ അതിന്റെ വിപുലീകൃത പതിപ്പുകൾ CP866, KOI8-R, Windows 1251 എന്നിവയിൽ നിന്ന് ആരംഭിച്ച്, യൂണികോഡ് കൺസോർഷ്യം UTF 16, 8 എന്നിവയുടെ ആധുനിക എൻകോഡിംഗുകളിൽ അവസാനിക്കുന്ന അവരുടെ വികസനത്തിന്റെ ചരിത്രം നമുക്ക് സൂക്ഷ്മമായി പരിശോധിക്കാം.

ചിലർക്ക്, ഈ വിവരങ്ങൾ അനാവശ്യമായി തോന്നിയേക്കാം, എന്നാൽ ക്രാൾഡ് ഔട്ട് ക്രാക്കോസിയാബ്രുകളെ (വായിക്കാനാകാത്ത അക്ഷരക്കൂട്ടം) സംബന്ധിച്ച് എനിക്ക് പ്രത്യേകമായി എത്ര ചോദ്യങ്ങൾ ഉണ്ടെന്ന് നിങ്ങൾക്കറിയാം. ഈ ലേഖനത്തിന്റെ വാചകത്തിലേക്ക് എല്ലാവരേയും റഫർ ചെയ്യാനും സ്വതന്ത്രമായി എന്റെ ജാംബുകൾക്കായി നോക്കാനും ഇപ്പോൾ എനിക്ക് അവസരം ലഭിക്കും. ശരി, വിവരങ്ങൾ ഉൾക്കൊള്ളാൻ തയ്യാറാകൂ, കഥയുടെ ഗതി പിന്തുടരാൻ ശ്രമിക്കുക.

ASCII - ലാറ്റിനിനായുള്ള അടിസ്ഥാന ടെക്സ്റ്റ് എൻകോഡിംഗ്

ടെക്സ്റ്റ് എൻകോഡിംഗുകളുടെ വികസനം ഐടി വ്യവസായത്തിന്റെ രൂപീകരണത്തോടൊപ്പം ഒരേസമയം സംഭവിച്ചു, ഈ സമയത്ത് അവർക്ക് വളരെയധികം മാറ്റങ്ങൾ വരുത്താൻ കഴിഞ്ഞു. ചരിത്രപരമായി, ഇതെല്ലാം ആരംഭിച്ചത് ഇബിസിഡിഐസിയിൽ നിന്നാണ്, ഇത് റഷ്യൻ ഉച്ചാരണത്തിൽ തികച്ചും വ്യത്യസ്തമായിരുന്നു, ഇത് ലാറ്റിൻ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ, അറബി അക്കങ്ങൾ, വിരാമചിഹ്നങ്ങൾ എന്നിവ നിയന്ത്രണ പ്രതീകങ്ങളോടെ എൻകോഡ് ചെയ്യുന്നത് സാധ്യമാക്കി.

എന്നിട്ടും, ആധുനിക ടെക്സ്റ്റ് എൻകോഡിംഗുകളുടെ വികസനത്തിന്റെ ആരംഭ പോയിന്റ് പ്രസിദ്ധമായി കണക്കാക്കണം ആസ്കി(അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇന്റർചേഞ്ച്, റഷ്യൻ ഭാഷയിൽ ഇത് സാധാരണയായി "ആസ്കി" എന്ന് ഉച്ചരിക്കുന്നു). ഇംഗ്ലീഷ് ഉപയോക്താക്കൾ ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന ആദ്യത്തെ 128 പ്രതീകങ്ങൾ - , അറബിക് അക്കങ്ങൾ, വിരാമചിഹ്നങ്ങൾ എന്നിവ ഇത് വിവരിക്കുന്നു.

ASCII-ൽ വിവരിച്ചിരിക്കുന്ന ഈ 128 പ്രതീകങ്ങളിൽ പോലും, ബ്രാക്കറ്റുകൾ, ബാറുകൾ, നക്ഷത്രചിഹ്നങ്ങൾ തുടങ്ങിയ ചില സേവന പ്രതീകങ്ങൾ ഉണ്ടായിരുന്നു. വാസ്തവത്തിൽ, നിങ്ങൾക്ക് അവ സ്വയം കാണാൻ കഴിയും:

ASCII-യുടെ യഥാർത്ഥ പതിപ്പിൽ നിന്നുള്ള ഈ 128 പ്രതീകങ്ങളാണ് സ്റ്റാൻഡേർഡ് ആയി മാറിയത്, മറ്റേതെങ്കിലും എൻകോഡിംഗിൽ നിങ്ങൾ തീർച്ചയായും അവരെ കണ്ടുമുട്ടുകയും അവ ആ ക്രമത്തിൽ നിൽക്കുകയും ചെയ്യും.

എന്നാൽ ഒരു ബൈറ്റ് വിവരത്തിന്റെ സഹായത്തോടെ, 128 അല്ല, 256 വ്യത്യസ്ത മൂല്യങ്ങൾ (എട്ടിന്റെ പവർ രണ്ട് മുതൽ 256 വരെ) എൻകോഡ് ചെയ്യാൻ കഴിയും എന്നതാണ് വസ്തുത. അസുക, ഒരു മുഴുവൻ പരമ്പര വിപുലീകരിച്ച ASCII എൻകോഡിംഗുകൾ, ഇതിൽ, 128 അടിസ്ഥാന പ്രതീകങ്ങൾക്ക് പുറമേ, ദേശീയ എൻകോഡിംഗിന്റെ ചിഹ്നങ്ങൾ എൻകോഡ് ചെയ്യാനും സാധിച്ചു (ഉദാഹരണത്തിന്, റഷ്യൻ).

ഇവിടെ, ഒരുപക്ഷേ, വിവരണത്തിൽ ഉപയോഗിക്കുന്ന നമ്പർ സിസ്റ്റങ്ങളെക്കുറിച്ച് കുറച്ചുകൂടി പറയേണ്ടതാണ്. ഒന്നാമതായി, നിങ്ങൾക്കെല്ലാവർക്കും അറിയാവുന്നതുപോലെ, ഒരു കമ്പ്യൂട്ടർ ബൈനറി സിസ്റ്റത്തിലെ അക്കങ്ങൾ ഉപയോഗിച്ച് മാത്രമേ പ്രവർത്തിക്കൂ, അതായത് പൂജ്യങ്ങളും വണ്ണുകളും ("ബൂളിയൻ ആൾജിബ്ര", ആരെങ്കിലും ഒരു ഇൻസ്റ്റിറ്റ്യൂട്ടിലോ സ്കൂളിലോ പഠിച്ചിട്ടുണ്ടെങ്കിൽ). , ഓരോന്നും ഡിഗ്രിയിലെ രണ്ട്, പൂജ്യത്തിൽ നിന്ന് തുടങ്ങി ഏഴാമത്തേതിൽ രണ്ട് വരെ:

അത്തരമൊരു നിർമ്മിതിയിൽ സാധ്യമായ പൂജ്യങ്ങളുടെയും ഒന്നിന്റെയും സംയോജനങ്ങളിൽ 256 മാത്രമേ ഉണ്ടാകൂ എന്ന് മനസ്സിലാക്കാൻ പ്രയാസമില്ല.ഒരു സംഖ്യയെ ബൈനറിയിൽ നിന്ന് ദശാംശത്തിലേക്ക് പരിവർത്തനം ചെയ്യുന്നത് വളരെ ലളിതമാണ്. രണ്ടിന്റെ എല്ലാ ശക്തികളും നിങ്ങൾ കൂട്ടിച്ചേർക്കേണ്ടതുണ്ട്, അതിൽ ഒന്നുണ്ട്.

ഞങ്ങളുടെ ഉദാഹരണത്തിൽ, ഇത് 1 (2 മുതൽ പൂജ്യത്തിന്റെ ശക്തി) പ്ലസ് 8 (രണ്ട് മുതൽ 3 വരെ), പ്ലസ് 32 (രണ്ട് മുതൽ അഞ്ചാം വരെ), പ്ലസ് 64 (ആറാം), പ്ലസ് 128 (ഏഴാം വരെ) . ദശാംശ നൊട്ടേഷനിൽ ആകെ 233 ലഭിക്കുന്നു. നിങ്ങൾക്ക് കാണാനാകുന്നതുപോലെ, എല്ലാം വളരെ ലളിതമാണ്.

എന്നാൽ നിങ്ങൾ ASCII പ്രതീകങ്ങളുള്ള പട്ടിക സൂക്ഷ്മമായി പരിശോധിച്ചാൽ, അവ ഹെക്സാഡെസിമൽ എൻകോഡിംഗിൽ പ്രതിനിധീകരിക്കുന്നത് നിങ്ങൾ കാണും. ഉദാഹരണത്തിന്, "നക്ഷത്രചിഹ്നം" അസ്കിയിൽ ഹെക്സാഡെസിമൽ സംഖ്യ 2A യുമായി യോജിക്കുന്നു. അറബി അക്കങ്ങൾക്ക് പുറമേ, ഹെക്സാഡെസിമൽ സംഖ്യാ സമ്പ്രദായം എ (പത്ത് എന്നർത്ഥം) മുതൽ എഫ് (പതിനഞ്ച് എന്നർത്ഥം) വരെയുള്ള ലാറ്റിൻ അക്ഷരങ്ങളും ഉപയോഗിക്കുന്നുണ്ടെന്ന് നിങ്ങൾക്കറിയാം.

നന്നായി, വേണ്ടി ബൈനറിയെ ഹെക്സാഡെസിമലിലേക്ക് പരിവർത്തനം ചെയ്യുകഇനിപ്പറയുന്ന ലളിതവും ദൃശ്യപരവുമായ രീതി അവലംബിക്കുക. മുകളിലെ സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്നതുപോലെ, വിവരങ്ങളുടെ ഓരോ ബൈറ്റും നാല് ബിറ്റുകളുടെ രണ്ട് ഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്നു. അത്. ഓരോ പകുതി ബൈറ്റിലും, പതിനാറ് മൂല്യങ്ങൾ മാത്രമേ ബൈനറി കോഡിൽ (രണ്ട് മുതൽ നാലാമത്തെ പവർ വരെ) എൻകോഡ് ചെയ്യാൻ കഴിയൂ, അത് ഒരു ഹെക്സാഡെസിമൽ സംഖ്യയായി എളുപ്പത്തിൽ പ്രതിനിധീകരിക്കാം.

മാത്രമല്ല, ബൈറ്റിന്റെ ഇടത് പകുതിയിൽ, പൂജ്യത്തിൽ നിന്ന് ആരംഭിക്കുന്ന ഡിഗ്രികൾ വീണ്ടും എണ്ണേണ്ടത് ആവശ്യമാണ്, സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്നതുപോലെയല്ല. തൽഫലമായി, ലളിതമായ കണക്കുകൂട്ടലുകൾ വഴി, സ്ക്രീൻഷോട്ടിൽ E9 എന്ന നമ്പർ എൻകോഡ് ചെയ്തിട്ടുണ്ടെന്ന് നമുക്ക് ലഭിക്കും. എന്റെ യുക്തിയുടെ ഗതിയും ഈ പസിലിനുള്ള പരിഹാരവും നിങ്ങൾക്ക് വ്യക്തമായിരിക്കുമെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു. ശരി, ഇപ്പോൾ നമുക്ക് തുടരാം, വാസ്തവത്തിൽ, ടെക്സ്റ്റ് എൻകോഡിംഗുകളെക്കുറിച്ച് സംസാരിക്കാം.

അസുകയുടെ വിപുലീകൃത പതിപ്പുകൾ - സ്യൂഡോഗ്രാഫിക്സുള്ള CP866, KOI8-R എൻകോഡിംഗുകൾ

അതിനാൽ, ഞങ്ങൾ ASCII നെക്കുറിച്ച് സംസാരിക്കാൻ തുടങ്ങി, അത് എല്ലാ ആധുനിക എൻകോഡിംഗുകളുടെയും (Windows 1251, യൂണികോഡ്, UTF 8) വികസനത്തിന്റെ ആരംഭ പോയിന്റായിരുന്നു.

തുടക്കത്തിൽ, അതിൽ ലാറ്റിൻ അക്ഷരമാലയുടെയും അറബി അക്കങ്ങളുടെയും മറ്റെന്തെങ്കിലും അക്ഷരങ്ങളുടെയും 128 പ്രതീകങ്ങൾ മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ, എന്നാൽ വിപുലീകൃത പതിപ്പിൽ ഒരു ബൈറ്റ് വിവരങ്ങളിൽ എൻകോഡ് ചെയ്യാൻ കഴിയുന്ന എല്ലാ 256 മൂല്യങ്ങളും ഉപയോഗിക്കാൻ സാധിച്ചു. ആ. നിങ്ങളുടെ ഭാഷയിലെ അക്ഷരങ്ങളുടെ പ്രതീകങ്ങൾ Asci-യിലേക്ക് ചേർക്കുന്നത് സാധ്യമായി.

ഇവിടെ വിശദീകരിക്കാൻ ഒരിക്കൽ കൂടി വ്യതിചലിക്കേണ്ടതുണ്ട് - നിങ്ങൾക്ക് എന്തിനാണ് കോഡിംഗ് വേണ്ടത്?വാചകങ്ങൾ, എന്തുകൊണ്ട് അത് വളരെ പ്രധാനമാണ്. നിങ്ങളുടെ കമ്പ്യൂട്ടർ സ്‌ക്രീനിലെ പ്രതീകങ്ങൾ രണ്ട് കാര്യങ്ങളുടെ അടിസ്ഥാനത്തിലാണ് രൂപപ്പെടുന്നത് - എല്ലാത്തരം പ്രതീകങ്ങളുടെയും വെക്റ്റർ ആകൃതികളുടെ (പ്രാതിനിധ്യങ്ങൾ) സെറ്റുകൾ (അവ കോ ഫയലുകളിലാണ്) ഈ വെക്റ്റർ രൂപങ്ങളിൽ നിന്ന് പുറത്തെടുക്കാൻ നിങ്ങളെ അനുവദിക്കുന്ന ഒരു കോഡ് ( ഫോണ്ട് ഫയൽ) നിങ്ങൾ ശരിയായ സ്ഥലത്ത് തിരുകേണ്ട പ്രതീകം.

വെക്റ്റർ ഫോമുകൾക്ക് ഫോണ്ടുകൾ ഉത്തരവാദികളാണെന്ന് വ്യക്തമാണ്, എന്നാൽ ഓപ്പറേറ്റിംഗ് സിസ്റ്റവും അതിൽ ഉപയോഗിക്കുന്ന പ്രോഗ്രാമുകളും എൻകോഡിംഗിന് ഉത്തരവാദികളാണ്. ആ. നിങ്ങളുടെ കമ്പ്യൂട്ടറിലെ ഏത് ടെക്‌സ്‌റ്റും ഒരു കൂട്ടം ബൈറ്റുകളായിരിക്കും, അവ ഓരോന്നും ഈ വാചകത്തിന്റെ ഒരു പ്രതീകം എൻകോഡ് ചെയ്യുന്നു.

ഈ വാചകം സ്ക്രീനിൽ പ്രദർശിപ്പിക്കുന്ന പ്രോഗ്രാം (ടെക്സ്റ്റ് എഡിറ്റർ, ബ്രൗസർ മുതലായവ), കോഡ് പാഴ്‌സ് ചെയ്യുമ്പോൾ, അടുത്ത പ്രതീകത്തിന്റെ എൻകോഡിംഗ് വായിക്കുകയും ഈ വാചകം പ്രദർശിപ്പിക്കുന്നതിന് ബന്ധിപ്പിച്ചിരിക്കുന്ന ആവശ്യമുള്ള ഫോണ്ട് ഫയലിൽ അനുബന്ധ വെക്റ്റർ ഫോമിനായി തിരയുകയും ചെയ്യുന്നു. പ്രമാണം. എല്ലാം ലളിതവും നിസ്സാരവുമാണ്.

ഇതിനർത്ഥം, നമുക്ക് ആവശ്യമുള്ള ഏത് പ്രതീകവും എൻകോഡ് ചെയ്യുന്നതിന് (ഉദാഹരണത്തിന്, ദേശീയ അക്ഷരമാലയിൽ നിന്ന്), രണ്ട് നിബന്ധനകൾ പാലിക്കേണ്ടതുണ്ട് - ഈ പ്രതീകത്തിന്റെ വെക്റ്റർ ഫോം ഉപയോഗിച്ച ഫോണ്ടിൽ ആയിരിക്കണം, കൂടാതെ ഈ പ്രതീകം വിപുലീകൃത ASCII എൻകോഡിംഗുകളിൽ എൻകോഡ് ചെയ്യാവുന്നതാണ്. ഒരു ബൈറ്റിൽ. അതിനാൽ, അത്തരം ഓപ്ഷനുകളുടെ ഒരു കൂട്ടം ഉണ്ട്. റഷ്യൻ ഭാഷയുടെ പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യുന്നതിന് മാത്രം, വിപുലീകരിച്ച അസ്കയുടെ നിരവധി ഇനങ്ങൾ ഉണ്ട്.

ഉദാഹരണത്തിന്, തുടക്കത്തിൽ ഉണ്ടായിരുന്നു CP866, അതിൽ റഷ്യൻ അക്ഷരമാലയിലെ പ്രതീകങ്ങൾ ഉപയോഗിക്കാൻ സാധിച്ചു, അത് ASCII-യുടെ വിപുലീകൃത പതിപ്പായിരുന്നു.

ആ. മുകളിലെ സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്ന അസുകയുടെ (128 ലാറ്റിൻ പ്രതീകങ്ങളും അക്കങ്ങളും മറ്റേതെങ്കിലും ഭ്രാന്തും) അതിന്റെ മുകൾ ഭാഗം പൂർണ്ണമായും പൊരുത്തപ്പെടുന്നു, എന്നാൽ CP866 എൻകോഡിംഗുള്ള പട്ടികയുടെ താഴത്തെ ഭാഗത്ത് സ്ക്രീൻഷോട്ടിൽ സൂചിപ്പിച്ചിരിക്കുന്ന ഫോം ഉണ്ടായിരുന്നു. താഴെ, മറ്റൊരു 128 അടയാളങ്ങൾ എൻകോഡ് ചെയ്യാൻ അനുവദിച്ചിരിക്കുന്നു (റഷ്യൻ അക്ഷരങ്ങളും എല്ലാത്തരം സ്യൂഡോഗ്രാഫിക്സും അവിടെ):

നിങ്ങൾ കാണുന്നത്, വലത് കോളത്തിൽ, അക്കങ്ങൾ 8 ൽ ആരംഭിക്കുന്നു, കാരണം 0 മുതൽ 7 വരെയുള്ള സംഖ്യകൾ ASCII ബേസ് ഭാഗത്തെ പരാമർശിക്കുന്നു (ആദ്യത്തെ സ്ക്രീൻഷോട്ട് കാണുക). അത്. CP866 ലെ റഷ്യൻ അക്ഷരമായ "M" ന് 9C കോഡ് ഉണ്ടായിരിക്കും (അത് അനുബന്ധ വരിയുടെ 9 ന്റെ കവലയിലും ഹെക്സാഡെസിമൽ നമ്പർ സിസ്റ്റത്തിലെ C നമ്പറുള്ള നിരയിലും സ്ഥിതിചെയ്യുന്നു), അത് ഒരു ബൈറ്റ് വിവരത്തിൽ എഴുതാം. , കൂടാതെ റഷ്യൻ അക്ഷരങ്ങളുള്ള അനുയോജ്യമായ ഒരു ഫോണ്ട് ഉണ്ടെങ്കിൽ, പ്രശ്നങ്ങളില്ലാത്ത ഈ കത്ത് ടെക്സ്റ്റിൽ പ്രദർശിപ്പിക്കും.

ഈ തുക എവിടെ നിന്ന് വന്നു? CP866 ലെ സ്യൂഡോഗ്രാഫിക്സ്? റഷ്യൻ ടെക്സ്റ്റിനായുള്ള ഈ എൻകോഡിംഗ് ആ രോമമുള്ള വർഷങ്ങളിൽ വികസിപ്പിച്ചെടുത്തതാണ്, ഇപ്പോൾ ഉള്ളതുപോലെ ഗ്രാഫിക്കൽ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളുടെ വിതരണം ഇല്ലായിരുന്നു. ദോസയിലും സമാനമായ ടെക്സ്റ്റ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിലും, കപട ഗ്രാഫിക്സ് എങ്ങനെയെങ്കിലും ടെക്സ്റ്റുകളുടെ രൂപകൽപ്പന വൈവിധ്യവത്കരിക്കുന്നത് സാധ്യമാക്കി, അതിനാൽ ഇത് CP866 ലും അസുകയുടെ വിപുലീകൃത പതിപ്പുകളുടെ വിഭാഗത്തിൽ നിന്നുള്ള മറ്റെല്ലാ സമപ്രായക്കാരിലും സമൃദ്ധമാണ്.

CP866 വിതരണം ചെയ്തത് IBM ആണ്, എന്നാൽ ഇതിനുപുറമെ, റഷ്യൻ പ്രതീകങ്ങൾക്കായി നിരവധി എൻകോഡിംഗുകൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്, ഉദാഹരണത്തിന്, അതേ തരം (വിപുലീകരിച്ച ASCII) ആട്രിബ്യൂട്ട് ചെയ്യാം. KOI8-R:

അതിന്റെ പ്രവർത്തനത്തിന്റെ തത്വം അൽപ്പം മുമ്പ് വിവരിച്ച CP866 ന് സമാനമാണ് - ടെക്സ്റ്റിന്റെ ഓരോ പ്രതീകവും ഒരൊറ്റ ബൈറ്റ് ഉപയോഗിച്ച് എൻകോഡ് ചെയ്തിരിക്കുന്നു. സ്ക്രീൻഷോട്ട് KOI8-R പട്ടികയുടെ രണ്ടാം പകുതി കാണിക്കുന്നു, കാരണം ഈ ലേഖനത്തിലെ ആദ്യ സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്ന അടിസ്ഥാന അസൂക്കയുമായി ആദ്യ പകുതി പൂർണ്ണമായും യോജിക്കുന്നു.

KOI8-R എൻകോഡിംഗിന്റെ സവിശേഷതകളിൽ, അതിന്റെ പട്ടികയിലെ റഷ്യൻ അക്ഷരങ്ങൾ അക്ഷരമാലാ ക്രമത്തിലല്ല എന്നത് ശ്രദ്ധിക്കാവുന്നതാണ്, ഉദാഹരണത്തിന്, CP866-ൽ ചെയ്തു.

നിങ്ങൾ ആദ്യത്തെ സ്ക്രീൻഷോട്ട് (എല്ലാ വിപുലീകൃത എൻകോഡിംഗുകളിലും ഉൾപ്പെടുത്തിയിരിക്കുന്ന അടിസ്ഥാന ഭാഗത്തിന്റെ) നോക്കുകയാണെങ്കിൽ, KOI8-R റഷ്യൻ അക്ഷരങ്ങൾ ലാറ്റിൻ അക്ഷരമാല വ്യഞ്ജനാക്ഷരത്തിന്റെ അക്ഷരങ്ങൾ പോലെ പട്ടികയുടെ അതേ സെല്ലുകളിൽ സ്ഥിതിചെയ്യുന്നത് നിങ്ങൾ ശ്രദ്ധിക്കും. മേശയുടെ ആദ്യ ഭാഗത്ത് നിന്ന് അവരോടൊപ്പം. ഒരു ബിറ്റ് (രണ്ട് മുതൽ ഏഴാമത്തെ പവർ അല്ലെങ്കിൽ 128 വരെ) മാത്രം ഉപേക്ഷിച്ച് റഷ്യൻ ഭാഷയിൽ നിന്ന് ലാറ്റിൻ അക്ഷരങ്ങളിലേക്ക് മാറുന്നതിനുള്ള സൗകര്യത്തിനായി ഇത് ചെയ്തു.

വിൻഡോസ് 1251 - ASCII യുടെ ആധുനിക പതിപ്പും എന്തുകൊണ്ട് krakozyabry ക്രാൾ ഔട്ട്

ഗ്രാഫിക്കൽ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങൾ ജനപ്രീതി നേടുകയും അവയിൽ സ്യൂഡോഗ്രാഫിക്സ് ഉപയോഗിക്കേണ്ടതിന്റെ ആവശ്യകത ക്രമേണ അപ്രത്യക്ഷമാകുകയും ചെയ്തതാണ് ടെക്സ്റ്റ് എൻകോഡിംഗുകളുടെ കൂടുതൽ വികസനത്തിന് കാരണം. തൽഫലമായി, ഒരു മുഴുവൻ ഗ്രൂപ്പും ഉടലെടുത്തു, അത് സാരാംശത്തിൽ, അസൂക്കയുടെ വിപുലീകൃത പതിപ്പുകളായിരുന്നു (ടെക്‌സ്റ്റിന്റെ ഒരു പ്രതീകം ഒരു ബൈറ്റ് വിവരങ്ങൾ ഉപയോഗിച്ച് എൻകോഡ് ചെയ്‌തിരിക്കുന്നു), എന്നാൽ സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങൾ ഉപയോഗിക്കാതെ.

അമേരിക്കൻ സ്റ്റാൻഡേർഡ് ഇൻസ്റ്റിറ്റ്യൂട്ട് വികസിപ്പിച്ച ANSI എൻകോഡിംഗുകൾ എന്ന് വിളിക്കപ്പെടുന്നവയാണ് അവ. സാധാരണ ഭാഷയിൽ, റഷ്യൻ ഭാഷയെ പിന്തുണയ്ക്കുന്ന വേരിയന്റിനായി സിറിലിക് എന്ന പേരും ഉപയോഗിച്ചു. ഇതിന് ഒരു ഉദാഹരണം നൽകാം.

മുമ്പ് ഉപയോഗിച്ച CP866, KOI8-R എന്നിവയിൽ നിന്ന് ഇത് അനുകൂലമായി വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, അതിൽ സ്യൂഡോഗ്രാഫിക് ചിഹ്നങ്ങളുടെ സ്ഥാനം റഷ്യൻ ടൈപ്പോഗ്രാഫിയുടെ (ആക്സന്റ് മാർക്ക് ഒഴികെ) നഷ്ടപ്പെട്ട ചിഹ്നങ്ങളും സ്ലാവിക് ഭാഷകളിൽ ഉപയോഗിച്ചിരിക്കുന്ന ചിഹ്നങ്ങളും എടുത്തതാണ്. റഷ്യൻ (ഉക്രേനിയൻ, ബെലാറഷ്യൻ മുതലായവ) ):

റഷ്യൻ ഭാഷാ എൻകോഡിംഗുകളുടെ സമൃദ്ധി കാരണം, ഫോണ്ട് നിർമ്മാതാക്കൾക്കും സോഫ്റ്റ്വെയർ നിർമ്മാതാക്കൾക്കും നിരന്തരം തലവേദനയുണ്ടായിരുന്നു, പ്രിയ വായനക്കാരായ ഞങ്ങൾ പലപ്പോഴും വളരെ കുപ്രസിദ്ധരായിരുന്നു. ക്രാക്കോസിയാബ്രിവാചകത്തിൽ ഉപയോഗിച്ചിരിക്കുന്ന പതിപ്പുമായി ആശയക്കുഴപ്പം ഉണ്ടായപ്പോൾ.

ഇ-മെയിൽ വഴി സന്ദേശങ്ങൾ അയയ്‌ക്കുമ്പോഴും സ്വീകരിക്കുമ്പോഴും പലപ്പോഴും അവർ പുറത്തായി, ഇത് വളരെ സങ്കീർണ്ണമായ പരിവർത്തന പട്ടികകൾ സൃഷ്ടിക്കുന്നതിലേക്ക് നയിച്ചു, ഇത് യഥാർത്ഥത്തിൽ റൂട്ടിൽ ഈ പ്രശ്നം പരിഹരിക്കാൻ കഴിഞ്ഞില്ല, മാത്രമല്ല പലപ്പോഴും ഉപയോക്താക്കൾ കുപ്രസിദ്ധമായത് ഒഴിവാക്കാൻ കത്തിടപാടുകൾക്ക് ഉപയോഗിക്കുന്നു. CP866, KOI8-R അല്ലെങ്കിൽ Windows 1251 പോലുള്ള റഷ്യൻ എൻകോഡിംഗുകൾ ഉപയോഗിക്കുമ്പോൾ krakozyabrs.

വാസ്തവത്തിൽ, റഷ്യൻ വാചകത്തിനുപകരം പുറത്തുവന്ന ക്രാക്കോസിയാബ്രി, ഈ ഭാഷയുടെ എൻകോഡിംഗിന്റെ തെറ്റായ ഉപയോഗത്തിന്റെ ഫലമാണ്, ഇത് വാചക സന്ദേശം യഥാർത്ഥത്തിൽ എൻകോഡ് ചെയ്ത ഒന്നുമായി പൊരുത്തപ്പെടുന്നില്ല.

ഉദാഹരണത്തിന്, നിങ്ങൾ വിൻഡോസ് 1251 കോഡ് ടേബിൾ ഉപയോഗിച്ച് CP866 ഉപയോഗിച്ച് എൻകോഡ് ചെയ്ത പ്രതീകങ്ങൾ പ്രദർശിപ്പിക്കാൻ ശ്രമിക്കുകയാണെങ്കിൽ, അതേ ക്രാക്കോസിയാബ്രി (അർത്ഥമില്ലാത്ത പ്രതീക സെറ്റ്) പുറത്തുവരും, സന്ദേശ വാചകം പൂർണ്ണമായും മാറ്റിസ്ഥാപിക്കും.

സൈറ്റിൽ സ്ഥിരസ്ഥിതിയായി ഉപയോഗിക്കുന്ന തെറ്റായ എൻകോഡിംഗിലോ അല്ലെങ്കിൽ ദൃശ്യമാകാത്ത കോഡിലേക്ക് ഗ്യാഗ് ചേർക്കുന്ന തെറ്റായ ടെക്സ്റ്റ് എഡിറ്ററിലോ റഷ്യൻ അക്ഷരങ്ങളുള്ള വാചകം തെറ്റായി സംരക്ഷിക്കപ്പെടുമ്പോൾ, ഫോറങ്ങളിലും ബ്ലോഗുകളിലും സമാനമായ ഒരു സാഹചര്യം പലപ്പോഴും സംഭവിക്കാറുണ്ട്. നഗ്നനേത്രങ്ങൾ.

അവസാനം, ധാരാളം എൻ‌കോഡിംഗുകളും നിരന്തരം ക്രാക്കോസിയാബ്രിയും പുറത്തെടുക്കുന്ന അത്തരം ഒരു സാഹചര്യം പലരും മടുത്തു, നിലവിലുള്ളവയെല്ലാം മാറ്റിസ്ഥാപിക്കുന്ന ഒരു പുതിയ സാർവത്രിക വ്യതിയാനം സൃഷ്ടിക്കുന്നതിനുള്ള മുൻവ്യവസ്ഥകൾ ഉണ്ടായിരുന്നു, അവസാനം വായിക്കാൻ കഴിയാത്ത പാഠങ്ങളുടെ രൂപത്തിലുള്ള പ്രശ്നം പരിഹരിക്കും. . കൂടാതെ, ചൈനീസ് പോലുള്ള ഭാഷകളുടെ പ്രശ്നമുണ്ടായിരുന്നു, അവിടെ ഭാഷയുടെ പ്രതീകങ്ങൾ 256 ൽ കൂടുതലാണ്.

യൂണികോഡ് (യൂണികോഡ്) - സാർവത്രിക എൻകോഡിംഗുകൾ UTF 8, 16, 32

തെക്കുകിഴക്കൻ ഏഷ്യൻ ഭാഷാ ഗ്രൂപ്പിലെ ഈ ആയിരക്കണക്കിന് പ്രതീകങ്ങൾ ഒരു ബൈറ്റ് വിവരങ്ങളിൽ ഒരു തരത്തിലും വിവരിക്കാൻ കഴിയില്ല, ഇത് ASCII- യുടെ വിപുലീകൃത പതിപ്പുകളിൽ പ്രതീകങ്ങൾ എൻകോഡിംഗ് ചെയ്യാൻ അനുവദിച്ചിരിക്കുന്നു. തൽഫലമായി, ഒരു കൺസോർഷ്യം വിളിച്ചു യൂണികോഡ്(യൂണികോഡ് - യൂണികോഡ് കൺസോർഷ്യം) ഒരു സാർവത്രിക ടെക്സ്റ്റ് എൻകോഡിംഗിന്റെ ആവിർഭാവത്തിൽ താൽപ്പര്യമുള്ള നിരവധി ഐടി വ്യവസായ പ്രമുഖരുടെ (സോഫ്റ്റ്‌വെയർ നിർമ്മിക്കുന്നവർ, ഹാർഡ്‌വെയർ എൻകോഡ് ചെയ്യുന്നവർ, ഫോണ്ടുകൾ സൃഷ്ടിക്കുന്നവർ) സഹകരണത്തോടെ.

യൂണികോഡ് കൺസോർഷ്യത്തിന്റെ കീഴിൽ പുറത്തിറക്കിയ ആദ്യ വേരിയേഷൻ ആയിരുന്നു UTF-32. എൻകോഡിംഗിന്റെ പേരിലുള്ള നമ്പർ അർത്ഥമാക്കുന്നത് ഒരു പ്രതീകം എൻകോഡ് ചെയ്യാൻ ഉപയോഗിക്കുന്ന ബിറ്റുകളുടെ എണ്ണം എന്നാണ്. 32 ബിറ്റുകൾ എന്നത് പുതിയ യൂണിവേഴ്സൽ എൻകോഡിംഗ് UTF-ൽ ഒരൊറ്റ പ്രതീകം എൻകോഡ് ചെയ്യുന്നതിന് ആവശ്യമായ 4 ബൈറ്റ് വിവരങ്ങളാണ്.

തൽഫലമായി, ASCII-യുടെ വിപുലീകൃത പതിപ്പിലും UTF-32-ലും എൻകോഡ് ചെയ്‌ത ടെക്‌സ്‌റ്റുള്ള അതേ ഫയലിന്, പിന്നീടുള്ള സന്ദർഭത്തിൽ നാലിരട്ടി വലിപ്പം (ഭാരം) ഉണ്ടായിരിക്കും. ഇത് മോശമാണ്, എന്നാൽ ഇപ്പോൾ UTF ഉപയോഗിച്ച് മുപ്പത്തിരണ്ടാം ശക്തിക്ക് തുല്യമായ രണ്ട് പ്രതീകങ്ങളുടെ എണ്ണം എൻകോഡ് ചെയ്യാനുള്ള അവസരമുണ്ട് ( കോടിക്കണക്കിന് കഥാപാത്രങ്ങൾ, അത് ഒരു വലിയ മാർജിൻ ഉപയോഗിച്ച് ശരിക്കും ആവശ്യമായ ഏതെങ്കിലും മൂല്യം ഉൾക്കൊള്ളുന്നു).

എന്നാൽ യൂറോപ്യൻ ഗ്രൂപ്പിന്റെ ഭാഷകളുള്ള പല രാജ്യങ്ങൾക്കും, എൻകോഡിംഗിൽ ഇത്രയും വലിയ അക്ഷരങ്ങൾ ഉപയോഗിക്കേണ്ട ആവശ്യമില്ല, എന്നിരുന്നാലും, UTF-32 ഉപയോഗിക്കുമ്പോൾ, അവർക്ക് വാചകത്തിന്റെ ഭാരത്തിൽ നാലിരട്ടി വർദ്ധനവ് ലഭിക്കും. ഒന്നിനും വേണ്ടിയുള്ള പ്രമാണങ്ങൾ, അതിന്റെ ഫലമായി, ഇന്റർനെറ്റ് ട്രാഫിക്കിന്റെയും വോളിയം സംഭരിച്ച ഡാറ്റയുടെയും അളവിൽ വർദ്ധനവ്. ഇത് ധാരാളം, അത്തരം മാലിന്യങ്ങൾ ആർക്കും താങ്ങാൻ കഴിയുമായിരുന്നില്ല.

യൂണികോഡിന്റെ വികസനത്തിന്റെ ഫലമായി, UTF-16, ഞങ്ങൾ ഉപയോഗിക്കുന്ന എല്ലാ പ്രതീകങ്ങൾക്കുമുള്ള ഡിഫോൾട്ട് ബേസ് സ്‌പെയ്‌സായി അത് അംഗീകരിക്കപ്പെടത്തക്കവിധം വിജയിച്ചു. ഒരു പ്രതീകം എൻകോഡ് ചെയ്യുന്നതിന് ഇത് രണ്ട് ബൈറ്റുകൾ ഉപയോഗിക്കുന്നു. ഈ സാധനം എങ്ങനെയാണെന്ന് നോക്കാം.

വിൻഡോസ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിൽ, നിങ്ങൾക്ക് "ആരംഭിക്കുക" - "പ്രോഗ്രാമുകൾ" - "ആക്സസറികൾ" - "യൂട്ടിലിറ്റികൾ" - "കാരക്ടർ ടേബിൾ" എന്ന പാതയിലൂടെ പോകാം. ഫലമായി, നിങ്ങളുടെ സിസ്റ്റത്തിൽ ഇൻസ്റ്റാൾ ചെയ്തിരിക്കുന്ന എല്ലാ ഫോണ്ടുകളുടെയും വെക്റ്റർ രൂപങ്ങളുള്ള ഒരു പട്ടിക തുറക്കും. "വിപുലമായ ഓപ്‌ഷനുകളിൽ" നിങ്ങൾ യൂണികോഡ് പ്രതീക സെറ്റ് തിരഞ്ഞെടുക്കുകയാണെങ്കിൽ, ഓരോ ഫോണ്ടിനും അതിൽ ഉൾപ്പെടുത്തിയിരിക്കുന്ന മുഴുവൻ പ്രതീകങ്ങളും നിങ്ങൾക്ക് വ്യക്തിഗതമായി കാണാൻ കഴിയും.

വഴിയിൽ, അവയിലേതെങ്കിലും ക്ലിക്കുചെയ്യുന്നതിലൂടെ, നിങ്ങൾക്ക് അതിന്റെ ഇരട്ട-ബൈറ്റ് കാണാൻ കഴിയും UTF-16 ഫോർമാറ്റിലുള്ള കോഡ്, നാല് ഹെക്സാഡെസിമൽ അക്കങ്ങൾ ഉൾക്കൊള്ളുന്നു:

16 ബിറ്റുകൾ ഉപയോഗിച്ച് UTF-16-ൽ എത്ര പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യാൻ കഴിയും? 65536 (രണ്ട് മുതൽ പതിനാറിന്റെ ശക്തി), ഈ സംഖ്യയാണ് യൂണിക്കോഡിലെ അടിസ്ഥാന ഇടമായി സ്വീകരിച്ചത്. കൂടാതെ, ഇത് ഉപയോഗിച്ച് ഏകദേശം രണ്ട് ദശലക്ഷം പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യാനുള്ള വഴികളുണ്ട്, പക്ഷേ ഒരു ദശലക്ഷം അക്ഷരങ്ങളുടെ വിസ്തൃതമായ സ്ഥലത്ത് പരിമിതപ്പെടുത്തിയിരിക്കുന്നു.

എന്നാൽ യൂണികോഡ് എൻകോഡിംഗിന്റെ ഈ വിജയകരമായ പതിപ്പ് പോലും ഇംഗ്ലീഷിൽ പ്രോഗ്രാമുകൾ എഴുതിയവർക്ക് വലിയ സംതൃപ്തി നൽകിയില്ല, കാരണം ASCII- യുടെ വിപുലീകൃത പതിപ്പിൽ നിന്ന് UTF-16 ലേക്ക് മാറിയതിനുശേഷം, പ്രമാണങ്ങളുടെ ഭാരം ഇരട്ടിയായി (ഓരോ ബൈറ്റ് Asci-യിലെ ഒരു പ്രതീകവും UTF-16-ൽ ഒരേ പ്രതീകത്തിന് രണ്ട് ബൈറ്റുകളും).

അതാണ് യൂണികോഡ് കൺസോർഷ്യത്തിലെ എല്ലാവരുടെയും എല്ലാത്തിന്റെയും സംതൃപ്തിക്കായി, അത് കൊണ്ടുവരാൻ തീരുമാനിച്ചു വേരിയബിൾ നീളം എൻകോഡിംഗ്. UTF-8 എന്നാണ് ഇതിന്റെ പേര്. പേരിൽ എട്ട് ഉണ്ടായിരുന്നിട്ടും, ഇതിന് ശരിക്കും ഒരു വേരിയബിൾ ദൈർഘ്യമുണ്ട്, അതായത്. ഓരോ വാചക പ്രതീകവും ഒന്ന് മുതൽ ആറ് വരെ ബൈറ്റുകളുടെ ഒരു ശ്രേണിയിലേക്ക് എൻകോഡ് ചെയ്യാവുന്നതാണ്.

പ്രായോഗികമായി, UTF-8-ൽ, ഒന്ന് മുതൽ നാല് ബൈറ്റുകൾ വരെയുള്ള ശ്രേണി മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ, കാരണം നാല് ബൈറ്റുകളുടെ കോഡിന് പിന്നിൽ, സൈദ്ധാന്തികമായി ഒന്നും സങ്കൽപ്പിക്കാൻ പോലും സാധ്യമല്ല. ഇതിലെ എല്ലാ ലാറ്റിൻ അക്ഷരങ്ങളും പഴയ ASCII പോലെ ഒരു ബൈറ്റിൽ എൻകോഡ് ചെയ്തിരിക്കുന്നു.

ശ്രദ്ധേയമായി, ലാറ്റിൻ മാത്രം എൻകോഡ് ചെയ്യുന്ന കാര്യത്തിൽ, യൂണികോഡ് മനസ്സിലാകാത്ത പ്രോഗ്രാമുകൾ പോലും UTF-8-ൽ എൻകോഡ് ചെയ്തിരിക്കുന്നത് വായിക്കും. ആ. അസൂക്കയുടെ അടിസ്ഥാന ഭാഗം യൂണികോഡ് കൺസോർഷ്യത്തിന്റെ ഈ ആശയത്തിലേക്ക് കടന്നുപോയി.

UTF-8-ലെ സിറിലിക് പ്രതീകങ്ങൾ രണ്ട് ബൈറ്റുകളിലും, ഉദാഹരണത്തിന്, ജോർജിയൻ പ്രതീകങ്ങൾ മൂന്ന് ബൈറ്റുകളിലും എൻകോഡ് ചെയ്തിട്ടുണ്ട്. യൂണികോഡ് കൺസോർഷ്യം, UTF 16 ഉം 8 ഉം സൃഷ്ടിച്ച ശേഷം, പ്രധാന പ്രശ്നം പരിഹരിച്ചു - ഇപ്പോൾ ഞങ്ങൾക്കുണ്ട് ഫോണ്ടുകൾക്ക് ഒരൊറ്റ കോഡ് സ്പേസ് ഉണ്ട്. ഇപ്പോൾ അവരുടെ നിർമ്മാതാക്കൾക്ക് അവരുടെ ശക്തിയും കഴിവുകളും അടിസ്ഥാനമാക്കിയുള്ള വാചക പ്രതീകങ്ങളുടെ വെക്റ്റർ രൂപങ്ങൾ കൊണ്ട് മാത്രമേ ഇത് പൂരിപ്പിക്കാൻ കഴിയൂ. ഇപ്പോൾ സെറ്റിൽ പോലും.

മുകളിലുള്ള "പ്രതീക പട്ടിക"യിൽ, വ്യത്യസ്ത ഫോണ്ടുകൾ വ്യത്യസ്ത എണ്ണം പ്രതീകങ്ങളെ പിന്തുണയ്ക്കുന്നതായി നിങ്ങൾക്ക് കാണാൻ കഴിയും. ചില യൂണികോഡ് സമ്പന്നമായ ഫോണ്ടുകൾ വളരെ വലുതായിരിക്കും. എന്നാൽ ഇപ്പോൾ അവ വ്യത്യസ്തമായത് വ്യത്യസ്ത എൻകോഡിംഗുകൾക്കായി സൃഷ്ടിക്കപ്പെട്ടതിലല്ല, മറിച്ച് ഫോണ്ട് നിർമ്മാതാവ് ഒന്നോ അല്ലെങ്കിൽ മറ്റൊരു വെക്റ്റർ ഫോം ഉപയോഗിച്ച് അവസാനം വരെ ഒരൊറ്റ കോഡ് സ്പേസ് പൂരിപ്പിച്ചതോ പൂരിപ്പിക്കാത്തതോ ആയ വസ്തുതയിലാണ്.

റഷ്യൻ അക്ഷരങ്ങൾക്ക് പകരം ക്രാക്കോസിയാബ്രി - എങ്ങനെ ശരിയാക്കാം

വാചകത്തിനുപകരം ക്രാക്കോസിയാബ്രാസ് എങ്ങനെ പ്രത്യക്ഷപ്പെടുന്നുവെന്ന് നോക്കാം, അല്ലെങ്കിൽ, മറ്റൊരു രീതിയിൽ പറഞ്ഞാൽ, റഷ്യൻ വാചകത്തിനുള്ള ശരിയായ എൻകോഡിംഗ് എങ്ങനെ തിരഞ്ഞെടുക്കപ്പെടുന്നുവെന്ന് നോക്കാം. യഥാർത്ഥത്തിൽ, നിങ്ങൾ ഇതേ ടെക്‌സ്‌റ്റ് സൃഷ്‌ടിക്കുന്നതോ എഡിറ്റ് ചെയ്യുന്നതോ ആയ പ്രോഗ്രാമിൽ ഇത് സജ്ജീകരിച്ചിരിക്കുന്നു, അല്ലെങ്കിൽ ടെക്‌സ്‌റ്റ് ശകലങ്ങൾ ഉപയോഗിച്ച് കോഡ്.

ടെക്‌സ്‌റ്റ് ഫയലുകൾ എഡിറ്റ് ചെയ്യുന്നതിനും സൃഷ്‌ടിക്കുന്നതിനും, എന്റെ അഭിപ്രായത്തിൽ, ഞാൻ വ്യക്തിപരമായി വളരെ നല്ലത് ഉപയോഗിക്കുന്നു. എന്നിരുന്നാലും, ഇതിന് നൂറിലധികം പ്രോഗ്രാമിംഗുകളുടെയും മാർക്ക്അപ്പ് ഭാഷകളുടെയും വാക്യഘടന ഹൈലൈറ്റ് ചെയ്യാൻ കഴിയും, കൂടാതെ പ്ലഗിനുകൾ ഉപയോഗിച്ച് വിപുലീകരിക്കാനുള്ള കഴിവുമുണ്ട്. ഈ അത്ഭുതകരമായ പ്രോഗ്രാമിന്റെ വിശദമായ അവലോകനം ചുവടെയുള്ള ലിങ്കിൽ വായിക്കുക.

നോട്ട്പാഡ് ++ ന്റെ മുകളിലെ മെനുവിൽ "എൻകോഡിംഗുകൾ" എന്ന ഒരു ഇനം ഉണ്ട്, അവിടെ നിങ്ങളുടെ സൈറ്റിൽ സ്ഥിരസ്ഥിതിയായി ഉപയോഗിക്കുന്ന ഓപ്ഷനിലേക്ക് നിലവിലുള്ള ഓപ്ഷൻ പരിവർത്തനം ചെയ്യാൻ നിങ്ങൾക്ക് അവസരം ലഭിക്കും:

ജൂംല 1.5-ഉം അതിലും ഉയർന്നതുമായ സൈറ്റിന്റെ കാര്യത്തിലും വേർഡ്പ്രസ്സിലെ ഒരു ബ്ലോഗിന്റെ കാര്യത്തിലും, ബഗുകൾ പ്രത്യക്ഷപ്പെടാതിരിക്കാൻ, ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക BOM ഇല്ലാതെ UTF8. BOM എന്ന പ്രിഫിക്‌സ് എന്താണ്?

UTF-16 എൻകോഡിംഗ് വികസിപ്പിച്ചപ്പോൾ, ചില കാരണങ്ങളാൽ, നേരിട്ടുള്ള ക്രമത്തിലും (ഉദാഹരണത്തിന്, 0A15) വിപരീതത്തിലും (150A) ഒരു പ്രതീക കോഡ് എഴുതാനുള്ള കഴിവ് പോലുള്ള ഒരു കാര്യം അറ്റാച്ചുചെയ്യാൻ അവർ തീരുമാനിച്ചു എന്നതാണ് വസ്തുത. . ഏത് ക്രമത്തിലാണ് കോഡുകൾ വായിക്കേണ്ടതെന്ന് പ്രോഗ്രാമുകൾ മനസിലാക്കാൻ, അത് കണ്ടുപിടിച്ചു BOM(ബൈറ്റ് ഓർഡർ മാർക്ക് അല്ലെങ്കിൽ, മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഒപ്പ്), ഇത് ഡോക്യുമെന്റുകളുടെ തുടക്കത്തിൽ തന്നെ മൂന്ന് അധിക ബൈറ്റുകൾ കൂട്ടിച്ചേർത്ത് പ്രകടിപ്പിച്ചു.

UTF-8 എൻകോഡിംഗിൽ, യൂണികോഡ് കൺസോർഷ്യത്തിൽ BOM ഒന്നും നൽകിയിട്ടില്ല, അതിനാൽ ഒരു ഒപ്പ് (ഡോക്യുമെന്റിന്റെ തുടക്കത്തിലെ ഈ ഏറ്റവും കുപ്രസിദ്ധമായ അധിക മൂന്ന് ബൈറ്റുകൾ) ചേർക്കുന്നത് ചില പ്രോഗ്രാമുകളെ കോഡ് വായിക്കുന്നതിൽ നിന്ന് തടയുന്നു. അതിനാൽ, UTF-ൽ ഫയലുകൾ സേവ് ചെയ്യുമ്പോൾ, നമ്മൾ എപ്പോഴും BOM ഇല്ലാതെ (ഒപ്പ് ഇല്ലാതെ) ഓപ്ഷൻ തിരഞ്ഞെടുക്കണം. അതിനാൽ നിങ്ങൾ മുന്നേറുക ക്രാക്കോസിയാബ്രി ഇഴയുന്നതിൽ നിന്ന് സ്വയം പരിരക്ഷിക്കുക.

ശ്രദ്ധേയമായി, വിൻഡോസിലെ ചില പ്രോഗ്രാമുകൾക്ക് ഇത് എങ്ങനെ ചെയ്യണമെന്ന് അറിയില്ല (അവർക്ക് BOM ഇല്ലാതെ UTF-8 ൽ ടെക്സ്റ്റ് സംരക്ഷിക്കാൻ കഴിയില്ല), ഉദാഹരണത്തിന്, അതേ കുപ്രസിദ്ധമായ വിൻഡോസ് നോട്ട്പാഡ്. ഇത് UTF-8-ൽ പ്രമാണം സംരക്ഷിക്കുന്നു, പക്ഷേ ഇപ്പോഴും അതിന്റെ തുടക്കത്തിലേക്ക് ഒപ്പ് (മൂന്ന് അധിക ബൈറ്റുകൾ) ചേർക്കുന്നു. മാത്രമല്ല, ഈ ബൈറ്റുകൾ എല്ലായ്പ്പോഴും സമാനമായിരിക്കും - നേരിട്ടുള്ള ക്രമത്തിൽ കോഡ് വായിക്കുക. എന്നാൽ സെർവറുകളിൽ, ഈ ചെറിയ കാര്യം കാരണം, ഒരു പ്രശ്നം ഉണ്ടാകാം - krakozyabry പുറത്തുവരും.

അതിനാൽ, ഒരു തരത്തിലും സാധാരണ വിൻഡോസ് നോട്ട്പാഡ് ഉപയോഗിക്കരുത്നിങ്ങളുടെ സൈറ്റിന്റെ പ്രമാണങ്ങൾ എഡിറ്റുചെയ്യുന്നതിന്, നിങ്ങൾക്ക് ക്രാക്കോസിയാബ്രോവിന്റെ രൂപം ആവശ്യമില്ലെങ്കിൽ. ഇതിനകം സൂചിപ്പിച്ച നോട്ട്പാഡ് ++ എഡിറ്റർ ഏറ്റവും മികച്ചതും ലളിതവുമായ ഓപ്ഷനായി ഞാൻ കരുതുന്നു, അത് പ്രായോഗികമായി പോരായ്മകളൊന്നുമില്ല, ഗുണങ്ങൾ മാത്രം ഉൾക്കൊള്ളുന്നു.

നോട്ട്പാഡ്++-ൽ, നിങ്ങൾ ഒരു എൻകോഡിംഗ് തിരഞ്ഞെടുക്കുമ്പോൾ, യുസിഎസ്-2 എൻകോഡിംഗിലേക്ക് ടെക്സ്റ്റ് പരിവർത്തനം ചെയ്യാനുള്ള ഓപ്ഷൻ നിങ്ങൾക്കുണ്ടാകും, അത് യുണികോഡ് സ്റ്റാൻഡേർഡിന് വളരെ അടുത്താണ്. നോട്ട്പാഡിൽ ANSI-യിൽ ടെക്സ്റ്റ് എൻകോഡ് ചെയ്യാനും സാധിക്കും, അതായത്. റഷ്യൻ ഭാഷയുമായി ബന്ധപ്പെട്ട്, ഇത് വിൻഡോസ് 1251 ആയിരിക്കും, ഞങ്ങൾ ഇതിനകം അല്പം മുകളിൽ വിവരിച്ചിരിക്കുന്നു. ഈ വിവരങ്ങൾ എവിടെ നിന്ന് വരുന്നു?

നിങ്ങളുടെ വിൻഡോസ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ രജിസ്ട്രിയിൽ ഇത് എഴുതിയിട്ടുണ്ട് - ANSI-യുടെ കാര്യത്തിൽ ഏത് എൻകോഡിംഗ് തിരഞ്ഞെടുക്കണം, OEM-ന്റെ കാര്യത്തിൽ ഏതാണ് തിരഞ്ഞെടുക്കേണ്ടത് (റഷ്യൻ ഭാഷയ്ക്ക് ഇത് CP866 ആയിരിക്കും). നിങ്ങളുടെ കമ്പ്യൂട്ടറിൽ മറ്റൊരു ഡിഫോൾട്ട് ഭാഷ ഇൻസ്റ്റാൾ ചെയ്യുകയാണെങ്കിൽ, ഈ എൻകോഡിംഗുകൾ അതേ ഭാഷയിൽ ANSI അല്ലെങ്കിൽ OEM വിഭാഗത്തിൽ നിന്ന് സമാനമായവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കും.

നിങ്ങൾക്ക് ആവശ്യമുള്ള എൻകോഡിംഗിൽ നോട്ട്പാഡ് ++ ൽ പ്രമാണം സംരക്ഷിച്ചതിന് ശേഷം അല്ലെങ്കിൽ എഡിറ്റിംഗിനായി സൈറ്റിൽ നിന്ന് ഡോക്യുമെന്റ് തുറക്കുക, എഡിറ്ററിന്റെ താഴെ വലത് കോണിൽ നിങ്ങൾക്ക് അതിന്റെ പേര് കാണാൻ കഴിയും:

krakozyabrov ഒഴിവാക്കാൻ, മുകളിൽ വിവരിച്ച പ്രവർത്തനങ്ങൾക്ക് പുറമേ, സൈറ്റിന്റെ എല്ലാ പേജുകളുടെയും സോഴ്സ് കോഡിന്റെ തലക്കെട്ടിൽ ഈ എൻകോഡിംഗിനെക്കുറിച്ചുള്ള വിവരങ്ങൾ എഴുതുന്നത് ഉപയോഗപ്രദമാകും, അതുവഴി സെർവറിലോ പ്രാദേശിക ഹോസ്റ്റിലോ ആശയക്കുഴപ്പം ഉണ്ടാകില്ല.

പൊതുവേ, Html ഒഴികെയുള്ള എല്ലാ ഹൈപ്പർടെക്സ്റ്റ് മാർക്ക്അപ്പ് ഭാഷകളിലും, ഒരു പ്രത്യേക xml ഡിക്ലറേഷൻ ഉപയോഗിക്കുന്നു, അത് ടെക്സ്റ്റ് എൻകോഡിംഗ് വ്യക്തമാക്കുന്നു.

കോഡ് പാഴ്‌സ് ചെയ്യുന്നതിന് മുമ്പ്, ഏത് പതിപ്പാണ് ഉപയോഗിക്കുന്നതെന്നും ആ ഭാഷയുടെ പ്രതീക കോഡുകൾ എങ്ങനെ കൃത്യമായി വ്യാഖ്യാനിക്കണമെന്നും ബ്രൗസറിന് അറിയാം. എന്നാൽ ശ്രദ്ധേയമായ കാര്യം, നിങ്ങൾ സ്ഥിരസ്ഥിതി യൂണികോഡിൽ പ്രമാണം സംരക്ഷിക്കുകയാണെങ്കിൽ, ഈ xml പ്രഖ്യാപനം ഒഴിവാക്കാവുന്നതാണ് (ബിഒഎം ഇല്ലെങ്കിൽ UTF-8 അല്ലെങ്കിൽ BOM ഉണ്ടെങ്കിൽ UTF-16 ആയി എൻകോഡിംഗ് പരിഗണിക്കും).

ഒരു Html ഭാഷാ പ്രമാണത്തിന്റെ കാര്യത്തിൽ, വ്യക്തമാക്കാൻ എൻകോഡിംഗ് ഉപയോഗിക്കുന്നു മെറ്റാ ഘടകം, തുറക്കുന്നതിനും അടയ്ക്കുന്നതിനും ഇടയിൽ എഴുതിയിരിക്കുന്ന ഹെഡ് ടാഗുകൾ:

... ...

ഈ എൻ‌ട്രി എന്നതിൽ നിന്ന് തികച്ചും വ്യത്യസ്തമാണ്, പക്ഷേ ഇത് സാവധാനം അവതരിപ്പിക്കുന്ന പുതിയ Html 5 സ്റ്റാൻഡേർഡുമായി പൂർണ്ണമായും പൊരുത്തപ്പെടുന്നു, നിലവിൽ ഉപയോഗിക്കുന്ന ഏത് ബ്രൗസറിലും ഇത് 100% ശരിയായി മനസ്സിലാക്കും.

സിദ്ധാന്തത്തിൽ, ഡോക്യുമെന്റിന്റെ Html എൻകോഡിംഗ് ഉള്ള മെറ്റാ എലമെന്റ് ഇടുന്നതാണ് നല്ലത് പ്രമാണത്തിന്റെ തലക്കെട്ടിൽ കഴിയുന്നത്ര ഉയർന്നത്അതിനാൽ മീറ്റിംഗ് സമയത്ത്, ആദ്യ പ്രതീകത്തിന്റെ വാചകത്തിൽ അടിസ്ഥാന ANSI യിൽ നിന്ന് അല്ല (എല്ലായ്‌പ്പോഴും ശരിയായി വായിക്കുകയും ഏത് വ്യതിയാനത്തിലും വായിക്കുകയും ചെയ്യും), ഈ പ്രതീകങ്ങളുടെ കോഡുകൾ എങ്ങനെ വ്യാഖ്യാനിക്കണം എന്നതിനെക്കുറിച്ചുള്ള വിവരങ്ങൾ ബ്രൗസറിന് ഇതിനകം ഉണ്ടായിരിക്കണം.

നിങ്ങൾക്ക് ആശംസകൾ! ബ്ലോഗ് പേജ് സൈറ്റിൽ ഉടൻ കാണാം

നിങ്ങൾക്ക് താൽപ്പര്യമുണ്ടാകാം

എന്താണ് ഒരു URL, ഒരു സൈറ്റിനായുള്ള കേവലവും ആപേക്ഷികവുമായ ലിങ്കുകൾ തമ്മിലുള്ള വ്യത്യാസം എന്താണ്
ഓപ്പൺസെർവർ - ഒരു ആധുനിക പ്രാദേശിക സെർവറും കമ്പ്യൂട്ടറിൽ വേർഡ്പ്രസ്സ് ഇൻസ്റ്റാൾ ചെയ്യുന്നതിനുള്ള ഒരു ഉദാഹരണവും
എന്താണ് Chmod, ഫയലുകൾക്കും ഫോൾഡറുകൾക്കും (777, 755, 666) എന്ത് അനുമതികൾ നൽകണം, PHP വഴി അത് എങ്ങനെ ചെയ്യാം
സൈറ്റിലും ഓൺലൈൻ സ്റ്റോറിലും Yandex തിരയൽ

— Zampolit (@ComradZampolit) ഓഗസ്റ്റ് 17, 2017

KOI8-R എങ്ങനെയാണ് പ്രവർത്തിക്കുന്നത്?

KOI8-R എന്നത് സിറിലിക് അക്ഷരമാല എൻകോഡ് ചെയ്യാൻ രൂപകൽപ്പന ചെയ്ത എട്ട്-ബിറ്റ് കോഡ് പേജാണ്. ഡവലപ്പർമാർ റഷ്യൻ അക്ഷരമാലയിലെ പ്രതീകങ്ങൾ സ്ഥാപിച്ചു, സിറിലിക് പ്രതീകങ്ങളുടെ സ്ഥാനങ്ങൾ അവയുടെ സ്വരസൂചക എതിരാളികളുമായി ഇംഗ്ലീഷ് അക്ഷരമാലയിൽ ടേബിളിന്റെ ചുവടെ യോജിക്കുന്നു. ഈ എൻകോഡിംഗിൽ എഴുതിയ വാചകത്തിൽ നിന്ന് ഓരോ പ്രതീകത്തിന്റെയും എട്ടാമത്തെ ബിറ്റ് നീക്കം ചെയ്താൽ, ലാറ്റിൻ അക്ഷരങ്ങളിലെ ലിപ്യന്തരണം പോലെയുള്ള ഒരു വാചകം ലഭിക്കും.

ഇസി സീരീസ് കമ്പ്യൂട്ടറുകളുടെ കമ്പ്യൂട്ടറുകളിൽ എഴുപതുകളിൽ അത്തരമൊരു വിവര കൈമാറ്റ കോഡ് ഉപയോഗിച്ചിരുന്നു, എൺപതുകളുടെ മധ്യത്തോടെ ഇത് യുണിക്സ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ ആദ്യ റസിഫൈഡ് പതിപ്പുകളിൽ ഉപയോഗിക്കാൻ തുടങ്ങി.

ഓരോ പ്രതീകത്തിനും ഒരു അദ്വിതീയ കോഡ് നൽകിയിരിക്കുന്നു എന്ന വസ്തുതയാണ് കോഡിംഗിൽ ഉൾപ്പെട്ടിരുന്നത്: 00000000 മുതൽ 11111111 വരെ. അങ്ങനെ, ഒരു വ്യക്തി കഥാപാത്രങ്ങളെ അവരുടെ ശൈലി കൊണ്ടും കമ്പ്യൂട്ടറിനെ കോഡ് കൊണ്ടും വേർതിരിച്ചു.

Chernoff എൻകോഡിംഗ് നിലവിൽ ഉപയോഗത്തിലുണ്ടോ?

ഇല്ല. പഴയ എട്ട്-ബിറ്റ് കമ്പ്യൂട്ടറുകൾക്ക് ഇത് പ്രസക്തമായിരുന്നു, ഇപ്പോൾ യൂണികോഡ് പ്രധാനമായും വിവിധ ഫോർമാറ്റുകളിൽ ഉപയോഗിക്കുന്നു.