KOI 8 എൻകോഡിംഗിൽ എത്ര പ്രതീകങ്ങളുണ്ട്. എന്താണ് KOI8-R എൻകോഡിംഗ്, അത് എന്താണ് നൽകിയത്? അസുകയുടെ വിപുലീകൃത പതിപ്പുകൾ - സ്യൂഡോഗ്രാഫിക്സുള്ള CP866, KOI8-R എൻകോഡിംഗുകൾ

KOI8-R എൻകോഡിംഗ്

ISO 8859-5 എൻകോഡിംഗ്

ISO 8859-5

ഇതര എൻകോഡിംഗ്

"ബദൽ എൻകോഡിംഗ്"- CP437 കോഡ്‌പേജിനെ അടിസ്ഥാനമാക്കി, രണ്ടാം പകുതിയിലെ എല്ലാ നിർദ്ദിഷ്ട യൂറോപ്യൻ പ്രതീകങ്ങളും സിറിലിക്കിലേക്ക് മാറ്റി, സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങൾ കേടുകൂടാതെയിരിക്കും. അതിനാൽ, ജോലിക്കായി ടെക്സ്റ്റ് വിൻഡോകൾ ഉപയോഗിക്കുന്ന പ്രോഗ്രാമുകളുടെ രൂപം ഇത് നശിപ്പിക്കില്ല, കൂടാതെ അവയിൽ സിറിലിക് പ്രതീകങ്ങളുടെ ഉപയോഗം ഉറപ്പാക്കുകയും ചെയ്യുന്നു.

ചരിത്രപരമായി, നിരവധി ഇതര എൻകോഡിംഗ് ഓപ്ഷനുകൾ ഉണ്ടായിട്ടുണ്ട്, എന്നാൽ എല്ലാ വ്യത്യാസങ്ങളും 0xF0 - 0xFF (240-255) പ്രദേശത്തെ മാത്രം ബാധിക്കുന്നു. അവസാന സ്റ്റാൻഡേർഡ് IBM CP866 എൻകോഡിംഗ് ആയിരുന്നു, അതിനുള്ള പിന്തുണ MS-DOS പതിപ്പ് 6.22-ലേക്ക് ചേർത്തു (അതിനുമുമ്പ്, എല്ലാത്തരം "സ്വയം നിർമ്മിത" വിള്ളലുകളും ഉപയോഗിച്ചിരുന്നു. ഇതര എൻകോഡിംഗ് ഇപ്പോഴും സജീവമാണ്, ഡോസിലും OS-ലും വളരെ ജനപ്രിയമാണ്. / 2 പരിസ്ഥിതി. കൂടാതെ, FAT ഫയൽ സിസ്റ്റത്തിലെ പേരുകൾ CP866 ഇപ്പോഴും Windows NT കുടുംബത്തിലെ Russified സിസ്റ്റങ്ങളുടെ കൺസോളിൽ ഉപയോഗിക്കുന്നു.

.എ

.ബി

.സി

.ഡി

.ഇ

.എഫ്

എ 410

ബി 411

ബി 412

G 413

ഡി 414

E 415

എഫ് 416

W 417

കൂടാതെ 418

Y 419

കെ 41 എ

എൽ 41 ബി

എം 41 സി

എച്ച് 41 ഡി

ഏകദേശം 41E

പി 41 എഫ്

R 420

സി 421

ടി 422

423

എഫ് 424

X 425

സി 426

Ch 427

SH 428

Sch 429

b 42A

എസ് 42 ബി

b 42c

ഇ 42 ഡി

യു 42ഇ

എനിക്ക് 42F ആണ്

എ.

ഒരു 430

b 431

432-ൽ

g 433

ഡി 434

ഇ 435

f 436

s 437

കൂടാതെ 438

439

43A വരെ

l 43B

മീറ്റർ 43 സി

n 43D

ഏകദേശം 43E

n 43F

ബി.

░ 2591

▒ 2592

▓ 2593

│ 2502

┤ 2524

╡ 2561

╢ 2562

╖ 2556

╕ 2555

╣ 2563

║ 2551

╗ 2557

നമ്പർ 255D

╜255C

╛255B

┐ 2510

സി.

└ 2514

┴ 2534

┬ 252 സി

├ 251 സി

─ 2500

┼ 253 സി

നമ്പർ 255E

╟255F

╚ 255A

╔ 2554

╩ 2569

╦ 2566

╠ 2560

═ 2550

╬ 256 സി

╧ 2567

ഡി.

╨ 2568

╤ 2564

╥ 2565

╙ 2559

╘ 2558

╒ 2552

╓ 2553

നമ്പർ 256B

നമ്പർ 256A

┘ 2518

┌250 സി

█ 2588

▄ 2584

▌258C

▐ 2590

▀ 2580

ഇ.

p 440

441 മുതൽ

ടി 442

443-ൽ

f 444

x 445

c 446

h 447

sh 448

w 449

b 44A

s 44B

b 44C

ഇ 44 ഡി

yu 44E

i 44F

എഫ്.

യോ 401

യോ 451

എഫ് 404

$454

£407

457

40ഇ

¢45E

°B0

∙ 2219

√ 221A

№ 2116

¤ A4

■ 25A0

SO 8859-5- സിറിലിക് എഴുതുന്നതിനുള്ള ISO-8859 ശ്രേണിയിൽ നിന്നുള്ള 8-ബിറ്റ് എൻകോഡിംഗ്. റഷ്യയിൽ മിക്കവാറും ഉപയോഗിച്ചിട്ടില്ല. പൊതുവേ, ISO 8859-5 വളരെ സൗകര്യപ്രദമായ ഒരു എൻകോഡിംഗ് അല്ല, കാരണം ഡാഷുകൾ (-), ഹെറിംഗ്ബോൺ ഉദ്ധരണികൾ (""), ഡിഗ്രികൾ (°) മുതലായ ആവശ്യമായ നിരവധി പ്രതീകങ്ങൾ ഇതിന് ഇല്ല.

.എ

.ബി

.സി

.ഡി

.ഇ

.എഫ്

എ.

യോ 401

€ 402

Ѓ 403

എഫ് 404

എസ് 405

ഐ 406

£407

£408

£409

Њ40A

£40B

40 സി

എ.ഡി

40ഇ

Џ 40F

ബി.

എ 410

ബി 411

ബി 412

G 413

ഡി 414

E 415

എഫ് 416

W 417

കൂടാതെ 418

Y 419

കെ 41 എ

എൽ 41 ബി

എം 41 സി

എച്ച് 41 ഡി

ഏകദേശം 41E

പി 41 എഫ്

സി.

R 420

സി 421

ടി 422

423

എഫ് 424

X 425

സി 426

Ch 427

SH 428

Sch 429

b 42A

എസ് 42 ബി

b 42c

ഇ 42 ഡി

യു 42ഇ

എനിക്ക് 42F ആണ്

ഡി.

ഒരു 430

b 431

432-ൽ

g 433

ഡി 434

ഇ 435

f 436

s 437

കൂടാതെ 438

439

43A വരെ

l 43B

മീറ്റർ 43 സി

n 43D

ഏകദേശം 43E

n 43F

ഇ.

p 440

441 മുതൽ

ടി 442

443-ൽ

f 444

x 445

c 446

h 447

sh 448

w 449

b 44A

s 44B

b 44C

ഇ 44 ഡി

yu 44E

i 44F

എഫ്.

№ 2116

യോ 451

$452

-453

$454

*455

ഞാൻ 456

457

$458

459

њ 45A

ћ 45B

ќ 45 സി

§ A7

¢45E

џ 45F

KOI-8 (വിവര കൈമാറ്റ കോഡ്, 8 ബിറ്റുകൾ), KOI8- കമ്പ്യൂട്ടർ സയൻസിലെ എട്ട്-ബിറ്റ് പ്രതീക എൻകോഡിംഗ് സ്റ്റാൻഡേർഡ്. സിറിലിക് അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ എൻകോഡ് ചെയ്യുന്നതിനായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു. എൻകോഡിംഗിന്റെ ഏഴ്-ബിറ്റ് പതിപ്പും ഉണ്ട് - KOI-7. KOI-7, KOI-8 എന്നിവ GOST 19768-74 ൽ വിവരിച്ചിരിക്കുന്നു (ഇപ്പോൾ അസാധുവാണ്).

KOI-8 ന്റെ ഡെവലപ്പർമാർ റഷ്യൻ അക്ഷരമാല അക്ഷരങ്ങൾ വിപുലീകരിച്ച ASCII പട്ടികയുടെ മുകളിൽ സ്ഥാപിച്ചു, അങ്ങനെ സിറിലിക് പ്രതീകങ്ങളുടെ സ്ഥാനങ്ങൾ പട്ടികയുടെ ചുവടെയുള്ള ഇംഗ്ലീഷ് അക്ഷരമാലയിലെ അവയുടെ സ്വരസൂചക എതിരാളികളുമായി പൊരുത്തപ്പെടുന്നു. ഇതിനർത്ഥം, KOI-8 ൽ എഴുതിയ വാചകത്തിൽ നിന്ന് ഓരോ പ്രതീകത്തിന്റെയും എട്ടാമത്തെ ബിറ്റ് നീക്കം ചെയ്താൽ, ലാറ്റിൻ അക്ഷരങ്ങളിൽ എഴുതിയിട്ടുണ്ടെങ്കിലും "വായിക്കാൻ കഴിയുന്ന" വാചകം ലഭിക്കും. ഉദാഹരണത്തിന്, "റഷ്യൻ ടെക്സ്റ്റ്" എന്ന വാക്കുകൾ "rUSSKIJ tEKST" ആയി മാറും. ഒരു പാർശ്വഫലമെന്ന നിലയിൽ, സിറിലിക് അക്ഷരങ്ങൾ അക്ഷരമാലാ ക്രമത്തിലായിരുന്നില്ല.

.എ

.ബി

.സി

.ഡി

.ഇ

.എഫ്

─ 2500

│ 2502

┌250 സി

┐ 2510

└ 2514

┘ 2518

├ 251 സി

┤ 2524

┬ 252 സി

┴ 2534

┼ 253 സി

▀ 2580

▄ 2584

█ 2588

▌258C

▐ 2590

░ 2591

▒ 2592

▓ 2593

⌠ 2320

■ 25A0

∙ 2219

√ 221A

≈ 2248

≤ 2264

≥ 2265

⌡ 2321

°B0

²B2

÷ F7

എ.

═ 2550

║ 2551

╒ 2552

യോ 451

╓ 2553

╔ 2554

╕ 2555

╖ 2556

╗ 2557

╘ 2558

╙ 2559

╚ 255A

╛255B

╜255C

നമ്പർ 255D

നമ്പർ 255E

ബി.

╟255F

╠ 2560

╡ 2561

യോ 401

╢ 2562

╣ 2563

╤ 2564

╥ 2565

╦ 2566

╧ 2567

╨ 2568

╩ 2569

നമ്പർ 256A

നമ്പർ 256B

╬ 256 സി

സി.

yu 44E

ഒരു 430

b 431

c 446

ഡി 434

ഇ 435

f 444

g 433

x 445

കൂടാതെ 438

439

43A വരെ

l 43B

മീറ്റർ 43 സി

n 43D

ഏകദേശം 43E

ഡി.

n 43F

i 44F

p 440

441 മുതൽ

ടി 442

443-ൽ

f 436

432-ൽ

b 44C

s 44B

s 437

sh 448

ഇ 44 ഡി

w 449

h 447

b 44A

ഇ.

യു 42ഇ

എ 410

ബി 411

സി 426

ഡി 414

E 415

എഫ് 424

G 413

X 425

കൂടാതെ 418

Y 419

കെ 41 എ

എൽ 41 ബി

എം 41 സി

എച്ച് 41 ഡി

ഏകദേശം 41E

എഫ്.

പി 41 എഫ്

എനിക്ക് 42F ആണ്

R 420

സി 421

ടി 422

423

എഫ് 416

ബി 412

b 42c

എസ് 42 ബി

W 417

SH 428

ഇ 42 ഡി

Sch 429

Ch 427

b 42A

KOI8-U എൻകോഡിംഗ് (ഉക്രേനിയൻ)

ഇന്റർനെറ്റിലെ ആദ്യത്തെ റഷ്യൻ സ്റ്റാൻഡേർഡ് എൻകോഡിംഗായി KOI-8 മാറി.

KOI-8 എൻകോഡിംഗ് ഓപ്ഷനുകളിൽ IETF നിരവധി RFC-കൾ അംഗീകരിച്ചു:

RFC 1489 - KOI8-R (റഷ്യൻ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ);
RFC 2319 - KOI8-U (ഉക്രേനിയൻ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ);
RFC 1345 - ISO-IR-111 (പ്രധാന ശ്രേണിയുടെ നിർവചനത്തിൽ ഒരു പിശകോടെ).

നൽകിയിരിക്കുന്ന പട്ടികകളിൽ, അക്ഷരങ്ങൾക്ക് താഴെയുള്ള അക്കങ്ങൾ അക്ഷരത്തിന്റെ ഹെക്സാഡെസിമൽ കോഡ് സൂചിപ്പിക്കുന്നു യൂണികോഡ്.

KOI8-R (റഷ്യൻ) എൻകോഡിംഗ്

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
8.	─ 2500	│ 2502	┌ 250 സി	┐ 2510	└ 2514	┘ 2518	├ 251 സി	┤ 2524	┬ 252 സി	┴ 2534	┼ 253 സി	▀ 2580	▄ 2584	█ 2588	▌ 258 സി	▐ 2590
9.	░ 2591	▒ 2592	▓ 2593	⌠ 2320	■ 25A0	∙ 2219	√ 221എ	≈ 2248	≤ 2264	≥ 2265	A0	⌡ 2321	° B0	² B2	· B7	÷ F7
എ.	═ 2550	║ 2551	╒ 2552	യോ 451	╓ 2553	╔ 2554	╕ 2555	╖ 2556	╗ 2557	╘ 2558	╙ 2559	╚ 255എ	╛ 255 ബി	╜ 255 സി	╝ 255D	╞ 255ഇ
ബി.	╟ 255F	╠ 2560	╡ 2561	യോ 401	╢ 2562	╣ 2563	╤ 2564	╥ 2565	╦ 2566	╧ 2567	╨ 2568	╩ 2569	╪ 256A	╫ 256B	╬ 256 സി	© A9
സി.	യു 44ഇ	എ 430	ബി 431	സി 446	ഡി 434	ഇ 435	എഫ് 444	ജി 433	എക്സ് 445	ഒപ്പം 438	th 439	ലേക്ക് 43എ	എൽ 43B	എം 43 സി	എൻ 43D	ഒ 43ഇ
ഡി.	പി 43F	ഐ 44F	ആർ 440	കൂടെ 441	ടി 442	ചെയ്തത് 443	ഒപ്പം 436	വി 432	ബി 44 സി	എസ് 44B	എച്ച് 437	w 448	ഓ 44D	sch 449	എച്ച് 447	ബി 44എ
ഇ.	YU 42ഇ	എ 410	ബി 411	സി 426	ഡി 414	ഇ 415	എഫ് 424	ജി 413	എക്സ് 425	ഒപ്പം 418	വൈ 419	TO 41എ	എൽ 41 ബി	എം 41 സി	എച്ച് 41D	കുറിച്ച് 41ഇ
എഫ്.	പി 41F	ഐ 42F	ആർ 420	കൂടെ 421	ടി 422	ചെയ്തത് 423	ഒപ്പം 416	IN 412	ബി 42 സി	എസ് 42 ബി	Z 417	ഡബ്ല്യു 428	ഇ 42D	SCH 429	എച്ച് 427	കൊമ്മേഴ്സന്റ് 42A

മറ്റ് ഓപ്ഷനുകൾ

മറ്റെല്ലാം പൊരുത്തപ്പെടുന്നതിനാൽ, പൊരുത്തപ്പെടാത്ത പട്ടിക വരികൾ മാത്രമേ കാണിക്കൂ.

എൻകോഡിംഗ് KOI8-U (റഷ്യൻ-ഉക്രേനിയൻ)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
എ.	═ 2550	║ 2551	╒ 2552	യോ 451	є 454	╔ 2554	і 456	ї 457	╗ 2557	╘ 2558	╙ 2559	╚ 255എ	╛ 255 ബി	ґ 491	╝ 255D	╞ 255ഇ
ബി.	╟ 255F	╠ 2560	╡ 2561	യോ 401	Є 404	╣ 2563	І 406	Ї 407	╦ 2566	╧ 2567	╨ 2568	╩ 2569	╪ 256A	Ґ 490	╬ 256 സി	© A9

എൻകോഡിംഗ് KOI8-RU (റഷ്യൻ-ബെലാറഷ്യൻ-ഉക്രേനിയൻ)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
എ.	═ 2550	║ 2551	╒ 2552	യോ 451	є 454	╔ 2554	і 456	ї 457	╗ 2557	╘ 2558	╙ 2559	╚ 255എ	╛ 255 ബി	ґ 491	ў 45ഇ	╞ 255ഇ
ബി.	╟ 255F	╠ 2560	╡ 2561	യോ 401	Є 404	╣ 2563	І 406	Ї 407	╦ 2566	╧ 2567	╨ 2568	╩ 2569	╪ 256A	Ґ 490	Ў 40ഇ	© A9

KOI8-C എൻകോഡിംഗ് (മധ്യേഷ്യ)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
8.	ғ 493	җ 497	қ 49B	ҝ 49D	ң 4A3	ү 4AF	ұ 4B1	ҳ 4B3	ҷ 4B7	ҹ 4B9	һ 4BB	▀ 2580	ә 4D9	ӣ 4E3	ө 4E9	ӯ 4EF
9.	Ғ 492	Җ 496	Қ 49എ	Ҝ 49 സി	Ң 4A2	Ү 4AE	Ұ 4B0	Ҳ 4B2	Ҷ 4B6	Ҹ 4B8	Һ 4BA	⌡ 2321	Ә 4D8	Ӣ 4E2	Ө 4E8	Ӯ 4EE
എ.	A0	ђ 452	ѓ 453	യോ 451	є 454	ѕ 455	і 456	ї 457	ј 458	љ 459	њ 45 എ	ћ 45 ബി	ќ 45 സി	ґ 491	ў 45ഇ	џ 45F
ബി.	№ 2116	Ђ 402	Ѓ 403	യോ 401	Є 404	Ѕ 405	І 406	Ї 407	Ј 408	Љ 409	Њ 40 എ	Ћ 40 ബി	Ќ 40 സി	Ґ 490	Ў 40ഇ	Џ 40F

KOI8-T എൻകോഡിംഗ് (താജിക്ക്)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
8.	қ 49B	ғ 493	‚ 201എ	Ғ 492	„ 201ഇ	… 2026	† 2020	‡ 2021		‰ 2030	ҳ 4B3	‹ 2039	Ҳ 4B2	ҷ 4B7	Ҷ 4B6
9.	Қ 49എ	‘ 2018	’ 2019	“ 201 സി	” 201D	2022	– 2013	- 2014		™ 2122		› 203എ
എ.		ӯ 4EF	Ӯ 4EE	യോ 451	¤ A4	ӣ 4E3	¦ A6	§ A7				« എബി	¬ എ.സി	എ.ഡി	® എ.ഇ
ബി.	° B0	± B1	² B2	യോ 401		Ӣ 4E2	¶ B6	· B7		№ 2116		» ബി.ബി				© A9

എൻകോഡിംഗ് KOI8-O, KOI8-S (സ്ലാവിക്, പഴയ അക്ഷരവിന്യാസം)

0407

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
8.	Ђ 0402	Ѓ 0403	¸ 00B8	ѓ 0453	„ 201ഇ	… 2026	† 2020	§ 00A7	€ 20എസി	¨ 00A8	Љ 0409	‹ 2039	Њ 040A	Ќ 040C	Ћ 040B	Џ 040F
9.	ђ 0452	‘ 2018	’ 2019	“ 201 സി	” 201D	2022	– 2013	— 2014	£ 00A3	· 00B7	љ 0459	› 203എ	њ 045A	ќ 045C	ћ 045B	џ 045F
എ.	00A0	ѵ 0475	ѣ 0463	യോ 0451	є 0454	ѕ 0455	і 0456	ї 0457	ј 0458	® 00AE	™ 2122	« 00AB	ѳ 0473	ґ 0491	ў 045E	´ 00B4
ബി.	° 00B0	Ѵ 0474	Ѣ 0462	യോ 0401	Є 0404	Ѕ 0405	І 0406	Ї 0407	Ј 0408	№ 2116	¢ 00A2	» 00BB	Ѳ 0472	Ґ 0490	Ў 040E	© 00A9

ISO-IR-111, KOI8-E എൻകോഡിംഗ്

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
എ.	00A0	ђ 0452	ѓ 0453	യോ 0451	є 0454	ѕ 0455	і 0456	ї 0457	ј 0458	љ 0459	њ 045A	ћ 045B	ќ 045C	00AD	ў 045E	џ 045F
ബി.	№ 2116	Ђ 0402	Ѓ 0403	യോ 0401	Є 0404	Ѕ 0405	І 0406	Ї 0407	Ј 0408	Љ 0409	Њ 040A	Ћ 040B	Ќ 040C	¤ 00A4	Ў 040E	Џ 040F

KOI8-യൂണിഫൈഡ്, KOI8-F എൻകോഡിംഗ്

KOI8-Unified (KOI8-F) എൻകോഡിംഗ് നിർദ്ദേശിച്ചത് ഫിംഗർടിപ്പ് സോഫ്റ്റ്‌വെയർ ആണ്.

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.എ	.ബി	.സി	.ഡി	.ഇ	.എഫ്
8.	─ 2500	│ 2502	┌ 250 സി	┐ 2510	└ 2514	┘ 2518	├ 251 സി	┤ 2524	┬ 252 സി	┴ 2534	┼ 253 സി	▀ 2580	▄ 2584	█ 2588	▌ 258 സി	▐ 2590
9.	░ 2591	‘ 2018	’ 2019	“ 201 സി	” 201D	2022	– 2013	— 2014	© 00A9	™ 2122	00A0	» 00BB	® 00AE	« 00AB	· 00B7	¤ 00A4
എ.	00A0	ђ 0452	ѓ 0453	യോ 0451	є 0454	ѕ 0455	і 0456	ї 0457	ј 0458	љ 0459	њ 045A	ћ 045B	ќ 045C	ґ 0491	ў 045E	џ 045F
ബി.	№ 2116	Ђ 0402	Ѓ 0403	യോ 0401	Є 0404	Ѕ 0405	І 0406	Ї 0407	Ј 0408	Љ 0409	Њ 040A	Ћ 040B	Ќ 040C	Ґ 0490	Ў 040E	Џ 040F

KOI-8-ന്റെ നോൺ-സിറിലിക് വകഭേദങ്ങൾ

ചില രാജ്യങ്ങളിൽ CMEAദേശീയ വകഭേദങ്ങൾക്കായി KOI-8-ന്റെ പരിഷ്‌ക്കരണങ്ങൾ സൃഷ്ടിച്ചു ലാറ്റിൻ. അടിസ്ഥാന ആശയം ഒന്നുതന്നെയായിരുന്നു - എട്ടാമത്തെ ബിറ്റ് "മുറിക്കുമ്പോൾ", വാചകം കൂടുതലോ കുറവോ മനസ്സിലാക്കാവുന്നതായിരിക്കണം.

- ശരി, ആരംഭിക്കുക! ഡോലോഖോവ് പറഞ്ഞു.
“ശരി,” പിയറി പറഞ്ഞു, അപ്പോഴും പുഞ്ചിരിച്ചു. - അത് ഭയപ്പെടുത്തുന്നുണ്ടായിരുന്നു. വളരെ എളുപ്പത്തിൽ ആരംഭിച്ച കർമ്മം ഇനി ഒന്നിനും തടയാൻ കഴിയില്ലെന്നും അത് സ്വയം മുന്നോട്ട് പോയി, ഇതിനകം തന്നെ ജനങ്ങളുടെ ഇഷ്ടത്തിനനുസരിച്ച് സ്വതന്ത്രമായി, പൂർത്തീകരിക്കേണ്ടതുണ്ടെന്നും വ്യക്തമായിരുന്നു. ഡെനിസോവ് ആദ്യമായി തടസ്സത്തിലേക്ക് വന്ന് പ്രഖ്യാപിച്ചു:
- "എതിരാളികൾ" "അനുകരിക്കാൻ" വിസമ്മതിച്ചതിനാൽ, ആരംഭിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നില്ലേ: പിസ്റ്റളുകൾ എടുത്ത്, ടി "എന്ന വാക്ക് അനുസരിച്ച് ഒത്തുചേരാൻ തുടങ്ങുക.
- ജി ... "അസ്! ടു! ടി" ഒപ്പം! ... - ഡെനിസോവ് ദേഷ്യത്തോടെ നിലവിളിച്ച് മാറിനിന്നു. കോടമഞ്ഞിൽ പരസ്പരം തിരിച്ചറിഞ്ഞുകൊണ്ട് ഇരുവരും ചവിട്ടിയ പാതകളിലൂടെ അടുത്തുകൂടെ നടന്നു. പ്രതിയോഗികൾക്ക് അവർക്കാവശ്യമുള്ളപ്പോൾ വെടിവെക്കാനുള്ള അവകാശം ഉണ്ടായിരുന്നു, തടസ്സത്തിലേക്ക് ഒത്തുചേരുന്നു. ഡോളോഖോവ് തന്റെ പിസ്റ്റൾ ഉയർത്താതെ പതുക്കെ നടന്നു, തന്റെ പ്രകാശം, തിളങ്ങുന്ന, നീലക്കണ്ണുകൾ എതിരാളിയുടെ മുഖത്തേക്ക് നോക്കി. അവന്റെ വായിൽ എപ്പോഴും എന്നപോലെ ഒരു പുഞ്ചിരിയുടെ സാദൃശ്യം ഉണ്ടായിരുന്നു.
- അതിനാൽ എനിക്ക് ആവശ്യമുള്ളപ്പോൾ - എനിക്ക് ഷൂട്ട് ചെയ്യാം! - പിയറി പറഞ്ഞു, മൂന്ന് എന്ന വാക്കിൽ, അവൻ വേഗത്തിലുള്ള ചുവടുകളോടെ മുന്നോട്ട് പോയി, അടിച്ച പാതയിൽ നിന്ന് തെറ്റി, കട്ടിയുള്ള മഞ്ഞുവീഴ്ചയിൽ നടന്നു. പിയറി പിസ്റ്റൾ പിടിച്ചു, വലതു കൈ മുന്നോട്ട് നീട്ടി, ഈ പിസ്റ്റൾ ഉപയോഗിച്ച് സ്വയം കൊല്ലുമോ എന്ന് ഭയപ്പെട്ടു. അവൻ ഉത്സാഹത്തോടെ ഇടത് കൈ പിന്നിലേക്ക് വെച്ചു, കാരണം അത് ഉപയോഗിച്ച് വലതു കൈ താങ്ങാൻ ആഗ്രഹിച്ചു, പക്ഷേ ഇത് അസാധ്യമാണെന്ന് അവനറിയാമായിരുന്നു. ആറടി നടന്ന് മഞ്ഞുവീഴ്ചയിലേക്കുള്ള വഴി തെറ്റിയ ശേഷം, പിയറി അവന്റെ കാലുകളിലേക്ക് ചുറ്റും നോക്കി, വീണ്ടും വേഗത്തിൽ ഡോലോഖോവിനെ നോക്കി, അവൻ പഠിപ്പിച്ചതുപോലെ വിരൽ വലിച്ചുകൊണ്ട് വെടിവച്ചു. ഇത്രയും ശക്തമായ ശബ്ദം പ്രതീക്ഷിക്കാതെ, പിയറി തന്റെ ഷോട്ടിൽ പതറി, എന്നിട്ട് സ്വന്തം മതിപ്പ് കണ്ട് പുഞ്ചിരിച്ച് നിർത്തി. പുക, പ്രത്യേകിച്ച് മൂടൽമഞ്ഞ്, ആദ്യം അവനെ കാണുന്നതിൽ നിന്ന് തടഞ്ഞു; എന്നാൽ അവൻ കാത്തിരുന്ന മറ്റൊരു ഷോട്ട് വന്നില്ല. ഡോളോഖോവിന്റെ തിടുക്കത്തിലുള്ള ചുവടുകൾ മാത്രം കേട്ടു, പുകയുടെ പിന്നിൽ നിന്ന് അവന്റെ രൂപം പ്രത്യക്ഷപ്പെട്ടു. ഒരു കൈകൊണ്ട് അവൻ ഇടതുവശത്ത് മുറുകെ പിടിച്ചു, മറ്റേ കൈകൊണ്ട് അവൻ താഴ്ത്തിയ പിസ്റ്റൾ മുറുകെ പിടിച്ചു. അവന്റെ മുഖം വിളറി. റോസ്തോവ് ഓടിവന്ന് അവനോട് എന്തോ പറഞ്ഞു.
- ഇല്ല ... ഇല്ല ... ടി, - ദോലോഖോവ് പല്ലുകളിലൂടെ പറഞ്ഞു, - ഇല്ല, അത് അവസാനിച്ചിട്ടില്ല, - കുറച്ച് കൂടി വീണുകിടക്കുന്ന ചുവടുകൾ വളരെ സേബറിലേക്ക് എടുത്ത്, അയാൾ അതിനടുത്തുള്ള മഞ്ഞിൽ വീണു. ഇടതുകൈ രക്തം പുരണ്ടിരുന്നു, അയാൾ അത് കോട്ടിൽ തുടച്ച് അതിൽ ചാരി കിടന്നു. അവന്റെ മുഖം വിളറി, നെറ്റി ചുളിക്കുകയും വിറയ്ക്കുകയും ചെയ്തു.
"ഇത് ഒരു ദയനീയമാണ് ..." ഡോലോഖോവ് ആരംഭിച്ചു, പക്ഷേ അയാൾക്ക് അത് ഉടനടി ഉച്ചരിക്കാൻ കഴിഞ്ഞില്ല ... "ഒരുപക്ഷേ," അവൻ ഒരു ശ്രമത്തോടെ പൂർത്തിയാക്കി. പിയറി, കഷ്ടിച്ച് കരച്ചിൽ അടക്കി, ഡോലോഖോവിലേക്ക് ഓടി, തടസ്സങ്ങളെ വേർതിരിക്കുന്ന ഇടം കടക്കാൻ പോകുകയായിരുന്നു, ഡോലോഖോവ് വിളിച്ചുപറഞ്ഞപ്പോൾ: - തടസ്സത്തിലേക്ക്! - എന്താണ് സംഭവിക്കുന്നതെന്ന് മനസിലാക്കിയ പിയറി തന്റെ സേബറിൽ നിർത്തി. 10 പടികൾ മാത്രമാണ് അവരെ വേർതിരിക്കുന്നത്. ഡോളോഖോവ് ഹിമത്തിലേക്ക് തല താഴ്ത്തി, അത്യാഗ്രഹത്തോടെ മഞ്ഞ് കടിച്ചു, തല വീണ്ടും ഉയർത്തി, സ്വയം തിരുത്തി, കാലുകൾ ഉയർത്തി, ഉറച്ച ഗുരുത്വാകർഷണ കേന്ദ്രം നോക്കി ഇരുന്നു. അവൻ തണുത്ത മഞ്ഞ് വിഴുങ്ങി, അത് വലിച്ചെടുത്തു; അവന്റെ ചുണ്ടുകൾ വിറച്ചു, പക്ഷേ ഇപ്പോഴും പുഞ്ചിരിക്കുന്നു; അവസാനം ശേഖരിച്ച ശക്തിയുടെ പ്രയത്നവും ദുരുദ്ദേശവും കൊണ്ട് അവന്റെ കണ്ണുകൾ തിളങ്ങി. അവൻ പിസ്റ്റൾ ഉയർത്തി ലക്ഷ്യമെടുത്തു.
"വശത്തേക്ക്, ഒരു പിസ്റ്റൾ ഉപയോഗിച്ച് സ്വയം മൂടുക," നെസ്വിറ്റ്സ്കി പറഞ്ഞു.
- 3ak "ope!" - സഹിക്കാൻ കഴിയാതെ ഡെനിസോവ് പോലും എതിരാളിയോട് ആക്രോശിച്ചു.
പശ്ചാത്താപത്തിന്റെയും പശ്ചാത്താപത്തിന്റെയും സൗമ്യമായ പുഞ്ചിരിയോടെ, നിസ്സഹായനായി കാലുകളും കൈകളും വിടർത്തി, വിശാലമായ നെഞ്ചുമായി ഡോളോഖോവിന്റെ മുന്നിൽ നേരിട്ട് നിന്ന് അവനെ സങ്കടത്തോടെ നോക്കി. ഡെനിസോവ്, റോസ്തോവ്, നെസ്വിറ്റ്സ്കി എന്നിവർ കണ്ണുകൾ അടച്ചു. അതേ സമയം അവർ ഡോളോഖോവിൽ നിന്ന് ഒരു വെടിയും കോപാകുലമായ നിലവിളിയും കേട്ടു.
- കഴിഞ്ഞ! - ഡോലോഖോവ് അലറി, ശക്തിയില്ലാതെ മുഖം താഴ്ത്തി മഞ്ഞിൽ കിടന്നു. പിയറി തലയിൽ മുറുകെ പിടിച്ച്, പിന്നോട്ട് തിരിഞ്ഞ് കാട്ടിലേക്ക് പോയി, പൂർണ്ണമായും മഞ്ഞുവീഴ്ചയിൽ നടന്ന് ഉച്ചത്തിൽ മനസ്സിലാക്കാൻ കഴിയാത്ത വാക്കുകൾ പറഞ്ഞു:
"മണ്ടൻ... മണ്ടൻ!" മരണം... നുണ.. - അവൻ ആവർത്തിച്ചു. നെസ്വിറ്റ്സ്കി അവനെ തടഞ്ഞു വീട്ടിലേക്ക് കൊണ്ടുപോയി.
റോസ്തോവും ഡെനിസോവും പരിക്കേറ്റ ഡോളോഖോവിനെ വഹിച്ചു.
ഡോളോഖോവ്, നിശബ്ദമായി, അടഞ്ഞ കണ്ണുകളോടെ, സ്ലീയിൽ കിടന്നു, തന്നോട് ചോദിച്ച ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാതെ; പക്ഷേ, മോസ്കോയിൽ പ്രവേശിച്ച അദ്ദേഹം പെട്ടെന്ന് തന്റെ അടുത്തേക്ക് വന്നു, പ്രയാസത്തോടെ തല ഉയർത്തി, തന്റെ അരികിൽ ഇരുന്ന റോസ്തോവിനെ കൈയ്യിൽ പിടിച്ചു. ഡോളോഖോവിന്റെ മുഖത്തിന്റെ പൂർണ്ണമായും മാറിയതും അപ്രതീക്ഷിതവുമായ ആവേശത്തോടെയുള്ള ആർദ്രമായ ഭാവം റോസ്തോവിനെ ഞെട്ടിച്ചു.
- നന്നായി? നിനക്ക് എന്തുതോന്നുന്നു? റോസ്തോവ് ചോദിച്ചു.
- മോശം! പക്ഷേ അതല്ല കാര്യം. എന്റെ സുഹൃത്ത്, - തകർന്ന ശബ്ദത്തിൽ ഡോലോഖോവ് പറഞ്ഞു, - ഞങ്ങൾ എവിടെയാണ്? ഞങ്ങൾ മോസ്കോയിലാണ്, എനിക്കറിയാം. എനിക്ക് സുഖമാണ്, പക്ഷേ ഞാൻ അവളെ കൊന്നു, അവളെ കൊന്നു ... അവൾക്ക് അത് ഉൾക്കൊള്ളാൻ കഴിയില്ല. അവൾ സഹിക്കില്ല...
- WHO? റോസ്തോവ് ചോദിച്ചു.
- എന്റെ അമ്മ. എന്റെ അമ്മ, എന്റെ മാലാഖ, എന്റെ പ്രിയപ്പെട്ട മാലാഖ, അമ്മ - ഒപ്പം ഡോലോഖോവും റോസ്തോവിന്റെ കൈ ഞെക്കി കരയാൻ തുടങ്ങി. അവൻ അൽപ്പം ശാന്തനായപ്പോൾ, താൻ അമ്മയോടൊപ്പമാണ് താമസിക്കുന്നതെന്നും അമ്മ മരിക്കുന്നത് കണ്ടാൽ അവൾക്ക് അത് സഹിക്കാൻ കഴിയില്ലെന്നും റോസ്തോവിനോട് വിശദീകരിച്ചു. അവളുടെ അടുത്ത് പോയി അവളെ തയ്യാറാക്കാൻ അവൻ റോസ്തോവിനോട് അപേക്ഷിച്ചു.
റോസ്തോവ് അസൈൻമെന്റ് നിർവ്വഹിക്കാൻ മുന്നോട്ട് പോയി, ഈ കലഹക്കാരനായ ഡോലോഖോവ് മോസ്കോയിൽ പ്രായമായ അമ്മയോടും കൂൺബാക്കഡ് സഹോദരിയോടും ഒപ്പം താമസിച്ചിരുന്നുവെന്നും ഏറ്റവും ആർദ്രമായ മകനും സഹോദരനുമായിരുന്നുവെന്ന് അദ്ദേഹം മനസ്സിലാക്കി.

പിയറി ഈയിടെയായി ഭാര്യയെ മുഖാമുഖം കാണുന്നത് വളരെ അപൂർവമായിരുന്നു. സെന്റ് പീറ്റേഴ്സ്ബർഗിലും മോസ്കോയിലും അവരുടെ വീട്ടിൽ നിരന്തരം അതിഥികൾ നിറഞ്ഞിരുന്നു. ദ്വന്ദ്വയുദ്ധത്തിന് ശേഷമുള്ള അടുത്ത രാത്രി, അവൻ പലപ്പോഴും ചെയ്തതുപോലെ, അവൻ കിടപ്പുമുറിയിൽ പോകാതെ, തന്റെ വലിയ, പിതാവിന്റെ പഠനത്തിൽ തന്നെ തുടർന്നു, അതിൽ കൗണ്ട് ബെസുഹി മരിച്ചു.
സോഫയിൽ കിടന്നുറങ്ങി, സംഭവിച്ചതെല്ലാം മറക്കാൻ അവൻ ഉറങ്ങാൻ ആഗ്രഹിച്ചു, പക്ഷേ അവന് അത് ചെയ്യാൻ കഴിഞ്ഞില്ല. അത്തരം വികാരങ്ങളുടെയും ചിന്തകളുടെയും ഓർമ്മകളുടെയും കൊടുങ്കാറ്റ് അവന്റെ ആത്മാവിൽ പെട്ടെന്ന് ഉയർന്നു, അയാൾക്ക് ഉറങ്ങാൻ മാത്രമല്ല, ഇരിക്കാനും കഴിയില്ല, സോഫയിൽ നിന്ന് ചാടി വേഗത്തിൽ ചുവടുകളോടെ മുറിക്ക് ചുറ്റും നടക്കേണ്ടിവന്നു. വിവാഹശേഷം, നഗ്നമായ തോളും ക്ഷീണിച്ച, വികാരാധീനമായ നോട്ടവുമായി അവൻ അവളെ ആദ്യമായി സങ്കൽപ്പിച്ചു, അവളുടെ അരികിൽ, അത്താഴസമയത്ത് ഡോലോഖോവിന്റെ സുന്ദരവും ധിക്കാരവും ഉറച്ച പരിഹാസവും ഉള്ള മുഖവും ഡോളോഖോവിന്റെ അതേ മുഖവും അയാൾ കണ്ടു. , തിരിഞ്ഞ് മഞ്ഞിൽ വീണപ്പോൾ വിളറി, വിറച്ചു, കഷ്ടപ്പെട്ടു.
"എന്ത് സംഭവിച്ചു? അവൻ സ്വയം ചോദിച്ചു. “ഞാൻ എന്റെ കാമുകനെ കൊന്നു, അതെ, ഞാൻ എന്റെ ഭാര്യയുടെ കാമുകനെ കൊന്നു. അതെ, അത് ആയിരുന്നു. എന്തില്നിന്ന്? ഞാൻ എങ്ങനെ അവിടെ എത്തി? "കാരണം നിങ്ങൾ അവളെ വിവാഹം കഴിച്ചു," ആന്തരിക ശബ്ദം ഉത്തരം നൽകി.
“എന്നാൽ എന്റെ തെറ്റ് എന്താണ്? അവന് ചോദിച്ചു. "അവളെ സ്നേഹിക്കാതെയാണ് നിങ്ങൾ വിവാഹം കഴിച്ചത്, നിങ്ങളെയും അവളെയും നിങ്ങൾ വഞ്ചിച്ചു എന്ന വസ്തുതയിൽ," അത്താഴത്തിന് ശേഷം വാസിലി രാജകുമാരന്റെ ആ നിമിഷം, അവനിൽ നിന്ന് പുറത്തുവരാത്ത ഈ വാക്കുകൾ പറഞ്ഞപ്പോൾ അവൻ വ്യക്തമായി സങ്കൽപ്പിച്ചു: "ജെ. നിങ്ങളുടെ ലക്ഷ്യം." [ഞാൻ നിന്നെ സ്നേഹിക്കുന്നു.] ഇതിൽ നിന്ന് എല്ലാം! എനിക്ക് അപ്പോൾ തോന്നി, അവൻ വിചാരിച്ചു, എനിക്ക് അതിന് അവകാശമില്ല എന്നല്ല എനിക്ക് അപ്പോൾ തോന്നിയത്. അങ്ങനെ അത് സംഭവിച്ചു." അവൻ മധുവിധു ഓർത്തു, ഓർത്തു നാണിച്ചു. ഒരു ദിവസം, തന്റെ വിവാഹം കഴിഞ്ഞ്, ഉച്ചയ്ക്ക് 12 മണിക്ക്, പട്ടുവസ്ത്രം ധരിച്ച ഗൗൺ ധരിച്ച്, കിടപ്പുമുറിയിൽ നിന്ന് ഓഫീസിലേക്ക് വന്നതും ഓഫീസിൽ കണ്ടതും എങ്ങനെയെന്ന ഓർമ്മയാണ് അദ്ദേഹത്തിന് പ്രത്യേകിച്ച് ഉജ്ജ്വലവും അപമാനകരവും ലജ്ജാകരവും. ബഹുമാനപൂർവ്വം തലകുനിച്ച ചീഫ് മാനേജർ, തന്റെ ഡ്രസ്സിംഗ് ഗൗണിൽ പിയറിയുടെ മുഖത്തേക്ക് നോക്കി ചെറുതായി പുഞ്ചിരിച്ചു, ഈ പുഞ്ചിരിയോടെ തന്റെ പ്രിൻസിപ്പലിന്റെ സന്തോഷത്തോട് ആദരവോടെ സഹതാപം പ്രകടിപ്പിക്കുന്നതുപോലെ.
"എത്ര തവണ ഞാൻ അവളെക്കുറിച്ച് അഭിമാനിച്ചിട്ടുണ്ട്, അവളുടെ ഗാംഭീര്യമുള്ള സൗന്ദര്യത്തിൽ, അവളുടെ ലൗകിക നയത്തിൽ അഭിമാനിക്കുന്നു," അവൻ ചിന്തിച്ചു; പീറ്റേഴ്‌സ്ബർഗിൽ നിന്ന് അവൾ സ്വീകരിച്ച തന്റെ വീടിനെക്കുറിച്ച് അയാൾ അഭിമാനിച്ചു, അവളുടെ അപ്രാപ്യതയിലും സൗന്ദര്യത്തിലും അഭിമാനിച്ചു. അപ്പോൾ ഞാൻ എന്താണ് അഭിമാനിക്കുന്നത്? ആ സമയം ഞാൻ വിചാരിച്ചു അവളെ എനിക്ക് മനസ്സിലായില്ല എന്ന്. എത്ര പ്രാവശ്യം, അവളുടെ സ്വഭാവത്തെക്കുറിച്ച് ആലോചിച്ച്, എനിക്ക് അവളെ മനസ്സിലാകാത്തത് എന്റെ തെറ്റാണെന്നും, ഈ ശാശ്വതമായ ശാന്തത, സംതൃപ്തി, മുൻ‌ഗണനകളുടെയും ആഗ്രഹങ്ങളുടെയും അഭാവം എന്നിവ എനിക്ക് മനസ്സിലായില്ലെന്നും ഞാൻ സ്വയം പറഞ്ഞു, മുഴുവൻ സൂചനയും ആ ഭയങ്കരമായ വാക്കിൽ ഉണ്ടായിരുന്നു. അവൾ ഒരു ദുഷിച്ച സ്ത്രീയായിരുന്നുവെന്ന്: സ്വയം ഈ ഭയങ്കരമായ വാക്ക്, എല്ലാം വ്യക്തമായി!
“അനറ്റോൾ അവളിൽ നിന്ന് പണം കടം വാങ്ങാൻ അവളുടെ അടുത്തേക്ക് പോയി അവളുടെ നഗ്നമായ തോളിൽ ചുംബിച്ചു. അവൾ അവന് പണം നൽകിയില്ല, പക്ഷേ അവൾ അവനെ ചുംബിക്കാൻ അനുവദിച്ചു. അവളുടെ അച്ഛൻ തമാശയായി അവളിൽ അസൂയ ഉണർത്തി; അവൾ അസൂയപ്പെടാൻ തക്ക മണ്ടനല്ലെന്ന് ശാന്തമായ പുഞ്ചിരിയോടെ പറഞ്ഞു: അവൾ ആഗ്രഹിക്കുന്നത് ചെയ്യട്ടെ, അവൾ എന്നെക്കുറിച്ച് പറഞ്ഞു. ഗര് ഭിണിയായതിന്റെ ലക്ഷണമുണ്ടോ എന്ന് ഒരിക്കല് ഞാന് അവളോട് ചോദിച്ചു. അവൾ അവജ്ഞയോടെ ചിരിച്ചു, കുട്ടികളുണ്ടാകാൻ ആഗ്രഹിക്കുന്ന ഒരു വിഡ്ഢിയല്ല അവൾ, എന്നിൽ നിന്ന് അവൾക്ക് കുട്ടികൾ ഉണ്ടാകില്ല.
ഉയർന്ന പ്രഭുക്കന്മാരുടെ വലയത്തിൽ വളർന്നിട്ടും അവളുടെ പരുക്കൻ സ്വഭാവവും അവളുടെ ചിന്തകളുടെ വ്യക്തതയും അവളുടെ ഭാവങ്ങളുടെ അശ്ലീലതയും അവൻ ഓർത്തു. "ഞാൻ ഒരുതരം വിഡ്ഢിയല്ല... പോയി സ്വയം പരീക്ഷിച്ചു നോക്കൂ... allez vous promener," [പുറത്തുപോവുക,] അവൾ പറഞ്ഞു. പലപ്പോഴും, പ്രായമായവരുടെയും യുവാക്കളുടെയും സ്ത്രീകളുടെയും കണ്ണുകളിൽ അവളുടെ വിജയം നോക്കുമ്പോൾ, എന്തുകൊണ്ടാണ് താൻ അവളെ സ്നേഹിക്കാത്തതെന്ന് പിയറിന് മനസ്സിലാക്കാൻ കഴിഞ്ഞില്ല. അതെ, ഞാൻ അവളെ ഒരിക്കലും സ്നേഹിച്ചിട്ടില്ല, പിയറി സ്വയം പറഞ്ഞു; അവൾ ഒരു ദുഷിച്ച സ്ത്രീയാണെന്ന് എനിക്കറിയാമായിരുന്നു, അവൻ സ്വയം ആവർത്തിച്ചു, പക്ഷേ അത് സമ്മതിക്കാൻ അവൻ ധൈര്യപ്പെട്ടില്ല.

ഹലോ, ബ്ലോഗ് സൈറ്റിന്റെ പ്രിയ വായനക്കാർ. സൈറ്റിലും പ്രോഗ്രാമുകളിലും ക്രാക്കോസിയാബ്രുകൾ എവിടെ നിന്നാണ് വരുന്നത്, ഏത് ടെക്സ്റ്റ് എൻകോഡിംഗുകൾ നിലവിലുണ്ട്, ഏതൊക്കെ ഉപയോഗിക്കണം എന്നതിനെക്കുറിച്ച് ഇന്ന് ഞങ്ങൾ നിങ്ങളോട് സംസാരിക്കും. അടിസ്ഥാന ASCII മുതൽ അതിന്റെ വിപുലീകൃത പതിപ്പുകൾ CP866, KOI8-R, Windows 1251 എന്നിവയിൽ നിന്ന് ആരംഭിച്ച്, യൂണികോഡ് കൺസോർഷ്യം UTF 16, 8 എന്നിവയുടെ ആധുനിക എൻകോഡിംഗുകളിൽ അവസാനിക്കുന്ന അവരുടെ വികസനത്തിന്റെ ചരിത്രം നമുക്ക് സൂക്ഷ്മമായി പരിശോധിക്കാം.

ചിലർക്ക്, ഈ വിവരങ്ങൾ അനാവശ്യമായി തോന്നിയേക്കാം, എന്നാൽ ക്രാൾഡ് ഔട്ട് ക്രാക്കോസിയാബ്രുകളെ (വായിക്കാനാകാത്ത അക്ഷരക്കൂട്ടം) സംബന്ധിച്ച് എനിക്ക് പ്രത്യേകമായി എത്ര ചോദ്യങ്ങൾ ഉണ്ടെന്ന് നിങ്ങൾക്കറിയാം. ഈ ലേഖനത്തിന്റെ വാചകത്തിലേക്ക് എല്ലാവരേയും റഫർ ചെയ്യാനും സ്വതന്ത്രമായി എന്റെ ജാംബുകൾക്കായി നോക്കാനും ഇപ്പോൾ എനിക്ക് അവസരം ലഭിക്കും. ശരി, വിവരങ്ങൾ ഉൾക്കൊള്ളാൻ തയ്യാറാകൂ, കഥയുടെ ഗതി പിന്തുടരാൻ ശ്രമിക്കുക.

ASCII - ലാറ്റിനിനായുള്ള അടിസ്ഥാന ടെക്സ്റ്റ് എൻകോഡിംഗ്

ടെക്സ്റ്റ് എൻകോഡിംഗുകളുടെ വികസനം ഐടി വ്യവസായത്തിന്റെ രൂപീകരണത്തോടൊപ്പം ഒരേസമയം സംഭവിച്ചു, ഈ സമയത്ത് അവർക്ക് വളരെയധികം മാറ്റങ്ങൾ വരുത്താൻ കഴിഞ്ഞു. ചരിത്രപരമായി, ഇതെല്ലാം ആരംഭിച്ചത് ഇബിസിഡിഐസിയിൽ നിന്നാണ്, ഇത് റഷ്യൻ ഉച്ചാരണത്തിൽ തികച്ചും വ്യത്യസ്തമായിരുന്നു, ഇത് ലാറ്റിൻ അക്ഷരമാലയിലെ അക്ഷരങ്ങൾ, അറബി അക്കങ്ങൾ, വിരാമചിഹ്നങ്ങൾ എന്നിവ നിയന്ത്രണ പ്രതീകങ്ങളോടെ എൻകോഡ് ചെയ്യുന്നത് സാധ്യമാക്കി.

എന്നിട്ടും, ആധുനിക ടെക്സ്റ്റ് എൻകോഡിംഗുകളുടെ വികസനത്തിന്റെ ആരംഭ പോയിന്റ് പ്രസിദ്ധമായി കണക്കാക്കണം ആസ്കി(അമേരിക്കൻ സ്റ്റാൻഡേർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇന്റർചേഞ്ച്, റഷ്യൻ ഭാഷയിൽ ഇത് സാധാരണയായി "ആസ്കി" എന്ന് ഉച്ചരിക്കുന്നു). ഇംഗ്ലീഷ് ഉപയോക്താക്കൾ ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന ആദ്യത്തെ 128 പ്രതീകങ്ങൾ - , അറബിക് അക്കങ്ങൾ, വിരാമചിഹ്നങ്ങൾ എന്നിവ ഇത് വിവരിക്കുന്നു.

ASCII-ൽ വിവരിച്ചിരിക്കുന്ന ഈ 128 പ്രതീകങ്ങളിൽ പോലും, ബ്രാക്കറ്റുകൾ, ബാറുകൾ, നക്ഷത്രചിഹ്നങ്ങൾ തുടങ്ങിയ ചില സേവന പ്രതീകങ്ങൾ ഉണ്ടായിരുന്നു. വാസ്തവത്തിൽ, നിങ്ങൾക്ക് അവ സ്വയം കാണാൻ കഴിയും:

ASCII-യുടെ യഥാർത്ഥ പതിപ്പിൽ നിന്നുള്ള ഈ 128 പ്രതീകങ്ങളാണ് സ്റ്റാൻഡേർഡ് ആയി മാറിയത്, മറ്റേതെങ്കിലും എൻകോഡിംഗിൽ നിങ്ങൾ തീർച്ചയായും അവരെ കണ്ടുമുട്ടുകയും അവ ആ ക്രമത്തിൽ നിൽക്കുകയും ചെയ്യും.

എന്നാൽ ഒരു ബൈറ്റ് വിവരത്തിന്റെ സഹായത്തോടെ, 128 അല്ല, 256 വ്യത്യസ്ത മൂല്യങ്ങൾ (എട്ടിന്റെ പവർ രണ്ട് മുതൽ 256 വരെ) എൻകോഡ് ചെയ്യാൻ കഴിയും എന്നതാണ് വസ്തുത. അസുക, ഒരു മുഴുവൻ പരമ്പര വിപുലീകരിച്ച ASCII എൻകോഡിംഗുകൾ, ഇതിൽ, 128 അടിസ്ഥാന പ്രതീകങ്ങൾക്ക് പുറമേ, ദേശീയ എൻകോഡിംഗിന്റെ ചിഹ്നങ്ങൾ എൻകോഡ് ചെയ്യാനും സാധിച്ചു (ഉദാഹരണത്തിന്, റഷ്യൻ).

ഇവിടെ, ഒരുപക്ഷേ, വിവരണത്തിൽ ഉപയോഗിക്കുന്ന നമ്പർ സിസ്റ്റങ്ങളെക്കുറിച്ച് കുറച്ചുകൂടി പറയേണ്ടതാണ്. ഒന്നാമതായി, നിങ്ങൾക്കെല്ലാവർക്കും അറിയാവുന്നതുപോലെ, ഒരു കമ്പ്യൂട്ടർ ബൈനറി സിസ്റ്റത്തിലെ അക്കങ്ങൾ ഉപയോഗിച്ച് മാത്രമേ പ്രവർത്തിക്കൂ, അതായത് പൂജ്യങ്ങളും വണ്ണുകളും ("ബൂളിയൻ ആൾജിബ്ര", ആരെങ്കിലും ഒരു ഇൻസ്റ്റിറ്റ്യൂട്ടിലോ സ്കൂളിലോ പഠിച്ചിട്ടുണ്ടെങ്കിൽ). , ഓരോന്നും ഡിഗ്രിയിലെ രണ്ട്, പൂജ്യത്തിൽ നിന്ന് തുടങ്ങി ഏഴാമത്തേതിൽ രണ്ട് വരെ:

അത്തരമൊരു നിർമ്മിതിയിൽ സാധ്യമായ പൂജ്യങ്ങളുടെയും ഒന്നിന്റെയും സംയോജനങ്ങളിൽ 256 മാത്രമേ ഉണ്ടാകൂ എന്ന് മനസ്സിലാക്കാൻ പ്രയാസമില്ല.ഒരു സംഖ്യയെ ബൈനറിയിൽ നിന്ന് ദശാംശത്തിലേക്ക് പരിവർത്തനം ചെയ്യുന്നത് വളരെ ലളിതമാണ്. രണ്ടിന്റെ എല്ലാ ശക്തികളും നിങ്ങൾ കൂട്ടിച്ചേർക്കേണ്ടതുണ്ട്, അതിൽ ഒന്നുണ്ട്.

ഞങ്ങളുടെ ഉദാഹരണത്തിൽ, ഇത് 1 (2 മുതൽ പൂജ്യത്തിന്റെ ശക്തി) പ്ലസ് 8 (രണ്ട് മുതൽ 3 വരെ), പ്ലസ് 32 (രണ്ട് മുതൽ അഞ്ചാം വരെ), പ്ലസ് 64 (ആറാം), പ്ലസ് 128 (ഏഴാം വരെ) . ദശാംശ നൊട്ടേഷനിൽ ആകെ 233 ലഭിക്കുന്നു. നിങ്ങൾക്ക് കാണാനാകുന്നതുപോലെ, എല്ലാം വളരെ ലളിതമാണ്.

എന്നാൽ നിങ്ങൾ ASCII പ്രതീകങ്ങളുള്ള പട്ടിക സൂക്ഷ്മമായി പരിശോധിച്ചാൽ, അവ ഹെക്സാഡെസിമൽ എൻകോഡിംഗിൽ പ്രതിനിധീകരിക്കുന്നത് നിങ്ങൾ കാണും. ഉദാഹരണത്തിന്, "നക്ഷത്രചിഹ്നം" അസ്കിയിൽ ഹെക്സാഡെസിമൽ സംഖ്യ 2A യുമായി യോജിക്കുന്നു. അറബി അക്കങ്ങൾക്ക് പുറമേ, ഹെക്സാഡെസിമൽ സംഖ്യാ സമ്പ്രദായം എ (പത്ത് എന്നർത്ഥം) മുതൽ എഫ് (പതിനഞ്ച് എന്നർത്ഥം) വരെയുള്ള ലാറ്റിൻ അക്ഷരങ്ങളും ഉപയോഗിക്കുന്നുണ്ടെന്ന് നിങ്ങൾക്കറിയാം.

നന്നായി, വേണ്ടി ബൈനറിയെ ഹെക്സാഡെസിമലിലേക്ക് പരിവർത്തനം ചെയ്യുകഇനിപ്പറയുന്ന ലളിതവും ദൃശ്യപരവുമായ രീതി അവലംബിക്കുക. മുകളിലെ സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്നതുപോലെ, വിവരങ്ങളുടെ ഓരോ ബൈറ്റും നാല് ബിറ്റുകളുടെ രണ്ട് ഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്നു. അത്. ഓരോ പകുതി ബൈറ്റിലും, പതിനാറ് മൂല്യങ്ങൾ മാത്രമേ ബൈനറി കോഡിൽ (രണ്ട് മുതൽ നാലാമത്തെ പവർ വരെ) എൻകോഡ് ചെയ്യാൻ കഴിയൂ, അത് ഒരു ഹെക്സാഡെസിമൽ സംഖ്യയായി എളുപ്പത്തിൽ പ്രതിനിധീകരിക്കാം.

മാത്രമല്ല, ബൈറ്റിന്റെ ഇടത് പകുതിയിൽ, പൂജ്യത്തിൽ നിന്ന് ആരംഭിക്കുന്ന ഡിഗ്രികൾ വീണ്ടും എണ്ണേണ്ടത് ആവശ്യമാണ്, സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്നതുപോലെയല്ല. തൽഫലമായി, ലളിതമായ കണക്കുകൂട്ടലുകൾ വഴി, സ്ക്രീൻഷോട്ടിൽ E9 എന്ന നമ്പർ എൻകോഡ് ചെയ്തിട്ടുണ്ടെന്ന് നമുക്ക് ലഭിക്കും. എന്റെ യുക്തിയുടെ ഗതിയും ഈ പസിലിനുള്ള പരിഹാരവും നിങ്ങൾക്ക് വ്യക്തമായിരിക്കുമെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു. ശരി, ഇപ്പോൾ നമുക്ക് തുടരാം, വാസ്തവത്തിൽ, ടെക്സ്റ്റ് എൻകോഡിംഗുകളെക്കുറിച്ച് സംസാരിക്കാം.

അസുകയുടെ വിപുലീകൃത പതിപ്പുകൾ - സ്യൂഡോഗ്രാഫിക്സുള്ള CP866, KOI8-R എൻകോഡിംഗുകൾ

അതിനാൽ, ഞങ്ങൾ ASCII നെക്കുറിച്ച് സംസാരിക്കാൻ തുടങ്ങി, അത് എല്ലാ ആധുനിക എൻകോഡിംഗുകളുടെയും (Windows 1251, യൂണികോഡ്, UTF 8) വികസനത്തിന്റെ ആരംഭ പോയിന്റായിരുന്നു.

തുടക്കത്തിൽ, അതിൽ ലാറ്റിൻ അക്ഷരമാലയുടെയും അറബി അക്കങ്ങളുടെയും മറ്റെന്തെങ്കിലും അക്ഷരങ്ങളുടെയും 128 പ്രതീകങ്ങൾ മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ, എന്നാൽ വിപുലീകൃത പതിപ്പിൽ ഒരു ബൈറ്റ് വിവരങ്ങളിൽ എൻകോഡ് ചെയ്യാൻ കഴിയുന്ന എല്ലാ 256 മൂല്യങ്ങളും ഉപയോഗിക്കാൻ സാധിച്ചു. ആ. നിങ്ങളുടെ ഭാഷയിലെ അക്ഷരങ്ങളുടെ പ്രതീകങ്ങൾ Asci-യിലേക്ക് ചേർക്കുന്നത് സാധ്യമായി.

ഇവിടെ വിശദീകരിക്കാൻ ഒരിക്കൽ കൂടി വ്യതിചലിക്കേണ്ടതുണ്ട് - നിങ്ങൾക്ക് എന്തിനാണ് കോഡിംഗ് വേണ്ടത്?വാചകങ്ങൾ, എന്തുകൊണ്ട് അത് വളരെ പ്രധാനമാണ്. നിങ്ങളുടെ കമ്പ്യൂട്ടർ സ്‌ക്രീനിലെ പ്രതീകങ്ങൾ രണ്ട് കാര്യങ്ങളുടെ അടിസ്ഥാനത്തിലാണ് രൂപപ്പെടുന്നത് - എല്ലാത്തരം പ്രതീകങ്ങളുടെയും വെക്റ്റർ ആകൃതികളുടെ (പ്രാതിനിധ്യങ്ങൾ) സെറ്റുകൾ (അവ കോ ഫയലുകളിലാണ്) ഈ വെക്റ്റർ രൂപങ്ങളിൽ നിന്ന് പുറത്തെടുക്കാൻ നിങ്ങളെ അനുവദിക്കുന്ന ഒരു കോഡ് ( ഫോണ്ട് ഫയൽ) നിങ്ങൾ ശരിയായ സ്ഥലത്ത് തിരുകേണ്ട പ്രതീകം.

വെക്റ്റർ ഫോമുകൾക്ക് ഫോണ്ടുകൾ ഉത്തരവാദികളാണെന്ന് വ്യക്തമാണ്, എന്നാൽ ഓപ്പറേറ്റിംഗ് സിസ്റ്റവും അതിൽ ഉപയോഗിക്കുന്ന പ്രോഗ്രാമുകളും എൻകോഡിംഗിന് ഉത്തരവാദികളാണ്. ആ. നിങ്ങളുടെ കമ്പ്യൂട്ടറിലെ ഏത് ടെക്‌സ്‌റ്റും ഒരു കൂട്ടം ബൈറ്റുകളായിരിക്കും, അവ ഓരോന്നും ഈ വാചകത്തിന്റെ ഒരു പ്രതീകം എൻകോഡ് ചെയ്യുന്നു.

ഈ വാചകം സ്ക്രീനിൽ പ്രദർശിപ്പിക്കുന്ന പ്രോഗ്രാം (ടെക്സ്റ്റ് എഡിറ്റർ, ബ്രൗസർ മുതലായവ), കോഡ് പാഴ്‌സ് ചെയ്യുമ്പോൾ, അടുത്ത പ്രതീകത്തിന്റെ എൻകോഡിംഗ് വായിക്കുകയും ഈ വാചകം പ്രദർശിപ്പിക്കുന്നതിന് ബന്ധിപ്പിച്ചിരിക്കുന്ന ആവശ്യമുള്ള ഫോണ്ട് ഫയലിൽ അനുബന്ധ വെക്റ്റർ ഫോമിനായി തിരയുകയും ചെയ്യുന്നു. പ്രമാണം. എല്ലാം ലളിതവും നിസ്സാരവുമാണ്.

ഇതിനർത്ഥം, നമുക്ക് ആവശ്യമുള്ള ഏത് പ്രതീകവും എൻകോഡ് ചെയ്യുന്നതിന് (ഉദാഹരണത്തിന്, ദേശീയ അക്ഷരമാലയിൽ നിന്ന്), രണ്ട് നിബന്ധനകൾ പാലിക്കേണ്ടതുണ്ട് - ഈ പ്രതീകത്തിന്റെ വെക്റ്റർ ഫോം ഉപയോഗിച്ച ഫോണ്ടിൽ ആയിരിക്കണം, കൂടാതെ ഈ പ്രതീകം വിപുലീകൃത ASCII എൻകോഡിംഗുകളിൽ എൻകോഡ് ചെയ്യാവുന്നതാണ്. ഒരു ബൈറ്റിൽ. അതിനാൽ, അത്തരം ഓപ്ഷനുകളുടെ ഒരു കൂട്ടം ഉണ്ട്. റഷ്യൻ ഭാഷയുടെ പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യുന്നതിന് മാത്രം, വിപുലീകരിച്ച അസ്കയുടെ നിരവധി ഇനങ്ങൾ ഉണ്ട്.

ഉദാഹരണത്തിന്, തുടക്കത്തിൽ ഉണ്ടായിരുന്നു CP866, അതിൽ റഷ്യൻ അക്ഷരമാലയിലെ പ്രതീകങ്ങൾ ഉപയോഗിക്കാൻ സാധിച്ചു, അത് ASCII-യുടെ വിപുലീകൃത പതിപ്പായിരുന്നു.

ആ. മുകളിലെ സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്ന അസുകയുടെ (128 ലാറ്റിൻ പ്രതീകങ്ങളും അക്കങ്ങളും മറ്റേതെങ്കിലും ഭ്രാന്തും) അതിന്റെ മുകൾ ഭാഗം പൂർണ്ണമായും പൊരുത്തപ്പെടുന്നു, എന്നാൽ CP866 എൻകോഡിംഗുള്ള പട്ടികയുടെ താഴത്തെ ഭാഗത്ത് സ്ക്രീൻഷോട്ടിൽ സൂചിപ്പിച്ചിരിക്കുന്ന ഫോം ഉണ്ടായിരുന്നു. താഴെ, മറ്റൊരു 128 അടയാളങ്ങൾ എൻകോഡ് ചെയ്യാൻ അനുവദിച്ചിരിക്കുന്നു (റഷ്യൻ അക്ഷരങ്ങളും എല്ലാത്തരം സ്യൂഡോഗ്രാഫിക്സും അവിടെ):

നിങ്ങൾ കാണുന്നത്, വലത് കോളത്തിൽ, അക്കങ്ങൾ 8 ൽ ആരംഭിക്കുന്നു, കാരണം 0 മുതൽ 7 വരെയുള്ള സംഖ്യകൾ ASCII ബേസ് ഭാഗത്തെ പരാമർശിക്കുന്നു (ആദ്യത്തെ സ്ക്രീൻഷോട്ട് കാണുക). അത്. CP866 ലെ റഷ്യൻ അക്ഷരമായ "M" ന് 9C കോഡ് ഉണ്ടായിരിക്കും (അത് അനുബന്ധ വരിയുടെ 9 ന്റെ കവലയിലും ഹെക്സാഡെസിമൽ നമ്പർ സിസ്റ്റത്തിലെ C നമ്പറുള്ള നിരയിലും സ്ഥിതിചെയ്യുന്നു), അത് ഒരു ബൈറ്റ് വിവരത്തിൽ എഴുതാം. , കൂടാതെ റഷ്യൻ അക്ഷരങ്ങളുള്ള അനുയോജ്യമായ ഒരു ഫോണ്ട് ഉണ്ടെങ്കിൽ, പ്രശ്നങ്ങളില്ലാത്ത ഈ കത്ത് ടെക്സ്റ്റിൽ പ്രദർശിപ്പിക്കും.

ഈ തുക എവിടെ നിന്ന് വന്നു? CP866 ലെ സ്യൂഡോഗ്രാഫിക്സ്? റഷ്യൻ ടെക്സ്റ്റിനായുള്ള ഈ എൻകോഡിംഗ് ആ രോമമുള്ള വർഷങ്ങളിൽ വികസിപ്പിച്ചെടുത്തതാണ്, ഇപ്പോൾ ഉള്ളതുപോലെ ഗ്രാഫിക്കൽ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളുടെ വിതരണം ഇല്ലായിരുന്നു. ദോസയിലും സമാനമായ ടെക്സ്റ്റ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിലും, കപട ഗ്രാഫിക്സ് എങ്ങനെയെങ്കിലും ടെക്സ്റ്റുകളുടെ രൂപകൽപ്പന വൈവിധ്യവത്കരിക്കുന്നത് സാധ്യമാക്കി, അതിനാൽ ഇത് CP866 ലും അസുകയുടെ വിപുലീകൃത പതിപ്പുകളുടെ വിഭാഗത്തിൽ നിന്നുള്ള മറ്റെല്ലാ സമപ്രായക്കാരിലും സമൃദ്ധമാണ്.

CP866 വിതരണം ചെയ്തത് IBM ആണ്, എന്നാൽ ഇതിനുപുറമെ, റഷ്യൻ പ്രതീകങ്ങൾക്കായി നിരവധി എൻകോഡിംഗുകൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്, ഉദാഹരണത്തിന്, അതേ തരം (വിപുലീകരിച്ച ASCII) ആട്രിബ്യൂട്ട് ചെയ്യാം. KOI8-R:

അതിന്റെ പ്രവർത്തനത്തിന്റെ തത്വം അൽപ്പം മുമ്പ് വിവരിച്ച CP866 ന് സമാനമാണ് - ടെക്സ്റ്റിന്റെ ഓരോ പ്രതീകവും ഒരൊറ്റ ബൈറ്റ് ഉപയോഗിച്ച് എൻകോഡ് ചെയ്തിരിക്കുന്നു. സ്ക്രീൻഷോട്ട് KOI8-R പട്ടികയുടെ രണ്ടാം പകുതി കാണിക്കുന്നു, കാരണം ഈ ലേഖനത്തിലെ ആദ്യ സ്ക്രീൻഷോട്ടിൽ കാണിച്ചിരിക്കുന്ന അടിസ്ഥാന അസൂക്കയുമായി ആദ്യ പകുതി പൂർണ്ണമായും യോജിക്കുന്നു.

KOI8-R എൻകോഡിംഗിന്റെ സവിശേഷതകളിൽ, അതിന്റെ പട്ടികയിലെ റഷ്യൻ അക്ഷരങ്ങൾ അക്ഷരമാലാ ക്രമത്തിലല്ല എന്നത് ശ്രദ്ധിക്കാവുന്നതാണ്, ഉദാഹരണത്തിന്, CP866-ൽ ചെയ്തു.

നിങ്ങൾ ആദ്യത്തെ സ്ക്രീൻഷോട്ട് (എല്ലാ വിപുലീകൃത എൻകോഡിംഗുകളിലും ഉൾപ്പെടുത്തിയിരിക്കുന്ന അടിസ്ഥാന ഭാഗത്തിന്റെ) നോക്കുകയാണെങ്കിൽ, KOI8-R റഷ്യൻ അക്ഷരങ്ങൾ ലാറ്റിൻ അക്ഷരമാല വ്യഞ്ജനാക്ഷരത്തിന്റെ അക്ഷരങ്ങൾ പോലെ പട്ടികയുടെ അതേ സെല്ലുകളിൽ സ്ഥിതിചെയ്യുന്നത് നിങ്ങൾ ശ്രദ്ധിക്കും. മേശയുടെ ആദ്യ ഭാഗത്ത് നിന്ന് അവരോടൊപ്പം. ഒരു ബിറ്റ് (രണ്ട് മുതൽ ഏഴാമത്തെ പവർ അല്ലെങ്കിൽ 128 വരെ) മാത്രം ഉപേക്ഷിച്ച് റഷ്യൻ ഭാഷയിൽ നിന്ന് ലാറ്റിൻ അക്ഷരങ്ങളിലേക്ക് മാറുന്നതിനുള്ള സൗകര്യത്തിനായി ഇത് ചെയ്തു.

വിൻഡോസ് 1251 - ASCII യുടെ ആധുനിക പതിപ്പും എന്തുകൊണ്ട് krakozyabry ക്രാൾ ഔട്ട്

ഗ്രാഫിക്കൽ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങൾ ജനപ്രീതി നേടുകയും അവയിൽ സ്യൂഡോഗ്രാഫിക്സ് ഉപയോഗിക്കേണ്ടതിന്റെ ആവശ്യകത ക്രമേണ അപ്രത്യക്ഷമാകുകയും ചെയ്തതാണ് ടെക്സ്റ്റ് എൻകോഡിംഗുകളുടെ കൂടുതൽ വികസനത്തിന് കാരണം. തൽഫലമായി, ഒരു മുഴുവൻ ഗ്രൂപ്പും ഉടലെടുത്തു, അത് സാരാംശത്തിൽ, അസൂക്കയുടെ വിപുലീകൃത പതിപ്പുകളായിരുന്നു (ടെക്‌സ്റ്റിന്റെ ഒരു പ്രതീകം ഒരു ബൈറ്റ് വിവരങ്ങൾ ഉപയോഗിച്ച് എൻകോഡ് ചെയ്‌തിരിക്കുന്നു), എന്നാൽ സ്യൂഡോഗ്രാഫിക് പ്രതീകങ്ങൾ ഉപയോഗിക്കാതെ.

അമേരിക്കൻ സ്റ്റാൻഡേർഡ് ഇൻസ്റ്റിറ്റ്യൂട്ട് വികസിപ്പിച്ച ANSI എൻകോഡിംഗുകൾ എന്ന് വിളിക്കപ്പെടുന്നവയാണ് അവ. സാധാരണ ഭാഷയിൽ, റഷ്യൻ ഭാഷയെ പിന്തുണയ്ക്കുന്ന വേരിയന്റിനായി സിറിലിക് എന്ന പേരും ഉപയോഗിച്ചു. ഇതിന് ഒരു ഉദാഹരണം നൽകാം.

മുമ്പ് ഉപയോഗിച്ച CP866, KOI8-R എന്നിവയിൽ നിന്ന് ഇത് അനുകൂലമായി വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, അതിൽ സ്യൂഡോഗ്രാഫിക് ചിഹ്നങ്ങളുടെ സ്ഥാനം റഷ്യൻ ടൈപ്പോഗ്രാഫിയുടെ (ആക്സന്റ് മാർക്ക് ഒഴികെ) നഷ്ടപ്പെട്ട ചിഹ്നങ്ങളും സ്ലാവിക് ഭാഷകളിൽ ഉപയോഗിച്ചിരിക്കുന്ന ചിഹ്നങ്ങളും എടുത്തതാണ്. റഷ്യൻ (ഉക്രേനിയൻ, ബെലാറഷ്യൻ മുതലായവ) ):

റഷ്യൻ ഭാഷാ എൻകോഡിംഗുകളുടെ സമൃദ്ധി കാരണം, ഫോണ്ട് നിർമ്മാതാക്കൾക്കും സോഫ്റ്റ്വെയർ നിർമ്മാതാക്കൾക്കും നിരന്തരം തലവേദനയുണ്ടായിരുന്നു, പ്രിയ വായനക്കാരായ ഞങ്ങൾ പലപ്പോഴും വളരെ കുപ്രസിദ്ധരായിരുന്നു. ക്രാക്കോസിയാബ്രിവാചകത്തിൽ ഉപയോഗിച്ചിരിക്കുന്ന പതിപ്പുമായി ആശയക്കുഴപ്പം ഉണ്ടായപ്പോൾ.

ഇ-മെയിൽ വഴി സന്ദേശങ്ങൾ അയയ്‌ക്കുമ്പോഴും സ്വീകരിക്കുമ്പോഴും പലപ്പോഴും അവർ പുറത്തായി, ഇത് വളരെ സങ്കീർണ്ണമായ പരിവർത്തന പട്ടികകൾ സൃഷ്ടിക്കുന്നതിലേക്ക് നയിച്ചു, ഇത് യഥാർത്ഥത്തിൽ റൂട്ടിൽ ഈ പ്രശ്നം പരിഹരിക്കാൻ കഴിഞ്ഞില്ല, മാത്രമല്ല പലപ്പോഴും ഉപയോക്താക്കൾ കുപ്രസിദ്ധമായത് ഒഴിവാക്കാൻ കത്തിടപാടുകൾക്ക് ഉപയോഗിക്കുന്നു. CP866, KOI8-R അല്ലെങ്കിൽ Windows 1251 പോലുള്ള റഷ്യൻ എൻകോഡിംഗുകൾ ഉപയോഗിക്കുമ്പോൾ krakozyabrs.

വാസ്തവത്തിൽ, റഷ്യൻ വാചകത്തിനുപകരം പുറത്തുവന്ന ക്രാക്കോസിയാബ്രി, ഈ ഭാഷയുടെ എൻകോഡിംഗിന്റെ തെറ്റായ ഉപയോഗത്തിന്റെ ഫലമാണ്, ഇത് വാചക സന്ദേശം യഥാർത്ഥത്തിൽ എൻകോഡ് ചെയ്ത ഒന്നുമായി പൊരുത്തപ്പെടുന്നില്ല.

ഉദാഹരണത്തിന്, നിങ്ങൾ വിൻഡോസ് 1251 കോഡ് ടേബിൾ ഉപയോഗിച്ച് CP866 ഉപയോഗിച്ച് എൻകോഡ് ചെയ്ത പ്രതീകങ്ങൾ പ്രദർശിപ്പിക്കാൻ ശ്രമിക്കുകയാണെങ്കിൽ, അതേ ക്രാക്കോസിയാബ്രി (അർത്ഥമില്ലാത്ത പ്രതീക സെറ്റ്) പുറത്തുവരും, സന്ദേശ വാചകം പൂർണ്ണമായും മാറ്റിസ്ഥാപിക്കും.

സൈറ്റിൽ സ്ഥിരസ്ഥിതിയായി ഉപയോഗിക്കുന്ന തെറ്റായ എൻകോഡിംഗിലോ അല്ലെങ്കിൽ ദൃശ്യമാകാത്ത കോഡിലേക്ക് ഗ്യാഗ് ചേർക്കുന്ന തെറ്റായ ടെക്സ്റ്റ് എഡിറ്ററിലോ റഷ്യൻ അക്ഷരങ്ങളുള്ള വാചകം തെറ്റായി സംരക്ഷിക്കപ്പെടുമ്പോൾ, ഫോറങ്ങളിലും ബ്ലോഗുകളിലും സമാനമായ ഒരു സാഹചര്യം പലപ്പോഴും സംഭവിക്കാറുണ്ട്. നഗ്നനേത്രങ്ങൾ.

അവസാനം, ധാരാളം എൻ‌കോഡിംഗുകളും നിരന്തരം ക്രാക്കോസിയാബ്രിയും പുറത്തെടുക്കുന്ന അത്തരം ഒരു സാഹചര്യം പലരും മടുത്തു, നിലവിലുള്ളവയെല്ലാം മാറ്റിസ്ഥാപിക്കുന്ന ഒരു പുതിയ സാർവത്രിക വ്യതിയാനം സൃഷ്ടിക്കുന്നതിനുള്ള മുൻവ്യവസ്ഥകൾ ഉണ്ടായിരുന്നു, അവസാനം വായിക്കാൻ കഴിയാത്ത പാഠങ്ങളുടെ രൂപത്തിലുള്ള പ്രശ്നം പരിഹരിക്കും. . കൂടാതെ, ചൈനീസ് പോലുള്ള ഭാഷകളുടെ പ്രശ്നമുണ്ടായിരുന്നു, അവിടെ ഭാഷയുടെ പ്രതീകങ്ങൾ 256 ൽ കൂടുതലാണ്.

യൂണികോഡ് (യൂണികോഡ്) - സാർവത്രിക എൻകോഡിംഗുകൾ UTF 8, 16, 32

തെക്കുകിഴക്കൻ ഏഷ്യൻ ഭാഷാ ഗ്രൂപ്പിലെ ഈ ആയിരക്കണക്കിന് പ്രതീകങ്ങൾ ഒരു ബൈറ്റ് വിവരങ്ങളിൽ ഒരു തരത്തിലും വിവരിക്കാൻ കഴിയില്ല, ഇത് ASCII- യുടെ വിപുലീകൃത പതിപ്പുകളിൽ പ്രതീകങ്ങൾ എൻകോഡിംഗ് ചെയ്യാൻ അനുവദിച്ചിരിക്കുന്നു. തൽഫലമായി, ഒരു കൺസോർഷ്യം വിളിച്ചു യൂണികോഡ്(യൂണികോഡ് - യൂണികോഡ് കൺസോർഷ്യം) ഒരു സാർവത്രിക ടെക്സ്റ്റ് എൻകോഡിംഗിന്റെ ആവിർഭാവത്തിൽ താൽപ്പര്യമുള്ള നിരവധി ഐടി വ്യവസായ പ്രമുഖരുടെ (സോഫ്റ്റ്‌വെയർ നിർമ്മിക്കുന്നവർ, ഹാർഡ്‌വെയർ എൻകോഡ് ചെയ്യുന്നവർ, ഫോണ്ടുകൾ സൃഷ്ടിക്കുന്നവർ) സഹകരണത്തോടെ.

യൂണികോഡ് കൺസോർഷ്യത്തിന്റെ കീഴിൽ പുറത്തിറക്കിയ ആദ്യ വേരിയേഷൻ ആയിരുന്നു UTF-32. എൻകോഡിംഗിന്റെ പേരിലുള്ള നമ്പർ അർത്ഥമാക്കുന്നത് ഒരു പ്രതീകം എൻകോഡ് ചെയ്യാൻ ഉപയോഗിക്കുന്ന ബിറ്റുകളുടെ എണ്ണം എന്നാണ്. 32 ബിറ്റുകൾ എന്നത് പുതിയ യൂണിവേഴ്സൽ എൻകോഡിംഗ് UTF-ൽ ഒരൊറ്റ പ്രതീകം എൻകോഡ് ചെയ്യുന്നതിന് ആവശ്യമായ 4 ബൈറ്റ് വിവരങ്ങളാണ്.

തൽഫലമായി, ASCII-യുടെ വിപുലീകൃത പതിപ്പിലും UTF-32-ലും എൻകോഡ് ചെയ്‌ത ടെക്‌സ്‌റ്റുള്ള അതേ ഫയലിന്, പിന്നീടുള്ള സന്ദർഭത്തിൽ നാലിരട്ടി വലിപ്പം (ഭാരം) ഉണ്ടായിരിക്കും. ഇത് മോശമാണ്, എന്നാൽ ഇപ്പോൾ UTF ഉപയോഗിച്ച് മുപ്പത്തിരണ്ടാം ശക്തിക്ക് തുല്യമായ രണ്ട് പ്രതീകങ്ങളുടെ എണ്ണം എൻകോഡ് ചെയ്യാനുള്ള അവസരമുണ്ട് ( കോടിക്കണക്കിന് കഥാപാത്രങ്ങൾ, അത് ഒരു വലിയ മാർജിൻ ഉപയോഗിച്ച് ശരിക്കും ആവശ്യമായ ഏതെങ്കിലും മൂല്യം ഉൾക്കൊള്ളുന്നു).

എന്നാൽ യൂറോപ്യൻ ഗ്രൂപ്പിന്റെ ഭാഷകളുള്ള പല രാജ്യങ്ങൾക്കും, എൻകോഡിംഗിൽ ഇത്രയും വലിയ അക്ഷരങ്ങൾ ഉപയോഗിക്കേണ്ട ആവശ്യമില്ല, എന്നിരുന്നാലും, UTF-32 ഉപയോഗിക്കുമ്പോൾ, അവർക്ക് വാചകത്തിന്റെ ഭാരത്തിൽ നാലിരട്ടി വർദ്ധനവ് ലഭിക്കും. ഒന്നിനും വേണ്ടിയുള്ള പ്രമാണങ്ങൾ, അതിന്റെ ഫലമായി, ഇന്റർനെറ്റ് ട്രാഫിക്കിന്റെയും വോളിയം സംഭരിച്ച ഡാറ്റയുടെയും അളവിൽ വർദ്ധനവ്. ഇത് ധാരാളം, അത്തരം മാലിന്യങ്ങൾ ആർക്കും താങ്ങാൻ കഴിയുമായിരുന്നില്ല.

യൂണികോഡിന്റെ വികസനത്തിന്റെ ഫലമായി, UTF-16, ഞങ്ങൾ ഉപയോഗിക്കുന്ന എല്ലാ പ്രതീകങ്ങൾക്കുമുള്ള ഡിഫോൾട്ട് ബേസ് സ്‌പെയ്‌സായി അത് അംഗീകരിക്കപ്പെടത്തക്കവിധം വിജയിച്ചു. ഒരു പ്രതീകം എൻകോഡ് ചെയ്യുന്നതിന് ഇത് രണ്ട് ബൈറ്റുകൾ ഉപയോഗിക്കുന്നു. ഈ സാധനം എങ്ങനെയാണെന്ന് നോക്കാം.

വിൻഡോസ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിൽ, നിങ്ങൾക്ക് "ആരംഭിക്കുക" - "പ്രോഗ്രാമുകൾ" - "ആക്സസറികൾ" - "യൂട്ടിലിറ്റികൾ" - "കാരക്ടർ ടേബിൾ" എന്ന പാതയിലൂടെ പോകാം. ഫലമായി, നിങ്ങളുടെ സിസ്റ്റത്തിൽ ഇൻസ്റ്റാൾ ചെയ്തിരിക്കുന്ന എല്ലാ ഫോണ്ടുകളുടെയും വെക്റ്റർ രൂപങ്ങളുള്ള ഒരു പട്ടിക തുറക്കും. "വിപുലമായ ഓപ്‌ഷനുകളിൽ" നിങ്ങൾ യൂണികോഡ് പ്രതീക സെറ്റ് തിരഞ്ഞെടുക്കുകയാണെങ്കിൽ, ഓരോ ഫോണ്ടിനും അതിൽ ഉൾപ്പെടുത്തിയിരിക്കുന്ന മുഴുവൻ പ്രതീകങ്ങളും നിങ്ങൾക്ക് വ്യക്തിഗതമായി കാണാൻ കഴിയും.

വഴിയിൽ, അവയിലേതെങ്കിലും ക്ലിക്കുചെയ്യുന്നതിലൂടെ, നിങ്ങൾക്ക് അതിന്റെ ഇരട്ട-ബൈറ്റ് കാണാൻ കഴിയും UTF-16 ഫോർമാറ്റിലുള്ള കോഡ്, നാല് ഹെക്സാഡെസിമൽ അക്കങ്ങൾ ഉൾക്കൊള്ളുന്നു:

16 ബിറ്റുകൾ ഉപയോഗിച്ച് UTF-16-ൽ എത്ര പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യാൻ കഴിയും? 65536 (രണ്ട് മുതൽ പതിനാറിന്റെ ശക്തി), ഈ സംഖ്യയാണ് യൂണിക്കോഡിലെ അടിസ്ഥാന ഇടമായി സ്വീകരിച്ചത്. കൂടാതെ, ഇത് ഉപയോഗിച്ച് ഏകദേശം രണ്ട് ദശലക്ഷം പ്രതീകങ്ങൾ എൻകോഡ് ചെയ്യാനുള്ള വഴികളുണ്ട്, പക്ഷേ ഒരു ദശലക്ഷം അക്ഷരങ്ങളുടെ വിസ്തൃതമായ സ്ഥലത്ത് പരിമിതപ്പെടുത്തിയിരിക്കുന്നു.

എന്നാൽ യൂണികോഡ് എൻകോഡിംഗിന്റെ ഈ വിജയകരമായ പതിപ്പ് പോലും ഇംഗ്ലീഷിൽ പ്രോഗ്രാമുകൾ എഴുതിയവർക്ക് വലിയ സംതൃപ്തി നൽകിയില്ല, കാരണം ASCII- യുടെ വിപുലീകൃത പതിപ്പിൽ നിന്ന് UTF-16 ലേക്ക് മാറിയതിനുശേഷം, പ്രമാണങ്ങളുടെ ഭാരം ഇരട്ടിയായി (ഓരോ ബൈറ്റ് Asci-യിലെ ഒരു പ്രതീകവും UTF-16-ൽ ഒരേ പ്രതീകത്തിന് രണ്ട് ബൈറ്റുകളും).

അതാണ് യൂണികോഡ് കൺസോർഷ്യത്തിലെ എല്ലാവരുടെയും എല്ലാത്തിന്റെയും സംതൃപ്തിക്കായി, അത് കൊണ്ടുവരാൻ തീരുമാനിച്ചു വേരിയബിൾ നീളം എൻകോഡിംഗ്. UTF-8 എന്നാണ് ഇതിന്റെ പേര്. പേരിൽ എട്ട് ഉണ്ടായിരുന്നിട്ടും, ഇതിന് ശരിക്കും ഒരു വേരിയബിൾ ദൈർഘ്യമുണ്ട്, അതായത്. ഓരോ വാചക പ്രതീകവും ഒന്ന് മുതൽ ആറ് വരെ ബൈറ്റുകളുടെ ഒരു ശ്രേണിയിലേക്ക് എൻകോഡ് ചെയ്യാവുന്നതാണ്.

പ്രായോഗികമായി, UTF-8-ൽ, ഒന്ന് മുതൽ നാല് ബൈറ്റുകൾ വരെയുള്ള ശ്രേണി മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ, കാരണം നാല് ബൈറ്റുകളുടെ കോഡിന് പിന്നിൽ, സൈദ്ധാന്തികമായി ഒന്നും സങ്കൽപ്പിക്കാൻ പോലും സാധ്യമല്ല. ഇതിലെ എല്ലാ ലാറ്റിൻ അക്ഷരങ്ങളും പഴയ ASCII പോലെ ഒരു ബൈറ്റിൽ എൻകോഡ് ചെയ്തിരിക്കുന്നു.

ശ്രദ്ധേയമായി, ലാറ്റിൻ മാത്രം എൻകോഡ് ചെയ്യുന്ന കാര്യത്തിൽ, യൂണികോഡ് മനസ്സിലാകാത്ത പ്രോഗ്രാമുകൾ പോലും UTF-8-ൽ എൻകോഡ് ചെയ്തിരിക്കുന്നത് വായിക്കും. ആ. അസൂക്കയുടെ അടിസ്ഥാന ഭാഗം യൂണികോഡ് കൺസോർഷ്യത്തിന്റെ ഈ ആശയത്തിലേക്ക് കടന്നുപോയി.

UTF-8-ലെ സിറിലിക് പ്രതീകങ്ങൾ രണ്ട് ബൈറ്റുകളിലും, ഉദാഹരണത്തിന്, ജോർജിയൻ പ്രതീകങ്ങൾ മൂന്ന് ബൈറ്റുകളിലും എൻകോഡ് ചെയ്തിട്ടുണ്ട്. യൂണികോഡ് കൺസോർഷ്യം, UTF 16 ഉം 8 ഉം സൃഷ്ടിച്ച ശേഷം, പ്രധാന പ്രശ്നം പരിഹരിച്ചു - ഇപ്പോൾ ഞങ്ങൾക്കുണ്ട് ഫോണ്ടുകൾക്ക് ഒരൊറ്റ കോഡ് സ്പേസ് ഉണ്ട്. ഇപ്പോൾ അവരുടെ നിർമ്മാതാക്കൾക്ക് അവരുടെ ശക്തിയും കഴിവുകളും അടിസ്ഥാനമാക്കിയുള്ള വാചക പ്രതീകങ്ങളുടെ വെക്റ്റർ രൂപങ്ങൾ കൊണ്ട് മാത്രമേ ഇത് പൂരിപ്പിക്കാൻ കഴിയൂ. ഇപ്പോൾ സെറ്റിൽ പോലും.

മുകളിലുള്ള "പ്രതീക പട്ടിക"യിൽ, വ്യത്യസ്ത ഫോണ്ടുകൾ വ്യത്യസ്ത എണ്ണം പ്രതീകങ്ങളെ പിന്തുണയ്ക്കുന്നതായി നിങ്ങൾക്ക് കാണാൻ കഴിയും. ചില യൂണികോഡ് സമ്പന്നമായ ഫോണ്ടുകൾ വളരെ വലുതായിരിക്കും. എന്നാൽ ഇപ്പോൾ അവ വ്യത്യസ്തമായത് വ്യത്യസ്ത എൻകോഡിംഗുകൾക്കായി സൃഷ്ടിക്കപ്പെട്ടതിലല്ല, മറിച്ച് ഫോണ്ട് നിർമ്മാതാവ് ഒന്നോ അല്ലെങ്കിൽ മറ്റൊരു വെക്റ്റർ ഫോം ഉപയോഗിച്ച് അവസാനം വരെ ഒരൊറ്റ കോഡ് സ്പേസ് പൂരിപ്പിച്ചതോ പൂരിപ്പിക്കാത്തതോ ആയ വസ്തുതയിലാണ്.

റഷ്യൻ അക്ഷരങ്ങൾക്ക് പകരം ക്രാക്കോസിയാബ്രി - എങ്ങനെ ശരിയാക്കാം

വാചകത്തിനുപകരം ക്രാക്കോസിയാബ്രാസ് എങ്ങനെ പ്രത്യക്ഷപ്പെടുന്നുവെന്ന് നോക്കാം, അല്ലെങ്കിൽ, മറ്റൊരു രീതിയിൽ പറഞ്ഞാൽ, റഷ്യൻ വാചകത്തിനുള്ള ശരിയായ എൻകോഡിംഗ് എങ്ങനെ തിരഞ്ഞെടുക്കപ്പെടുന്നുവെന്ന് നോക്കാം. യഥാർത്ഥത്തിൽ, നിങ്ങൾ ഇതേ ടെക്‌സ്‌റ്റ് സൃഷ്‌ടിക്കുന്നതോ എഡിറ്റ് ചെയ്യുന്നതോ ആയ പ്രോഗ്രാമിൽ ഇത് സജ്ജീകരിച്ചിരിക്കുന്നു, അല്ലെങ്കിൽ ടെക്‌സ്‌റ്റ് ശകലങ്ങൾ ഉപയോഗിച്ച് കോഡ്.

ടെക്‌സ്‌റ്റ് ഫയലുകൾ എഡിറ്റ് ചെയ്യുന്നതിനും സൃഷ്‌ടിക്കുന്നതിനും, എന്റെ അഭിപ്രായത്തിൽ, ഞാൻ വ്യക്തിപരമായി വളരെ നല്ലത് ഉപയോഗിക്കുന്നു. എന്നിരുന്നാലും, ഇതിന് നൂറിലധികം പ്രോഗ്രാമിംഗുകളുടെയും മാർക്ക്അപ്പ് ഭാഷകളുടെയും വാക്യഘടന ഹൈലൈറ്റ് ചെയ്യാൻ കഴിയും, കൂടാതെ പ്ലഗിനുകൾ ഉപയോഗിച്ച് വിപുലീകരിക്കാനുള്ള കഴിവുമുണ്ട്. ഈ അത്ഭുതകരമായ പ്രോഗ്രാമിന്റെ വിശദമായ അവലോകനം ചുവടെയുള്ള ലിങ്കിൽ വായിക്കുക.

നോട്ട്പാഡ് ++ ന്റെ മുകളിലെ മെനുവിൽ "എൻകോഡിംഗുകൾ" എന്ന ഒരു ഇനം ഉണ്ട്, അവിടെ നിങ്ങളുടെ സൈറ്റിൽ സ്ഥിരസ്ഥിതിയായി ഉപയോഗിക്കുന്ന ഓപ്ഷനിലേക്ക് നിലവിലുള്ള ഓപ്ഷൻ പരിവർത്തനം ചെയ്യാൻ നിങ്ങൾക്ക് അവസരം ലഭിക്കും:

ജൂംല 1.5-ഉം അതിലും ഉയർന്നതുമായ സൈറ്റിന്റെ കാര്യത്തിലും വേർഡ്പ്രസ്സിലെ ഒരു ബ്ലോഗിന്റെ കാര്യത്തിലും, ബഗുകൾ പ്രത്യക്ഷപ്പെടാതിരിക്കാൻ, ഓപ്ഷൻ തിരഞ്ഞെടുക്കുക BOM ഇല്ലാതെ UTF8. BOM എന്ന പ്രിഫിക്‌സ് എന്താണ്?

UTF-16 എൻകോഡിംഗ് വികസിപ്പിച്ചപ്പോൾ, ചില കാരണങ്ങളാൽ, നേരിട്ടുള്ള ക്രമത്തിലും (ഉദാഹരണത്തിന്, 0A15) വിപരീതത്തിലും (150A) ഒരു പ്രതീക കോഡ് എഴുതാനുള്ള കഴിവ് പോലുള്ള ഒരു കാര്യം അറ്റാച്ചുചെയ്യാൻ അവർ തീരുമാനിച്ചു എന്നതാണ് വസ്തുത. . ഏത് ക്രമത്തിലാണ് കോഡുകൾ വായിക്കേണ്ടതെന്ന് പ്രോഗ്രാമുകൾ മനസിലാക്കാൻ, അത് കണ്ടുപിടിച്ചു BOM(ബൈറ്റ് ഓർഡർ മാർക്ക് അല്ലെങ്കിൽ, മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഒപ്പ്), ഇത് ഡോക്യുമെന്റുകളുടെ തുടക്കത്തിൽ തന്നെ മൂന്ന് അധിക ബൈറ്റുകൾ കൂട്ടിച്ചേർത്ത് പ്രകടിപ്പിച്ചു.

UTF-8 എൻകോഡിംഗിൽ, യൂണികോഡ് കൺസോർഷ്യത്തിൽ BOM ഒന്നും നൽകിയിട്ടില്ല, അതിനാൽ ഒരു ഒപ്പ് (ഡോക്യുമെന്റിന്റെ തുടക്കത്തിലെ ഈ ഏറ്റവും കുപ്രസിദ്ധമായ അധിക മൂന്ന് ബൈറ്റുകൾ) ചേർക്കുന്നത് ചില പ്രോഗ്രാമുകളെ കോഡ് വായിക്കുന്നതിൽ നിന്ന് തടയുന്നു. അതിനാൽ, UTF-ൽ ഫയലുകൾ സേവ് ചെയ്യുമ്പോൾ, നമ്മൾ എപ്പോഴും BOM ഇല്ലാതെ (ഒപ്പ് ഇല്ലാതെ) ഓപ്ഷൻ തിരഞ്ഞെടുക്കണം. അതിനാൽ നിങ്ങൾ മുന്നേറുക ക്രാക്കോസിയാബ്രി ഇഴയുന്നതിൽ നിന്ന് സ്വയം പരിരക്ഷിക്കുക.

ശ്രദ്ധേയമായി, വിൻഡോസിലെ ചില പ്രോഗ്രാമുകൾക്ക് ഇത് എങ്ങനെ ചെയ്യണമെന്ന് അറിയില്ല (അവർക്ക് BOM ഇല്ലാതെ UTF-8 ൽ ടെക്സ്റ്റ് സംരക്ഷിക്കാൻ കഴിയില്ല), ഉദാഹരണത്തിന്, അതേ കുപ്രസിദ്ധമായ വിൻഡോസ് നോട്ട്പാഡ്. ഇത് UTF-8-ൽ പ്രമാണം സംരക്ഷിക്കുന്നു, പക്ഷേ ഇപ്പോഴും അതിന്റെ തുടക്കത്തിലേക്ക് ഒപ്പ് (മൂന്ന് അധിക ബൈറ്റുകൾ) ചേർക്കുന്നു. മാത്രമല്ല, ഈ ബൈറ്റുകൾ എല്ലായ്പ്പോഴും സമാനമായിരിക്കും - നേരിട്ടുള്ള ക്രമത്തിൽ കോഡ് വായിക്കുക. എന്നാൽ സെർവറുകളിൽ, ഈ ചെറിയ കാര്യം കാരണം, ഒരു പ്രശ്നം ഉണ്ടാകാം - krakozyabry പുറത്തുവരും.

അതിനാൽ, ഒരു തരത്തിലും സാധാരണ വിൻഡോസ് നോട്ട്പാഡ് ഉപയോഗിക്കരുത്നിങ്ങളുടെ സൈറ്റിന്റെ പ്രമാണങ്ങൾ എഡിറ്റുചെയ്യുന്നതിന്, നിങ്ങൾക്ക് ക്രാക്കോസിയാബ്രോവിന്റെ രൂപം ആവശ്യമില്ലെങ്കിൽ. ഇതിനകം സൂചിപ്പിച്ച നോട്ട്പാഡ് ++ എഡിറ്റർ ഏറ്റവും മികച്ചതും ലളിതവുമായ ഓപ്ഷനായി ഞാൻ കരുതുന്നു, അത് പ്രായോഗികമായി പോരായ്മകളൊന്നുമില്ല, ഗുണങ്ങൾ മാത്രം ഉൾക്കൊള്ളുന്നു.

നോട്ട്പാഡ്++-ൽ, നിങ്ങൾ ഒരു എൻകോഡിംഗ് തിരഞ്ഞെടുക്കുമ്പോൾ, യുസിഎസ്-2 എൻകോഡിംഗിലേക്ക് ടെക്സ്റ്റ് പരിവർത്തനം ചെയ്യാനുള്ള ഓപ്ഷൻ നിങ്ങൾക്കുണ്ടാകും, അത് യുണികോഡ് സ്റ്റാൻഡേർഡിന് വളരെ അടുത്താണ്. നോട്ട്പാഡിൽ ANSI-യിൽ ടെക്സ്റ്റ് എൻകോഡ് ചെയ്യാനും സാധിക്കും, അതായത്. റഷ്യൻ ഭാഷയുമായി ബന്ധപ്പെട്ട്, ഇത് വിൻഡോസ് 1251 ആയിരിക്കും, ഞങ്ങൾ ഇതിനകം അല്പം മുകളിൽ വിവരിച്ചിരിക്കുന്നു. ഈ വിവരങ്ങൾ എവിടെ നിന്ന് വരുന്നു?

നിങ്ങളുടെ വിൻഡോസ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ രജിസ്ട്രിയിൽ ഇത് എഴുതിയിട്ടുണ്ട് - ANSI-യുടെ കാര്യത്തിൽ ഏത് എൻകോഡിംഗ് തിരഞ്ഞെടുക്കണം, OEM-ന്റെ കാര്യത്തിൽ ഏതാണ് തിരഞ്ഞെടുക്കേണ്ടത് (റഷ്യൻ ഭാഷയ്ക്ക് ഇത് CP866 ആയിരിക്കും). നിങ്ങളുടെ കമ്പ്യൂട്ടറിൽ മറ്റൊരു ഡിഫോൾട്ട് ഭാഷ ഇൻസ്റ്റാൾ ചെയ്യുകയാണെങ്കിൽ, ഈ എൻകോഡിംഗുകൾ അതേ ഭാഷയിൽ ANSI അല്ലെങ്കിൽ OEM വിഭാഗത്തിൽ നിന്ന് സമാനമായവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കും.

നിങ്ങൾക്ക് ആവശ്യമുള്ള എൻകോഡിംഗിൽ നോട്ട്പാഡ് ++ ൽ പ്രമാണം സംരക്ഷിച്ചതിന് ശേഷം അല്ലെങ്കിൽ എഡിറ്റിംഗിനായി സൈറ്റിൽ നിന്ന് ഡോക്യുമെന്റ് തുറക്കുക, എഡിറ്ററിന്റെ താഴെ വലത് കോണിൽ നിങ്ങൾക്ക് അതിന്റെ പേര് കാണാൻ കഴിയും:

krakozyabrov ഒഴിവാക്കാൻ, മുകളിൽ വിവരിച്ച പ്രവർത്തനങ്ങൾക്ക് പുറമേ, സൈറ്റിന്റെ എല്ലാ പേജുകളുടെയും സോഴ്സ് കോഡിന്റെ തലക്കെട്ടിൽ ഈ എൻകോഡിംഗിനെക്കുറിച്ചുള്ള വിവരങ്ങൾ എഴുതുന്നത് ഉപയോഗപ്രദമാകും, അതുവഴി സെർവറിലോ പ്രാദേശിക ഹോസ്റ്റിലോ ആശയക്കുഴപ്പം ഉണ്ടാകില്ല.

പൊതുവേ, Html ഒഴികെയുള്ള എല്ലാ ഹൈപ്പർടെക്സ്റ്റ് മാർക്ക്അപ്പ് ഭാഷകളിലും, ഒരു പ്രത്യേക xml ഡിക്ലറേഷൻ ഉപയോഗിക്കുന്നു, അത് ടെക്സ്റ്റ് എൻകോഡിംഗ് വ്യക്തമാക്കുന്നു.

കോഡ് പാഴ്‌സ് ചെയ്യുന്നതിന് മുമ്പ്, ഏത് പതിപ്പാണ് ഉപയോഗിക്കുന്നതെന്നും ആ ഭാഷയുടെ പ്രതീക കോഡുകൾ എങ്ങനെ കൃത്യമായി വ്യാഖ്യാനിക്കണമെന്നും ബ്രൗസറിന് അറിയാം. എന്നാൽ ശ്രദ്ധേയമായ കാര്യം, നിങ്ങൾ സ്ഥിരസ്ഥിതി യൂണികോഡിൽ പ്രമാണം സംരക്ഷിക്കുകയാണെങ്കിൽ, ഈ xml പ്രഖ്യാപനം ഒഴിവാക്കാവുന്നതാണ് (ബിഒഎം ഇല്ലെങ്കിൽ UTF-8 അല്ലെങ്കിൽ BOM ഉണ്ടെങ്കിൽ UTF-16 ആയി എൻകോഡിംഗ് പരിഗണിക്കും).

ഒരു Html ഭാഷാ പ്രമാണത്തിന്റെ കാര്യത്തിൽ, വ്യക്തമാക്കാൻ എൻകോഡിംഗ് ഉപയോഗിക്കുന്നു മെറ്റാ ഘടകം, തുറക്കുന്നതിനും അടയ്ക്കുന്നതിനും ഇടയിൽ എഴുതിയിരിക്കുന്ന ഹെഡ് ടാഗുകൾ:

... ...

ഈ എൻ‌ട്രി എന്നതിൽ നിന്ന് തികച്ചും വ്യത്യസ്തമാണ്, പക്ഷേ ഇത് സാവധാനം അവതരിപ്പിക്കുന്ന പുതിയ Html 5 സ്റ്റാൻഡേർഡുമായി പൂർണ്ണമായും പൊരുത്തപ്പെടുന്നു, നിലവിൽ ഉപയോഗിക്കുന്ന ഏത് ബ്രൗസറിലും ഇത് 100% ശരിയായി മനസ്സിലാക്കും.

സിദ്ധാന്തത്തിൽ, ഡോക്യുമെന്റിന്റെ Html എൻകോഡിംഗ് ഉള്ള മെറ്റാ എലമെന്റ് ഇടുന്നതാണ് നല്ലത് പ്രമാണത്തിന്റെ തലക്കെട്ടിൽ കഴിയുന്നത്ര ഉയർന്നത്അതിനാൽ മീറ്റിംഗ് സമയത്ത്, ആദ്യ പ്രതീകത്തിന്റെ വാചകത്തിൽ അടിസ്ഥാന ANSI യിൽ നിന്ന് അല്ല (എല്ലായ്‌പ്പോഴും ശരിയായി വായിക്കുകയും ഏത് വ്യതിയാനത്തിലും വായിക്കുകയും ചെയ്യും), ഈ പ്രതീകങ്ങളുടെ കോഡുകൾ എങ്ങനെ വ്യാഖ്യാനിക്കണം എന്നതിനെക്കുറിച്ചുള്ള വിവരങ്ങൾ ബ്രൗസറിന് ഇതിനകം ഉണ്ടായിരിക്കണം.

നിങ്ങൾക്ക് ആശംസകൾ! ബ്ലോഗ് പേജ് സൈറ്റിൽ ഉടൻ കാണാം

നിങ്ങൾക്ക് താൽപ്പര്യമുണ്ടാകാം

എന്താണ് ഒരു URL, ഒരു സൈറ്റിനായുള്ള കേവലവും ആപേക്ഷികവുമായ ലിങ്കുകൾ തമ്മിലുള്ള വ്യത്യാസം എന്താണ്
ഓപ്പൺസെർവർ - ഒരു ആധുനിക പ്രാദേശിക സെർവറും കമ്പ്യൂട്ടറിൽ വേർഡ്പ്രസ്സ് ഇൻസ്റ്റാൾ ചെയ്യുന്നതിനുള്ള ഒരു ഉദാഹരണവും
എന്താണ് Chmod, ഫയലുകൾക്കും ഫോൾഡറുകൾക്കും (777, 755, 666) എന്ത് അനുമതികൾ നൽകണം, PHP വഴി അത് എങ്ങനെ ചെയ്യാം
സൈറ്റിലും ഓൺലൈൻ സ്റ്റോറിലും Yandex തിരയൽ

— Zampolit (@ComradZampolit) ഓഗസ്റ്റ് 17, 2017

KOI8-R എങ്ങനെയാണ് പ്രവർത്തിക്കുന്നത്?

KOI8-R എന്നത് സിറിലിക് അക്ഷരമാല എൻകോഡ് ചെയ്യാൻ രൂപകൽപ്പന ചെയ്ത എട്ട്-ബിറ്റ് കോഡ് പേജാണ്. ഡവലപ്പർമാർ റഷ്യൻ അക്ഷരമാലയിലെ പ്രതീകങ്ങൾ സ്ഥാപിച്ചു, സിറിലിക് പ്രതീകങ്ങളുടെ സ്ഥാനങ്ങൾ അവയുടെ സ്വരസൂചക എതിരാളികളുമായി ഇംഗ്ലീഷ് അക്ഷരമാലയിൽ ടേബിളിന്റെ ചുവടെ യോജിക്കുന്നു. ഈ എൻകോഡിംഗിൽ എഴുതിയ വാചകത്തിൽ നിന്ന് ഓരോ പ്രതീകത്തിന്റെയും എട്ടാമത്തെ ബിറ്റ് നീക്കം ചെയ്താൽ, ലാറ്റിൻ അക്ഷരങ്ങളിലെ ലിപ്യന്തരണം പോലെയുള്ള ഒരു വാചകം ലഭിക്കും.

ഇസി സീരീസ് കമ്പ്യൂട്ടറുകളുടെ കമ്പ്യൂട്ടറുകളിൽ എഴുപതുകളിൽ അത്തരമൊരു വിവര കൈമാറ്റ കോഡ് ഉപയോഗിച്ചിരുന്നു, എൺപതുകളുടെ മധ്യത്തോടെ ഇത് യുണിക്സ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ ആദ്യ റസിഫൈഡ് പതിപ്പുകളിൽ ഉപയോഗിക്കാൻ തുടങ്ങി.

ഓരോ പ്രതീകത്തിനും ഒരു അദ്വിതീയ കോഡ് നൽകിയിരിക്കുന്നു എന്ന വസ്തുതയാണ് കോഡിംഗിൽ ഉൾപ്പെട്ടിരുന്നത്: 00000000 മുതൽ 11111111 വരെ. അങ്ങനെ, ഒരു വ്യക്തി കഥാപാത്രങ്ങളെ അവരുടെ ശൈലി കൊണ്ടും കമ്പ്യൂട്ടറിനെ കോഡ് കൊണ്ടും വേർതിരിച്ചു.