Aksara BS (ruang belakang) membenarkan pencetak mencetak satu aksara di atas aksara yang lain. ASCII menyediakan untuk menambah diakritik pada huruf dengan cara ini, contohnya:
- a BS "→ á
- a BS ` → à
- a BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → с
Nota: dalam fon lama, apostrof " dilukis condong ke kiri, dan tilde ~ dialihkan ke atas, jadi ia hanya sesuai dengan peranan akut dan tilde di atas.
Jika aksara yang sama ditindih pada aksara, hasilnya ialah kesan fon tebal, dan jika garis bawah ditindih pada aksara, hasilnya ialah teks yang digariskan.
- a BS a → a
- aBS_→ a
Nota: ini digunakan, sebagai contoh, dalam sistem bantuan lelaki.
Varian ASCII kebangsaanPiawaian ISO 646 (ECMA-6) memperuntukkan kemungkinan meletakkan aksara kebangsaan menggantikan @ [ \ ] ^ ` ( | ) ~ . Di samping itu, £ boleh diletakkan di # tempat dan ¤ boleh diletakkan di tempat $. Sistem ini sangat sesuai untuk bahasa Eropah di mana hanya beberapa aksara tambahan diperlukan. Versi ASCII tanpa aksara kebangsaan dipanggil US-ASCII, atau "Versi Rujukan Antarabangsa".
Selepas itu, ternyata lebih mudah untuk menggunakan pengekodan 8-bit (halaman kod), di mana bahagian bawah jadual kod (0-127) diduduki oleh aksara AS-ASCII, dan bahagian atas (128-255) oleh watak tambahan, termasuk satu set watak kebangsaan. Oleh itu, bahagian atas jadual ASCII, sebelum penggunaan Unicode secara meluas, digunakan secara aktif untuk mewakili aksara setempat, huruf bahasa tempatan. Kekurangan standard bersatu untuk meletakkan aksara Cyrillic dalam jadual ASCII menyebabkan banyak masalah dengan pengekodan (KOI-8, Windows-1251 dan lain-lain). Bahasa lain dengan skrip bukan Latin juga mengalami beberapa pengekodan yang berbeza.
NUL | SOM | EOA | EOM | EQT | W.R.U. | RU | LOCENG | BKSP | HT | LF | VT | FF | CR | JADI | S.I. |
DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ERR | SYNC | L.E.M. | S 0 | S 1 | S 2 | S 3 | S 4 | S 5 | S 6 | S 7 |
KOSONG | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
@ | A | B | C | D | E | F | G | H | saya | J | K | L | M | N | O |
P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ← | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
hlm | q | r | s | t | u | v | w | x | y | z | ESC | DEL |
Pada komputer tersebut di mana unit memori boleh alamat minimum ialah perkataan 36-bit, aksara 6-bit pada mulanya digunakan (1 perkataan = 6 aksara). Selepas peralihan kepada ASCII, komputer tersebut mula mengandungi sama ada 5 aksara tujuh-bit (1 bit kekal tambahan) atau 4 aksara sembilan-bit dalam satu perkataan.
Kod ASCII juga digunakan untuk menentukan kekunci yang ditekan semasa pengaturcaraan. Untuk papan kekunci QWERTY standard, jadual kod kelihatan seperti ini:
Excel untuk Office 365 Word untuk Office 365 Outlook untuk Office 365 PowerPoint untuk Office 365 Publisher untuk Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2016 Outlook 2 PowerPoint 2019 Standard 2016 Word OneNote 2016 Publisher 013 Penerbit 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 1 Visio Excel 2020 Publisher 2010 Word 2010 7 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Kurang Dalam artikel ini: Masukkan aksara ASCII atau Unicode ke dalam dokumenJika anda hanya perlu memasukkan beberapa aksara atau simbol khas, anda boleh menggunakan pintasan papan kekunci. Untuk senarai aksara ASCII, lihat jadual berikut atau artikel Memasukkan Abjad Kebangsaan Menggunakan Pintasan Papan Kekunci. Nota: Memasukkan aksara ASCIIUntuk memasukkan aksara ASCII, tekan dan tahan kekunci ALT semasa memasukkan kod aksara. Contohnya, untuk memasukkan simbol darjah (º), tekan dan tahan kekunci ALT, kemudian masukkan 0176 pada pad kekunci angka. Untuk memasukkan nombor, gunakan pad kekunci angka dan bukannya nombor pada papan kekunci utama. Jika anda perlu memasukkan nombor pada papan kekunci angka, pastikan penunjuk NUM LOCK dihidupkan. Memasukkan Aksara UnikodUntuk memasukkan aksara Unicode, masukkan kod aksara, kemudian tekan ALT dan X. Contohnya, untuk memasukkan simbol dolar ($), masukkan 0024 dan tekan ALT dan X. Untuk semua kod aksara Unicode, lihat . Penting: Sesetengah program Microsoft Office, seperti PowerPoint dan InfoPath, tidak menyokong penukaran kod Unicode kepada aksara. Jika anda perlu memasukkan aksara Unicode dalam salah satu program ini, gunakan . Nota: Jika aksara Unicode yang salah muncul selepas anda menekan ALT+X, pilih kod yang betul, dan kemudian tekan ALT+X sekali lagi. Selain itu, anda mesti memasukkan "U+" sebelum kod. Contohnya, jika anda memasukkan "1U+B5" dan tekan ALT+X, teks "1µ" akan dipaparkan, dan jika anda memasukkan "1B5" dan tekan ALT+X, simbol "Ƶ" akan dipaparkan. Jadual aksara ialah program terbina dalam Microsoft Windows yang membolehkan anda melihat aksara yang tersedia untuk fon yang dipilih. Menggunakan jadual simbol, anda boleh menyalin simbol individu atau sekumpulan simbol ke papan keratan dan menampalnya ke dalam mana-mana program yang menyokong paparan simbol tersebut. Membuka jadual simbol Dalam Windows 10, masukkan perkataan "simbol" dalam kotak carian pada bar tugas dan pilih jadual simbol daripada hasil carian. Dalam Windows 8, taip "simbol" pada skrin Mula dan pilih jadual simbol daripada hasil carian. Dalam Windows 7, klik butang Mula, pilih Semua Program, Aksesori, Alat Sistem, dan kemudian klik Peta Aksara. Aksara dikumpulkan mengikut fon. Klik senarai fon untuk memilih set aksara yang sesuai. Untuk memilih simbol, klik padanya, kemudian klik butang Pilih. Untuk memasukkan simbol, klik kanan lokasi yang dikehendaki dalam dokumen dan pilih Tampal. Kod aksara yang kerap digunakanUntuk senarai lengkap aksara, lihat Komputer, Jadual Kod Aksara ASCII atau Jadual Aksara Unikod Disusun mengikut Set.
Menurut Kesatuan Telekomunikasi Antarabangsa, pada 2016, tiga setengah bilion orang menggunakan Internet dengan kerap. Kebanyakan mereka tidak memikirkan hakikat bahawa sebarang mesej yang mereka hantar melalui PC atau alat mudah alih, serta teks yang dipaparkan pada semua jenis monitor, sebenarnya adalah gabungan 0 dan 1. Perwakilan maklumat ini dipanggil pengekodan . Ia memastikan dan memudahkan penyimpanan, pemprosesan dan penghantarannya. Pada tahun 1963, pengekodan ASCII Amerika telah dibangunkan, yang menjadi subjek artikel ini. Mempersembahkan maklumat pada komputerDari sudut pandangan mana-mana komputer elektronik, teks ialah satu set aksara individu. Ini termasuk bukan sahaja huruf, termasuk huruf besar, tetapi juga tanda baca dan nombor. Selain itu, aksara khas “=”, “&”, “(” dan ruang digunakan. Set aksara yang membentuk teks dipanggil abjad, dan nombornya dipanggil kardinaliti (ditandakan sebagai N). Untuk menentukannya, ungkapan N = 2^b digunakan, dengan b ialah bilangan bit atau berat maklumat bagi simbol tertentu. Telah terbukti bahawa abjad dengan kapasiti 256 aksara boleh mewakili semua aksara yang diperlukan. Oleh kerana 256 mewakili kuasa ke-8 daripada dua, berat setiap aksara ialah 8 bit. Satu unit ukuran 8 bit dipanggil 1 bait, jadi adalah kebiasaan untuk mengatakan bahawa mana-mana aksara dalam teks yang disimpan pada komputer mengambil satu bait memori. Sebarang teks dimasukkan ke dalam ingatan komputer peribadi menggunakan kekunci papan kekunci di mana nombor, huruf, tanda baca dan simbol lain ditulis. Mereka dipindahkan ke RAM dalam kod binari, iaitu setiap aksara dikaitkan dengan kod perpuluhan yang biasa kepada manusia, dari 0 hingga 255, yang sepadan dengan kod binari - dari 00000000 hingga 11111111. Pengekodan aksara bait-bait membenarkan pemproses yang menjalankan pemprosesan teks untuk mengakses setiap aksara secara individu. Pada masa yang sama, 256 aksara sudah cukup untuk mewakili sebarang maklumat simbolik. Singkatan dalam bahasa Inggeris ini bermaksud kod untuk pertukaran maklumat. Walaupun pada awal pengkomputeran, ia menjadi jelas bahawa adalah mungkin untuk menghasilkan pelbagai cara untuk mengekod maklumat. Walau bagaimanapun, untuk memindahkan maklumat dari satu komputer ke komputer lain, adalah perlu untuk membangunkan standard bersatu. Jadi, pada tahun 1963, jadual pengekodan ASCII muncul di Amerika Syarikat. Di dalamnya, sebarang simbol abjad komputer dikaitkan dengan nombor sirinya dalam perwakilan binari. ASCII pada asalnya hanya digunakan di Amerika Syarikat dan kemudiannya menjadi standard antarabangsa untuk PC. Kod ASCII terbahagi kepada 2 bahagian. Hanya separuh pertama jadual ini dianggap sebagai standard antarabangsa. Ia termasuk aksara dengan nombor bersiri daripada 0 (berkod sebagai 00000000) hingga 127 (berkod 01111111).
Dalam jadual, pengekodan menggunakan huruf besar dan mengikut satu sama lain dalam susunan abjad, dan nombor adalah dalam susunan menaik. Prinsip ini tetap sama untuk abjad Rusia. Kawal aksaraJadual pengekodan ASCII pada asalnya dicipta untuk menerima dan menghantar maklumat melalui peranti yang tidak digunakan untuk masa yang lama, seperti teletaip. Dalam hal ini, aksara tidak boleh dicetak telah dimasukkan ke dalam set aksara, digunakan sebagai arahan untuk mengawal peranti ini. Arahan serupa digunakan dalam kaedah pemesejan pra-komputer seperti kod Morse, dsb. Watak teletaip yang paling biasa ialah NUL (00). Ia masih digunakan hari ini dalam kebanyakan bahasa pengaturcaraan untuk menunjukkan penghujung baris. Kod Standard Amerika diperlukan bukan sahaja untuk memasukkan maklumat teks pada papan kekunci. Ia juga digunakan dalam grafik. Khususnya, dalam ASCII Art Maker, imej pelbagai sambungan mewakili spektrum aksara ASCII. Terdapat dua jenis produk tersebut: produk yang melaksanakan fungsi penyunting grafik dengan menukar imej kepada teks dan produk yang menukar "lukisan" kepada grafik ASCII. Contohnya, emotikon yang terkenal ialah contoh utama bagi simbol pengekodan. ASCII juga boleh digunakan semasa membuat dokumen HTML. Dalam kes ini, anda boleh memasukkan set aksara tertentu, dan apabila melihat halaman, simbol yang sepadan dengan kod ini akan muncul pada skrin. ASCII juga diperlukan untuk membuat tapak web berbilang bahasa, kerana aksara yang tidak disertakan dalam jadual kebangsaan tertentu digantikan dengan kod ASCII. ASCII pada asalnya digunakan untuk mengekod maklumat teks menggunakan 7 bit (satu dibiarkan kosong), tetapi hari ini ia berfungsi sebagai 8 bit. Huruf yang terletak dalam lajur yang terletak di atas dan di bawah berbeza antara satu sama lain dalam hanya satu bit. Ini mengurangkan kerumitan audit dengan ketara. Menggunakan ASCII dalam Microsoft OfficeJika perlu, pengekodan maklumat teks jenis ini boleh digunakan dalam penyunting teks Microsoft seperti Notepad dan Office Word. Walau bagaimanapun, anda mungkin tidak dapat menggunakan beberapa fungsi semasa menaip dalam kes ini. Sebagai contoh, anda tidak akan dapat menggunakan teks tebal kerana pengekodan ASCII hanya mengekalkan makna maklumat, mengabaikan rupa dan bentuk amnya. Organisasi ISO telah menerima pakai piawaian ISO 8859. Kumpulan ini mentakrifkan pengekodan lapan bit untuk kumpulan bahasa yang berbeza. Khususnya, ISO 8859-1 ialah jadual ASCII Lanjutan untuk Amerika Syarikat dan negara Eropah Barat. Dan ISO 8859-5 ialah jadual yang digunakan untuk abjad Cyrillic, termasuk bahasa Rusia. Untuk beberapa sebab sejarah, piawaian ISO 8859-5 telah digunakan untuk masa yang sangat singkat. Untuk bahasa Rusia, pengekodan berikut sebenarnya digunakan pada masa ini:
Kelebihan utama piawaian CP866 pertama ialah pengekalan aksara pseudografik dalam kedudukan yang sama seperti dalam ASCII Lanjutan. Ini memungkinkan untuk menjalankan program teks buatan asing, seperti Norton Commander yang terkenal, tanpa pengubahsuaian. Pada masa ini, CP866 digunakan untuk program yang dibangunkan untuk Windows yang berjalan dalam mod teks skrin penuh atau dalam tetingkap teks, termasuk FAR Manager. Teks komputer yang ditulis dalam pengekodan CP866 agak jarang berlaku pada hari ini, tetapi ia adalah teks yang digunakan untuk nama fail Rusia dalam Windows. "Unikod"Pada masa ini, pengekodan ini adalah yang paling banyak digunakan. Kod Unicode dibahagikan kepada kawasan. Yang pertama (U+0000 hingga U+007F) termasuk aksara ASCII dengan kod. Ini diikuti dengan kawasan watak pelbagai skrip kebangsaan, serta tanda baca dan simbol teknikal. Selain itu, beberapa kod Unicode dikhaskan sekiranya terdapat keperluan untuk memasukkan aksara baharu pada masa hadapan. Sekarang anda tahu bahawa dalam ASCII, setiap aksara diwakili sebagai gabungan 8 sifar dan satu. Kepada bukan pakar, maklumat ini mungkin kelihatan tidak perlu dan tidak menarik, tetapi tidakkah anda ingin tahu apa yang berlaku "dalam otak" PC anda?! Setiap komputer mempunyai set aksara sendiri yang dilaksanakannya. Set ini mengandungi 26 huruf besar dan kecil, nombor dan aksara khas (titik, ruang, dsb.). Apabila ditukar kepada integer, simbol dipanggil kod. Piawaian telah dibangunkan supaya komputer mempunyai set kod yang sama. Piawaian ASCIIASCII (American Standard Code for Information Interchange) ialah kod standard Amerika untuk pertukaran maklumat. Setiap aksara ASCII mempunyai 7 bit, jadi bilangan maksimum aksara ialah 128 (Jadual 1). Kod 0 hingga 1F ialah aksara kawalan yang tidak dicetak. Banyak aksara ASCII yang tidak boleh dicetak diperlukan untuk menghantar data. Sebagai contoh, mesej mungkin terdiri daripada aksara permulaan pengepala SOH, pengepala itu sendiri dan aksara permulaan teks STX, teks itu sendiri dan aksara akhir teks ETX, dan akhir penghantaran. watak EOT. Walau bagaimanapun, data melalui rangkaian dihantar dalam paket, yang bertanggungjawab untuk permulaan dan akhir penghantaran. Jadi aksara yang tidak boleh dicetak hampir tidak pernah digunakan. Jadual 1 - Jadual kod ASCII
Pengekodan sebelumnya baik untuk bahasa Inggeris, tetapi ia tidak sesuai untuk bahasa lain. Contohnya, bahasa Jerman mempunyai umlaut, dan bahasa Perancis mempunyai superskrip. Sesetengah bahasa mempunyai abjad yang sama sekali berbeza. Percubaan pertama untuk melanjutkan ASCII ialah IS646, yang melanjutkan pengekodan sebelumnya dengan tambahan 128 aksara. Huruf Latin dengan sebatan dan diakritik telah ditambah, dan menerima nama - Latin 1. Percubaan seterusnya ialah IS 8859 - yang mengandungi halaman kod. Terdapat juga percubaan pada sambungan, tetapi ini tidak universal. Pengekodan UNICODE telah dibuat (ialah 10646). Idea di sebalik pengekodan adalah untuk menetapkan nilai 16-bit malar tunggal kepada setiap aksara, yang dipanggil penunjuk kod. Secara keseluruhan terdapat 65536 petunjuk. Untuk menjimatkan ruang, kami menggunakan Latin-1 untuk kod 0 -255, menukar ASII kepada UNICODE dengan mudah. Piawaian ini menyelesaikan banyak masalah, tetapi bukan semua. Oleh kerana kedatangan perkataan baru, contohnya, untuk bahasa Jepun, perlu menambah bilangan istilah kira-kira 20 ribu. Ia juga perlu memasukkan braille.
Perihalan aksara khas (kawalan) Perlu diingat bahawa pada mulanya aksara kawalan jadual ASCII digunakan untuk memastikan pertukaran data melalui teletaip, kemasukan data daripada pita tebuk dan untuk kawalan mudah peranti luaran. Pada masa ini, kebanyakan aksara kawalan jadual ASCII tidak lagi membawa beban ini dan boleh digunakan untuk tujuan lain.
|