Завдяки символу BS (повернення на крок) на принтері можна друкувати один символ поверх іншого. В ASCII було передбачено додавання таким чином діакритики до літер, наприклад:
- a BS " → á
- a BS ` → à
- a BS ^ → â
- o BS / → ø
- c BS → ç
- n BS ~ → ñ
Примітка: у старих шрифтах апостроф "малювався з нахилом вліво, а тильда ~ була зрушена вгору, так що вони якраз підходили на роль акута і тильди зверху.
Якщо символ накладається той самий символ, то виходить ефект жирного шрифту, і якщо символ накладається підкреслення, то виходить підкреслений текст.
- a BS a → a
- a BS _ → a
Примітка: це використовується, наприклад, у довідковій системі man.
Національні варіанти ASCIIСтандарт ISO 646 (ECMA-6) передбачає можливість розміщення національних символів на місці @[\]^`(|)~. На додаток до цього, на місці # може бути розміщений £ , а на місці $ - ¤ . Така система добре підходить для європейських мов, де потрібно лише кілька додаткових символів. Варіант ASCII без національних символів називається US-ASCII або «International Reference Version».
Згодом виявилося зручніше використовувати 8-бітові кодування (кодові сторінки), де нижню половину кодової таблиці (0-127) займають символи US-ASCII, а верхню (128-255) - додаткові символи, включаючи набір національних символів. Таким чином, верхня половина таблиці ASCII до повсюдного впровадження Юнікод активно використовувалася для представлення локалізованих символів, літер місцевої мови. Відсутність єдиного стандарту розміщення кирилиць у таблиці ASCII доставляла безліч проблем з кодуваннями (КОІ-8, Windows-1251 та інші). Інші мови з нелатинською писемністю теж страждали через кілька різних кодувань.
NUL | SOM | EOA | EOM | EQT | WRU | RU | BELL | BKSP | HT | LF | VT | FF | CR | SO | SI |
DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ERR | SYNC | LEM | S 0 | S 1 | S 2 | S 3 | S 4 | S 5 | S 6 | S 7 |
BLANK | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ← | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
p | q | r | s | t | u | v | w | x | y | z | ESC | DEL |
На комп'ютерах, де мінімально адресованою одиницею пам'яті було 36-битное слово, спочатку використовували 6-битные символи (1 слово = 6 символів). Після переходу на ASCII на таких комп'ютерах в одному слові почали розміщувати або 5 семибітних символів (1 біт залишався зайвим), або 4 дев'ятибітні символи.
ASCII-коди також використовуються для визначення натиснутої клавіші при програмуванні. Для стандартної QWERTY-клавіатури таблиця кодів виглядає так:
Excel для Office 365 Word для Office 365 Outlook для Office 365 PowerPoint для Office 365 Publisher для Office 365 Excel 2019 Outlook 2019 6 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio професійний 2016 Visio стандартний 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 7 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 OneNote 2007 Office 2010 Visio Стандартний 2007 Visio стандартний 2010 Менше У цій статті Вставка символу ASCII або Юнікоду в документЯкщо вам потрібно ввести лише кілька спеціальних знаків або символів, можна використовувати або клавіші. Список символів ASCII див. у наступних таблицях або статті Вставлення літер національних алфавітів за допомогою клавіш . Примітки: Вставка символів ASCIIЩоб вставити символ ASCII, натисніть та утримуйте клавішу ALT, вводячи код символу. Наприклад, щоб вставити символ градусів (º), натисніть та утримуйте клавішу ALT, а потім введіть 0176 на цифровій клавіатурі. Щоб ввести цифри, використовуйте цифрову клавіатуру , а не цифри на основній клавіатурі. Якщо на цифровій клавіатурі потрібно ввести цифри, переконайтеся, що увімкнено індикатор NUM LOCK. Вставка символів ЮнікодуЩоб вставити символ Юнікоду, введіть код символу, потім послідовно натисніть клавіші ALT і X. Наприклад, щоб вставити символ долара ($), введіть 0024 і послідовно натисніть клавіші ALT і X. Усі коди символів Юнікоду див. Важливо: Деякі програми Microsoft Office, наприклад PowerPoint та InfoPath, не підтримують перетворення кодів Юнікоду на символи. Якщо вам потрібно вставити символ Юнікоду в одній з таких програм, використовуйте . Примітки: Якщо після натискання клавіш ALT+X відображається неправильний символ Юнікоду, виберіть правильний код, а потім натисніть ALT+X. Крім того, перед кодом слід ввести U+. Наприклад, якщо ввести "1U+B5" та натиснути клавіші ALT+X, відобразиться текст "1µ", а якщо ввести "1B5" і натиснути клавіші ALT+X, з'явиться символ "Ƶ". Таблиця символів - це програма, вбудована в Microsoft Windows, яка дозволяє переглядати символи, доступні для вибраного шрифту. За допомогою таблиці символів можна копіювати окремі символи або групу символів у буфер обміну та вставляти їх у будь-яку програму, яка підтримує відображення цих символів. Відкриття таблиці символів У Windows 10 Введіть слово "символ" у полі пошуку на панелі завдань та оберіть таблицю символів у результатах пошуку. У Windows 8 Введіть слово "символ" на початковому екрані та оберіть таблицю символів у результатах пошуку. У Windows 7 натисніть кнопку Пуск, послідовно виберіть Усі програми, Стандартні, Службові та клацніть Таблиця символів. Символи групуються за шрифтом. Натисніть список шрифтів, щоб вибрати відповідний набір символів. Щоб вибрати символ, клацніть його та натисніть кнопку Вибрати . Щоб вставити символ, клацніть потрібне місце в документі правою кнопкою миші та виберіть Вставити . Коди символів, що часто використовуютьсяПовний список символів див. на комп'ютері, таблиці кодів символів ASCII або таблицях символів Юнікоду, впорядкованих за наборами .
За даними Міжнародного Союзу електрозв'язку, у 2016 році Інтернетом з тією чи іншою регулярністю користувалося три з половиною мільярди людей. Більшість з них навіть не замислюються про те, що будь-які повідомлення, надіслані ними через ПК або мобільні гаджети, а також тексти, що відображаються на всіляких моніторах, насправді є комбінаціями з 0 і 1. Таке подання інформації називається кодуванням. Воно забезпечує і значно полегшує здійснення її зберігання, обробки та передачі. У 1963 році було розроблено американське кодування ASCII, якому і присвячена дана стаття. Подання інформації на комп'ютеріЗ погляду будь-якої електронно-обчислювальної машини текст є набір окремих символів. До них належать не тільки літери, включаючи великі, а й розділові знаки, цифри. Крім того, використовуються спецсимволи "=", "&", "(" і прогалини). Безліч символів, у тому числі складається текст, називається алфавітом, які кількість — потужністю (позначається, як N). Для її визначення використовується вираз N = 2^b, де b - Число біт або інформаційна вага конкретного символу. Доведено, що алфавіт потужністю 256 символів дозволяє подати всі необхідні символи. Так як 256 є 8 ступінь двійки, то вага кожного символу дорівнює 8 біт. Одиниця виміру 8 біт називається 1 байтом, тому прийнято говорити, що будь-якого символу в тексті, що зберігається на комп'ютері, займає один байт пам'яті. Як здійснюється кодуванняБудь-які тексти вводяться в пам'ять персонального комп'ютера за допомогою клавіш клавіатури, на яких написані цифри, літери, розділові знаки та інші символи. В оперативну пам'ять вони передаються в двійковому коді, тобто кожному символу зіставляється звичний для людини десятичний код, від 0 до 255, якому відповідає двійковий код - від 00000000 до 11111111. Побайтове кодування символів дозволяє процесору, який виконує обробку тексту, звертатися до кожного символу окремо. У той самий час 256 символів цілком достатньо представлення будь-якої символьної інформації. Кодування символів ASCIIЦя абревіатура англійською розшифровується як code for information interchange. Ще на зорі комп'ютеризації стало очевидно, що можна вигадати найрізноманітніші способи кодування інформації. Однак для перенесення інформації з однієї ЕОМ на іншу потрібно розробити єдиний стандарт. Так було в 1963 року у США з'явилася таблиця кодування ASCII. У ній будь-якому символу комп'ютерного алфавіту поставлений у відповідність його порядковий номер у двійковому поданні. Спочатку кодування ASCII використовувалося лише у Сполучених Штатах, а потім стало міжнародним стандартом для ПК. Коди ASCII поділяються на 2 частини. Міжнародним стандартом вважається лише перша половина цієї таблиці. До неї входять символи з порядковими номерами від 0 (кодується як 00000000) до 127 (код 01111111).
У таблиці кодування великі і йдуть один за одним в алфавітному порядку, а цифри - за зростанням значень. Такий принцип зберігається й у російського алфавіту. Керуючі символиТаблиця кодування ASCII спочатку створювалася для прийому та передачі інформації з такого вже давно не використовуваного пристрою, як телетайп. У зв'язку з цим у набір символів були включені недруковані, які використовуються як команди для управління цим пристроєм. Подібні команди застосовувалися і в таких докомп'ютерних методах обміну повідомленнями, як абетка Морзе та ін. Найпоширенішим «телетайпним» символом є NUL (00, «нульовий»). Він і досі використовується у більшості мов програмування, позначаючи ознаку кінця рядка. Де застосовують кодування ASCIIАмериканський стандартний код необхідний не лише для введення текстової інформації із клавіатури. Його також використовують у графіку. Зокрема, у програмі ASCII Art Maker зображення різних розширень є спектром символів кодування ASCII. Подібні продукти бувають двох типів: виконують функцію графічних редакторів шляхом перетворення зображення на текст і конвертують «малюнки» в ASCII-графіку. Наприклад, відомий смайлик є яскравим прикладом символу кодування. ASCII може використовуватися і під час створення документа HTML. У такому разі ви можете вводити певний набір символів, а під час перегляду сторінки на екрані з'явиться символ, який відповідає коду. ASCII необхідний і для створення багатомовних сайтів, оскільки знаки, які не входять до конкретної національної таблиці, замінюються ASCII-кодами. Деякі особливостіДля кодування текстової інформації кодування ASCII спочатку використовували 7 біт (один залишався порожнім), проте сьогодні вона працює як 8-бітна. Літери, що знаходяться в колонках, що знаходяться зверху і знизу, відрізняються один від одного лише одним-єдиним бітом. Це значно знижує рівень складності перевірки. Застосування ASCII у Microsoft OfficeУ разі потреби цей тип кодування текстової інформації може використовуватися в текстових редакторах корпорації Microsoft, таких як Notepad та Office Word. Однак при наборі тексту в цьому випадку неможливо використовувати деякі функції. Наприклад, ви не зможете здійснювати виділення жирним шрифтом, оскільки кодування ASCII зберігає лише зміст інформації, ігноруючи її загальний вигляд та форму. СтандартизаціяОрганізація ISO ухвалила стандарти ISO 8859. Ця група визначає восьмибітові кодування для різних мовних груп. Зокрема, ISO 8859-1 - це Extended ASCII, що є таблицею для Сполучених Штатів і країн Західної Європи. А ISO 8859-5 - це таблиця, що використовується для кирилиці, у тому числі для російської мови. З історичних причин стандарт ISO 8859-5 використовувався дуже недовго. Для російської мови на даний момент реально застосовуються кодування:
Основною перевагою першого стандарту CP866 було збереження псевдографічних символів на тих же позиціях, що й Extended ASCII. Це дозволяло запускати без змін текстові програми зарубіжного виробництва, такі як відомий Norton Commander. На даний момент CP866 застосовується для програм, розроблених під Windows, які працюють у повноекранному текстовому режимі або текстових вікнах, у тому числі у FAR Manager. Комп'ютерні тексти, написані в кодуванні CP866, останнім часом зустрічаються досить рідко, проте саме воно застосовується для російських імен файлів у "Віндоус". "Юнікод"На даний момент найбільшого поширення набуло саме це кодування. Коди "Юнікоду" розділені на області. Перша (від U+0000 до U+007F) містить символи набору ASCII з кодами. Потім слідують області знаків різних національних писемностей, а також пунктуаційні знаки та технічні символи. Крім того, частина кодів "Юнікоду" зарезервована на випадок виникнення необхідності включити нові символи у майбутньому. Тепер ви знаєте, що в кодуванні ASCII кожен символ представляється як комбінація 8 нулів та одиниць. Нефахівцям ця інформація може здатися непотрібною та нецікавою, але хіба вам не хоче знати, що відбувається «в мізках» вашого ПК?! Кожен комп'ютер має власний набір знаків, який він продає. Такий набір містить 26 великих і малих літер, цифри та спеціальні символи (точка, пробіл і тд). Символи під час переведення в цілі числа мають назву кодами. Були розроблені стандарти, щоб комп'ютери мали однакові набори кодів. Стандарт ASCIIASCII (American Standart Code for Inmormation Interchange) – американський стандартний код для обміну інформацією. Кожен символ ASCII має 7 бітів, тому максимальна кількість символів – 128 (таблиця 1). Коди від 0 до 1F є символами керування, які не друкуються. Безліч недрукованих символів ASCII потрібні передачі даних. Наприклад послання може складатися із символу початку заголовка SOH, самого заголовка та символу початку тексту STX, самого тексту та символу кінця тексту ETX, та символ кінця передачі EOT. Однак дані мережі передаються в пакетах, які самі відповідають за початок передачі і кінець. Отже, недруковані символи майже не використовуються. Таблиця 1 - таблиця кодів ASCII
Попереднє кодування відмінно підходить для англійської мови, однак для інших мов вона не зручна. Наприклад у німецькій мові є умляути, а французькою надрядкові знаки. Деякі мови мають абсолютно різні алфавіти. Першою спробою розширення ASCII був IS646, який розширював попереднє кодування ще на 128 символів. Додані були латинські літери зі штрихами та діакритичними знаками, і отримав назву – Latin 1. Наступна спроба була IS 8859 – які містили кодову сторінку. Були ще спроби розширень, але це було не універсальним. Було створено кодування UNICODE (10646). Ідея кодування в тому, щоб приписати кожному символу єдине постійне 16-бітне значення, яке називається - покажчиком коду . Усього виходить 65536 покажчиків. Для економії місця використовували Latin-1 для кодів 0 -255, легко змінюючи ASII UNICODE. Такий стандарт вирішив багато проблем, проте не всі. У зв'язку з надходженням нових слів, наприклад для японської мови необхідно підвищувати кількість термінів десь на 20 тис. Також необхідно включити шрифт брайля.
Опис спеціальних (керуючих) символів Слід зазначити, що спочатку керуючі символи таблиці ASCII використовувалися для забезпечення обміну даними по телетайпу, введення даних з перфострічки та найпростішого керування зовнішніми пристроями. В даний час більшість керуючих символів ASCII таблиці вже не несуть це навантаження і можуть використовуватися для інших цілей.
|