ถามรหัส. การเข้ารหัส ASCII (รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล) - การเข้ารหัสข้อความพื้นฐานสำหรับตัวอักษรละติน

เพื่อที่จะใช้ ASCII อย่างถูกต้อง จำเป็นต้องเพิ่มพูนความรู้ในด้านนี้และเกี่ยวกับความสามารถในการเขียนโค้ด

มันคืออะไร?

ASCII เป็นชุดอักขระ ตัวอักษรที่พิมพ์(ดูภาพหน้าจอหมายเลข 1) โทรออก แป้นพิมพ์คอมพิวเตอร์เพื่อส่งข้อมูลและรหัสบางส่วน กล่าวอีกนัยหนึ่งคือตัวอักษรถูกเข้ารหัสและ หลักทศนิยมให้เป็นสัญลักษณ์ที่เหมาะสมซึ่งแสดงถึงและนำข้อมูลที่จำเป็น

การเข้ารหัส ASCIIได้รับการพัฒนาในอเมริกา ดังนั้น ตารางการเข้ารหัสมาตรฐานมักจะมีตัวอักษรภาษาอังกฤษพร้อมตัวเลข รวมทั้งหมดประมาณ 128 อักขระ แต่แล้วคำถามที่ยุติธรรมก็เกิดขึ้น: จะทำอย่างไรถ้าจำเป็นต้องเข้ารหัสตัวอักษรประจำชาติ?

ตาราง ASCII เวอร์ชันอื่นๆ ได้รับการพัฒนาเพื่อแก้ไขปัญหาที่คล้ายกัน ตัวอย่างเช่นสำหรับภาษาที่มีโครงสร้างต่างประเทศตัวอักษรของตัวอักษรภาษาอังกฤษจะถูกลบออกหรือมีการเพิ่มอักขระเพิ่มเติมในรูปแบบของตัวอักษรประจำชาติ ดังนั้นการเข้ารหัส ASCII อาจมีตัวอักษรรัสเซียเพื่อใช้ในระดับชาติ (ดูภาพหน้าจอหมายเลข 2)

ระบบการเข้ารหัส ASCII ใช้ที่ไหน?

ระบบการเข้ารหัสนี้จำเป็นไม่เพียงแต่สำหรับการโทรออกเท่านั้น ข้อมูลข้อความบนแป้นพิมพ์ นอกจากนี้ยังใช้ในกราฟิก เช่น ในโปรแกรม ASCII Art Maker ภาพกราฟิก ส่วนขยายต่างๆประกอบด้วยช่วงของอักขระ ASCII (ดูภาพหน้าจอหมายเลข 3)


ตามกฎแล้ว โปรแกรมที่คล้ายกันสามารถแบ่งออกเป็นผู้ที่ทำหน้าที่ได้ บรรณาธิการกราฟิกการแปลงรูปภาพเป็นข้อความ และการแปลงรูปภาพเป็นกราฟิก ASCII อิโมติคอนที่รู้จักกันดี (หรือที่เรียกกันว่า "ใบหน้ามนุษย์ยิ้ม") ก็เป็นตัวอย่างของสัญลักษณ์การเข้ารหัสเช่นกัน

วิธีการเข้ารหัสนี้ยังสามารถใช้ในระหว่างการเขียนหรือการสร้างได้อีกด้วย เอกสาร HTML- ตัวอย่างเช่นคุณป้อนชุดอักขระเฉพาะและจำเป็นและเมื่อดูหน้านั้นสัญลักษณ์ที่สอดคล้องกับรหัสนี้จะปรากฏบนหน้าจอ

เหนือสิ่งอื่นใด ประเภทนี้จำเป็นต้องมีการเข้ารหัสเมื่อสร้างเว็บไซต์หลายภาษา เนื่องจากอักขระที่ไม่รวมอยู่ในตารางของประเทศใดประเทศหนึ่งจะต้องถูกแทนที่ด้วยรหัส ASCII หากผู้อ่านเชื่อมต่อโดยตรงกับเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มันจะมีประโยชน์สำหรับเขาที่จะทำความคุ้นเคยกับระบบต่างๆเช่น:

  • ชุดอักขระแบบพกพา
  • อักขระควบคุม
  • เอ็บซีดิค;
  • วิสซีไอ;
  • ยัสซี;
  • ยูนิโค้ด;
  • ศิลปะ ASCII;
  • ก้อย-8.
  • คุณสมบัติตาราง ASCII

    เช่นเดียวกับโปรแกรมระบบอื่นๆ ASCII มีคุณสมบัติเฉพาะของตัวเอง ตัวอย่างเช่น ระบบเลขฐานสิบ (ตัวเลขตั้งแต่ 0 ถึง 9) จะถูกแปลงเป็น ระบบไบนารี่แคลคูลัส (เช่น ทศนิยมแต่ละหลักจะถูกแปลงเป็นเลขฐานสอง 288=1001000 ตามลำดับ)

    ตัวอักษรที่อยู่ในคอลัมน์บนและล่างแตกต่างกันเพียงเล็กน้อยเท่านั้น ซึ่งช่วยลดระดับความซับซ้อนในการตรวจสอบและแก้ไขเคสได้อย่างมาก

    ด้วยคุณสมบัติทั้งหมดนี้ การเข้ารหัส ASCII จะทำงานเป็น 8 บิต แม้ว่าเดิมทีตั้งใจจะเป็น 7 บิตก็ตาม

    การใช้ ASCII ในโปรแกรม ไมโครซอฟต์ ออฟฟิศ:

    ถ้าจำเป็น ตัวเลือกนี้การเข้ารหัสข้อมูลสามารถใช้ใน Microsoft Notepad และ Microsoft ออฟฟิศเวิร์ด- ภายในแอปพลิเคชันเหล่านี้ สามารถบันทึกเอกสารในรูปแบบ ASCII ได้ แต่ในกรณีนี้ คุณจะไม่สามารถใช้ฟังก์ชันบางอย่างเมื่อพิมพ์ข้อความได้

    โดยเฉพาะอย่างยิ่ง การเลือกตัวหนาและเพศจะไม่สามารถใช้ได้ เป็นตัวหนาเนื่องจากการเข้ารหัสจะรักษาเฉพาะความหมายของข้อมูลที่พิมพ์เท่านั้น ไม่ใช่ มุมมองทั่วไปและรูปร่าง คุณสามารถเพิ่มรหัสดังกล่าวลงในเอกสารโดยใช้แอปพลิเคชันซอฟต์แวร์ต่อไปนี้:

    • ไมโครซอฟต์เอ็กเซล;
    • ไมโครซอฟต์ ฟร้อนท์เพจ;
    • ไมโครซอฟต์อินโฟพาธ;
    • ไมโครซอฟต์ วันโน้ต;
    • ไมโครซอฟต์เอาท์ลุค;
    • ไมโครซอฟต์พาวเวอร์พอยท์;
    • โครงการไมโครซอฟต์

    ควรพิจารณาว่าเมื่อพิมพ์รหัส ASCII ในแอปพลิเคชันเหล่านี้คุณต้องกดค้างไว้ ปุ่มคีย์บอร์ดอัลที

    แน่นอนว่ารหัสที่จำเป็นทั้งหมดจำเป็นต้องมีการศึกษาที่ยาวและละเอียดมากขึ้น แต่นี่อยู่นอกเหนือขอบเขตของบทความของเราในวันนี้ ฉันหวังว่าคุณจะพบว่ามันมีประโยชน์จริงๆ

    แล้วพบกันใหม่!

    ดีไม่ดี

    คอมพิวเตอร์แต่ละเครื่องมีชุดอักขระของตัวเองที่นำไปใช้ ชุดนี้ประกอบด้วยตัวอักษรพิมพ์ใหญ่และพิมพ์เล็ก ตัวเลข และ อักขระพิเศษ(จุด ช่องว่าง ฯลฯ) เมื่อแปลงเป็นจำนวนเต็ม สัญลักษณ์จะเรียกว่ารหัส มาตรฐานได้รับการพัฒนาเพื่อให้คอมพิวเตอร์มีรหัสชุดเดียวกัน

    มาตรฐาน ASCII

    ASCII (รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล Inmormation) - อเมริกัน รหัสมาตรฐานเพื่อการแลกเปลี่ยนข้อมูล อักขระ ASCII แต่ละตัวมี 7 บิตดังนั้น จำนวนสูงสุดอักขระ - 128 (ตารางที่ 1) รหัส 0 ถึง 1F คืออักขระควบคุมที่ไม่ได้พิมพ์ จำเป็นต้องใช้อักขระ ASCII ที่ไม่สามารถพิมพ์ได้จำนวนมากในการส่งข้อมูล ตัวอย่างเช่น ข้อความอาจประกอบด้วยอักขระเริ่มต้นของส่วนหัว SOH, ส่วนหัวเองและอักขระเริ่มต้นของข้อความ STX, ตัวข้อความเองและอักขระสิ้นสุดของข้อความ ETX และการสิ้นสุดการส่ง ตัวละคร EOT อย่างไรก็ตาม ข้อมูลบนเครือข่ายจะถูกส่งเป็นแพ็กเก็ต ซึ่งตัวเองมีหน้าที่รับผิดชอบในการเริ่มและสิ้นสุดการส่งข้อมูล อักขระที่ไม่สามารถพิมพ์ได้จึงแทบไม่เคยใช้เลย

    ตารางที่ 1 - ตารางรหัส ASCII

    ความหมายของคำสั่งตัวเลข ความหมายคำสั่งตัวเลข
    0 น.ล ตัวชี้ค่าว่าง 10 เดล ออกจากระบบส่งกำลัง
    1 สโอ จุดเริ่มต้นของชื่อ 11 ดีซี1 การจัดการอุปกรณ์
    2 เอสทีเอ็กซ์ จุดเริ่มต้นของข้อความ 12 ดีซี2 การจัดการอุปกรณ์
    3 อีทีเอ็กซ์ สิ้นสุดข้อความ 13 ดีซี3 การจัดการอุปกรณ์
    4 อีโอที สิ้นสุดการส่งสัญญาณ 14 ดีซี4 การจัดการอุปกรณ์
    5 อ๊ากก ขอ 15 นาเค ไม่ยืนยันการรับ
    6 เบล การยืนยันการยอมรับ 16 ซิน เรียบง่าย
    7 บี.เอส. สัญลักษณ์ระฆัง 17 อีทีบี จุดสิ้นสุดของบล็อกการส่ง
    8 HT ถอยกลับไป 18 สามารถ เครื่องหมาย
    9 แอลเอฟ การจัดตารางแนวนอน 19 อี.เอ็ม. จบสื่อ.
    เวอร์มอนต์ ฟีดบรรทัด 1เอ ย่อย ตัวห้อย
    บี เอฟเอฟ แท็บแนวตั้ง 1B เอสซี ออก
    CR การแปลหน้า 1ซี เอฟเอส ตัวแยกไฟล์
    ดี ดังนั้น การรับรถคืน 1D จี.เอส. ตัวแยกกลุ่ม
    อี เอสไอ เปลี่ยนไปใช้การลงทะเบียนเพิ่มเติม 1จ อาร์.เอส. ตัวแยกบันทึก
    เอสไอ เปลี่ยนไปใช้กรณีมาตรฐาน 1F เรา ตัวแยกโมดูล
    หมายเลข สัญลักษณ์ หมายเลข สัญลักษณ์ หมายเลข สัญลักษณ์ หมายเลข สัญลักษณ์ หมายเลข สัญลักษณ์ หมายเลข สัญลักษณ์
    20 ช่องว่าง 30 0 40 @ 50 60 . 70 พี
    21 ! 31 1 41 51 ถาม 61 71 ถาม
    22 32 2 42 บี 52 62 72
    23 # 33 3 43 53 63 73
    24 φ 34 4 44 ดี 54 64 74 ที
    25 % 35 5 45 อี 55 และ 65 75 และ
    26 & 36 6 46 เอฟ 56 วี 66 76 โวลต์
    27 37 7 47 57 67 77
    28 ( 38 8 48 ชม 58 เอ็กซ์ 68 ชม. 78 x
    29 ) 39 9 49 ฉัน 59 69 ฉัน 70
    2เอ 3เอ ; 4เอ เจ 5เอ ซี 6เอ เจ 7เอ z
    2B + 3B ; 4B เค 5B [ 6B เค 7B {
    2ซี 3ซี < 4ซี 5ซี \ 6ซี 7ซี |
    2D 3 มิติ = 4D 5D ] 6D 7D }
    2E 3อี > 4E เอ็น 5E 6อี n 7อี ~
    2เอฟ / 3เอฟ 4เอฟ โอ 5F _ 6เอฟ โอ 7เอฟ เดล
    มาตรฐานยูนิโค้ด

    การเข้ารหัสก่อนหน้านี้ใช้ได้ดีสำหรับ ภาษาอังกฤษแต่ไม่สะดวกสำหรับภาษาอื่น เช่นใน เยอรมันมีเครื่องหมายอัศเจรีย์และเป็นภาษาฝรั่งเศส ตัวยก- บางภาษามีตัวอักษรต่างกันโดยสิ้นเชิง ความพยายามครั้งแรกในการขยาย ASCII คือ IS646 ซึ่งขยายการเข้ารหัสก่อนหน้านี้เพิ่มอีก 128 อักขระ มีการเพิ่มตัวอักษรละตินที่มีเส้นขีดและตัวกำกับเสียง และได้รับชื่อ - ละติน 1 ความพยายามครั้งต่อไปคือ IS 8859 ซึ่งมีโค้ดเพจ นอกจากนี้ยังมีความพยายามในการขยายเวลา แต่ก็ไม่เป็นสากล ถูกสร้างขึ้น การเข้ารหัส UNICODE(คือ 10646) แนวคิดเบื้องหลังการเข้ารหัสคือการกำหนดค่า 16 บิตคงที่ให้กับอักขระแต่ละตัว ซึ่งเรียกว่าตัวชี้โค้ด มีทั้งหมด 65536 พอยน์เตอร์ เพื่อประหยัดพื้นที่ เราใช้ Latin-1 สำหรับรหัส 0 -255 ซึ่งเปลี่ยน ASII เป็น UNICODE ได้อย่างง่ายดาย มาตรฐานนี้แก้ไขปัญหาได้หลายอย่าง แต่ไม่ใช่ทั้งหมด เนื่องจากการมาถึงของคำศัพท์ใหม่ เช่น ในภาษาญี่ปุ่น จำเป็นต้องเพิ่มจำนวนคำศัพท์ประมาณ 20,000 คำ นอกจากนี้ยังจำเป็นต้องรวมอักษรเบรลล์ด้วย

    Unicode (Unicode ในภาษาอังกฤษ) เป็นมาตรฐานการเข้ารหัสอักขระ พูดง่ายๆ ก็คือ นี่คือตารางการติดต่อระหว่างอักขระข้อความ (ตัวอักษร องค์ประกอบเครื่องหมายวรรคตอน) และรหัสไบนารี่ คอมพิวเตอร์เข้าใจเฉพาะลำดับของศูนย์และลำดับเท่านั้น เพื่อให้รู้ว่าควรแสดงอะไรบนหน้าจอ จำเป็นต้องกำหนดสัญลักษณ์แต่ละตัวของตัวเอง หมายเลขที่ไม่ซ้ำ- ในยุคแปดสิบ อักขระถูกเข้ารหัสในหนึ่งไบต์ นั่นคือ แปดบิต (แต่ละบิตคือ 0 หรือ 1) ปรากฎว่ามีหนึ่งตาราง (หรือที่เรียกว่าการเข้ารหัสหรือชุด) สามารถรองรับอักขระได้เพียง 256 ตัวเท่านั้น นี่อาจไม่เพียงพอแม้แต่กับภาษาเดียว ดังนั้นการเข้ารหัสที่แตกต่างกันมากมายจึงปรากฏขึ้น ความสับสนซึ่งมักนำไปสู่ความจริงที่ว่าแทนที่จะเป็น ข้อความที่อ่านได้มีสิ่งมีชีวิตเล็กๆ แปลกๆ ปรากฏขึ้น ที่จำเป็น มาตรฐานเดียวซึ่งเป็นสิ่งที่ Unicode กลายเป็น การเข้ารหัสที่ใช้มากที่สุดคือ UTF-8 (Unicode Transformation Format) ซึ่งใช้ 1 ถึง 4 ไบต์เพื่อแสดงอักขระ

    สัญลักษณ์

    อักขระในตาราง Unicode จะเป็นตัวเลข เลขฐานสิบหก- ตัวอย่างเช่น ซีริลลิก อักษรตัวใหญ่ M ถูกกำหนดให้เป็น U+041C ซึ่งหมายความว่ามันตั้งอยู่ที่จุดตัดของแถว 041 และคอลัมน์ C คุณสามารถคัดลอกและวางที่ไหนสักแห่งก็ได้ เพื่อไม่ให้ค้นหารายการหลายกิโลเมตร คุณควรใช้การค้นหา เมื่อคุณไปที่หน้าสัญลักษณ์ คุณจะเห็นหมายเลขเป็น Unicode และวิธีการเขียน แบบอักษรที่แตกต่างกัน- คุณสามารถใส่เครื่องหมายลงในแถบค้นหาได้ แม้ว่าจะวาดรูปสี่เหลี่ยมจัตุรัสแทนก็ตาม อย่างน้อยก็เพื่อดูว่ามันคืออะไร นอกจากนี้ บนเว็บไซต์นี้ยังมีชุดไอคอนประเภทเดียวกันพิเศษ (และสุ่ม) ที่รวบรวมจากส่วนต่างๆ เพื่อความสะดวกในการใช้งาน

    มาตรฐาน Unicode เป็นมาตรฐานสากล ประกอบด้วยตัวละครจากสคริปต์เกือบทั้งหมดของโลก รวมถึงของที่ไม่ได้ใช้แล้วด้วย อักษรอียิปต์โบราณ อักษรรูนดั้งเดิม อักษรมายัน อักษรคูนิฟอร์ม และอักษรของรัฐโบราณ นอกจากนี้ยังมีการนำเสนอการกำหนดน้ำหนักและการวัด โน้ตดนตรี และแนวคิดทางคณิตศาสตร์อีกด้วย

    Unicode Consortium เองไม่ได้คิดค้นอักขระใหม่ ไอคอนเหล่านั้นที่พบการใช้งานในสังคมจะถูกเพิ่มลงในตาราง ตัวอย่างเช่น มีการใช้เครื่องหมายรูเบิลเป็นเวลาหกปีก่อนที่จะถูกเพิ่มลงใน Unicode รูปสัญลักษณ์อิโมจิ (อีโมติคอน) ถูกนำมาใช้กันอย่างแพร่หลายในญี่ปุ่นเป็นครั้งแรกก่อนที่จะรวมไว้ในการเข้ารหัส แต่ เครื่องหมายการค้าและไม่มีการใส่โลโก้บริษัทแต่อย่างใด แม้กระทั่งเรื่องธรรมดาๆ เช่น แอปเปิ้ลแอปเปิ้ลหรือธง Windows จนถึงปัจจุบันมีการเข้ารหัสอักขระประมาณ 120,000 ตัวในเวอร์ชัน 8.0

    จากข้อมูลของสหภาพโทรคมนาคมระหว่างประเทศ ในปี 2559 ผู้คนสามพันห้าพันล้านคนใช้อินเทอร์เน็ตอย่างสม่ำเสมอ ส่วนใหญ่ไม่ได้คิดถึงความจริงที่ว่าข้อความใด ๆ ที่พวกเขาส่งผ่านพีซีหรือ อุปกรณ์เคลื่อนที่เช่นเดียวกับข้อความที่แสดงบนจอภาพทุกประเภท จริงๆ แล้วเป็นค่าผสมระหว่าง 0 และ 1 การแสดงข้อมูลนี้เรียกว่าการเข้ารหัส ช่วยให้มั่นใจและอำนวยความสะดวกอย่างมากในการจัดเก็บ การประมวลผล และการส่งผ่าน ในปี 1963 การเข้ารหัส American ASCII ได้รับการพัฒนาซึ่งเป็นหัวข้อของบทความนี้

    การนำเสนอข้อมูลบนคอมพิวเตอร์

    จากมุมมองของคอมพิวเตอร์อิเล็กทรอนิกส์ ข้อความคือชุดของอักขระแต่ละตัว สิ่งเหล่านี้ไม่เพียงแต่รวมถึงตัวอักษรเท่านั้น รวมถึงตัวพิมพ์ใหญ่ด้วย แต่ยังรวมถึงเครื่องหมายวรรคตอนและตัวเลขด้วย นอกจากนี้ มีการใช้อักขระพิเศษ “=”, “&”, “(” และการเว้นวรรค

    ชุดอักขระที่ประกอบเป็นข้อความเรียกว่าตัวอักษร และตัวเลขเรียกว่าคาร์ดินัลลิตี (แสดงเป็น N) ในการพิจารณาจะใช้นิพจน์ N = 2^b โดยที่ b คือจำนวนบิตหรือน้ำหนักข้อมูลของสัญลักษณ์เฉพาะ

    ได้รับการพิสูจน์แล้วว่าตัวอักษรที่มีความจุ 256 ตัวอักษรสามารถเป็นตัวแทนของตัวอักษรที่จำเป็นทั้งหมดได้

    เนื่องจาก 256 แทนกำลัง 8 ของ 2 น้ำหนักของอักขระแต่ละตัวคือ 8 บิต

    หน่วยวัด 8 บิตเรียกว่า 1 ไบต์ ดังนั้นจึงเป็นเรื่องปกติที่จะบอกว่าอักขระใดๆ ในข้อความที่จัดเก็บไว้ในคอมพิวเตอร์จะใช้หน่วยความจำหนึ่งไบต์

    การเข้ารหัสทำอย่างไร?

    ข้อความใด ๆ จะถูกป้อนลงในหน่วยความจำ คอมพิวเตอร์ส่วนบุคคลผ่านแป้นคีย์บอร์ดที่ใช้เขียนตัวเลข ตัวอักษร เครื่องหมายวรรคตอน และสัญลักษณ์อื่นๆ ใน แรมพวกเขาจะถูกส่งในรหัสไบนารี่นั่นคือ อักขระแต่ละตัวเชื่อมโยงกับรหัสทศนิยมที่มนุษย์คุ้นเคยตั้งแต่ 0 ถึง 255 ซึ่งสอดคล้องกับ รหัสไบนารี่- จาก 00000000 ถึง 11111111

    การเข้ารหัสอักขระแบบไบต์ไบต์ช่วยให้โปรเซสเซอร์ดำเนินการประมวลผลข้อความเพื่อเข้าถึงอักขระแต่ละตัวแยกกันได้ ในเวลาเดียวกัน 256 ตัวอักษรก็เพียงพอแล้วสำหรับการแสดงข้อมูลเชิงสัญลักษณ์

    การเข้ารหัสอักขระ ASCII

    ตัวย่อในภาษาอังกฤษนี้ย่อมาจากรหัส สำหรับข้อมูลการแลกเปลี่ยน

    แม้แต่ในช่วงเริ่มต้นของการใช้คอมพิวเตอร์ ก็เห็นได้ชัดว่ามีความเป็นไปได้ที่จะมีวิธีการเข้ารหัสข้อมูลที่หลากหลาย อย่างไรก็ตาม ในการถ่ายโอนข้อมูลจากคอมพิวเตอร์เครื่องหนึ่งไปยังอีกเครื่องหนึ่ง จำเป็นต้องพัฒนามาตรฐานที่เป็นหนึ่งเดียว ดังนั้นในปี พ.ศ. 2506 ตารางการเข้ารหัส ASCII จึงปรากฏในสหรัฐอเมริกา ในนั้นสัญลักษณ์ใด ๆ ของตัวอักษรคอมพิวเตอร์จะถูกกำหนดหมายเลขประจำเครื่อง การเป็นตัวแทนไบนารี- ASCII เดิมใช้เฉพาะในสหรัฐอเมริกาเท่านั้น และต่อมาได้กลายเป็นมาตรฐานสากลสำหรับพีซี

    รหัส ASCII แบ่งออกเป็น 2 ส่วน มาตรฐานสากลพิจารณาเพียงครึ่งแรกของตารางนี้เท่านั้น ประกอบด้วยตัวละครด้วย หมายเลขซีเรียลจาก 0 (รหัสเป็น 00000000) ถึง 127 (รหัสเป็น 01111111)

    หมายเลขซีเรียล

    การเข้ารหัสข้อความ ASCII

    เครื่องหมาย

    0000 0000 - 0001 1111

    อักขระที่มี N ตั้งแต่ 0 ถึง 31 เรียกว่าอักขระควบคุม หน้าที่ของพวกเขาคือ "จัดการ" กระบวนการแสดงข้อความบนจอภาพหรืออุปกรณ์การพิมพ์ ให้สัญญาณเสียง เป็นต้น

    0010 0000 - 0111 1111

    อักขระที่มี N ตั้งแต่ 32 ถึง 127 (ส่วนมาตรฐานของตาราง) - ตัวพิมพ์ใหญ่ และ ตัวอักษรตัวพิมพ์เล็ก ตัวอักษรละติน, หลักที่ 10 เครื่องหมายวรรคตอน รวมถึงวงเล็บต่างๆ สัญลักษณ์ทางการค้า และสัญลักษณ์อื่นๆ อักขระ 32 หมายถึงช่องว่าง

    1000 0000 - 1111 1111

    อักขระที่มี N ตั้งแต่ 128 ถึง 255 (ส่วนของตารางหรือโค้ดเพจสำรอง) อาจมี ตัวเลือกต่างๆซึ่งแต่ละอันก็มีหมายเลขของตัวเอง โค้ดเพจใช้เพื่อระบุตัวอักษรประจำชาติที่แตกต่างจากภาษาละติน โดยเฉพาะอย่างยิ่งด้วยความช่วยเหลือในการเข้ารหัส ASCII สำหรับอักขระรัสเซีย

    ในตาราง การเข้ารหัสจะขึ้นต้นด้วยตัวพิมพ์ใหญ่และตามกัน ลำดับตัวอักษรและตัวเลขจะเรียงลำดับจากน้อยไปหามาก หลักการนี้ยังคงเหมือนเดิมสำหรับตัวอักษรรัสเซีย

    อักขระควบคุม

    เดิมทีตารางการเข้ารหัส ASCII ถูกสร้างขึ้นเพื่อรับและส่งข้อมูลผ่านอุปกรณ์ที่ไม่ได้ใช้งานมาเป็นเวลานาน เช่น โทรพิมพ์ ในเรื่องนี้ อักขระที่ไม่สามารถพิมพ์ได้รวมอยู่ในชุดอักขระ ซึ่งใช้เป็นคำสั่งในการควบคุมอุปกรณ์นี้ คำสั่งที่คล้ายกันถูกนำมาใช้ในวิธีการส่งข้อความก่อนคอมพิวเตอร์ เช่น รหัสมอร์ส เป็นต้น

    อักขระโทรพิมพ์ที่พบบ่อยที่สุดคือ NUL (00) ปัจจุบันยังคงใช้ในภาษาการเขียนโปรแกรมส่วนใหญ่เพื่อระบุจุดสิ้นสุดของบรรทัด

    การเข้ารหัส ASCII ใช้ที่ไหน

    รหัส American Standard จำเป็นไม่เพียงแต่สำหรับการป้อนข้อมูลข้อความบนแป้นพิมพ์เท่านั้น นอกจากนี้ยังใช้ในกราฟิก โดยเฉพาะในโปรแกรม ASCII Art โปรแกรมสร้างรูปภาพส่วนขยายต่างๆ แสดงถึงสเปกตรัมของอักขระ ASCII

    ผลิตภัณฑ์ดังกล่าวมีสองประเภท: ผลิตภัณฑ์ที่ทำหน้าที่แก้ไขกราฟิกโดยการแปลงรูปภาพเป็นข้อความและผลิตภัณฑ์ที่แปลง "ภาพวาด" เป็นกราฟิก ASCII ตัวอย่างเช่น อิโมติคอนที่มีชื่อเสียงคือ ตัวอย่างที่สดใสอักขระการเข้ารหัส

    ASCII ยังสามารถนำมาใช้เมื่อสร้างเอกสาร HTML ในกรณีนี้คุณสามารถป้อนชุดอักขระบางชุดได้และเมื่อดูหน้าเว็บสัญลักษณ์ที่สอดคล้องกับรหัสนี้จะปรากฏบนหน้าจอ

    ASCII ยังจำเป็นสำหรับการสร้างเว็บไซต์หลายภาษา เนื่องจากอักขระที่ไม่รวมอยู่ในตารางของประเทศใดประเทศหนึ่งจะถูกแทนที่ด้วยรหัส ASCII

    คุณสมบัติบางอย่าง

    เดิมที ASCII ใช้เพื่อเข้ารหัสข้อมูลข้อความโดยใช้ 7 บิต (อันหนึ่งเว้นว่างไว้) แต่ปัจจุบันใช้งานได้เป็น 8 บิต

    ตัวอักษรที่อยู่ในคอลัมน์ด้านบนและด้านล่างแตกต่างกันเพียงบิตเดียวเท่านั้น ซึ่งจะช่วยลดความซับซ้อนของการตรวจสอบลงอย่างมาก

    การใช้ ASCII ใน Microsoft Office

    หากจำเป็น สามารถใช้การเข้ารหัสข้อมูลข้อความประเภทนี้ได้ โปรแกรมแก้ไขข้อความ Microsoft Corporation เช่น Notepad และ Office Word อย่างไรก็ตาม คุณอาจไม่สามารถใช้ฟังก์ชันบางอย่างได้เมื่อพิมพ์ในกรณีนี้ ตัวอย่างเช่น คุณจะไม่สามารถใช้ข้อความตัวหนาได้เนื่องจากการเข้ารหัส ASCII จะรักษาความหมายของข้อมูลเท่านั้น โดยไม่สนใจรูปลักษณ์และรูปแบบโดยรวม

    การทำให้เป็นมาตรฐาน

    องค์กร ISO ได้นำมาตรฐาน ISO 8859 มาใช้ กลุ่มนี้กำหนดการเข้ารหัสแปดบิตสำหรับกลุ่มภาษาต่างๆ โดยเฉพาะอย่างยิ่ง ISO 8859-1 เป็นตาราง Extended ASCII สำหรับประเทศสหรัฐอเมริกาและประเทศในยุโรปตะวันตก และ ISO 8859-5 เป็นตารางที่ใช้สำหรับอักษรซีริลลิกรวมถึงภาษารัสเซีย

    ด้วยเหตุผลหลายประการทางประวัติศาสตร์ มาตรฐานไอเอสโอ 8859-5 ถูกใช้สั้นมาก

    สำหรับภาษารัสเซีย ในขณะนี้การเข้ารหัสจริงที่ใช้คือ:

    • CP866 (รหัสหน้า 866) หรือ DOS,ซึ่งมักเรียกว่าการเข้ารหัส GOST ทางเลือก มีการใช้งานอย่างแข็งขันจนถึงกลางทศวรรษที่ 90 ของศตวรรษที่ผ่านมา ในขณะนี้ไม่ได้ใช้จริง
    • ก้อย-8.การเข้ารหัสได้รับการพัฒนาในช่วงปี 1970 และ 1980 และปัจจุบันเป็นมาตรฐานที่ยอมรับโดยทั่วไปสำหรับ ข้อความเมลในรูเน็ต มีการใช้กันอย่างแพร่หลายในระบบปฏิบัติการ ครอบครัวยูนิกซ์รวมถึงลินุกซ์ด้วย KOI-8 เวอร์ชัน "รัสเซีย" เรียกว่า KOI-8R นอกจากนี้ยังมีเวอร์ชันสำหรับภาษาซีริลลิกอื่นๆ เช่น ภาษายูเครน
    • รหัสหน้า 1251 (CP 1251, Windows - 1251)พัฒนาโดย Microsoft เพื่อให้การสนับสนุนภาษารัสเซียในสภาพแวดล้อม Windows

    ข้อได้เปรียบหลักของมาตรฐาน CP866 แรกคือการรักษาอักขระเทียมในตำแหน่งเดียวกับใน Extended ASCII สิ่งนี้ทำให้สามารถทำงานโดยไม่มีการเปลี่ยนแปลง โปรแกรมข้อความ,การผลิตจากต่างประเทศเช่นที่มีชื่อเสียง ผู้บัญชาการนอร์ตัน- ปัจจุบัน CP866 ใช้สำหรับโปรแกรมที่พัฒนาสำหรับ Windows ที่ทำงานในโหมดข้อความเต็มหน้าจอหรือใน หน้าต่างข้อความรวมถึงใน FAR Manager

    ข้อความคอมพิวเตอร์ที่เขียนด้วยการเข้ารหัส CP866 ใน เมื่อเร็วๆ นี้ค่อนข้างหายาก แต่เป็นชื่อที่ใช้สำหรับชื่อไฟล์ภาษารัสเซียใน Windows

    "ยูนิโค้ด"

    ในขณะนี้การเข้ารหัสนี้มีการใช้กันอย่างแพร่หลายที่สุด รหัส Unicode แบ่งออกเป็นพื้นที่ ตัวแรก (U+0000 ถึง U+007F) มีอักขระ ASCII พร้อมรหัส ตามด้วยส่วนอักขระของอักษรประจำชาติต่างๆ ตลอดจนเครื่องหมายวรรคตอนและสัญลักษณ์ทางเทคนิค นอกจากนี้ รหัส Unicode บางรหัสจะถูกสงวนไว้ในกรณีที่จำเป็นต้องเพิ่มอักขระใหม่ในอนาคต

    ตอนนี้คุณรู้แล้วว่าใน ASCII อักขระแต่ละตัวจะแสดงด้วยค่าศูนย์ 8 ตัวและหนึ่งตัวรวมกัน สำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญ ข้อมูลนี้อาจดูเหมือนไม่จำเป็นและไม่น่าสนใจ แต่คุณไม่อยากรู้ว่าเกิดอะไรขึ้น "ในสมอง" ของพีซีของคุณใช่ไหม!

    Excel สำหรับ Office 365 Word สำหรับ Office 365 Outlook สำหรับ Office 365 PowerPoint for Office 365 Publisher สำหรับ Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 2013 Publisher 20 16 วิสิโอ 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 ผู้เผยแพร่ 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 ผู้จัดพิมพ์ 2010 Visio 2010 Excel 2007 Word 2007 Outlook 20 07 PowerPoint 2007 ผู้เผยแพร่ 2007 เข้าถึง 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 น้อยกว่า

    ในบทความนี้: แทรกอักขระ ASCII หรือ Unicode ลงในเอกสาร

    หากคุณต้องการป้อนอักขระพิเศษหรือสัญลักษณ์เพียงไม่กี่ตัว คุณสามารถใช้แป้นพิมพ์ลัดได้ สำหรับรายการอักขระ ASCII โปรดดูตารางต่อไปนี้หรือบทความการแทรกตัวอักษรประจำชาติโดยใช้แป้นพิมพ์ลัด

    หมายเหตุ:

    การแทรกอักขระ ASCII

    หากต้องการแทรกอักขระ ASCII ให้กดปุ่ม ALT ค้างไว้ขณะป้อนโค้ดอักขระ ตัวอย่างเช่น หากต้องการแทรกสัญลักษณ์องศา (°) ให้กดปุ่ม ALT ค้างไว้ จากนั้นพิมพ์ 0176 ลงไป แป้นพิมพ์ตัวเลข.

    หากต้องการป้อนตัวเลข ให้ใช้แป้นพิมพ์ตัวเลขแทนตัวเลขบนแป้นพิมพ์หลัก หากคุณต้องการป้อนตัวเลขบนแป้นพิมพ์ตัวเลข ตรวจสอบให้แน่ใจว่าตัวบ่งชี้ NUM LOCK เปิดอยู่

    การแทรกอักขระ Unicode

    หากต้องการแทรกอักขระ Unicode ให้ป้อนรหัสอักขระ จากนั้นกด ปุ่ม ALTและ X ตัวอย่างเช่น หากต้องการแทรกสัญลักษณ์ดอลลาร์ ($) ให้ป้อน 0024 แล้วกด ALT และ X ตามลำดับ สำหรับโค้ดอักขระ Unicode ทั้งหมด โปรดดู

    สำคัญ: บางส่วน โปรแกรมไมโครซอฟต์ Office เช่น PowerPoint และ InfoPath ไม่รองรับการแปลงโค้ด Unicode เป็นอักขระ หากคุณต้องการแทรกอักขระ Unicode ในโปรแกรมใดโปรแกรมหนึ่งเหล่านี้ ให้ใช้ .

    หมายเหตุ:

      หากอักขระ Unicode ที่ไม่ถูกต้องปรากฏขึ้นหลังจากที่คุณกด ALT+X ให้เลือกโค้ดที่ถูกต้อง จากนั้นกด ALT+X อีกครั้ง

      นอกจากนี้คุณต้องป้อน "U+" ก่อนรหัส ตัวอย่างเช่น หากคุณป้อน "1U+B5" และกด ALT+X ข้อความ "1µ" จะแสดงขึ้น และหากคุณป้อน "1B5" และกด ALT+X สัญลักษณ์ "Ƶ" จะแสดงขึ้น

    การใช้ตารางสัญลักษณ์

    ตารางสัญลักษณ์คือโปรแกรมที่ติดตั้งอยู่ภายใน ไมโครซอฟต์ วินโดวส์ซึ่งช่วยให้คุณดูอักขระที่ใช้ได้สำหรับแบบอักษรที่เลือก

    การใช้ตารางสัญลักษณ์คุณสามารถคัดลอกได้ ตัวละครแต่ละตัวหรือกลุ่มอักขระลงในคลิปบอร์ดแล้ววางลงในโปรแกรมที่รองรับการแสดงอักขระเหล่านี้ การเปิดตารางสัญลักษณ์

      ใน Windows 10 ให้ป้อนคำว่า "สัญลักษณ์" ในช่องค้นหาบนทาสก์บาร์และเลือกตารางสัญลักษณ์จากผลการค้นหา

      ใน Windows 8 ให้ป้อนคำว่า "ตัวอักษร" ที่ หน้าจอหลักและเลือกตารางสัญลักษณ์จากผลการค้นหา

      ใน Windows 7 คลิกปุ่มเริ่ม เลือกโปรแกรมทั้งหมด อุปกรณ์เสริม เครื่องมือระบบ จากนั้นคลิกผังอักขระ

    อักขระจะถูกจัดกลุ่มตามแบบอักษร คลิกรายการแบบอักษรเพื่อเลือกชุดอักขระที่เหมาะสม หากต้องการเลือกสัญลักษณ์ ให้คลิกสัญลักษณ์นั้น จากนั้นคลิกปุ่มเลือก หากต้องการแทรกสัญลักษณ์ คลิก คลิกขวาหนู สถานที่ที่ถูกต้องในเอกสารแล้วเลือกวาง

    รหัสอักขระที่ใช้บ่อย

    รายการเต็มดูบนคอมพิวเตอร์ของคุณ ตารางรหัสอักขระ ASCII หรือตารางอักขระ Unicode ที่จัดระเบียบตามชุด

    สัญลักษณ์

    สัญลักษณ์

    สกุลเงิน

    สัญลักษณ์ทางกฎหมาย

    สัญลักษณ์ทางคณิตศาสตร์

    เศษส่วน

    เครื่องหมายวรรคตอนและสัญลักษณ์ภาษาถิ่น

    สัญลักษณ์รูปร่าง

    รหัสกำกับเสียงที่ใช้กันทั่วไป

    สำหรับรายการสัญลักษณ์ทั้งหมดและรหัสที่เกี่ยวข้อง โปรดดูที่

    สัญลักษณ์

    สัญลักษณ์

    อักขระควบคุม ASCII ที่ไม่พิมพ์

    ป้ายที่ใช้ควบคุมบางส่วน อุปกรณ์ต่อพ่วงเช่น เครื่องพิมพ์ เป็นต้น ตาราง ASCIIมีหมายเลข 0–31 ตัวอย่างเช่น การป้อนหน้า/อักขระหน้าใหม่คือหมายเลข 12 อักขระนี้บอกให้เครื่องพิมพ์ย้ายไปยังจุดเริ่มต้นของหน้าถัดไป

    ตารางอักขระควบคุม ASCII ที่ไม่พิมพ์

    เลขทศนิยม

    เข้าสู่ระบบ

    เลขทศนิยม

    เข้าสู่ระบบ

    ปล่อยช่องข้อมูล

    จุดเริ่มต้นของชื่อเรื่อง

    รหัสควบคุมอุปกรณ์แรก

    จุดเริ่มต้นของข้อความ

    รหัสควบคุมอุปกรณ์ที่สอง

    สิ้นสุดข้อความ

    รหัสควบคุมอุปกรณ์ที่สาม

    สิ้นสุดการส่งสัญญาณ

    รหัสควบคุมอุปกรณ์ที่สี่

    ห้าแฉก

    การยืนยันเชิงลบ

    การยืนยัน

    โหมดการส่งข้อมูลแบบซิงโครนัส

    บี๊บ

    สิ้นสุดบล็อกข้อมูลที่ส่ง

    การจัดตารางแนวนอน

    จบสื่อ.

    ขึ้นบรรทัดใหม่/ขึ้นบรรทัดใหม่

    สัญลักษณ์แทนที่

    แท็บแนวตั้ง

    เกิน

    การแปลหน้า/หน้าใหม่

    สิบสอง

    ตัวแยกไฟล์

    การรับรถคืน

    ตัวแยกกลุ่ม

    Shift โดยไม่เก็บบิต

    ตัวแยกบันทึก

    กะการรักษาบิต

    สิบห้า

    ตัวแยกข้อมูล