อักขระควบคุม C ตัวอักษร เครื่องหมายการค้าและสกุลเงิน

ตัวอักษร

ใน C# ตัวอักษรเรียกว่าค่าคงที่ซึ่งแสดงอยู่ในรูปแบบที่สะดวกต่อการรับรู้ เช่น ตัวเลข 100 เป็นตัวอักษร ตัวตัวอักษรและจุดประสงค์ของมันชัดเจนมากจนถูกใช้ในตัวอย่างโปรแกรมก่อนหน้านี้ทั้งหมดโดยไม่มีคำอธิบายใดๆ แต่ตอนนี้ถึงเวลาที่จะต้องอธิบายอย่างเป็นทางการแล้ว

ในตัวอักษร C# สามารถเป็นอะไรก็ได้ ประเภทเรียบง่าย- การแสดงตัวอักษรแต่ละคำขึ้นอยู่กับประเภทเฉพาะ ตามที่อธิบายไว้ก่อนหน้านี้ ตัวอักษรตัวอักษรจะอยู่ในนั้น คำพูดเดียว- ตัวอย่างเช่น "a" และ "%" เป็นตัวอักษรตัวอักษร

ตัวอักษรจำนวนเต็มจะแสดงเป็นตัวเลขที่ไม่มีเศษส่วน ตัวอย่างเช่น 10 และ -100 เป็นตัวอักษรจำนวนเต็ม หากต้องการแสดงตัวอักษรจุดลอยตัว คุณต้องระบุ จุดทศนิยมและ เศษส่วนตัวเลข ตัวอย่างเช่น 11.123 เป็นลิเทอรัลจุดลอยตัว สำหรับ ตัวเลขจริงด้วยจุดลอยตัว C# ยังช่วยให้คุณใช้สัญกรณ์ทางวิทยาศาสตร์ได้

ตัวอักษรก็ต้องมีด้วย ประเภทเฉพาะเนื่องจาก C# เป็นภาษาที่พิมพ์ยาก ในเรื่องนี้มีคำถามตามธรรมชาติเกิดขึ้น: ควรจัดประเภทตัวอักษรตัวเลขเป็นประเภทใดเช่น 2, 12 3987 หรือ 0.23 โชคดีที่ C# มีกฎที่ปฏิบัติตามง่ายเพื่อตอบคำถามนี้:

    ขั้นแรก ตัวอักษรจำนวนเต็มจะต้องมีประเภทจำนวนเต็มที่น้อยที่สุดที่สามารถแทนได้ด้วย โดยเริ่มจาก พิมพ์ int- ดังนั้นตัวอักษรจำนวนเต็มสามารถมีค่าใดค่าหนึ่งได้ ประเภทต่อไปนี้: int, uint, long หรือ ulong ขึ้นอยู่กับค่าของตัวอักษร

    ตัวอักษรจุดลอยตัวเป็นแบบ double

    หากคุณไม่พอใจกับประเภทตัวอักษรเริ่มต้น คุณสามารถระบุประเภทอื่นได้อย่างชัดเจนโดยใช้ คำต่อท้าย.

    ดังนั้น เพื่อระบุประเภทยาว คำต่อท้าย l หรือ L จะถูกต่อท้ายตัวอักษร ตัวอย่างเช่น 12 เป็นตัวอักษรของประเภท int และ 12L เป็นตัวอักษรของประเภทยาว เพื่อบ่งชี้ ประเภทจำนวนเต็มตัวอักษรที่ไม่ได้ลงนามจะถูกต่อท้ายด้วยส่วนต่อท้าย u หรือ U ดังนั้น 100 จึงเป็นตัวอักษรประเภท int และ 100U จึงเป็นตัวอักษรประเภท uint และเพื่อระบุประเภทจำนวนเต็มยาวที่ไม่ได้ลงนาม คำต่อท้าย ul หรือ UL จะถูกต่อท้ายตามตัวอักษร ตัวอย่างเช่น 984375UL เป็นตัวอักษรประเภท ulong

    นอกจากนี้เพื่อบ่งชี้ ประเภทลอยตัวอักษรจะถูกต่อท้ายด้วยคำต่อท้าย F หรือ f ตัวอย่างเช่น 10.19F เป็นตัวอักษรลอยตัว คุณยังสามารถระบุประเภท double ได้ด้วยการเพิ่มส่วนต่อท้ายตามตัวอักษร d หรือ D แม้ว่าจะไม่จำเป็นก็ตาม ท้ายที่สุด ตามที่กล่าวไว้ข้างต้น ตามค่าเริ่มต้น ตัวอักษรจุดลอยตัวจะเป็นประเภท double

    สุดท้ายนี้ เพื่อระบุประเภททศนิยม ตัวอักษรจะถูกต่อท้ายด้วยส่วนต่อท้าย m หรือ M ตัวอย่างเช่น 9.95M เป็นตัวอักษรทศนิยมของประเภททศนิยม

    แม้ว่าตัวอักษรจำนวนเต็มจะสร้างค่า int, uint, long หรือ ulong ตามค่าเริ่มต้น แต่ก็สามารถกำหนดให้กับตัวแปรได้ ประเภทไบต์, sbyte, short หรือ ushort โดยมีเงื่อนไขว่าค่าที่กำหนดสามารถแสดงตามประเภทเป้าหมายได้

ตัวอักษรฐานสิบหก

คุณคงทราบดีว่าในการเขียนโปรแกรม บางครั้งการใช้ระบบเลขฐาน 16 จะง่ายกว่าระบบเลขฐาน 10 เลขฐานสิบหก- ใช้ตัวเลขตั้งแต่ 0 ถึง 9 เช่นเดียวกับตัวอักษรตั้งแต่ A ถึง F ซึ่งแทนเลขทศนิยม 10,11,12,13, 14 และ 15 ตัวอย่างเช่น เลขทศนิยม 16 ตรงกับเลขฐานสิบหก 10 เนื่องจากข้อเท็จจริงที่ว่า เลขฐานสิบหกมีการใช้ค่อนข้างบ่อยในการเขียนโปรแกรม C# ช่วยให้คุณสามารถระบุตัวอักษรจำนวนเต็มในรูปแบบเลขฐานสิบหก ตัวอักษรฐานสิบหกต้องขึ้นต้นด้วย 0x ตัวอักษร, เช่น. ศูนย์และต่อมา อักษรละติน"เอ็กซ์" ด้านล่างนี้คือตัวอย่างบางส่วนของตัวอักษรฐานสิบหก:

จำนวน = 0xFF; // เท่ากับ 255 ในระบบทศนิยม incr = 0x1a; // เท่ากับ 26 ในระบบทศนิยม

ลำดับการหลบหนี

อักขระที่พิมพ์ได้ส่วนใหญ่สามารถใส่เครื่องหมายคำพูดเดี่ยวได้อย่างง่ายดาย แต่การพิมพ์อักขระบางตัวในโปรแกรมประมวลผลคำ เช่น การขึ้นบรรทัดใหม่ นั้นทำได้ยากเป็นพิเศษ นอกจากนี้ ยังมีตัวละครอื่นๆ อีกจำนวนหนึ่ง รวมทั้ง single และ เครื่องหมายคำพูดคู่, มี วัตถุประสงค์พิเศษใน C# ดังนั้นจึงไม่สามารถใช้โดยตรงได้ ด้วยเหตุผลเหล่านี้ C# จึงจัดเตรียมสิ่งพิเศษไว้ ลำดับอักขระหลีก:

ตัวอักษรสตริง

C# รองรับตัวอักษรอีกประเภทหนึ่ง - เชือก- ตัวอักษรสตริงคือชุดของอักขระที่อยู่ในเครื่องหมายคำพูดคู่ ตัวอย่างเช่นส่วนของโค้ดต่อไปนี้:

นอกเหนือจากอักขระปกติแล้ว ตัวอักษรสตริงยังสามารถมีลำดับอักขระควบคุมตั้งแต่หนึ่งลำดับขึ้นไปที่กล่าวถึงข้างต้น คุณยังสามารถระบุได้ ตัวอักษรสตริงตัวอักษร- ตัวอักษรดังกล่าวเริ่มต้นด้วยสัญลักษณ์ @ ตามด้วยสตริงที่ยกมา เนื้อหาของสตริงที่ยกมาจะถือว่าไม่มีการเปลี่ยนแปลงและสามารถขยายได้ตั้งแต่สองบรรทัดขึ้นไป ซึ่งหมายความว่าสามารถรวมอักขระไว้ในสตริงตัวอักษรตามตัวอักษรได้ บรรทัดใหม่แท็บ และอื่นๆ โดยไม่ต้องใช้ลำดับการควบคุม ข้อยกเว้นเพียงอย่างเดียวคือเครื่องหมายคำพูดคู่ (") ซึ่งจะต้องระบุโดยใช้เครื่องหมายคำพูดคู่ตามด้วยเครื่องหมายแบ็กสแลช ("\") ตัวอย่างเช่น

อักขระควบคุม

อักขระควบคุม- องค์ประกอบของการเข้ารหัสที่กำหนดซึ่งไม่ได้ถูกกำหนดไว้ การแสดงกราฟิกแต่ใช้ในการจัดการอุปกรณ์ จัดระเบียบการถ่ายโอนข้อมูล และวัตถุประสงค์อื่น ๆ

ปัจจุบันมีการใช้รูปแบบไฟล์ ภาษาควบคุมอุปกรณ์ (เช่น Postscript) และโปรโตคอลเครือข่ายเพื่อวัตถุประสงค์เหล่านี้ ดังนั้นขณะนี้อักขระควบคุมจำนวนมากจึงไม่ได้ใช้เลยหรือใช้เพื่อวัตถุประสงค์อื่น

อักขระควบคุม ASCII

ตัวเลข ชื่อภาษาอังกฤษ ชื่อรัสเซีย โซเช-
การฟอกหนัง
cla-
นิดหน่อย
หนี
หลังจาก-
โดวา-
โทร-
เนส
วัตถุประสงค์
00 โมฆะ สัญลักษณ์ว่างเปล่า \0 สัญลักษณ์นี้ไม่ได้ทำอะไรเลย เทอร์มินัลบางตัวแสดงเป็นช่องว่าง แต่สิ่งนี้ไม่ถูกต้อง NULL มักใช้เพื่อระบุจุดสิ้นสุดของสตริงอักขระ (เช่น ในภาษา C)
01 จุดเริ่มต้นของส่วนหัว จุดเริ่มต้นของชื่อ ^ก
02 จุดเริ่มต้นของข้อความ จุดเริ่มต้นของข้อความ ^บี ปัจจุบันใช้ในคอนโซลของเราเตอร์ Cisco
03 สิ้นสุดข้อความ ท้ายข้อความ ^ค เมื่อป้อนบนเทอร์มินัล มักจะตีความว่าเป็นสัญญาณขัดจังหวะ
04 สิ้นสุดการส่ง สิ้นสุดการส่ง ^ดี เมื่อป้อนบนเทอร์มินัลบนระบบ UNIX ข้อมูลจะถูกตีความเป็นจุดสิ้นสุดของข้อมูลอินพุต ถ้า โปรแกรมปัจจุบันนำข้อมูลจากเทอร์มินัลมา มันจะสิ้นสุดทันทีที่ประมวลผลทุกอย่างที่อยู่หน้าสัญลักษณ์ ^D
05 สอบถามข้อมูล ขอ ^จ ใช้ในการสื่อสารแบบโทรพิมพ์ เพื่อเป็นการตอบสนอง มันควรจะได้รับสตริงการระบุตัวตนของอุปกรณ์ระยะไกล
06 รับทราบ การยืนยัน ^ฟ ใช้ในการสื่อสารแบบโทรพิมพ์
07 กระดิ่ง บี๊บ ^จี \a หากอักขระนี้ถูกส่งไปยังเครื่องพิมพ์หรือเทอร์มินัล จะไม่มีการพิมพ์ใดๆ ออกมา แต่จะได้ยินเสียงบี๊บ
08 แบ็คสเปซ ย้อนกลับไปหนึ่งก้าว ^H \ข ย้ายตำแหน่งการพิมพ์กลับไปหนึ่งอักขระ บนเครื่องพิมพ์สามารถใช้เพื่อวางอักขระตัวหนึ่งไว้บนอีกตัวหนึ่งได้ เช่น บี.เอส. ^ = â - เมื่อเข้าจากเทอร์มินัล บางครั้งใช้เพื่อลบอักขระที่อยู่ข้างหน้า ("backspace")
09 ตารางอักขระ (ตารางแนวนอน) แท็บแนวนอน ^ฉัน \t ย้ายตำแหน่งการพิมพ์ไปยังแถบหยุดแนวนอนถัดไป
0เอ ไลน์ฟีด ฟีดบรรทัด ^เจ \n ย้ายตำแหน่งการพิมพ์ลงไปหนึ่งบรรทัด ในไฟล์ข้อความบน Unix ให้แยกบรรทัด
0B เส้นตาราง (ตารางแนวตั้ง) แท็บแนวตั้ง ^เค \v ย้ายตำแหน่งการพิมพ์ไปยังแถบหยุดแนวตั้งถัดไป บนเทอร์มินัล อักขระนี้มักจะเทียบเท่ากับการป้อนบรรทัด
0ซี ฟีดแบบฟอร์ม ฟีดหน้าการเปลี่ยนหน้า ^ล \ฉ โยนมันทิ้งไป หน้าปัจจุบันและเริ่มพิมพ์จากอันถัดไป บนเทอร์มินัล อักขระนี้มักจะเทียบเท่ากับการป้อนบรรทัด (แม้ว่าโดยหลักการแล้วสามารถใช้เพื่อล้างหน้าจอได้)
0D การส่งคืนรถ การคืนรถ ^ม \r ย้ายตำแหน่งการพิมพ์ไปทางซ้ายสุด ในไฟล์ข้อความบน Mac OS (แต่ไม่ใช่ Mac OS X) ให้แยกบรรทัด ใน CP/M, MS-DOS และ Microsoft Windows การใช้อักขระผสม \r\n เพื่อแยกบรรทัดในไฟล์ข้อความ
0อี SHIFT OUT (ล็อค-กะหนึ่ง) โหมดสัญลักษณ์ประจำชาติ ^เอ็น KOI-7 มีโหมดรัสเซีย ในเครื่องพิมพ์บางรุ่น เปิดใช้งานโหมดอักขระแบบความกว้างสองเท่า
0เอฟ SHIFT IN (ล็อค-Shift ศูนย์) โหมด ASCII ปกติ ^โอ KOI-7 มีโหมดละติน ในเครื่องพิมพ์บางรุ่น เปิดใช้งานโหมดอักขระแคบ
10 หลบหนีการเชื่อมโยงข้อมูล ปล่อยช่องข้อมูล ^ป หมายความว่าอักขระควบคุมต่อไปนี้ควรถือเป็นข้อมูลแทนที่จะเป็นอักขระควบคุม
11 การควบคุมอุปกรณ์อย่างใดอย่างหนึ่ง รหัสควบคุมอุปกรณ์ที่ 1 ^ถาม อนุญาตให้เทอร์มินัลส่งออกข้อมูลต่อไปได้
12 การควบคุมอุปกรณ์สอง รหัสควบคุมอุปกรณ์ที่ 2 ^อาร์
13 การควบคุมอุปกรณ์สาม รหัสควบคุมอุปกรณ์ที่ 3 ^ส ขัดจังหวะ (ระงับ) ข้อมูลเอาต์พุตบนเทอร์มินัลชั่วคราว
14 การควบคุมอุปกรณ์สี่ รหัสควบคุมอุปกรณ์ที่ 4 ^ต
15 การรับรู้เชิงลบ การยืนยันเชิงลบ ^ยู ใช้ในการสื่อสารแบบโทรพิมพ์
16 การทำงานแบบซิงโครนัส อักขระว่างสำหรับโหมดการถ่ายโอนแบบซิงโครนัส ^วี สายสื่อสารบางสายได้รับการออกแบบในลักษณะที่ต้องการการถ่ายโอนข้อมูลอย่างต่อเนื่อง หากไม่มีสิ่งใดที่จะส่ง สัญลักษณ์นี้จะถูกส่งไป
17 สิ้นสุดการส่งผ่านบล็อก จุดสิ้นสุดของบล็อกข้อมูลที่ส่ง ^ว
18 ยกเลิก การยกเลิก ^เอ็กซ์ ข้อมูลที่มาก่อนหน้าไม่ถูกต้อง (ปกติจะเป็นบรรทัดเดียว)
19 จุดสิ้นสุดของสื่อ จุดสิ้นสุดของสื่อ ^ย ใช้ เช่น เมื่อเทปพันช์หมด เป็นต้น
1เอ ทดแทน ตัวละครทดแทน ^ซ แทนที่อักขระที่ความหมายสูญหายระหว่างการถ่ายทอด ใน CP/M และ MS-DOS ใช้เพื่อระบุจุดสิ้นสุด ไฟล์ข้อความและจุดสิ้นสุดของข้อมูลที่ป้อนจากคอนโซล (แม้ว่าอักขระ ^C และ ^D จะมีจุดประสงค์เพื่อการนี้ก็ตาม) บาง โปรแกรมแก้ไขข้อความภายใต้ DOS นั้น ^Z จะถูกเพิ่มโดยอัตโนมัติที่ส่วนท้ายของไฟล์
1B หนี ทะเบียนสำรองหมายเลข 2 (AR2) ^[ บ่งชี้ว่าอักขระที่ตามมามีความหมายอื่นนอกเหนือจากที่กำหนดไว้ใน ASCII โดยทั่วไปแล้วจะเริ่มลำดับการหลีกเลี่ยง
1ซี ตัวแยกข้อมูลสี่ (ตัวแยกไฟล์) ตัวแยกข้อมูล #4 (ตัวแยกไฟล์) ^\
1D ตัวแยกข้อมูลสาม (ตัวแยกกลุ่ม) ตัวแยกข้อมูล #3 (ตัวแยกกลุ่ม) ^]
1จ ตัวแยกข้อมูลสอง (ตัวแยกบันทึก) ตัวแยกข้อมูล #2 (ตัวแยกบันทึก) ^^ เห็นได้ชัดว่ามีจุดประสงค์เพื่อแยกบันทึกในฐานข้อมูล แต่แทบไม่เคยใช้สำหรับสิ่งนี้เลย
1F ตัวแยกข้อมูล ONE (ตัวแยกหน่วย) ตัวแยกข้อมูล #1 (ตัวแยกฟิลด์) ^_ เห็นได้ชัดว่ามีจุดประสงค์เพื่อแยกฟิลด์ในฐานข้อมูล แต่แทบไม่เคยใช้สำหรับสิ่งนี้เลย
7เอฟ ลบ การลบ ^? ออกแบบมาเพื่อเจาะตัวอักษรที่เจาะผิดบนเทปพันช์ 7 แทร็ก (เนื่องจากระบุด้วยการเจาะรูในทุกแทร็ก) ดังนั้นจึงเทียบเท่ากับอักขระว่าง (\0) บนเทอร์มินัลสามารถสร้างได้โดยการกดปุ่ม Backspace หรือ Delete

อักขระควบคุม ISO 8859

80 ,PADDING CHARACTER อักขระตัวยึดตำแหน่ง

81 , พรีเซ็ตออคเต็ตสูง, ???.

82 , อนุญาต BREAK ที่นี่ อนุญาตให้ใช้ตัวแบ่งบรรทัดที่นี่

83 , NO BREAK HERE ไม่อนุญาตให้ขึ้นบรรทัดใหม่ที่นี่

84 , ดัชนี ???.

85 บรรทัดถัดไป บรรทัดถัดไป- ป้อนบรรทัดพร้อมกันและส่งกลับตำแหน่งการพิมพ์ไปที่จุดเริ่มต้นของบรรทัด (เทียบเท่ากับ \r\n)

86 ,จุดเริ่มต้นของพื้นที่ที่เลือก, จุดเริ่มต้นของพื้นที่ที่เลือก

87 , จุดสิ้นสุดของพื้นที่ที่เลือก, จุดสิ้นสุดของพื้นที่ที่เลือก

88 , CHARACTER TABULATION SET กำหนดตำแหน่งการจัดตารางแนวนอน

89 ,CHARACTER TABULATION WITH JUSTIFICATION กำหนดตำแหน่งและการจัดตำแหน่งของแท็บแนวนอน

8เอ, LINE TABULATION SET กำหนดตำแหน่งการจัดตารางแนวตั้ง

8B, PARTIAL LINE FORWARD, การป้อนบรรทัดบางส่วนไปข้างหน้า

8ซี, PARTIAL LINE BACKWARD, ป้อนบรรทัดบางส่วนกลับ

8D, REVERSE LINE FEED, การป้อนเส้นย้อนกลับ

8E, SINGLE SHIFT TWO ค่าที่ 2 สำหรับอักขระถัดไป

8F, SINGLE SHIFT THREE ค่าที่ 3 สำหรับอักขระถัดไป

90 , DEVICE CONTROL STRING, สตริงควบคุมอุปกรณ์

91 , ใช้งานส่วนตัว, ตัวละครผู้ใช้ #1

92 , ใช้งานส่วนตัวสอง, สัญลักษณ์ผู้ใช้ #2

93 , SET TRANSMIT STATE, การตั้งค่าโหมดการส่งสัญญาณ

94 , CANCEL CHARACTER สัญลักษณ์การยกเลิก

95 , MESSAGE WAITING มีข้อความเข้ามา

96 ,จุดเริ่มต้นของพื้นที่คุ้มครอง จุดเริ่มต้นของพื้นที่คุ้มครอง

97 , จุดสิ้นสุดของพื้นที่คุ้มครอง, จุดสิ้นสุดของพื้นที่คุ้มครอง

98 , START OF STRING, จุดเริ่มต้นของบรรทัด

99 , SINGLE GRAPHIC CHARACTER INTRODUCER อักขระต่อไปนี้ถูกตีความว่าเป็นกราฟิกพิเศษ

9เอ, SINGLE CHARACTER INTRODUCER อักขระถัดไปจะถูกตีความว่าเป็นอักขระควบคุม

9B, ผู้แนะนำลำดับการควบคุม, เริ่มต้น ลำดับการควบคุม- โดยทั่วไปอักขระนี้จะเทียบเท่ากับ Escape+[

9ซี, STRING TERMINATOR, สิ้นสุดบรรทัด

9D, OPERATING SYSTEM COMMAND, คำสั่งระบบปฏิบัติการ

9E, ข้อความความเป็นส่วนตัว, ข้อความลับ

9F, คำสั่งโปรแกรมแอปพลิเคชัน, คำสั่งโปรแกรมแอปพลิเคชัน

อักขระควบคุม Unicode

034ฟ, การรวม GRAPHEME JOINER รวมอักขระทางซ้ายและขวา (สร้างอักษรควบ)

200B, พื้นที่ ZERO-WIDTH, พื้นที่ความกว้างเป็นศูนย์ อาจขยายได้เมื่อจัดแนวให้กว้าง

200C, ความกว้างเป็นศูนย์ที่ไม่ใช่ช่างไม้ ห้ามการก่อตัวของมัด

200D, ช่างไม้ความกว้างเป็นศูนย์ อนุญาตให้มีการก่อตัวของเอ็น

200E,เครื่องหมายจากซ้ายไปขวา เขียนจากซ้ายไปขวา

200F, เครื่องหมายจากขวาไปซ้าย เขียนจากขวาไปซ้าย

2028 , LINE SEPARATOR, ตัวคั่นบรรทัด แยกบรรทัดข้อความ แต่ไม่ใช่ย่อหน้า

2029 , ย่อ SEPARATOR, ตัวคั่นย่อหน้า แยกย่อหน้าของข้อความ

202เอ,การฝังจากซ้ายไปขวา จุดเริ่มต้นของข้อความที่เขียนจากซ้ายไปขวาภายในข้อความที่เขียนจากขวาไปซ้าย

202B, การฝังจากขวาไปซ้าย จุดเริ่มต้นของข้อความที่เขียนจากขวาไปซ้ายภายในข้อความที่เขียนจากซ้ายไปขวา

202C, การจัดรูปแบบทิศทางป๊อป ส่วนท้ายของข้อความที่แทรกไปในทิศทางอื่น

202Dแทนที่จากซ้ายไปขวา แทนที่ข้อความที่เขียนจากซ้ายไปขวาด้วยข้อความที่เขียนจากขวาไปซ้าย

202E, แทนที่จากขวาไปซ้าย แทนที่ข้อความที่เขียนจากขวาไปซ้ายด้วยข้อความที่เขียนจากซ้ายไปขวา

2060 , WORD JOINER, ตัวเชื่อมต่อคำ

FE01FE0F, VARIATION SELECTOR-1...16, การเลือกตัวเลือกสไตล์หมายเลข 1... หมายเลข 16

เฟฟ, ZERO WIDTH NO-BREAK SPACE / BYTE ORDER MARK, ตัวบ่งชี้ลำดับพื้นที่ไม่แบ่งความกว้างเป็นศูนย์ / ไบต์ สัญลักษณ์นี้ใช้เพื่อบ่งบอกว่า ไฟล์นี้เขียนเป็น UTF-16 หรือ UTF-32 โดยมีลำดับไบต์เฉพาะ (เนื่องจากไม่มีอักขระ FFFE และ UTF-8 ไม่ได้ใช้ไบต์ FE และ FF) โดยใช้สัญลักษณ์นี้ว่า พื้นที่ไม่ทำลายไม่แนะนำให้ใช้ความกว้างเป็นศูนย์ มีสัญลักษณ์ U+2060 (ตัวเชื่อมคำ) สำหรับสิ่งนี้

FFFD, การแทนที่อักขระ การแทนที่อักขระ ใช้เมื่อไม่ทราบความหมายของอักขระหรือไม่สามารถแสดงเป็น Unicode ได้ (ดูอักขระ 1A ด้วย)

E0100E01EF, VARIATION SELECTOR-17...256, ตัวเลือกสไตล์หมายเลข 17...หมายเลข 256

การเข้ารหัสอักขระ
พื้นฐาน → ข้อความตัวอักษร (ข้อมูลไฟล์) การแปลงชุดอักขระ
การเข้ารหัสในอดีต → ส่วนเสริม: เซมาฟอร์ (Makarova) Morse Baudot MTK-2 Comp.: ซอฟต์สตาร์ทเตอร์ 6 บิต RADIX-50 EBCDIC (DKOI-8) KOI-7 ISO 646
ทันสมัย
ตัวแปร
8 บิต
ปัจจุบัน
ความเกียจคร้าน
ตัวอักษร → แอสซิส ( ผู้จัดการพิมพ์) ไม่ใช่ ASCII (นามแฝง)
8 บิต รหัส.เพจ หลากหลาย → ซีริลลิก: KOI-8 GOST 19768-87 MacCyrillic
ISO 8859 → 1(ละติน) 5 (ไซรัส.) 12 15(€)
หน้าต่าง → 1251(ไซรัส.) 1255 1256 1257 1258 | WGL4
ไอบีเอ็ม&ดอส → 866 "อัลโต"(MIC) (สถาบันวิจัยคอมพิวเตอร์)

ข้อความที่พิมพ์ดีดประกอบด้วยอักขระที่พิมพ์ - สัญลักษณ์กราฟิก
สัญลักษณ์กราฟิกคือสัญลักษณ์ที่มีการแสดงในข้อความ
สัญลักษณ์กราฟิกทั้งหมดถูกรวบรวมไว้ในชุดเดียว ระบบสากลยูนิโค้ด
แทรก สัญลักษณ์กราฟิก Unicode เป็นเอกสาร html
- จุดประสงค์หลักและเพียงอย่างเดียวสำหรับตารางนี้

คุณสามารถแทรกสัญลักษณ์ลงในเอกสาร HTML ได้ด้วยวิธีใดวิธีหนึ่งต่อไปนี้:

  1. คัดลอกรูปภาพสัญลักษณ์จากหน้าต่างเบราว์เซอร์ไปยังหน้าต่างของโปรแกรมแก้ไข Visual html ของคุณ
  2. คัดลอกโค้ด html ของสัญลักษณ์ลงในโค้ดของเอกสาร html โดยตรง
โปรดเข้าใจว่านี่เป็นสองวิธีที่แตกต่างกัน:
  1. แทรกภาพลงในภาพ
  2. ใส่รหัสลงในรหัส

แบบอักษรสำหรับสัญลักษณ์ ขนาด และสีใน HTML สามารถตั้งค่าได้ด้วยโค้ดดังนี้:
ตัวละคร_รหัส
ที่ไหน,
Arial - แบบอักษร
10px - ขนาดตัวอักษรเป็นพิกเซล
#ff0000 - รหัสสีตัวอักษร (สีแดง)

ตัวอย่างเช่น:
☎ - ขนาดตัวอักษรตัวอักษร 30px,
☎ - ตัวอักษรสัญลักษณ์ขนาด 30px สี - แดง
☎ - ขนาดตัวอักษรตัวอักษร 20px,
☎ - ตัวอักษรสัญลักษณ์ขนาด 10px.
บันทึก แบบอักษรที่แนะนำสำหรับการแทรกอักขระพิเศษ ได้แก่ Arial, Verdana และ Tahoma แบบอักษรเหล่านี้แสดงอักขระ Unicode อย่างถูกต้อง และในทางกลับกัน แบบอักษรเหล่านี้ก็ได้รับการสนับสนุนอย่างถูกต้องจากเว็บแอปพลิเคชัน

  1. "เครื่องหมาย"
    (แสดงสัญลักษณ์ที่มองเห็นได้)
    จากคอลัมน์นี้ คุณสามารถคัดลอกภาพสัญลักษณ์และวางลงในหน้าต่างได้ โปรแกรมแก้ไขข้อความ html- สัญลักษณ์จะถูกคัดลอกด้วยขนาดตัวอักษร 20px หลังจากการคัดลอกเสร็จสิ้น อาจจำเป็นต้องปรับขนาดแบบอักษรทีละตัวอักษรให้เป็นอักขระที่คัดลอกโดยตรง
  2. "ชื่อ"
    (เฉพาะที่สำคัญหรือ ตัวละครแปลก ๆ)
    คำอธิบายวัตถุประสงค์ของสัญลักษณ์ ขอบเขต ตัวอย่าง...
  3. "การช่วยจำ"
    ตัวช่วยจำคือการสร้างตัวอักษรในรูปแบบ " ซึ่งแสดงถึงรหัสตัวอักษรของอักขระใน HTML โดยจะถูกแทรกลงในโค้ด html ของเอกสาร html โดยตรง ตัวช่วยจำเป็นที่นิยมอย่างมากในหมู่นักออกแบบเลย์เอาต์มืออาชีพ พวกมันถูกจดจำได้อย่างสมบูรณ์แบบโดยมนุษย์และ ได้รับการสนับสนุนโดยแอปพลิเคชัน html ทั้งหมด ตัวช่วยจำแต่ละตัวมีชื่อตัวอักษร (การกำหนด ) ของสัญลักษณ์ของคุณและ ป้ายบริการ(&) ซึ่งทำหน้าที่เป็นสัญญาณให้เบราว์เซอร์อ่านโค้ดและไม่แสดงบนหน้าจอมอนิเตอร์ ชื่อช่วยในการช่วยจำแต่ละชื่อมีเอกลักษณ์เฉพาะตัวและอ่านง่ายเนื่องจากได้มาจากคำภาษาอังกฤษที่แสดงลักษณะของสัญลักษณ์

    Mnemonics (กรีก) - ศิลปะแห่งการจดจำบางสิ่ง การช่วยจำใช้เพื่ออำนวยความสะดวกในการรับรู้ข้อมูลที่ยากต่อการจดจำเมื่อวัตถุของการท่องจำถูกทำให้เข้าสู่สถานะเชื่อมโยงกับบางสิ่งบางอย่าง

  4. "รหัส"
    รหัส - ตัวเลข รหัสทศนิยมอักขระใน HTML เช่น & แทรกโดยตรงลงในโค้ด html ของเอกสาร html รหัสทศนิยมประกอบด้วยตัวเลขที่ระบุ หมายเลขซีเรียลอักขระในระบบ Unicode และอักขระบริการหลายตัว (& และ #) ซึ่งทำหน้าที่เป็นสัญญาณให้เบราว์เซอร์อ่านโค้ดและไม่แสดงบนหน้าจอมอนิเตอร์ รหัสทศนิยมมีการใช้กันอย่างแพร่หลายและใช้กันอย่างแพร่หลายเนื่องจากมีความคล่องตัวและง่ายต่อการรับรู้

อักขระควบคุมในรูปแบบ HTML (XHTML)

อักขระควบคุมใน HTML (XHTML) คืออักขระบริการของภาษา HTML ที่ใช้ในโครงร่าง HTML ของเว็บเพจ เบราว์เซอร์ใด ๆ จะต้องรองรับอักขระเหล่านี้ เนื่องจากหากไม่มีพวกมันจึงไม่สามารถแสดงข้อความ HTML ได้อย่างถูกต้อง อักขระควบคุมจะไม่แสดงในข้อความ และเมื่อป้อนโดยตรงจากแป้นพิมพ์ เบราว์เซอร์จะตีความว่าเป็นเครื่องหมายวรรคตอนเรียกร้องให้ดำเนินการบางอย่างเมื่อวาดหน้าบนหน้าจอ

คุณสามารถใช้อักขระควบคุมได้ ข้อความธรรมดาซึ่งเป็นสัญลักษณ์ของแนวคิดสากลและเบราว์เซอร์ตีความว่าเป็นอักขระตัวพิมพ์ธรรมดา เมื่อใช้สัญลักษณ์บริการในข้อความ HTML ในลักษณะนี้ ไม่จำเป็นต้องป้อนค่าของสัญลักษณ์ แต่เป็นโค้ด HTML เพราะขอย้ำอีกครั้งไม่เช่นนั้นเบราว์เซอร์จะรับรู้สัญลักษณ์บริการเป็นการเรียกร้องให้ดำเนินการและจะแสดงข้อความ HTML บนหน้าจอมอนิเตอร์ไม่ถูกต้อง

เบราว์เซอร์ทั้งหมดรู้จักและเข้าใจอักขระควบคุมและโค้ด HTML โดยไม่มีข้อยกเว้น ซึ่งไม่สามารถพูดได้เกี่ยวกับอักขระอื่น ๆ ที่อาจแสดงไม่ถูกต้อง เบราว์เซอร์ที่แตกต่างกันหรือแย่กว่านั้นคือไม่มีการแสดงเลย

ไวยากรณ์และเครื่องหมายวรรคตอน

ปริภูมิความยาว N (ปริภูมิปกติ)
ช่องว่างความยาว M (ช่องว่างยาว)
- ยัติภังค์แบบอ่อน (อักขระที่ไม่สามารถพิมพ์ได้) - ­
ยัติภังค์ –
- เส้นประที่มีความยาว N (เส้นประปกติ) -
เส้นประของความยาว M (em เส้นประ)
. จุด .
, ลูกน้ำ ,
จุดไข่ปลา …
: ลำไส้ใหญ่ :
; อัฒภาค ;
! เครื่องหมายอัศเจรีย์ !
ǃ
? เครื่องหมายคำถาม ?
@ "สุนัข" @
* "ดาว" *
# "ขัดแตะ" #
เครื่องหมายคำพูดซ้ายบนเดี่ยว ‘
เครื่องหมายคำพูดขวาบนอันเดียว ’
เครื่องหมายคำพูดขวาล่างอันเดียว ‚
เครื่องหมายคำพูดซ้ายบนคู่ “
เครื่องหมายคำพูดขวาบนคู่ ”
เครื่องหมายคำพูดขวาล่างคู่ &bdquo „
« ซ้ายสองครั้ง คำพูดมุม(มาตุภูมิ) « «
» เครื่องหมายคำพูดมุมขวาคู่ (มาตุภูมิ) » »
́ เครื่องหมายเน้นเสียง เช่น วาสยา ́
" เครื่องหมายอะพอสทรอฟีตัวอย่าง: คุณ "ฉัน "
´ เฉียบพลันตัวอย่าง: Vasya ´ ´
ย่อหน้า (อักขระที่ไม่สามารถพิมพ์ได้)
§ ย่อหน้า § §
ˆ สำเนียง (นกคว่ำ) ˆ ˆ
ˆ
˜ ตัวหนอนขนาดเล็ก ˜ ˜
˜
¦ เส้นประแนวตั้ง ¦ ¦
( วงเล็บซ้าย (
) วงเล็บขวา )
วงเล็บมุมซ้าย
วงเล็บมุมขวา
วงเล็บมุมซ้าย, ตัวเลือก
วงเล็บมุมขวาตัวเลือก
[ วงเล็บเหลี่ยมด้านซ้าย [
] วงเล็บเหลี่ยมด้านขวา ]
/ สแลช - อักขระสแลช /
\ แบ็กสแลช \
เครื่องหมายทับ (เครื่องหมายแบ่ง)
ǀ แถบแนวตั้ง ǀ
ǁ แถบแนวตั้งคู่ ǁ
ที่ทับซ้อนกัน เช่น วาสยา‾วาสยา
¯ มาครง เช่น วัชยวาสยะ ¯ ¯

เครื่องหมายการค้าและสกุลเงิน

+ บวก + +
ลบ -
= เท่ากับ =
± บวกหรือลบ ± ±
× เครื่องหมายคูณ × ×
÷ สัญลักษณ์การแบ่ง ÷ ÷
ตัวดำเนินการจุด (กลางบรรทัด) ·
ตัวดำเนินการเครื่องหมายดอกจัน (กลางบรรทัด)
ตัวดำเนินการตัวหนอน
. เครื่องหมายรายการ (กลางบรรทัด) . •
¹ ตัวยก "1" ¹ ¹
² ตัวยก "2" ² ²
³ ตัวยก "3" ³ ³
ตัวยกและตัวห้อยใน HTML (XHTML)
สามารถแทรกได้โดยใช้แท็ก และ ตามลำดับ:
ตัวเลข ตัวยก→ ตัวยก NUMBER
ตัวเลข ตัวห้อย→ ตัวห้อย NUMBER
½ เศษส่วน "ครึ่งหนึ่ง" ½ ½
เศษส่วน "หนึ่งในสาม"
¼ เศษส่วน "หนึ่งในสี่" ¼ ¼
¾ เศษส่วน "สามในสี่" ¾ ¾
เครื่องหมายหมายเลข
% เปอร์เซ็นต์ %
ppm ‰
° องศา ° °
นายกรัฐมนตรี (นาที ฟุต)
นายกคู่ (วินาที นิ้ว)
ตัวอย่างที่ 1: 30° 25′ 12″
ตัวอย่างที่ 2: 25' 12
µ ไมโคร µ µ
π พาย π π
ƒ เครื่องหมายฟังก์ชั่น
(อย่าสับสนกับ "ปริพันธ์")
ƒ ƒ
ƒ
บูรณาการ
ข้ามศูนย์ เซตว่าง
(อย่าสับสนกับ "เส้นผ่านศูนย์กลาง")
เส้นผ่านศูนย์กลาง (อย่าสับสนกับอักษรละติน "o") ที่ขีดฆ่า
ø ละติน "o" ขีดฆ่าในแนวทแยง ø ø
Ø อักษรละตินตัวพิมพ์ใหญ่ "O" ขีดฆ่าออกในแนวทแยง Ø Ø
เครื่องหมายการทำงาน
เครื่องหมายผลรวม
หัวรุนแรง
(รากที่สองหรือรากของ x)
ตามสัดส่วน
อนันต์
มุม
ตั้งฉาก (ตั้งฉาก)
ลงชื่อ "ดังนั้น"
ประมาณเท่ากัน
เกือบจะเท่ากัน
ไม่เท่ากัน
เหมือนกัน
น้อยกว่าหรือเท่ากับ
มากกว่าหรือเท่ากับ
ตรรกะและ
ตรรกะหรือ
บวกเครื่องหมายเป็นวงกลม
(จำนวนเงินโดยตรง)
เครื่องหมายคูณในวงกลม
(ผลคูณกากบาท ลูกศรจากผู้สังเกต)
ʘ จุดเป็นวงกลม
(ลูกศรชี้ไปที่ผู้สังเกต)
ʘ

✵ ✵