การจดจำข้อความ การแปลงวัสดุเก็บถาวรให้เป็นดิจิทัลโดยใช้วิธีการชั่วคราว

โปรแกรมฟรีสำหรับ การรับรู้อัตโนมัติข้อความที่สแกน โปรแกรมดูไม่เหมือนคาราเมล แต่รู้เนื้อหาต่างๆ

คอมพิวเตอร์ได้เข้าสู่ชีวิตของประชาชนทั่วไปอย่างมั่นใจแล้ว เมื่อคุณต้องการข้อมูลการพิมพ์จำนวนไม่มากนัก วิธีที่ง่ายที่สุดคือการพิมพ์ข้อความด้วยตนเองโดยใช้โปรแกรมแก้ไขข้อความ

อย่างไรก็ตาม บางครั้งคุณจำเป็นต้อง "เขียนใหม่" หนังสือทั้งเล่ม ในกรณีเช่นนี้ การใช้เครื่องสแกนถือเป็นเรื่องสมเหตุสมผลที่สุด แต่เครื่องสแกนเองก็ทำสำเนาข้อความเท่านั้นซึ่งไม่สามารถแก้ไขได้ในทางใดทางหนึ่ง ในการเปลี่ยนแปลงข้อมูลในรูปภาพที่ได้ คุณต้องทำการจดจำเอกสาร

ผู้นำที่ไม่มีปัญหาในเรื่องนี้คือระบบ OCR (การรู้จำอักขระด้วยแสง) จาก Abbyy - FineReader แต่มันมีราคาค่อนข้างแพงและไม่ใช่ทุกคนจะมีเครื่องมือดังกล่าวในคลังแสงได้ วันนี้เราจะมาทำความรู้จักกับ ทางเลือกฟรี Fine Reader - โปรแกรม คูเนอิฟอร์ม- ฉันจะพาคุณไป ตารางเปรียบเทียบคุณสมบัติของทั้งสองแพ็คเกจ:

การเปรียบเทียบเครื่องมือรู้จำข้อความ CuneiForm กับ FineReader แบบอะนาล็อกที่ต้องชำระเงิน

อย่างที่คุณเห็น หากคุณต้องการจดจำข้อความได้ฟรี คุณจะต้องยอมจำนนต่อบางสิ่ง สิ่งแรกที่คุณต้องทำใจคือ CuneiForm ไม่สามารถทำงานร่วมกับสแกนเนอร์บางตัวได้ (โดยเฉพาะสแกนเนอร์ MFP) ดังนั้นคุณจะต้องสแกนเอกสารโดยใช้ คุณสมบัติมาตรฐานหน้าต่าง ประการที่สอง คุณต้องตรวจสอบความละเอียดในการสแกน

เนื่องจาก CuneiForm ไม่สามารถจัดการได้ ไฟล์ขนาดใหญ่(มากกว่า 100 KB) และยิ่งความละเอียดสูงเท่าไร ขนาดใหญ่ขึ้นสแกนไฟล์ แต่คุณภาพของการรู้จำข้อความในโปรแกรมนั้นสูงกว่าคู่แข่งที่ต้องชำระเงินมาก ตัวเลือกที่ดีที่สุดพารามิเตอร์การสแกนจะเป็น 200 dpi (เป็นไปได้มากกว่านี้ แต่ก็มีโอกาสที่โปรแกรมจะหยุดทำงาน)

จำนวนภาษาก็มีน้อยเช่นกัน แต่ก็มีภาษาหลักอยู่ ยิ่งไปกว่านั้น แม้ว่าจะเป็นไปไม่ได้ที่จะรวมภาษาเข้าด้วยกัน แต่ CuneiForm ก็มีโหมดการจดจำภาษาอังกฤษ-รัสเซียแบบผสม! นี่คือจุดสิ้นสุดข้อเสีย :) คุณสามารถเริ่มการติดตั้งได้

การติดตั้ง CuneiForm

ไม่มีปัญหาใด ๆ เนื่องจากตัวติดตั้งจะช่วยคุณได้ แค่วิ่ง ไฟล์การติดตั้งและปฏิบัติตามคำแนะนำ หลังการติดตั้ง เมนู Start จะปรากฏขึ้น ส่วนใหม่- เปิดและเปิด CuneiForm

อินเตอร์เฟซโปรแกรม

อินเทอร์เฟซของ CuneiForm นั้นเรียบง่ายกว่า Fine Reader มากและแทบไม่ต้องกำหนดค่าใดๆ เลย สามารถควบคุมโปรแกรมได้อย่างเต็มที่ด้วยปุ่มบนแถบเครื่องมือ มาดูรายละเอียดเพิ่มเติม:

โปรแกรมสามารถทำงานในโหมดวิซาร์ดซึ่งเปิดใช้งานโดยปุ่มแรก แต่หาก CuneiForm ไม่รองรับเครื่องสแกนของคุณ คุณควรละทิ้งโหมดนี้ ปุ่มถัดไปจะเริ่มกระบวนการสแกน (อีกครั้ง หากมีการรองรับเครื่องสแกน) คุณอาจสังเกตเห็นลูกศรเล็กๆ บนปุ่มนี้และปุ่มต่อไปนี้ เมื่อคลิกที่พวกมันเราจะสามารถเข้าถึงฟังก์ชันเพิ่มเติมบางอย่างได้

การทำงานกับ CuneiForm

ตอนนี้เรามาลองใช้ CuneiForm ในทางปฏิบัติกันดีกว่า หากโปรแกรมรองรับสแกนเนอร์ของคุณ ปุ่มแรกที่คุณควรคลิกคือ "รับรูปภาพ" หากเป็นไปไม่ได้ เราจะเปิดการสแกนแบบสำเร็จรูป (รองรับ รูปแบบ JPG, GIF, BMP, PNG (ไม่ถูกต้องเสมอไป) รวมถึง TIF (เต็มขอบเขต)

ตอนนี้คุณต้องทำเครื่องหมาย ช่วยระบุบล็อกที่ประกอบเป็นเพจ รองรับการรับรู้บล็อกในรูปแบบของข้อความ (กรอบสีน้ำเงิน) รูปภาพ (กรอบสีเขียว) หรือตาราง (กรอบสีส้ม) (การทำเครื่องหมายอัตโนมัติสามารถแก้ไขได้ด้วยตนเองโดยใช้ เมนูบริบทปิดกั้น).

เมื่อทำเครื่องหมายข้อความแล้ว ก็ถึงเวลาทำการจดจำ โดยคลิกปุ่มถัดไป เมื่อสิ้นสุดกระบวนการจดจำ ข้อความจะแสดงในหน้าต่างการทำงาน ซึ่งสามารถแก้ไขได้ในโปรแกรมแก้ไขข้อความในตัวขนาดเล็กที่คล้ายกับ ไมโครซอฟต์ เวิร์ด- ในเวลาเดียวกันคุณจะสามารถเห็นคำที่โปรแกรม "ไม่แน่ใจ" ได้ทันที (ไฮไลต์สีน้ำเงิน) และมีข้อผิดพลาด (ตัวอักษรที่น่าสงสัย - สีชมพู)

และสุดท้าย หลังจากแก้ไขสำเร็จแล้ว คุณก็สามารถบันทึกผลงานของเราได้ คลิกปุ่มสุดท้ายบนแถบเครื่องมือแล้วบันทึกข้อความเป็นไฟล์ RTF, HTML หรือ TXT

หากคุณต้องการมากกว่านี้ คุณสามารถเลือกตัวเลือกการส่งออกไปยังหนึ่งในโปรแกรมที่เสนอได้โดยคลิกที่ลูกศรด้านข้าง (Microsoft Word, Excel หรือ Euphrates)

ดูภาพหน้าจอก่อนหน้า แน่นอนคุณสังเกตเห็นว่าใน เมนูเพิ่มเติมปุ่มเริ่มต้นด้วย "มาร์กอัป" และลงท้ายด้วย "บันทึก" จะมีรายการ "อัตโนมัติ" อยู่ท้ายรายการ การเปิดใช้งานตัวเลือกนี้จะทำให้คุณไม่ต้องกดปุ่มที่เลือก นั่นคือคุณสามารถทำให้กระบวนการสแกนเป็นอัตโนมัติจนถึงจุดที่คุณจะเปิดเท่านั้น เอกสารใหม่- CuneiForm ที่เหลือจะจัดการเอง!

การตั้งค่า CuneiForm ทั่วไป

ในตอนแรกโปรแกรมได้รับการกำหนดค่าอย่างเหมาะสมที่สุด แต่หากคุณต้องการเปลี่ยนแปลงบางอย่างเพียงไปที่เมนู "ไฟล์" แล้วเลือก " การตั้งค่าทั่วไป- ซึ่งอาจเป็นประโยชน์สำหรับการเปลี่ยนภาษาและพารามิเตอร์อื่นๆ สำหรับการจดจำ การจัดรูปแบบ และการสแกนข้อความ

การรับรู้แบทช์

เราอาจดำเนินการเสร็จสิ้นได้หากแพ็คเกจ CuneiForm ไม่มียูทิลิตี้อื่น เปิด "Start" อีกครั้งและในโฟลเดอร์โปรแกรมคุณจะพบแอปพลิเคชันอื่น - "Batch Recognition" ลองนึกภาพการสแกนหนังสือทั้งเล่ม! และตอนนี้เราต้องรับรู้มัน!!! หากคุณเปิดไฟล์สแกนแต่ละไฟล์แยกกัน อาจใช้เวลานาน แต่โหมดแบทช์ช่วยให้คุณระบุได้ ไฟล์ที่จำเป็นและโปรแกรมจะจัดการส่วนที่เหลือเอง

ก่อนอื่นคุณต้องสร้าง แพ็คเกจใหม่ไฟล์. คลิกปุ่มที่เหมาะสมและปฏิบัติตามคำแนะนำของวิซาร์ดที่เปิดใช้งาน:

เมื่อการจดจำเสร็จสมบูรณ์ คุณจะสามารถดูเอกสารที่ได้รับการยอมรับทั้งหมดในหน้าต่างหลัก หากการจดจำสำเร็จในแผงด้านซ้ายคุณจะพบเพียงสองรายการที่ใช้งานอยู่: "ต้นฉบับ" และ "ดำเนินการแล้ว" หากมีไฟล์ที่ไม่สามารถจดจำได้ เราจะพบไฟล์เหล่านั้นในส่วน “ข้อผิดพลาด”

ข้อสรุป

CuneiForm มีศักยภาพที่ดีอย่างชัดเจน แต่การพัฒนาค่อนข้างช้า แม้จะเปิดให้บริการแล้วก็ตาม ซอร์สโค้ดเห็นได้ชัดว่าบริษัท Cognitive ต้องการนักพัฒนาอย่างมาก เนื่องจากความคืบหน้าไม่ได้ปรากฏมานานนัก เราหวังได้เพียงว่าสิ่งต่างๆ จะเดินหน้าต่อไปและโปรแกรมจะดียิ่งขึ้นไปอีก แต่ตอนนี้เราพอใจกับสิ่งเล็กๆ น้อยๆ เท่านั้น แต่มันเล็กขนาดนั้นจริงๆเหรอ... ทางเลือกเป็นของคุณ!

สมัครรับบทเรียนวิดีโอใหม่!

กิจกรรมหลักของฉันเกี่ยวกับการถ่ายภาพมาหลายปีแล้ว ดังนั้นเมื่อท่องอินเทอร์เน็ต ฉันจึงให้ความสำคัญกับการออกแบบและภาพประกอบมากกว่าข้อความ เมื่อฉันเจอภาพถ่ายเกี่ยวกับการระเบิดใน Medeo ระหว่างการก่อสร้างเขื่อนบนอินเทอร์เน็ต สำหรับฉันแล้วดูเหมือนว่าคุณภาพของภาพถ่ายจะดีกว่านี้ การค้นหาภาพก็ไม่ได้ให้ผลลัพธ์ที่น่าพอใจเช่นกัน: พบภาพถ่ายอีกสองสามภาพ แต่ก็ยังห่างไกลจากอุดมคติ ภาพถ่ายที่ดีมีบางอย่างบนอินเทอร์เน็ต แต่มีเอกสารไม่ดีจนเครื่องมือค้นหาไม่พบ จากนั้นฉันก็ตัดสินใจพยายามแปลงข้อมูลเป็นดิจิทัลและโพสต์สิ่งที่อยู่ในแฟ้มเอกสารของพ่อฉัน ก่อนอื่นนี่คืออัลบั้ม A3 ที่มีรูปถ่ายสีวางอยู่ในนั้นและบทความหลายบทความที่มีรูปถ่ายเกือบเหมือนกัน แต่มีรูปถ่ายขาวดำพิมพ์แบบออฟเซ็ต จริงอยู่ ภาพถ่ายปี 1967 มีสีเหลืออยู่เพียงเล็กน้อย และฉันไม่แน่ใจว่าสีในนั้นเหมาะแต่เดิม

แต่ความพยายามนี้ไม่ใช่การทรมาน ดังนั้นภารกิจจึงถูกกำหนดให้ทำภาพถ่ายดิจิทัล แปลงดิจิทัลและจดจำข้อความ และแทรกข้อความประกอบในไฟล์ภาพถ่าย ฉันไม่ได้ตั้งใจจะทำงานด้วย ปริมาณมากวัสดุและใช้อุปกรณ์และโปรแกรมระดับมืออาชีพสำหรับสิ่งนี้ ฉันแค่อยากจะทราบว่าเป็นไปได้หรือไม่ที่จะทำงานนี้โดยใช้วิธีการชั่วคราวและอุปกรณ์และโปรแกรมใดที่เหมาะสมที่สุดสำหรับสิ่งนี้

การใช้วิธีชั่วคราวหมายความว่าฉันมีสแกนเนอร์รวมอยู่ด้วยเท่านั้น ซัมซุง เอ็มเอฟพี SCX 4200 นี่คือเครื่องสแกนประเภท CIS ฉันได้เขียนเกี่ยวกับข้อเสียของเครื่องสแกนประเภทนี้ซ้ำแล้วซ้ำอีก เช่น . นอกจากนี้ยังมีไม้บรรทัดขาวดำและการสแกนสีทำได้โดยการเปลี่ยนสีแบ็คไลท์ตามลำดับและสุดท้ายก็เป็นเพียง A4 และกระจกอยู่ด้านล่างเล็กน้อยกรอบด้านนอก

ซึ่งทำให้ยากต่อการกดภาพถ่ายขนาด A3 ลงบนกระจกให้แน่น โดยปกติแล้วการทำงานกับข้อความก็เกินพอแล้ว ฉันมีกล้องดิจิตอลหลายตัว แต่การถ่ายภาพมันกลับไม่ใช่เรื่องง่าย ปัญหาอยู่ที่แสงจ้า สำหรับการประมวลผลนั้นมีคอมพิวเตอร์และแล็ปท็อปซึ่งทั้งคู่ใช้ Slackware OS ในกรณีแรกด้วยเวอร์ชัน 13.37 และในกรณีที่สอง 14.0 ในการสื่อสารกับ MFP ได้มีการติดตั้ง Samsung Unified Driver 3.00.19 และ 4.00.31 ตามลำดับ ฉันตัดสินใจเริ่มต้นด้วยการสแกน โดยตัดสินใจว่าจะมีมากกว่านี้วิธีแก้ปัญหาง่ายๆ - ขั้นแรกเราสแกนเป็นส่วนๆ จากนั้นจึงต่อเข้าด้วยกันในโปรแกรม Hugin เมื่อนำชิ้นส่วนที่สแกนมาต่อเข้าด้วยกัน เราไม่จำเป็นต้องแก้ไขความบิดเบี้ยวของแสง ดังนั้นเมื่อถามเกี่ยวกับทางยาวโฟกัสของเลนส์ที่เราตั้งไว้ค่าสูงสุด
- ฉันตั้งไว้ที่ 1,000 มม. อย่างไรก็ตาม ปรากฎว่าจำนวนโทนเสียงที่สแกนเนอร์นี้สามารถส่งได้นั้นไม่เพียงพอสำหรับภาพถ่ายที่ซีดจาง แม้ว่าที่จริงแล้วทั้งสองซีกจะถูกสแกนโดยโปรแกรม xSane ในโหมดเดียวกัน แต่การเย็บทำให้สถานการณ์แย่ลงและมีแถบบนการเปลี่ยนแปลงที่ราบรื่น สบตาฉันช่วงไดนามิก

การถ่ายภาพในรูปแบบ Raw ช่วยให้คุณเพิ่มจำนวนการไล่สีได้อย่างมาก ดังนั้นความพยายามครั้งต่อไปจึงเกิดขึ้นด้วยกล้อง Sony NEX-5 พร้อมเลนส์ 16 มม. เนื่องจากในภาพถ่ายเป็นเพียงรูปแบบที่น่าประทับใจ ไม่ใช่รายละเอียดของภาพถ่าย ฉันจึงไม่ได้พยายามใช้พื้นที่ทั้งหมดของเมทริกซ์อย่างเต็มที่ และเพื่อหลีกเลี่ยงแสงสะท้อน ฉันจึงถ่ายภาพที่ มุมเล็กน้อยในแนวตั้งฉาก โปรแกรม DarkTable ใช้สำหรับการแปลงจาก RAW การแก้ไขสีหลัก และการแก้ไขการบิดเบือนเปอร์สเปคทีฟ

สำหรับแรสเตอร์ ภาพถ่ายขาวดำการสแกนด้วยความละเอียด 300 dpi และ xSane de-screening ก็เพียงพอแล้ว

เพื่อการรับรู้อย่างแน่นอน โปรแกรมที่ดีที่สุดวันนี้คือ FineReader Engine แต่ 150 ยูโรสำหรับใบอนุญาตสำหรับการรับรู้ 12,000 รายการต่อปีนั้นไม่ใช่ตัวเลือกที่ชัดเจนที่สามารถเรียกได้ว่าเป็นวิธีการชั่วคราว ดังนั้นฉันจึงต้องหันไปหาคู่แข่งจากยุค 90 ของศตวรรษที่ผ่านมาและดูว่าพวกเขารู้สึกอย่างไรในปัจจุบัน

ระบบการรับรู้ด้วยแสง ข้อความ CuneiFormได้รับการพัฒนาโดย บริษัท Cognitive Technologies ของรัสเซียตั้งแต่ปี 1993 รวมอยู่ในแพ็คเกจ คอเรลวาด- ในปี 1996 เป็นรายแรกในโลกที่ใช้อัลกอริธึมการรู้จำแบบปรับตัว ได้รับการพัฒนาจนถึงปี 1999 และหากเราพิจารณาเฉพาะอัลกอริธึมการจดจำด้วยแสงโดยไม่มีการประมวลผลภาพเบื้องต้นและการประมวลผลทางภาษาขั้นสุดท้าย บางทีอาจเป็นสิ่งที่ดีที่สุดและยังคงค่อนข้างดี ในปี 2008 ซอร์สโค้ดสำหรับ OCR Cuneiform ได้รับการเผยแพร่ภายใต้ใบอนุญาต BSD เวอร์ชันล่าสุดพอร์ต Linux ของ Cuneiform 1.1.0 เปิดตัวเมื่อวันที่ 19/04/11 ดูเหมือนว่าโครงการนี้จะถูกละทิ้งไป

Tesseract ได้รับการพัฒนาโดย Hewlett-Packard ตั้งแต่ปี 1985 ถึง 1998 จากนั้นจึงละทิ้งไปจนถึงปี 2006 เมื่อ Google ซื้อมันและเปิดซอร์สโค้ดภายใต้ลิขสิทธิ์ Apache 2.0 ในยุค 90 เราไม่น่าสนใจสำหรับเราแม้ว่าจะมักจะมีสแกนเนอร์มาให้ก็ตามเนื่องจากไม่รองรับภาษารัสเซียทุกวันนี้ทุกอย่างเป็นไปตามภาษาและไม่เร็วมาก แต่มีการพัฒนา เวอร์ชันเสถียรปัจจุบันคือ 3.02 ตั้งแต่วันที่ 23/10/55 และในวันที่ 4 กุมภาพันธ์ 2014 ได้มีการประกาศการเปิดตัว V3.03 (rc1)

แม้ว่าทั้งสองโปรแกรมจะมีเพียงอินเทอร์เฟซคอนโซล แต่ก็มีการพัฒนาสำหรับพวกเขา นักพัฒนาบุคคลที่สามอินเทอร์เฟซแบบกราฟิกหลายแบบ ฉันพยายามทำงานกับสองคน: YAGF และ . ปรากฎว่าอินเทอร์เฟซแบบกราฟิกใช้ความสามารถของอินเทอร์เฟซคอนโซลแตกต่างและไม่สมบูรณ์ ดังนั้นผลลัพธ์ไม่เพียงขึ้นอยู่กับโปรแกรมการจดจำเท่านั้น แต่ยังขึ้นอยู่กับอินเทอร์เฟซแบบกราฟิกด้วย เป็นที่ชัดเจนว่าชุดค่าผสมใดที่ให้ผลลัพธ์ที่ดีที่สุด

ฉันทำไม่ได้

ข้อดีของ YAGF ได้แก่ ความสามารถในการหมุนหน้าที่โหลดและทำงานร่วมกับเครื่องสแกนผ่าน xSane ซึ่งให้การตั้งค่าการสแกนที่ยืดหยุ่นมากขึ้น

OCRFeeder ทำงานผ่าน Sane และไม่อนุญาตให้คุณแก้ไขการตั้งค่าการสแกน

อย่างไรก็ตาม สามารถปรับปรุงภาพที่สแกนได้โดยใช้โมดูล Unpaper GUI ทั้งสองช่วยให้คุณสามารถจัดแนวหน้าที่หมุนได้เล็กน้อย

ข้อเสียอย่างหนึ่งของ YAGF ก็คือไม่ได้เลือกบล็อกโดยอัตโนมัติอย่างถูกต้อง ซึ่งเป็นการตัดเส้นที่ยื่นออกมาในระยะขอบ (เอฟเฟกต์นี้ไม่พบใน OCRFeeder อินเทอร์เฟซทั้งสองมีความสามารถในการจัดสรรบล็อกด้วยตนเอง) ย่อหน้าจะถูกเน้นเฉพาะเมื่อเขียนผลลัพธ์ในรูปแบบ HTML และเมื่อจดจำผ่าน CuneiForm เท่านั้น เมื่อทำงานกับ Tesseract ไม่ใช่ย่อหน้า แต่มีการเน้นบรรทัด ยัติภังค์จะถูกลบออกเมื่อทำงานกับ CuneiForm และบันทึกในโหมดข้อความเท่านั้น OCRFeeder จัดการย่อหน้าและยัติภังค์ได้ดีขึ้น โดยไม่คำนึงถึงโปรแกรมการจดจำ และบันทึกผลลัพธ์เป็นไฟล์ ODT

ฉันไม่สามารถรับมือกับตารางในโปรแกรมและอินเทอร์เฟซแบบกราฟิกรวมกันได้ โปรแกรมการจดจำมีข้อกำหนดที่แตกต่างกันเล็กน้อยสำหรับโหมดการสแกน เหล่านั้น.การรับรู้ที่ดีที่สุด

เกิดขึ้นที่คอนทราสต์และความละเอียดการสแกนที่แตกต่างกัน สำหรับ CuneiForm การเพิ่มความละเอียดสูงกว่า 200 dpi ไม่ได้ปรับปรุงคุณภาพของการจดจำ สำหรับการสแกนคุณภาพสูง ผลลัพธ์ที่ได้จะใกล้เคียงกัน แม้ว่าอาจไม่ได้รับการยอมรับก็ตาม. สัญลักษณ์ที่แตกต่างกันอินเทอร์เฟซแบบกราฟิก ช่วยให้คุณสามารถใช้โปรแกรมการจดจำที่แตกต่างกันได้แยกย่อหน้า

ดังนั้นรูปถ่ายและข้อความสำหรับรูปภาพเหล่านั้นจึงถูกแปลงเป็นดิจิทัล ตอนนี้งานคือการรวมข้อมูลนี้เข้าด้วยกัน เพื่อที่ว่าในภายหลัง แม้ว่ารูปถ่ายนั้นจะถูกนำออกจากบริบทของบทความ แต่ก็เป็นไปได้ที่จะกำหนดสิ่งที่ปรากฎในนั้นได้ ความสามารถในการแนบลายเซ็นเข้ากับไฟล์ภาพถ่ายนั้นมีมานานแล้ว แต่มีความเสี่ยงอย่างมากที่ลายเซ็นนี้จะถูกอ่านโดยโปรแกรมที่สร้างขึ้นเท่านั้น แต่ไม่มีอะไรคงอยู่ตลอดไป และมีแนวโน้มมากว่าภาพถ่ายจะอยู่ได้นานกว่าโปรแกรมนี้และ OC ที่จะสามารถใช้งานได้ นอกจากนี้ยังมีการคิดค้นการเข้ารหัสมากเกินไปสำหรับภาษารัสเซีย และความเสี่ยงที่จะเห็นรอยแตกนั้นสูงมาก ตอนนี้สถานการณ์เริ่มดีขึ้นบ้างแล้ว ดูเหมือนว่า UTF-8 จะกลายเป็นมาตรฐานหลักสำหรับทุกคน นอกจากนี้ยังมีความสอดคล้องกับฟิลด์สำหรับรายการมากขึ้นอีกด้วย มีสามมาตรฐานหลัก: EXIF, IPTC, XMP

EXIF (Exchangeable Image File Format) เป็นมาตรฐานที่ให้คุณเพิ่มได้ ข้อมูลเพิ่มเติม(เมตาดาต้า) แสดงความคิดเห็นในไฟล์นี้ อธิบายเงื่อนไขและวิธีการรับไฟล์ การประพันธ์ ฯลฯ

IPTC (International Press Telecommunications Council) คือมาตรฐานข้อมูลเมตาสำหรับภาพดิจิทัลที่ช่วยให้สามารถจัดเก็บคำอธิบายประกอบที่อธิบายเนื้อหาได้ ในตอนแรกตั้งใจที่จะใช้เฉพาะตัวอักษรละตินและแม้ว่าหลายโปรแกรมจะอนุญาตให้คุณเขียนข้อความในช่อง IPTC ได้ แต่ในการเข้ารหัสที่แตกต่างกันโอกาสที่ทุกโปรแกรมจะอ่านตัวอักษรซีริลลิกได้อย่างถูกต้องนั้นค่อนข้างต่ำ

Adobe XMP (eXtensible Metadata Platform) เป็นเทคโนโลยีที่สร้างขึ้นโดย Adobe ที่อนุญาตให้ผู้ใช้เพิ่มข้อมูลเพิ่มเติมลงในไฟล์

หากคุณสร้างลายเซ็นในมาตรฐานเหล่านี้ทั้งหมด ก็มีแนวโน้มว่าจะสามารถดูได้มากที่สุด โปรแกรมที่แตกต่างกัน, เพิ่มขึ้นอย่างรวดเร็ว. ขอแนะนำให้สร้างรายการทั้งหมดด้วยโปรแกรมเดียว เนื่องจากหากคุณทำเช่นนี้ด้วยวิธีที่แตกต่างกัน มีความเสี่ยงสูงที่รายการเก่าจะถูกทำลาย ฉันพิจารณาโปรแกรมที่เหมาะสมที่สุดสำหรับจุดประสงค์นี้

หากต้องการบันทึกข้อมูล ให้เปิดเมนูแก้ไขคำอธิบาย/ความคิดเห็น

ระบบอัจฉริยะ Optical Character Recognition (OCR) Cuneiform ทำงานใน สภาพแวดล้อมของไมโครซอฟต์วินโดวส์ 3.1 หรือสูงกว่า รุ่นที่ใหม่กว่า- บริบทที่ละเอียดอ่อน ระบบช่วยเหลือรองรับ CuneiForm ระบบมาตรฐาน วิธีใช้ Windows- ระบบมีความสามารถทางเทคโนโลยีดังต่อไปนี้:

  • รองรับเครื่องสแกนเดสก์ท็อปที่หลากหลาย
  • จดจำหน้าที่สแกน (รวมถึงข้อความหลายคอลัมน์และข้อความที่มีการออกแบบที่ซับซ้อน)
  • ช่วยให้คุณสามารถสแกนและบันทึกภาพเป็น TIFF และเรียกใช้การจดจำในภายหลัง (ทำให้สะดวกในการสแกนกองเอกสาร)
  • มีความสามารถในการบันทึกไฟล์หลายประเภทที่ช่วยให้คุณสามารถสแกนหน้าต่างๆ ได้และโปรแกรมจะทำการบันทึกอัตโนมัติโดยกำหนดชื่อตามลำดับให้กับรูปภาพ (หน้า 1, หน้า 2 ฯลฯ );
  • สามารถอ่านภาพที่สแกนโดยโปรแกรมและแฟกซ์อื่นในโหมด Fine และ Normal
  • แยกข้อความออกจากกราฟิกและแปลงจากกราฟิกเป็นไฟล์ข้อความสำหรับหนึ่งในนั้น โปรแกรมประมวลผลคำ, ฐานข้อมูลหรือ สเปรดชีต;
  • มีฟังก์ชัน "กำหนดพื้นที่การจดจำ" ซึ่งอนุญาตให้เลือกการจดจำในส่วนที่เลือกของหน้า
  • จดจำตัวอักษรของตัวอักษรรัสเซียและอังกฤษ ไม่รวมแบบอักษรเก๋ๆ เช่น ตัวอักษรโกธิค
  • จดจำแบบอักษรที่ใช้กันทั่วไปทั้งหมด (รวมถึงตัวหนา ตัวเอียง และขีดเส้นใต้) ที่อาจผสมกันภายในหน้า แม้แต่ในย่อหน้าหรือคำ
  • สามารถประมวลผลเอกสารที่พิมพ์ด้วยเครื่องพิมพ์ดอทเมทริกซ์ LQ และ NLQ, อิงค์เจ็ท, เครื่องพิมพ์เลเซอร์บนเครื่องพิมพ์ดีด (ยอมรับทั้งการพิมพ์แบบโมโนสเปซและแบบสัดส่วน)
  • สามารถรักษาการจัดรูปแบบและการจัดตารางดั้งเดิมและปรับการเยื้องและการจัดตำแหน่ง
  • มีโปรแกรมแก้ไขข้อความภายในและการควบคุมพจนานุกรม ซึ่งคุณสามารถควบคุมคุณภาพของการจดจำและแก้ไขข้อความได้ ในการดำเนินการนี้ หน้าต่างตัวแก้ไขในตัวจะแสดงข้อความที่รู้จัก โดยเน้นอักขระที่น่าสงสัยและคำที่ไม่ได้อยู่ในพจนานุกรม ในหน้าต่างส่วนขยายที่อยู่ติดกัน คุณจะเห็นภาพขยายของข้อความที่สแกน ทำให้คุณแก้ไขได้โดยไม่ต้องมอง เอกสารต้นฉบับ;
  • ไม่รู้จัก ข้อความที่เขียนด้วยลายมือ.

หน้าจอ Suneiform ประกอบด้วยสี่ส่วนหลักตามที่ระบุไว้ในรูป

การดำเนินการขั้นพื้นฐาน(ขั้นตอน) เมื่อทำงานในระบบมีดังนี้:

ปุ่มแผง ทำหน้าที่แล้ว
การสแกนและการรับรู้ ปุ่ม "สแกนและจดจำ" จะมีประโยชน์หากคุณมั่นใจว่าการออกแบบของเอกสารค่อนข้างเรียบง่ายและจะไม่ทำให้การจดจำข้อความซับซ้อน (สำหรับการกระจายตัวที่ซับซ้อนมากขึ้น การดำเนินการ "สแกนและแสดง" จะมีประโยชน์) เมื่อคุณคลิกปุ่มในแผง เข้าถึงได้อย่างรวดเร็ว(หรือโดยการเรียกคำสั่ง ActionScanning and Recognition) หน้าต่างข้อความจะปรากฏขึ้นเพื่อแจ้งให้คุณทราบว่ากำลังสแกนอยู่ ถัดไป ฟิลด์ตัวบ่งชี้ความคืบหน้าจะแสดงระยะการรู้จำอักขระปัจจุบัน รวมถึงเปอร์เซ็นต์รวมของการรู้จำอักขระที่เสร็จสมบูรณ์ การกดปุ่มจะเทียบเท่ากับการดำเนินการคำสั่ง "สแกนและแสดง" และ "การจดจำ"
เปิดภาพ ช่วยให้คุณสามารถโหลดรูปภาพจากไฟล์กราฟิกที่มีอยู่ (โดยใช้ปุ่มหรือคำสั่งรูปภาพ FileOpen) ในหน้าต่างที่ปรากฏขึ้น คุณต้องเลือกไดเร็กทอรีและชื่อไฟล์
สแกนและแสดง ช่วยให้คุณสามารถสแกนเอกสารและดูเอกสารได้ (โดยใช้ปุ่มหรือคำสั่ง Scan and View Action) โดยไม่ต้องเรียกใช้การรู้จำอักขระ การสแกนจะเริ่มทันที และหน้าต่างรูปภาพที่สแกนจะปรากฏที่ด้านขวาของหน้าจอ
การยอมรับ ใช้เมื่อเริ่มต้น (โดยใช้ปุ่มหรือคำสั่ง ActionRecognition) การรู้จำอักขระหลังจากดำเนินการ "Scan and Look" หรือหลังจากโหลดไฟล์
ความสว่าง ช่วยให้คุณสามารถติดตั้ง ระดับที่เหมาะสมที่สุดความสว่างสำหรับการสแกนเอกสาร (โดยใช้ปุ่มหรือคำสั่ง Action Brightness) CuneiForm มีระดับความสว่าง 256 ระดับ (0-255) ตามค่าเริ่มต้น ค่าของมันคือ 127 หากเกิดข้อผิดพลาดในการรู้จำหลายครั้งเนื่องจากภาพที่สแกนสว่างเกินไป คุณจะต้องตั้งค่าความสว่างให้ต่ำลงแล้วสแกนเอกสารอีกครั้ง หากภาพมืดเกินไป คุณจะต้องตั้งค่า ความสว่างที่มากขึ้น- ระดับความสว่างสามารถเปลี่ยนแปลงได้ดังต่อไปนี้: ก) เลื่อนแถบเลื่อนบนสเกลไปทางขวาและซ้าย; b) ตั้งค่าความสว่างโดยอัตโนมัติ โดยคลิกปุ่ม "อัตโนมัติ" ในช่อง "การตั้งค่าความสว่าง" กล่องโต้ตอบเล็กๆ จะปรากฏขึ้นเพื่อแจ้งให้คุณ "เลือก" ปุ่มซ้ายเมาส์เพื่อเลือกความสว่างหรือคลิกยกเลิก" เมื่อคุณเลื่อนเคอร์เซอร์ไปที่รูปภาพ มันจะอยู่ในรูปของหลอดไฟโดยมีเป้าเล็งอยู่ข้างๆ ต่อไป คุณจะต้องเลื่อนเป้าเล็งไปที่ส่วนของรูปภาพที่มี ความหนาแน่นของอักขระปานกลางหรือความมืดแล้วคลิกปุ่มเมาส์ ความสว่างอัตโนมัติตรวจสอบพื้นที่รอบๆ จุดที่ผู้ปฏิบัติงานเลือกไว้เพื่อกำหนด การติดตั้งทั่วไปความสว่าง ถัดไป คุณจะได้รับแจ้งให้สแกนหน้าใหม่โดยใช้ค่าความสว่างใหม่ หากต้องการ หากคุณเลือก "ใช่" เอกสารจะถูกสแกนอีกครั้ง สิ่งนี้ควรปรับปรุงความแม่นยำเมื่อมีการรันการรับรู้อีกครั้ง คุณยังสามารถเปิดหน้าต่างการปรับความสว่างได้โดยเลือกความสว่างจากเมนูการกระทำ ไม่ว่าจะติดตั้งที่ไหน ระดับปัจจุบันความสว่างจะแสดงที่ด้านซ้ายสุดของแถบสถานะที่ด้านล่างของหน้าจอเสมอ
รูปภาพก่อนหน้า การดำเนินการทำได้โดยการคลิกปุ่มหรือใช้คำสั่ง FileRestore ภาพก่อนหน้าเพื่อส่งคืนภาพสุดท้ายที่อยู่บนหน้าจอระหว่างเซสชั่นนี้
ติดกาวหน้า ใช้เมื่อจำเป็นต้องสแกนด้วยเครื่องสแกนมือถือ (ซึ่งมีหน้าต่างจับภาพเล็กกว่าขนาดหน้า) เต็มแผ่น- โดยการกดปุ่มหรือใช้คำสั่ง ActionGlue หน้าขั้นตอนการประมวลผลทางขวาหรือ ส่วนบนหน้าตามวิธีการติดกาวที่เลือก ขั้นแรก กล่องโต้ตอบ TWAIN สำหรับการทำงานกับเครื่องสแกนจะถูกเรียกขึ้นมา และส่วนที่เกี่ยวข้องของหน้าจะถูกสแกน จากนั้นกระบวนการจดจำจะเริ่มต้นขึ้น การดำเนินการต่อเนื่องทั้งหมดจะถูกทำซ้ำโดยอัตโนมัติในส่วนถัดไปของหน้า ขั้นตอนต่อไปคือการติดกาวทั้งสองส่วนที่เป็นที่รู้จักให้เป็นข้อความเดียว

เส้นสถานะอาจรวมถึงองค์ประกอบหลักต่อไปนี้ที่ติดตั้งภายในเมนูหลัก: (ดูรูป)



หน้าต่างส่วนขยายออกแบบมาเพื่อแสดงส่วนของภาพที่สแกนเมื่อ กำลังขยายที่สูงขึ้น- หน้าต่างนี้จะปรากฏบนหน้าจอเมื่อจำเป็นต้องดูส่วนต่างๆ อย่างละเอียดมากขึ้น หน้าต่างถูกเรียกขึ้นมาในเมนู ViewExtension การขยายในหน้าต่างการขยายจะถูกควบคุมโดยการเลือกเมนูมุมมองหนึ่งต่อหนึ่ง กำลังขยาย 200% หรือ 400% ตำแหน่งที่หน้าต่างส่วนขยายปรากฏบนหน้าจอขึ้นอยู่กับการกระทำที่ทำให้หน้าต่างปรากฏขึ้น:

  • หากถูกเรียกโดยตำแหน่งเคอร์เซอร์หลังจากใช้ “สแกนและแสดง” หรือหลังจากเปิดไฟล์จะปรากฏที่ส่วนล่างซ้ายของหน้าจอ
  • หากปรากฏพร้อมกับหน้าต่าง "ตัวแก้ไข" หลังจากการจดจำตำแหน่งจะขึ้นอยู่กับการออกแบบหน้าจอที่เลือกจากเมนู "หน้าต่าง"
  • หน้าต่างขยายสามารถเลื่อนไปรอบๆ หน้าจอได้โดยการเลื่อนเข้าไป ลากและหยด.

หน้าต่างการกระจายตัวแบบแมนนวลใช้เมื่อเอกสารที่ได้รับการยอมรับมี โครงสร้างที่ซับซ้อนประกอบด้วยข้อความและ/หรือกราฟิกมากกว่าหนึ่งคอลัมน์

ใน โหมดปกติหลังจากการสแกน CuneiForm จะแยกส่วนและสลายภาพออกเป็นบล็อกโดยอัตโนมัติ ซึ่งถือเป็นข้อความที่เชื่อมต่อกันและมีความหมาย และล้อมรอบด้วยเส้นประเมื่อแสดงในโหมดการแยกส่วน อย่างไรก็ตาม บล็อกข้อความเป็นเพียงชุดของสัญลักษณ์ และไม่ถือเป็นส่วนความหมายที่สมบูรณ์เสมอไป

เนื่องจากโปรแกรมแบ่งตามการเว้นวรรคมากกว่าการวิเคราะห์ข้อมูลตามบริบท จึงไม่สามารถตัดสินได้อย่างสมบูรณ์ว่าข้อความใดเกี่ยวข้องกัน หน้าต่าง Manual Fragmentation มีหลายตัวเลือก การสร้างเพิ่มเติมบล็อกเมื่อการกระจายตัวอัตโนมัติไม่ถูกต้อง

โหมด "การกระจายตัว" มีอยู่อย่างแม่นยำเพื่อแก้ไขข้อผิดพลาดที่เกิดขึ้นในระหว่างกระบวนการกระจายตัวโดยอัตโนมัติก่อนการจดจำ ในกรณีนี้ ให้เลือกเมนู OptionsFragmentation ในขณะเดียวกัน คำว่า “Fragm” ปรากฏทางด้านขวาของบรรทัดสถานะ หน้าต่าง Manual Tile จะปรากฏขึ้นในภายหลัง หลังจากสแกนเอกสารหรือเรียกจากไฟล์กราฟิก

นอกจากบล็อกที่มีป้ายกำกับโดยอัตโนมัติแล้ว หน้าต่างยังมีคอลัมน์ของปุ่มเรียงกันทางด้านซ้าย:

ปุ่ม ทำหน้าที่แล้ว
ดำเนินการ ให้การเปลี่ยนไปสู่การแสดงการจดจำหลังจากนั้น การดำเนินการที่จำเป็นโดยการกระจายตัว
กลับซ้ำ ช่วยให้คุณย้อนกลับไปหนึ่งขั้นตอนและทำซ้ำการดำเนินการล่าสุด
ข้อความ ให้คุณเลือกบล็อกที่มีทุกส่วนของตาราง เช่น เพื่อรวมเป็นส่วนเดียว ในการดำเนินการนี้หลังจากกดปุ่มแล้ว คุณจะต้องทำเครื่องหมายสี่เหลี่ยมรอบพื้นที่ที่เลือกด้วยเคอร์เซอร์ เป็นผลให้มันถูกสร้างขึ้น บล็อกใหม่ซึ่งระหว่างการรับรู้ถือเป็นส่วนรวม
ขอบฟ้า สีเขียว ช่วยให้คุณกำหนดการกระจายตัวเพิ่มเติมในแนวนอนหรือแนวตั้ง ในการดำเนินการนี้ หลังจากเลือกปุ่มแล้ว ให้วางเคอร์เซอร์ในตำแหน่งที่ต้องการ และในโหมดลาก ให้ทำเครื่องหมายขอบเขตการกระจายตัวในแนวนอนหรือแนวตั้ง ตามลำดับ
กาว ช่วยให้คุณ "ติดกาว" ชิ้นส่วนที่สร้างขึ้นโดยใช้ปุ่ม "แนวนอน" และ "เวิร์ต" ในการดำเนินการนี้เพียงทำเครื่องหมายชิ้นส่วนที่จะติดกาวด้วยเคอร์เซอร์แล้วเลือกปุ่ม "กาว"
ลบ ช่วยให้คุณสามารถลบส่วนที่ทำเครื่องหมายไว้โดยใช้ปุ่มข้อความออกจากกระบวนการจดจำได้
ขยาย ช่วยให้คุณสามารถขยายส่วนของข้อความในหน้าต่างไทล์แบบแมนนวล ในการดำเนินการนี้ หลังจากเลือกปุ่มแล้ว ให้วางเคอร์เซอร์ในตำแหน่งที่ต้องการในข้อความแล้วคลิกปุ่มเมาส์
ไม่ได้พาฉันไป ช่วยให้คุณสามารถส่งคืนส่วนที่ขยายของข้อความไปที่ สถานะเริ่มต้น- ในการดำเนินการนี้ หลังจากเลือกปุ่มแล้ว ให้วางเคอร์เซอร์ในตำแหน่งที่เลือกแล้วคลิกปุ่มซ้ายของเมาส์
การวาดภาพ ช่วยให้คุณสามารถสร้าง รูปภาพใหม่
ช่วย ช่วยให้คุณสามารถแสดง ข้อมูลความเป็นมาเกี่ยวกับการใช้ปุ่มควบคุมการกระจายตัวแบบแมนนวล

ตัวเลือกเพิ่มเติมสำหรับการแก้ไขการบล็อกที่ผิดพลาดในหน้าต่าง Manual Fragmentation:

  • การแบ่งแนวนอน
  • การแบ่งแนวตั้ง
  • ติดกาว

ให้มีข้อความสองคอลัมน์ในเอกสาร แต่ CuneiForm “ไม่เห็น” สิ่งนี้ แต่จะรวมสองคอลัมน์เป็นบล็อกเดียวแทน เนื่องจากสิ่งนี้อาจนำไปสู่ปัญหาการจดจำเพิ่มเติมได้ จึงจำเป็นต้องแบ่งคอลัมน์ออกเป็นบล็อก:

  • กด "แนวตั้ง" ที่ด้านซ้ายของหน้าต่าง "Fragmentation"
  • วางเคอร์เซอร์ในตำแหน่งที่คุณต้องการเริ่มการหาร
  • ในขณะที่กดปุ่มเมาส์ค้างไว้ ให้ลากเคอร์เซอร์ไปยังตำแหน่งที่การแบ่งควรสิ้นสุด
  • ปล่อยปุ่ม

CuneiForm จะแบ่งบล็อกในแนวตั้งออกเป็นสองส่วน ส่วนของข้อความ(ฟังก์ชัน "แบ่งตามแนวนอน" จะดำเนินการเดียวกันกับข้อความที่ควรแบ่งตามแนวนอน)

ในบางกรณี CuneiForm สามารถแบ่งข้อความที่ผสานออกเป็นส่วนย่อยได้โดยอัตโนมัติ หากต้องการแก้ไขพาร์ติชันนี้ คุณต้องคลิกเคอร์เซอร์บนแต่ละแฟรกเมนต์แล้วคลิกปุ่ม "กาว" ทั้งสองส่วนจะรวมกันเป็นบล็อกเดียว

ในหน้าต่าง Editor ที่ด้านบนจะมีเมนูง่ายๆ ห้าปุ่ม: "ออก", "บันทึกเป็น...", "แนบกับ...", "ถัดไป" น่าสงสัย" และ "เติมคำ" ด้วยความช่วยเหลือทำให้สะดวกในการดำเนินการตามขั้นตอนต่างๆเมื่อใช้หน้าต่างแก้ไข

หน้าต่าง "ตัวแก้ไข" มีผลการจดจำ หลังจากการจดจำ หน้าต่างแก้ไขจะครอบคลุมรูปภาพในหน้าต่างรูปภาพ ข้อความที่ผู้ใช้เลือกในหน้าต่างแก้ไขจะซิงโครไนซ์กับรูปภาพในหน้าต่างส่วนขยาย เมื่อคุณเลื่อนเคอร์เซอร์ในหน้าต่างแก้ไข รูปภาพในหน้าต่างส่วนขยายจะเลื่อนตามตำแหน่งเคอร์เซอร์ใหม่ และอักขระที่เลือกจะถูกไฮไลท์

ข้อผิดพลาดที่เกิดขึ้นระหว่างกระบวนการจดจำสามารถแก้ไขได้ในภายหลังในโปรแกรมประมวลผลคำตัวใดตัวหนึ่ง หรือใช้เมนู "ตัวแก้ไข" และปุ่มหน้าต่างแก้ไข ในกรณีหลัง เมื่อใช้เมนู ViewSettings คุณสามารถเลือกขนาดของตัวอักษรที่แสดงบนหน้าจอได้เพื่อความสะดวกในการแก้ไข

มีสิ่งอำนวยความสะดวกเพิ่มเติมมากมายสำหรับการแก้ไข:

  • โอกาสในการดำเนินการ ตรวจสอบอัตโนมัติการสะกดหลังจากเลือกเมนูควบคุมตัวเลือกคำศัพท์ (ในกรณีนี้คำที่เรียกว่าน่าสงสัยเช่นคำที่หายไปจากพจนานุกรมจะแสดงบนหน้าจอ)
  • การเดินทางที่รวดเร็วระหว่างการควบคุมคำศัพท์โดยใช้ปุ่ม "ถัดไป" สงสัย” เป็นคำอื่นที่ขาดหายไปจากพจนานุกรม
  • ความสามารถในการเปิดและใช้พจนานุกรมผู้ใช้ที่นำเข้าไปยังเมนู FileDynamic Dictionary Load... หรือ Import...
  • ความสามารถในการเพิ่มคำที่เน้นระหว่างการตรวจสอบลงในพจนานุกรมของผู้ใช้ แต่แก้ไขให้ถูกต้องโดยคลิกปุ่ม "เพิ่มคำ"
  • ความสามารถในการส่งออกพจนานุกรมที่กำหนดเองไปยังเมนู FileDynamic DictionaryUpload... หรือส่งออก... หลังจากใช้งานหรือเพิ่มเข้าไป

เมนูคำสั่ง การดำเนินการที่จะดำเนินการ
ไฟล์
เปิดภาพ อ่านภาพจากไฟล์ รูปแบบต่อไปนี้: TIFF 5.0, PCX, BMP, GIF, TARGA, JPEG
คืนค่าก่อนหน้า ภาพ รับภาพสแกนและจัดเก็บเพื่อเลือก พื้นที่ใหม่การรับรู้ (ถ้าจำเป็น)
จำภาพ บันทึกภาพในรูปแบบ TIFF 5.0
เปิดไฟล์ ED เปิดไฟล์ที่มีข้อความที่รู้จักก่อนหน้านี้
บันทึกเป็นข้อความ เขียนข้อความที่รู้จักในไฟล์บางรูปแบบ เช่น ASCII, Smart ASCII, RTF, ANSI, Smart ANSI
กาวด้วยข้อความ เพิ่มข้อความที่รู้จักต่อท้ายข้อความที่มีอยู่ ไฟล์ข้อความ
เลือกจากรายการ TWAIN เลือกสแกนเนอร์ที่จะใช้ภายใต้อินเทอร์เฟซ TWAIN
รับภาพ TWAIN ใช้การเข้าถึงรูปภาพผ่าน TWAIN
พจนานุกรมแบบไดนามิก ใช้พจนานุกรมผู้ใช้
โมดูลการรับรู้ โมดูลการรับรู้โหลด/ยกเลิกการโหลด
ออก ออกจากคูนิฟอร์ม
บรรณาธิการ
ติดตาม. น่าสงสัย ย้ายไปยังคำที่น่าสงสัยถัดไป
ก่อนหน้า น่าสงสัย ไปที่คำที่น่าสงสัยก่อนหน้า
ทำเครื่องหมายคำที่น่าสงสัย เปิด/ปิด โหมดสำหรับเน้นคำที่น่าสงสัย
ค้นหา ค้นหาสตริงอักขระในข้อความที่รู้จัก
ค้นหาร่องรอย ค้นหาซ้ำ
เพิ่มคำ ทำให้คำถูกต้องตามกฎหมายและเพิ่มลงในรายการ
ยกเลิกการเพิ่ม สร้างคำที่น่าสงสัยและลบออกจากรายการ

นอกจากนี้ยังสามารถใช้แผงควบคุมที่ด้านบนของหน้าต่างแก้ไข ซึ่งประกอบด้วยปุ่มหลายปุ่ม: ออก, บันทึกเป็น..., แนบกับ..., ถัดไป สงสัย และเพิ่มคำ/

เมนูคำสั่ง SuneiForm

- ระบบอัจฉริยะการจดจำข้อความ ให้การแปลงเอกสารกระดาษและอิเล็กทรอนิกส์ที่รวดเร็วและมีคุณภาพสูง ไฟล์กราฟิกลงในข้อความที่แก้ไขเพื่อนำไปใช้งานต่อไปใน โปรแกรมสำนักงานและ โปรแกรมแก้ไขข้อความ- สามารถบันทึกผลลัพธ์ในรูปแบบยอดนิยมและค้นหาข้อความแบบเต็มได้
ความเป็นไปได้คูเนอิฟอร์ม :
ในระหว่างการรับรู้ โครงสร้างของเอกสารและการจัดรูปแบบจะยังคงอยู่
รับรู้ตารางของโครงสร้างและความซับซ้อนใดๆ รวมถึงตารางที่ไม่แสดงเส้นตาราง
แบบอักษรที่พิมพ์ออกมาทุกชนิดได้รับการยอมรับ: หนังสือ หนังสือพิมพ์ นิตยสาร งานพิมพ์จากเครื่องพิมพ์เลเซอร์และเมทริกซ์ ข้อความจากเครื่องพิมพ์ดีด ฯลฯ
อัลกอริธึมการรู้จำด้วยแสง (OCR, การรู้จำอักขระด้วยแสง) ที่มีอยู่ในโปรแกรมช่วยให้คุณจดจำข้อความได้ เครื่องพิมพ์ดอทเมทริกซ์, ถ่ายเอกสารและแฟกซ์ไม่ดี
การรับรู้เอกสารมากกว่า 20 ภาษา: รัสเซีย อังกฤษ ยูเครน เยอรมัน ฝรั่งเศส สเปน อิตาลี และอื่นๆ
เพื่อปรับปรุงคุณภาพการจดจำ โปรแกรมจะใช้การตรวจสอบพจนานุกรม ในเวลาเดียวกัน พจนานุกรมมาตรฐานสามารถขยายได้โดยการนำเข้าคำศัพท์ใหม่จากไฟล์ข้อความ
มีเว็บไซต์ประสานงานการทำงานในโครงการ OpenOCR.org พร้อมฟอรัมภาษารัสเซีย
สถานะของโปรแกรม:ฟรี
ระบบปฏิบัติการ:วินโดว์ 7,วิสต้า,XP
อินเทอร์เฟซ:อังกฤษ, รัสเซีย
ผู้พัฒนา:เทคโนโลยีความรู้ความเข้าใจ
ขนาด: 33.3 เมกะไบต์
ดาวน์โหลด OCR CuneiForm V.12
ดาวน์โหลด OpenOCR ความรู้ความเข้าใจ (ภาษารัสเซีย)
ดาวน์โหลด OpenOCR ความรู้ความเข้าใจ (ภาษาอังกฤษ)
คู่มือเล็กๆ เกี่ยวกับวิธีการทำงาน:
หลังการติดตั้ง คุณจะมีทางลัด 2 ทาง:

การจดจำแบทช์ - ประมวลผลทั้งโฟลเดอร์
CuneiForm - ประมวลผลเอกสารจากเครื่องสแกนหรือไฟล์แต่ละไฟล์
มาเปิดโปรแกรมกันเถอะ ในความคิดของฉัน ตัวเลือกที่สองสำหรับการเปิดตัวโปรแกรมเหมาะสำหรับคนส่วนใหญ่ ในหน้าต่างที่เปิดขึ้น ให้เลือกไอคอนที่มีไม้กายสิทธิ์ (ลูกศร)


หน้าต่างตัวช่วยสร้างการรู้จำจะเปิดขึ้น การเลือกแหล่งที่มา ไฟล์ต้นฉบับ(ฮาร์ดไดรฟ์หรือสแกนเนอร์) ตัวอย่างเช่น ฉันเลือกไฟล์ในฮาร์ดไดรฟ์ของฉัน


คลิก "ถัดไป" หน้าการเลือกภาษาจะเปิดขึ้นโดยที่เราเลือก (ตามธรรมชาติ) ภาษา (ลูกศร 1) และสัญลักษณ์ที่จะแทนที่ตัวอักษรที่ไม่รู้จัก (ลูกศร 2)


"ถัดไป" อีกครั้ง เลือกพารามิเตอร์ของข้อความที่รู้จัก เนื่องจากฉันมีข้อความที่สแกนด้วยลายมือ ฉันจึงเลือก "คำศัพท์" และ "แฟกซ์"


และเพราะว่า แหล่งที่มาไม่มีตารางและรูปภาพ ลบจุดที่เกี่ยวข้องในรายการการตั้งค่าถัดไป


"ถัดไป" อีกครั้ง และโปรแกรมก็เริ่มประมวลผลข้อความ


นี่คือผลลัพธ์ ส่วนต้นฉบับและหลังการประมวลผลโดยโปรแกรม

นี่คือผลลัพธ์ของการประมวลผลส่วนที่เขียนด้วยลายมือ
และนี่คือผลลัพธ์ของการประมวลผลข้อความพิมพ์ดีดที่สแกน(พารามิเตอร์แหล่งที่มาถูกตั้งค่าเหมือนกัน):

อย่างที่คุณเห็นผลลัพธ์ขึ้นอยู่กับแหล่งที่มาโดยตรง เมื่อแปรรูปแป้งที่เขียนด้วยลายมือ คุณภาพไม่ดีการพิมพ์ด้วยตนเองทันทีเหมาะสมกว่าการประมวลผลด้วยโปรแกรมแล้วแก้ไข
ดังนั้นจึงไม่ควรหวังปาฏิหาริย์ หลังจากการจดจำข้อความแล้ว การทำงานที่ต้องใช้ความอุตสาหะค่อนข้างมากในการแก้ไขข้อผิดพลาด.
จัดทำขึ้นตามวัสดุจาก computer-vsem.ru, Cognitiveforms.com, softportal.com
การรวบรวมข้อความและลิงค์