โปรแกรมคอมพิวเตอร์เพื่อการวิเคราะห์เนื้อหา เมเยอร์ อาร์.วี. โปรแกรมคอมพิวเตอร์ที่ทำให้การประเมินวัตถุและการวิเคราะห์เนื้อหาของข้อความเป็นแบบอัตโนมัติ

โปรแกรมคอมพิวเตอร์ที่ประเมินวัตถุและวิเคราะห์เนื้อหาของข้อความโดยอัตโนมัติ

เมเยอร์ โรเบิร์ต วาเลรีวิช
สถาบันสอนการสอนแห่งรัฐ Glazov ตั้งชื่อตาม วี.จี.โคโรเลนโก
วิทยาศาสตรดุษฎีบัณฑิต ศาสตราจารย์ภาควิชาฟิสิกส์และการสอนฟิสิกส์


คำอธิบายประกอบ
การพัฒนาทฤษฎีการเรียนรู้จำเป็นต้องมีการนำไปใช้ วิธีการทางคณิตศาสตร์เพื่อประเมินวัตถุการสอน นำเสนอ วิธีง่ายๆระบบอัตโนมัติของการประเมินวัตถุโดยใช้วิธีการเปรียบเทียบและกำหนดคู่ ประเภทต่างๆข้อมูลในข้อความโดยใช้คอมพิวเตอร์ มีการนำเสนอข้อความของโปรแกรมที่เขียนในสภาพแวดล้อม Free Pascal ซึ่งการใช้งานช่วยให้คุณสามารถ: 1) ประเมินความซับซ้อนในการสอนของแนวคิดที่แสดงถึงเครื่องมือทางกายภาพปริมาณและการทดลองทางกายภาพ; 2) วิเคราะห์เนื้อหาของย่อหน้าในตำราฟิสิกส์ต่างๆ

โปรแกรมคอมพิวเตอร์ที่ประเมินวัตถุและการวิเคราะห์เนื้อหาโดยอัตโนมัติ

เมเยอร์ โรเบิร์ต วาเลรีวิช
สถาบันการสอนแห่งรัฐ Glazov Korolenko
แพทย์ศาสตร์บัณฑิต, รองศาสตราจารย์


เชิงนามธรรม
การพัฒนาทฤษฎีการฝึกอบรมต้องใช้วิธีทางคณิตศาสตร์ในการประเมินวัตถุการสอน มีวิธีง่ายๆ ในการประเมินวัตถุโดยอัตโนมัติโดยวิธีการเปรียบเทียบคู่และคำจำกัดความของปริมาณของข้อมูลประเภทต่างๆ ในข้อความโดยใช้คอมพิวเตอร์ ส่งข้อความของโปรแกรมที่เขียนในสภาพแวดล้อมของ Free Pascal ซึ่งอนุญาตให้ใช้: 1) เพื่อประเมินความซับซ้อนในการสอนของแนวคิดที่กำหนดปริมาณทางกายภาพ อุปกรณ์ และการทดลอง; 2) ทำการวิเคราะห์เนื้อหาย่อหน้าของตำราฟิสิกส์ต่างๆ

การแนะนำ

ใน เมื่อเร็วๆ นี้ความสนใจในการใช้วิธีการทางคณิตศาสตร์ในการสอนเพิ่มขึ้น หากต้องการใช้ แบบจำลองทางคณิตศาสตร์การสร้างรูปแบบเชิงคุณภาพและเชิงปริมาณคุณจะต้องสามารถประเมินได้ คุณสมบัติที่แตกต่างกันวัตถุการสอน, ระดับความรู้ของนักเรียนเกี่ยวกับสื่อการศึกษา, ความซับซ้อนของแนวคิด, สูตร, หัวข้อ, งาน, เนื้อหาข้อมูลของภาพวาด ฯลฯ อีกด้วย คุ้มค่ามากมีปัญหาในการกำหนดจำนวนข้อมูลประเภทใดประเภทหนึ่ง (เช่น เชิงประจักษ์ ทฤษฎี คณิตศาสตร์) ในเนื้อหาทางการศึกษา การบรรยาย หรือคำตอบของนักเรียน

การประเมินและจัดอันดับออบเจ็กต์หลายสิบรายการเป็นกระบวนการที่ต้องใช้แรงงานคนมากในการดำเนินการด้วยตนเอง ดังนั้น ในการประเมินวัตถุ 30 ชิ้นโดยใช้วิธีการเปรียบเทียบแบบคู่ จำเป็นต้องดำเนินการเปรียบเทียบที่แตกต่างกันอย่างน้อย 450 รายการ ในระหว่างที่ผู้เชี่ยวชาญจะต้องเชื่อมโยงระดับการมีอยู่ของคุณภาพที่ประเมินในวัตถุทั้งสองที่กำลังเปรียบเทียบ ดังนั้นจึงเป็นการดีกว่าที่จะทำให้กระบวนการนี้เป็นอัตโนมัติโดยใช้โปรแกรมคอมพิวเตอร์ที่สุ่มนำเสนอวัตถุที่ถูกเปรียบเทียบ รับรู้คำตอบของผู้เชี่ยวชาญ และเขียนผลลัพธ์ลงในไฟล์ สิ่งสำคัญคือผู้เชี่ยวชาญมีโอกาสที่จะหยุดพัก บันทึกผล และกลับมาในวันถัดไปและทำงานต่อ

การวิเคราะห์เนื้อหาของข้อความหลายหน้า การนับคำศัพท์ต่างๆ โดยผู้เชี่ยวชาญเองเป็นงานที่ต้องใช้แรงงานเข้มข้น และผลลัพธ์ขึ้นอยู่กับปัจจัยสุ่มต่างๆ มีความเป็นไปได้ที่จะเพิ่มความเป็นกลางของการวิเคราะห์เนื้อหาของข้อความทางการศึกษาและการทำซ้ำของผลลัพธ์ที่ได้โดยใช้โปรแกรมคอมพิวเตอร์ที่นับความถี่ของการกล่าวถึงคำศัพท์ต่าง ๆ ในไฟล์ข้อความโดยคำนึงถึงความซับซ้อนโดยใช้พจนานุกรมอรรถาภิธาน และอยู่ในชั้นเรียนเฉพาะ งานของผู้เชี่ยวชาญในกรณีนี้มีดังต่อไปนี้ 1) รวบรวมพจนานุกรม-อรรถาภิธาน; 2) การจำแนกประเภทและการประเมินข้อกำหนดที่รวมอยู่ในนั้น 3) การเตรียมไฟล์พร้อมข้อความที่วิเคราะห์ 4) การเปิดตัวโปรแกรมที่วิเคราะห์ข้อความ 5) การตีความผลลัพธ์

1. โปรแกรมสำหรับการเปรียบเทียบวัตถุแบบคู่

ในการประเมินวัตถุโดยใช้วิธีเปรียบเทียบคู่จะใช้โปรแกรม PR-1 ที่เขียนในสภาพแวดล้อม Free Pascal (รูปที่ 1) สมมติว่าคุณต้องประเมินความซับซ้อนของแนวคิดจากหลักสูตรฟิสิกส์ของโรงเรียน ใช้ Far_manager สร้างไฟล์ vhod.txt ที่มีรายการแนวคิด N=25 ที่จะประเมิน (รูปที่ 2.1) สุ่มเลือกแนวคิดที่มีหมายเลข N0=8 และเปิดโปรแกรมคอมพิวเตอร์ PR-1 แนวคิด N0=8 ปรากฏบนหน้าจอ และมีบรรทัดด้านล่าง - แนวคิดที่เลือกแบบสุ่มจากรายการ เช่น แนวคิด 12 ผู้เชี่ยวชาญจะต้องเปรียบเทียบคุณสมบัติที่ประเมินของวัตถุทั้งสองนี้ และป้อนสัญลักษณ์ "+", "0 ” หรือ “–” จากแป้นพิมพ์ เครื่องหมายบวกหมายความว่าคุณภาพที่ประเมินในวัตถุ 1 มากกว่าในวัตถุ 2 ศูนย์หมายถึงเท่ากันโดยประมาณ และลบหมายถึงน้อยกว่าในวัตถุ 2

หลังจากกดปุ่ม "Enter" แนวคิดที่มีหมายเลข N0=8 และแนวคิดที่เลือกแบบสุ่ม 23 จะปรากฏขึ้นอีกครั้ง ผู้เชี่ยวชาญทำการเปรียบเทียบอีกครั้งและให้คะแนน "+", "–" หรือ "0" โปรแกรมถูกเขียนในลักษณะที่แนวคิดที่มีหมายเลข N0 จะไม่ถูกเปรียบเทียบกับตัวมันเอง (เป็นที่รู้กันว่าผลลัพธ์คือ "0") และจะไม่ถูกเปรียบเทียบสองครั้งกับแนวคิดอื่น ๆ หลังจากเสร็จสิ้นขั้นตอนการเปรียบเทียบแนวคิดที่ 8 กับแนวคิดอื่นๆ ทั้งหมดแล้ว ไฟล์อินพุต(รูปที่ 2.1) โปรแกรมสร้างไฟล์ข้อความ vihod.txt จากหนึ่งบรรทัดที่มีหมายเลขอ็อบเจ็กต์ N0=8 และผลลัพธ์ของการเปรียบเทียบกับแนวคิด 1, แนวคิด 2, ...., แนวคิด N ในรูปแบบ “+ + + ... + 0 0 – + … – 0 + – –” (รูปที่ 2.2) จากนั้นผู้เชี่ยวชาญจะทำซ้ำขั้นตอนเดียวกันกับวัตถุอื่น ตัวอย่างเช่น ด้วยแนวคิด N0=10 หากจำเป็น ผู้เชี่ยวชาญสามารถหยุดพักหรือเลื่อนขั้นตอนการเปรียบเทียบไปจนถึงวันถัดไปได้ โดยการใช้ โปรแกรมแก้ไขข้อความจากเส้นผลลัพธ์ (รูปที่ 2.2) เมทริกซ์ NxN สองมิติจะถูกสร้างขึ้นคล้ายกับที่แสดงในรูปที่ 2 2.3. จากการค้นหารายการแนวคิดทั้งหมดอย่างสมบูรณ์ มีการเปรียบเทียบแนวคิดแต่ละคู่สองครั้ง (ครั้งแรกที่ i-th กับ j-th และในทางกลับกัน) ซึ่งทำให้สามารถลดอิทธิพลของปัจจัยสุ่มได้ . ผลลัพธ์ของการเปรียบเทียบวัตถุสองชิ้นจะถูกบันทึกที่จุดตัดของแถวและคอลัมน์ที่เกี่ยวข้อง จากทางซ้าย มุมบนเส้นทแยงมุมของศูนย์จะไปที่มุมขวาล่าง



ในการรับการจัดอันดับวัตถุ ผลลัพธ์เมทริกซ์สองมิติของเครื่องหมายบวก ศูนย์ และหน่วย (รูปที่ 2.3) จะถูกวิเคราะห์โดยโปรแกรม PR-2 (รูปที่ 3) ซึ่งสำหรับแต่ละแถวที่ i จะค้นหาผลรวมของเครื่องหมายบวกทั้งหมดและ ลบผลรวมของ minuses ทั้งหมดออกจากมัน ผลลัพธ์ที่ได้ A_i สำหรับแต่ละแถวจะถูกพิมพ์ลงบนหน้าจอ หากในโปรแกรม PR-2 คุณเปิดใช้งาน x และใส่เครื่องหมาย x ไว้ มันจะประมวลผลคอลัมน์เมทริกซ์ในลักษณะเดียวกัน ผลลัพธ์ที่สอดคล้องกัน B_i (i=1, 2, …, N) จะแสดงบนหน้าจอ ค่า K ของคุณภาพที่ประเมินของวัตถุ i-th ถือเป็นสัดส่วนกับความแตกต่าง A_i-B_i คุณสามารถเพิ่มค่าคงที่ลงไปแล้วคูณผลลัพธ์ด้วยสัมประสิทธิ์เพื่อให้ได้ค่านั้น ค่าสูงสุดลักษณะ K เท่ากับหนึ่ง และค่าต่ำสุดเท่ากับศูนย์

2. โปรแกรมวิเคราะห์เนื้อหาข้อความ

วิธีการวิเคราะห์เนื้อหาประกอบด้วย "การแปลข้อมูลข้อความจำนวนมากเป็นตัวบ่งชี้เชิงปริมาณ" และต่อมา การประมวลผลทางสถิติ- ในการประเมินจำนวนความรู้เชิงประจักษ์ทฤษฎีและคณิตศาสตร์ที่มีอยู่ในข้อความจำเป็นต้องกำหนดจำนวนการใช้คำศัพท์ "เชิงประจักษ์" (หมายถึงวัตถุและปรากฏการณ์เครื่องมือและอุปกรณ์) คำศัพท์ "ทางทฤษฎี" (ชื่อ ปริมาณทางกายภาพ) คำศัพท์ทางคณิตศาสตร์ (ปริมาณทางคณิตศาสตร์ การดำเนินการ สัญลักษณ์ในสูตร) ​​และคำศัพท์ทางวิทยาศาสตร์ทั่วไป (เช่น “เราจะพิสูจน์” “การวัด” “วิเคราะห์” ฯลฯ) หน่วยวัดปริมาณข้อมูลคือการกล่าวถึงคำศัพท์หนึ่งคำ เนื่องจากในภาษารัสเซียความยาวเฉลี่ยของคำคือ 6.3 ตัวอักษร (รวมช่องว่าง) ดังนั้นหากต้องการค้นหาจำนวนคำทั้งหมด N (จำนวนข้อมูลในข้อความ I) ก็เพียงพอที่จะหารจำนวนตัวอักษรทั้งหมดด้วย 6.3

วิธีวิทยาสำหรับการวิเคราะห์เชิงคุณภาพและเชิงปริมาณของเนื้อหาของตำราการศึกษานั้นเกี่ยวข้องกับการเลือกเกณฑ์ที่ละเอียดถี่ถ้วนและไม่เกิดร่วมกันและการกำหนดกฎสำหรับการบันทึกลักษณะที่จำเป็นของข้อความอย่างน่าเชื่อถือเพื่อให้ผลลัพธ์ที่ได้ไม่ขึ้นอยู่กับผู้เชี่ยวชาญ สามารถทำซ้ำได้สูงและสะท้อนถึงลักษณะวัตถุประสงค์ของข้อความ ข้อความทางกายภาพรวมถึงข้อมูลจริงด้วย ข้อมูลข้อความ, ภาพวาด ( ข้อมูลกราฟิก) และสูตร ในการประมาณปริมาณข้อมูลในรูปและสูตร เราจะแทนที่ด้วยประโยคที่สั้นที่สุดเท่าที่จะเป็นไปได้ซึ่งสื่อถึงเนื้อหาที่อยู่ในนั้นได้ครบถ้วน ข้อมูลการศึกษา. มันเกี่ยวกับโอ ข้อมูลที่เป็นประโยชน์จำเป็นสำหรับการเรียนรู้ย่อหน้าที่เกี่ยวข้องของตำราเรียน ( ข้อมูลที่ไม่จำเป็นที่มีอยู่ในตัวเลขจะไม่นำมาพิจารณา)

สามารถสันนิษฐานได้ว่าปริมาณของข้อมูล "สูตร" เป็นสัดส่วนกับจำนวน สัญลักษณ์ทางคณิตศาสตร์ปรากฏในข้อความและสูตร สัญลักษณ์แต่ละอันสอดคล้องกับแนวคิดบางอย่าง เราจะประเมินความซับซ้อนของสัญลักษณ์ในระดับห้าจุด: 1. ความซับซ้อน S=1: สัญลักษณ์เดี่ยว (ไม่ใช่เวกเตอร์) ผลรวม ผลต่าง ผลิตภัณฑ์และการหาร 2. ความซับซ้อน S=2: การยกกำลัง การแยกราก การบวกและการลบเวกเตอร์ 3. ความยาก S=3: สูตรประกอบด้วย ฟังก์ชันตรีโกณมิติ, ลอการิทึม, ผลคูณสเกลาร์ของเวกเตอร์ 4. ความซับซ้อน S=4: ขีดจำกัด ส่วนต่าง อนุพันธ์ ผลคูณเวกเตอร์ 5. ความซับซ้อน S=5: ปริพันธ์ ตัวดำเนินการ ฯลฯ จำนวนสัญลักษณ์ทางคณิตศาสตร์ในย่อหน้าที่มีความซับซ้อน S=1, 2, 3, 4, 5 จะถูกนับ และผลลัพธ์จะถูกกำหนดให้กับองค์ประกอบของเมทริกซ์ mat_sim[i] (โปรแกรม Analizer, ขั้นตอน Formuli)

ในรูป 4 นำเสนอ โปรแกรมพิเศษตัววิเคราะห์ (สภาพแวดล้อม Free Pascal) ซึ่งใช้พจนานุกรมอรรถาภิธานในการนับความถี่ของการกล่าวถึงคำศัพท์ทางกายภาพและทางคณิตศาสตร์ต่างๆ ในไฟล์ข้อความ การวิเคราะห์เนื้อหาของข้อความดำเนินการดังนี้ 1. กำหนดความซับซ้อนและปริมาณของข้อมูล "สูตร" โดยการนับจำนวนสัญลักษณ์ทางคณิตศาสตร์ที่มีความซับซ้อนต่างกันในข้อความและสูตร ผลลัพธ์จะถูกป้อนลงใน mat_sim[i]2. แทนที่ภาพวาด คำอธิบายสั้น ๆซึ่งมีข้อมูลเกี่ยวกับวัตถุทางกายภาพและทางคณิตศาสตร์ที่ปรากฎในภาพ 3. สร้างไฟล์ข้อความในรูปแบบ vhod1.txt ที่มีข้อความที่วิเคราะห์พร้อมคำอธิบายรูปภาพโดยไม่มีสูตร (รูปที่ 5) 4. เขียนรายการคำศัพท์ทางฟิสิกส์ คณิตศาสตร์ และวิทยาศาสตร์ทั่วไปที่พบในเนื้อหานี้ ในการดำเนินการนี้ให้ใช้โปรแกรม Word_stat, Word_count, Word_statistic ซึ่งสามารถพบได้บนอินเทอร์เน็ต 5. สร้างพจนานุกรม - อรรถาภิธานของข้อความที่มีส่วนทั่วไปของคำศัพท์ที่เชื่อมโยงกัน (เช่นคำว่า diffraction, diffract, diffraction - ส่วนทั่วไปของ "diffraction") ซึ่งถูกบันทึกไว้ในไฟล์ slovar.txt (รูปที่ 6.1 ). 6. แต่ละภาคเรียนถูกกำหนดให้กับหนึ่งในชั้นเรียน "เชิงประจักษ์", "เชิงทฤษฎี", "คณิตศาสตร์", "วิทยาศาสตร์ทั่วไป" และประเมินความซับซ้อนในระดับ 1-2-3 ผลลัพธ์จะถูกเขียนลงในไฟล์ Dictionary.txt 7. เปิดตัว โปรแกรมวิเคราะห์ซึ่งเมื่อเข้าถึงไฟล์ slovar.txt จะวิเคราะห์ข้อความที่จัดเก็บไว้ในไฟล์ vhod1.txt และเขียนผลลัพธ์ลงในไฟล์ vihod1.txt นอกจากนี้ยังมีการสร้างโปรไฟล์ข้อความซึ่งประกอบด้วยเมทริกซ์ของคำที่พบบ่อยที่สุดและความถี่ (รูปที่ 6.2) 8. ตีความผลลัพธ์ที่ได้รับ สร้างตาราง สร้างฮิสโตแกรม ฯลฯ

บทสรุป

บทความแนะนำ ตัวเลือกง่ายๆการแก้ปัญหาการประเมินวัตถุโดยอัตโนมัติโดยใช้วิธีเปรียบเทียบคู่และกำหนดจำนวนข้อมูลประเภทต่าง ๆ ในข้อความ การเปรียบเทียบ ประเมิน และจัดอันดับวัตถุ ตลอดจนกำหนดจำนวนข้อมูลประเภทต่างๆ ในข้อความ - ขั้นตอนสำคัญการวัดที่ใช้ในมนุษยศาสตร์ การใช้โปรแกรม PR-1 และ PR-2 (รูปที่ 1 และ 3) ซึ่งช่วยใช้วิธีการเปรียบเทียบแบบคู่ ทำให้สามารถประเมินความซับซ้อนทางการสอนของแนวคิดที่แสดงถึงเครื่องมือทางกายภาพ ปริมาณ และการทดลองทางกายภาพได้ ทั้งหมดนี้ทำให้สามารถจัดประเภทหนังสือเรียนและหัวข้อของหลักสูตรฟิสิกส์ของโรงเรียนตามการประเมินความซับซ้อนทางกายภาพและคณิตศาสตร์ และเพื่อสร้างรูปแบบการแจกจ่ายสื่อการเรียนรู้ โปรแกรม PR-3 (รูปที่ 4) ใช้สำหรับการวิเคราะห์เนื้อหาของย่อหน้าในตำราฟิสิกส์ต่างๆ

  • วิธี Mayer R.V. ในการประเมินความซับซ้อนทางกายภาพของหัวข้อในหลักสูตรฟิสิกส์ของโรงเรียน // แนวคิด – 2557 – ฉบับที่ 08 (สิงหาคม) – ศิลปะ 14199 – URL: http://e-koncept.ru/2014/14199.htm - นาย เร็ก อีเมล ไม่มี FS 77–49965
  • เมเยอร์ อาร์.วี. การประเมินความซับซ้อนทางการสอนของแนวคิดทางกายภาพโดยใช้วิธีเปรียบเทียบคู่ // โลกแห่งวิทยาศาสตร์ วารสารออนไลน์ทางวิทยาศาสตร์ [ ทรัพยากรอิเล็กทรอนิกส์- – 2014 ฉบับที่ 3 – 8 น. http://mir-nauki.com
  • เมเยอร์ อาร์.วี. การประเมินความซับซ้อนทางการสอนของตำราฟิสิกส์ต่างๆ // สมัยใหม่ การวิจัยทางวิทยาศาสตร์และนวัตกรรม – พฤษภาคม 2014 – ลำดับที่ 5 [ทรัพยากรอิเล็กทรอนิกส์] URL: http://web.snauka.ru/issues/2014/05/34429
  • เมเยอร์ อาร์.วี. วิธีการที่มีประสิทธิภาพการประเมินความซับซ้อนในการสอนของแนวคิดทางกายภาพ // การวิจัยขั้นพื้นฐาน- – N 11. – 2014. – หน้า 904–909.
  • Psychosemantics ของคำและสถิติทางภาษาของข้อความ: คำแนะนำที่เป็นระบบสู่หลักสูตรพิเศษ/คอมพ์ เอ.พี. วาร์โฟโลมีเยฟ. – คาลินินกราด: คาลินินกราด ม., 2000. – 37 น.
  • Tolstova Yu.N. พื้นฐานของการปรับขนาดหลายมิติ: คู่มือการฝึกอบรม- – อ.: มข., 2549. – 160 น.
  • จำนวนการดูสิ่งพิมพ์: โปรดรอ

    วิธีการวิเคราะห์เนื้อหาประกอบด้วย "การแปลข้อมูลข้อความจำนวนมากเป็นตัวบ่งชี้เชิงปริมาณ" และการประมวลผลทางสถิติที่ตามมา ในการประเมินปริมาณความรู้เชิงประจักษ์ เชิงทฤษฎี และคณิตศาสตร์ที่มีอยู่ในข้อความ จำเป็นต้องกำหนดจำนวนการใช้คำศัพท์ "เชิงประจักษ์" (หมายถึงวัตถุและปรากฏการณ์ เครื่องมือและอุปกรณ์) เงื่อนไข "ทางทฤษฎี" (ชื่อของปริมาณทางกายภาพ ) คำศัพท์ทางคณิตศาสตร์ (ปริมาณทางคณิตศาสตร์ การดำเนินการ สัญลักษณ์ในสูตร) ​​และคำศัพท์ทางวิทยาศาสตร์ทั่วไป (เช่น “เราจะพิสูจน์” “การวัด” “เราจะวิเคราะห์” ฯลฯ) หน่วยวัดปริมาณข้อมูลคือการกล่าวถึงคำศัพท์หนึ่งคำ เนื่องจากในภาษารัสเซียความยาวเฉลี่ยของคำคือ 6.3 ตัวอักษร (รวมช่องว่าง) ดังนั้นหากต้องการค้นหาจำนวนคำทั้งหมด N (จำนวนข้อมูลในข้อความ I) ก็เพียงพอที่จะหารจำนวนตัวอักษรทั้งหมดด้วย 6.3

    วิธีวิทยาสำหรับการวิเคราะห์เชิงคุณภาพและเชิงปริมาณของเนื้อหาของตำราการศึกษานั้นเกี่ยวข้องกับการเลือกเกณฑ์ที่ละเอียดถี่ถ้วนและไม่เกิดร่วมกันและคำจำกัดความของกฎสำหรับการบันทึกลักษณะที่จำเป็นของข้อความอย่างน่าเชื่อถือเพื่อให้ผลลัพธ์ที่ได้ไม่ขึ้นอยู่กับผู้เชี่ยวชาญ สามารถทำซ้ำได้สูงและสะท้อนถึงลักษณะวัตถุประสงค์ของข้อความ ข้อความทางกายภาพรวมถึงข้อมูลข้อความจริง ภาพวาด (ข้อมูลกราฟิก) และสูตร เพื่อประเมินปริมาณข้อมูลในรูปภาพและสูตร เราจะแทนที่ด้วยประโยคที่สั้นที่สุดเท่าที่จะเป็นไปได้ซึ่งสื่อถึงข้อมูลทางการศึกษาที่มีอยู่ในรูปภาพและสูตรได้ครบถ้วน เรากำลังพูดถึงข้อมูลที่เป็นประโยชน์ที่จำเป็นสำหรับการเรียนรู้ย่อหน้าที่เกี่ยวข้องของหนังสือเรียน (ไม่คำนึงถึงข้อมูลที่ไม่จำเป็นที่อยู่ในรูปภาพ)

    ประมาณว่าเราสามารถสรุปได้ว่าจำนวนข้อมูล "สูตร" เป็นสัดส่วนกับจำนวนสัญลักษณ์ทางคณิตศาสตร์ที่พบในข้อความและในสูตร สัญลักษณ์แต่ละอันสอดคล้องกับแนวคิดบางอย่าง เราจะประเมินความซับซ้อนของสัญลักษณ์ในระดับห้าจุด: 1. ความซับซ้อน S=1: สัญลักษณ์เดี่ยว (ไม่ใช่เวกเตอร์) ผลรวม ผลต่าง ผลิตภัณฑ์และการหาร 2. ความซับซ้อน S=2: การยกกำลัง การแยกราก การบวกและการลบเวกเตอร์ 3. ความซับซ้อน S=3: สูตรประกอบด้วยฟังก์ชันตรีโกณมิติ ลอการิทึม ผลคูณสเกลาร์ของเวกเตอร์ 4. ความซับซ้อน S=4: ขีดจำกัด ส่วนต่าง อนุพันธ์ ผลคูณเวกเตอร์ 5. ความซับซ้อน S=5: ปริพันธ์ ตัวดำเนินการ ฯลฯ จำนวนสัญลักษณ์ทางคณิตศาสตร์ในย่อหน้าที่มีความซับซ้อน S=1, 2, 3, 4, 5 จะถูกนับ และผลลัพธ์จะถูกกำหนดให้กับองค์ประกอบของเมทริกซ์ mat_sim[i] (โปรแกรม Analizer, ขั้นตอน Formuli)

    ในรูป 4 นำเสนอโปรแกรมวิเคราะห์พิเศษ (สภาพแวดล้อม Free Pascal) ซึ่งใช้พจนานุกรมอรรถาภิธานในการนับความถี่ของการกล่าวถึงคำศัพท์ทางกายภาพและทางคณิตศาสตร์ต่างๆในไฟล์ข้อความ การวิเคราะห์เนื้อหาของข้อความดำเนินการดังนี้ 1. กำหนดความซับซ้อนและปริมาณของข้อมูล "สูตร" โดยการนับจำนวนสัญลักษณ์ทางคณิตศาสตร์ที่มีความซับซ้อนต่างกันในข้อความและสูตร ผลลัพธ์จะถูกป้อนลงใน mat_sim[i] 2. แทนที่ภาพวาดด้วยคำอธิบายสั้น ๆ ที่มีข้อมูลเกี่ยวกับวัตถุทางกายภาพและทางคณิตศาสตร์ที่ปรากฎในภาพวาด 3. สร้างไฟล์ข้อความในรูปแบบ vhod1.txt ที่มีข้อความที่วิเคราะห์พร้อมคำอธิบายรูปภาพโดยไม่มีสูตร (รูปที่ 5) 4. เขียนรายการคำศัพท์ทางฟิสิกส์ คณิตศาสตร์ และวิทยาศาสตร์ทั่วไปที่พบในเนื้อหานี้ ในการดำเนินการนี้ให้ใช้โปรแกรม Word_stat, Word_count, Word_statistic ซึ่งสามารถพบได้บนอินเทอร์เน็ต 5. สร้างพจนานุกรม - อรรถาภิธานของข้อความที่มีส่วนทั่วไปของคำศัพท์ที่เชื่อมโยงกัน (เช่นคำว่า diffraction, diffract, diffraction - ส่วนทั่วไปของ "diffraction") ซึ่งถูกบันทึกไว้ในไฟล์ slovar.txt (รูปที่ 6.1 ). 6. แต่ละภาคเรียนถูกกำหนดให้กับหนึ่งในชั้นเรียน "เชิงประจักษ์", "เชิงทฤษฎี", "คณิตศาสตร์", "วิทยาศาสตร์ทั่วไป" และประเมินความซับซ้อนในระดับ 1-2-3 ผลลัพธ์จะถูกเขียนลงในไฟล์ Dictionary.txt 7. เปิดโปรแกรม Analyzer ซึ่งโดยการเข้าถึงไฟล์ slovar.txt จะวิเคราะห์ข้อความที่จัดเก็บไว้ในไฟล์ vhod1.txt และเขียนผลลัพธ์ลงในไฟล์ vihod1.txt นอกจากนี้ยังมีการสร้างโปรไฟล์ข้อความซึ่งประกอบด้วยเมทริกซ์ของคำที่พบบ่อยที่สุดและความถี่ (รูปที่ 6.2) 8. ตีความผลลัพธ์ที่ได้รับ สร้างตาราง สร้างฮิสโตแกรม ฯลฯ

    นำเสนอที่นี่ ลักษณะโดยย่อโปรแกรมสำหรับการวิเคราะห์เนื้อหา ผมจะค่อยๆขยายรายการ รีวิวโดยละเอียดจะมีอยู่ในบล็อกในส่วนเกี่ยวกับโปรแกรมสำหรับการวิเคราะห์เนื้อหา

    เล็คต้า— สร้างการวิเคราะห์เนื้อหาหลายมิติของอาร์เรย์ข้อความ บน ระยะเริ่มแรกช่วยในการรวบรวมพจนานุกรมวิเคราะห์เนื้อหาทั้งตามความถี่และตามระบบหมวดหมู่ที่สร้างไว้ล่วงหน้า ช่วยให้คุณแบ่งข้อความออกเป็นส่วนที่มีขนาดเท่ากัน ถัดไป ช่วยให้คุณสามารถรวมหน่วยการนับและส่วนของข้อความเข้าเป็นกลุ่มๆ โดยใช้การวิเคราะห์ปัจจัย ดังนั้นผู้วิจัยจึงมีโครงสร้างที่ชัดเจนของลักษณะของวิชาที่กำลังศึกษาอยู่ พื้นที่ข้อมูลสมเหตุสมผลโดยหลักการความถี่ของคำศัพท์ที่รวมอยู่ในพจนานุกรม ตามด้วยการตีความเชิงคุณภาพของบล็อกเฉพาะเรื่องที่เกิดขึ้น คำอธิบายโดยละเอียดทำงานในโปรแกรม LECTA บนบล็อก

    ATLAS.ti— โปรแกรมช่วยให้คุณวิเคราะห์เนื้อหาคุณภาพสูงทั้งข้อความ เสียง วิดีโอ เอกสารกราฟิก. ความสนใจมากทุ่มเทให้กับกระบวนการเข้ารหัสวัสดุ คำอธิบายโดยละเอียดเกี่ยวกับวิธีการทำงานของโปรแกรมอยู่ในบล็อก

    ทาบาริ(KEDS) คือโปรแกรมสำหรับการเข้ารหัสข้อมูลเหตุการณ์ทางการเมืองโดยอัตโนมัติ ใช้ตัววิเคราะห์ในตัวเพื่อระบุคำที่ใช้ในการวิเคราะห์เนื้อหา เมื่อรันโปรแกรมจะเข้าถึงพจนานุกรมในตัวและดาวน์โหลดได้ ข้อมูลสามารถนำไปใช้ในการทำงานอื่นๆได้ โปรแกรมพิเศษเช่น SPSS และ SAS

    เจความถี่สร้างเมทริกซ์ความถี่ของการใช้คำในอาเรย์ ใช้สำหรับการวิเคราะห์เนื้อหา และทำงานร่วมกับภาษาส่วนใหญ่ของโลก ไม่สามารถใช้ได้กับภาษาญี่ปุ่น จีน และไทย เนื่องจากระบบภาษาของภาษาเหล่านี้มีพื้นฐานแตกต่างจากภาษาส่วนใหญ่ โปรแกรมช่วยให้คุณสามารถแยกอักขระที่อ่านไม่ได้และอักขระที่ไม่รวมอยู่ในฐานข้อมูลตามตัวอักษรออกจากอาร์เรย์ ทำงานบนระบบปฏิบัติการใดก็ได้

    ความสอดคล้องโปรแกรมที่ใช้ในการวิเคราะห์เนื้อหา เอกสารอิเล็กทรอนิกส์, ในนั้นคุณสามารถสร้างรายการหน่วยบัญชี ดัชนี คำที่เกี่ยวข้องเมื่อทำงานกับข้อความอิเล็กทรอนิกส์ ช่วยให้คุณประมวลผลอาร์เรย์ขนาดใหญ่ ทำให้สามารถดูความสัมพันธ์ระหว่างคำที่รวมอยู่ในพจนานุกรมการวิเคราะห์เนื้อหาได้ ผลงานของคุณสามารถโพสต์บนอินเทอร์เน็ตได้อย่างง่ายดายโดยใช้เครื่องมือในตัวของโปรแกรม คำอธิบายในบล็อก -

    ไฮเปอร์รีเสิร์ชช่วยให้คุณสามารถเข้ารหัส ค้นหาและถอดรหัสข้อความ เสียง และวิดีโอได้ ช่วยให้สามารถวิเคราะห์รูปแบบข้อมูลดังกล่าวได้

    เล็กซิแมนเซอร์– พูดได้หลายภาษา ซอฟต์แวร์ดำเนินการวิเคราะห์เนื้อหา ปริมาณมากข้อความ ช่วยให้คุณสามารถรวมข้อความประเภทและสไตล์ที่แตกต่างกันในอาเรย์ รวมถึงวิภาษวิธีและภาษารูปแบบอื่น ๆ ที่ไม่ใช่แบบดั้งเดิม

    โปรแทน– ชุดโปรแกรม 30 โปรแกรมที่รวมอยู่ในบล็อกเดียว ช่วยให้สามารถวิเคราะห์เนื้อหาของอาร์เรย์ข้อความโดยใช้พจนานุกรมในตัวและระบุโครงเรื่อง กำหนดความสัมพันธ์ระหว่างคำในพจนานุกรมผ่านการวิเคราะห์ปัจจัย ครอบครอง จำนวนมากฟังก์ชั่นอื่น ๆ

    // ]]>แพ็คข้อความ– เข้ารหัสข้อความตามพจนานุกรมที่ผู้ใช้สร้างขึ้น เปรียบเทียบเอกสาร 2 ฉบับ เปรียบเทียบเนื้อหาคำศัพท์ ตรวจพบข้อความที่คล้ายกันภายในเอกสาร ข้อมูลนำเข้าไปยังแพ็คเกจ เช่น SPSS หรือ SAS ได้อย่างง่ายดาย

    คิวดีเอ คนขุดแร่เป็นเครื่องมือสำหรับการวิเคราะห์ข้อมูลข้อความเชิงคุณภาพ คำอธิบายประกอบ การเรียกค้น และการตรวจสอบข้อมูลที่เข้ารหัส โปรแกรมช่วยให้คุณทำงานได้ จำนวนมากเอกสารที่มีทั้งข้อมูลข้อความและตัวเลข QDA Miner ยังมีเครื่องมือค้นหาที่หลากหลายเพื่อระบุความสัมพันธ์ในข้อมูลที่เข้ารหัส (QDA MINER LITE มีอธิบายอยู่ในบล็อก)

    WordStatโมดูลการวิเคราะห์ข้อความที่ออกแบบมาโดยเฉพาะสำหรับการประมวลผลสื่อ เช่น บทความในนิตยสาร งานวรรณกรรม บทสัมภาษณ์ เช่นเดียวกับคนอื่นๆ โปรแกรมที่คล้ายกันช่วยให้คุณสร้างเครื่องมือจัดหมวดหมู่และพจนานุกรมการวิเคราะห์เนื้อหา การวิเคราะห์เพิ่มเติมสามารถทำได้โดยใช้การสร้างและการคำนวณตารางไขว้ รวมถึงวิธี KWIS แพ็คเกจช่วยให้คุณทำงานได้มากขึ้น วิธีการที่ซับซ้อน การวิเคราะห์ทางสถิติเช่น การจัดกลุ่มและการปรับขนาดหลายมิติ อุปกรณ์จัดหมวดหมู่และพจนานุกรมสคีมาที่สร้างขึ้นสามารถนำไปใช้กับอาร์เรย์ข้อความอื่นๆ ได้ในอนาคต

    เกลือ– ซอฟต์แวร์ที่วิเคราะห์เนื้อหาของอาร์เรย์ข้อความ รองรับการทำงานกับทุกภาษา กำหนดความยาวเฉลี่ยของประโยค จำนวนคำที่ค้นหา และจำนวนคำทั้งหมด สามารถสร้าง รายการตามตัวอักษรคำ เข้ารหัสอาร์เรย์ข้อความตามรหัสที่กำหนดโดยผู้วิจัย ใช้ได้กับเท่านั้น ระบบปฏิบัติการหน้าต่าง

    โมโนคอน –ค้นหาหน่วย การวิเคราะห์ข้อความกำหนดความสัมพันธ์ระหว่างสิ่งเหล่านั้นในอาร์เรย์

    โทรเปส– ดำเนินการวิเคราะห์เชิงคุณภาพตามลำดับเวลาของข้อความ ยังช่วยให้คุณได้รับ ข้อมูลทั่วไปตามความถี่ในการใช้บัญชีบางหน่วย

    ควอรัสเป็นเครื่องมือสำหรับดำเนินการวิเคราะห์ข้อมูลเชิงคุณภาพ เข้ารหัสองค์ประกอบอาเรย์เพื่อประมวลผลต่อไป สามารถใช้ Qualrus เพื่อดำเนินการได้ เต็มสเปกตรัมการวิจัยเชิงคุณภาพ ได้แก่ การวิเคราะห์วัฒนธรรม วิธีการตีความ สัญศาสตร์ ประวัติศาสตร์ การถ่ายคร่อม การวิเคราะห์เชิงประจักษ์ การวิเคราะห์เรื่องราวและผลงานประเภทอื่น

    คามีโอ– ระบบที่สร้างขึ้นเพื่อการเข้ารหัสและวิเคราะห์การสื่อสารทางการเมือง รวม 20 หมวดหมู่เหตุการณ์หลักและ 200 หมวดหมู่ย่อย ซึ่งเป็นฐานข้อมูลที่ครอบคลุมสำหรับการเข้ารหัสชื่อนักการเมืองในข้อความ

    แอนโนเทปเป็นซอฟต์แวร์สำหรับบันทึกและวิเคราะห์ข้อมูลเสียง วิดีโอ กราฟิกและข้อความที่มีจุดประสงค์เพื่อการวิจัยเชิงคุณภาพ การตลาด การสื่อสารมวลชนด้วยสื่อ บริการเก็บเอกสารสำคัญ การบันทึก ไฟล์เสียง– สัมภาษณ์ สนทนา ออกอากาศทางวิทยุโดยตรง ฮาร์ดไดรฟ์คอมพิวเตอร์. ช่วยให้คุณสามารถจัดเก็บเสียงได้นานถึงหนึ่งร้อยชั่วโมงพร้อมกับข้อมูลข้อความในฐานข้อมูลรวมเดียว ดำเนินการวิเคราะห์ข้อมูล คำอธิบายประกอบ และการจัดทำดัชนีเสียงต้นฉบับและ ไฟล์ข้อความ- แยกอาร์เรย์ข้อมูลเสียงออกเป็นส่วนๆ อย่างมีประสิทธิภาพ