บอทสนทนา chatbot ของ Microsoft เป็นการทดสอบทัวริงที่ใหญ่ที่สุดเท่าที่เคยมีมา

การเรียนรู้ของเครื่อง

เทคโนโลยีการค้นหา

ความหมาย

การพัฒนาเว็บไซต์

ฉันเคยเขียนเกี่ยวกับแชทบอทที่ใช้โครงข่ายประสาทเทียมเมื่อไม่นานมานี้ วันนี้ฉันจะพูดถึงวิธีที่ฉันพยายามสร้างเวอร์ชันภาษารัสเซียเต็มรูปแบบ

ระบบบทสนทนาที่เรียนรู้ได้ซึ่งซื้อมาจาก เมื่อเร็วๆ นี้ความนิยมที่ไม่คาดคิด น่าเสียดายที่ทุกสิ่งทุกอย่างที่ทำภายในกรอบของระบบการสนทนาโครงข่ายประสาทเทียมนั้นทำเพื่อภาษาอังกฤษ แต่วันนี้เราจะมาเติมเต็มช่องว่างนี้และสอนโมเดลให้พูดภาษารัสเซีย

วิธี
ฉันตัดสินใจเริ่มต้นด้วยการละทิ้งการสร้างข้อความแบบคำต่อคำ มันเจ๋ง แต่ก็ไม่มีประโยชน์เท่าที่ควรและเป็นเรื่องยากโดยเฉพาะอย่างยิ่งสำหรับภาษารัสเซียด้วย จำนวนมากรูปแบบคำที่แตกต่างกัน แต่ฉันตัดสินใจเลือกคำตอบที่ถูกต้องจากฐานข้อมูลขนาดใหญ่แทน เหล่านั้น. เป้าหมายคือการสร้างโครงข่ายประสาทเทียมที่กำหนดว่าประโยคนั้นเป็นคำตอบที่เหมาะสมหรือไม่ โดยพิจารณาจากบริบทของการสนทนาหรือไม่

ทำไมจึงเป็นเช่นนั้น:
- เราไม่จำเป็นต้องมีเลเยอร์ softmax ขนาดใหญ่ในการเลือกคำ ซึ่งหมายความว่าเราสามารถจัดสรรทรัพยากรเครือข่ายประสาทมากขึ้นให้กับงานการวิเคราะห์ข้อความจริงได้
- โมเดลการจับคู่ที่ได้นั้นเหมาะสำหรับวัตถุประสงค์ที่แตกต่างกัน ในทางทฤษฎี มันเป็นไปได้ที่จะทำให้แชทบอทสื่อสารในรูปแบบที่แตกต่างกัน หัวข้อพิเศษเพียงดาวน์โหลด ฐานใหม่ข้อความโดยไม่มีการฝึกอบรมใหม่ สิ่งนี้มีประโยชน์ในทางปฏิบัติ
- เป็นไปได้ที่จะสร้างโมเดลที่ทำงานเร็วและสามารถสื่อสารกับผู้ใช้หลายคนพร้อมกันได้จริงโดยไม่ต้องใช้ GPU หลายตัวบนเซิร์ฟเวอร์

เพื่ออะไร
โดยทั่วไป ระบบบทสนทนาเฉพาะเรื่องทั่วไปมีประโยชน์ เช่น ในที่ปรึกษาออนไลน์ เพื่อให้ที่ปรึกษาสามารถพูดคุยเกี่ยวกับหัวข้อที่ไม่เกี่ยวข้องกับงานหลัก ในเกม และในงานอื่นๆ อีกจำนวนหนึ่ง

ทำไมต้องโครงข่ายประสาทเทียม?
เป็นไปได้ไหมที่จะแก้ไขปัญหาโดยใช้วิธีดั้งเดิมกว่านี้? โหลดชุดคำตอบลงในฐานข้อมูลและค้นหาด้วยดัชนีข้อความแบบเต็มสำหรับวลีก่อนหน้าหรือไม่ คำตอบคือ ทำได้แต่ผลลัพธ์ไม่ค่อยดีนัก สมมติว่า:

ซี: สวัสดี!
K: เกร็ก มาเรีย นี่อาลี...
ซี: เป็นยังไงบ้าง?
K: มีเสียงบ่นจากห้องข้างๆ ครับนาย
ซี: คุณชื่ออะไร?
เค: ขอบคุณ ขอบคุณ
ซี: คุณอายุเท่าไหร่?
K: คุณอาศัยอยู่แถวๆ นี้หรือเปล่า...?

การค้นหาผ่านฐานข้อมูลขนาดใหญ่ของคำตอบให้ผลลัพธ์มากมาย แต่ความเกี่ยวข้องมีน้อย ดังนั้นบทสนทนาจึงค่อนข้างดี คุณภาพต่ำ- นี่คือจุดที่มันควรจะช่วยเรา โครงข่ายประสาทเทียม– ด้วยความช่วยเหลือนี้ เราจะจัดเรียงคำตอบที่ดีจากคำตอบที่ไม่ดี

จะรับข้อมูลการฝึกอบรมได้ที่ไหน:
คำถามที่เจ็บปวดที่สุดสำหรับหลาย ๆ คน ผู้คนจึงเอาฐานข้อมูลคำบรรยายสำหรับภาพยนตร์ มีฐานข้อมูลสำหรับภาษารัสเซียถึงแม้ว่าจะมีขนาดเล็กกว่าก็ตาม แต่ปัญหาใหญ่ของฐานนี้คือ มีบทพูดคนเดียวมากมายอยู่ในนั้น ขยะต่างๆและโดยทั่วไปแล้วเป็นการยากที่จะแยกบทสนทนาออกจากกัน

ดังนั้นฉันจึงตัดสินใจไปในเส้นทางอื่นและนอกเหนือจากคำบรรยายแล้วยังรวบรวมบทสนทนาจากผู้ที่เข้ามาด้วย เปิดการเข้าถึงหนังสือ นักเขียนและผู้แต่งนิยายแฟนตาซีทุกประเภทที่มีความมุ่งมั่นได้สร้างข้อมูลจำนวนมหาศาล ดังนั้น การไม่ใช้ข้อมูลดังกล่าวถือเป็นบาป แน่นอนว่ายังมีเรื่องไร้สาระอยู่มากมาย ในกระบวนการทำงานฉันต้องอ่านสิ่งนี้อย่างหลีกเลี่ยงไม่ได้และหัวของฉันก็บวมจากการสนทนาอันยาวนานของ Sergei และเซเลอร์มูนบางคน (ใครมีความคิดแบบเดียวกัน!) แต่โดยทั่วไป นี่เป็นฐานข้อมูลที่ดีกว่าคำบรรยาย แม้ว่าจะรวบรวมได้ไม่ง่ายนัก แต่คุณต้องใช้เวลา

สถาปัตยกรรม
มีขอบเขตมากมายสำหรับจินตนาการที่นี่ ฉันเริ่มต้นด้วย ตัวเลือกง่ายๆและมุ่งไปสู่สิ่งที่ซับซ้อนเพื่อทำความเข้าใจว่าระฆังและนกหวีดต่างๆ แท้จริงแล้วมีประโยชน์อย่างไร ในบทความ ผู้คนมักจะพยายามทำให้มันเท่และติดกระดิ่งและนกหวีดใหม่ๆ แต่เนื่องจากพื้นที่นี้ยังเป็นพื้นที่ใหม่ ประโยชน์ของสิ่งนี้จึงไม่ชัดเจนเสมอไป

โมเดลที่ง่ายที่สุดจะนำลำดับของเวกเตอร์บริบทและคำตอบสนองมาต่อกัน และป้อนข้อมูลทั้งหมดลงในเลเยอร์ที่เชื่อมต่อกันอย่างสมบูรณ์ตามปกติ เนื่องจากคำตอบอาจมีความยาวต่างกัน เราจึงเขียนลงในเวกเตอร์ที่มีความยาวคงที่ โดยเติมศูนย์ "ส่วนเกิน" ลงในช่องว่าง นี่ถือว่าไม่ดี มาดูกัน.

ตัวเลือกที่สองแตกต่างออกไปตรงที่ก่อนที่จะ "ผสม" บริบทและคำตอบ พวกเขาจะได้รับเลเยอร์ "ของพวกเขาเอง" เพื่อสร้างแนวคิด อาจมีการประมวลผลหลายชั้นตามรูปแสดงสองชั้น

ตัวเลือกที่สามเข้ารหัสลำดับที่มีความยาวต่างกันโดยใช้ตัวเข้ารหัส LSTM ที่เกิดซ้ำ มันช้ากว่ามากและใช้เวลาฝึกนานกว่ามาก แต่ดูเหมือนว่าจะทำงานได้ดีขึ้น

รูปที่ 1. สถาปัตยกรรมโครงข่ายประสาทเทียม

ผลลัพธ์
โดยสามารถเลือกคำตอบที่ถูกต้องจากหลายตัวเลือกที่เสนอ (สุ่มคำตอบ) มากที่สุด ผลลัพธ์ที่ดีที่สุดแสดงแบบจำลองหมายเลข 2 โดยมีห้าชั้นสำหรับการวิเคราะห์ข้อมูลของเซลล์ประสาท 700 แต่ละเซลล์ (+1 ชั้นของการแสดงข้อมูลอินพุต และ 700 เซลล์ประสาทเช่นกัน) เพื่อฝึกเช่นนี้ เครือข่ายเชิงลึกฉันต้องใช้เลเยอร์ Highway ซึ่งช่วยให้ข้อมูลแพร่กระจายจากชั้นล่างไปยังชั้นบนได้ง่ายขึ้น และรอสองสามวันในขณะที่คำนวณโมเดลบน GPU โมเดลหมายเลข 1 ได้รับการฝึกฝนอย่างชัดเจน และหมายเลข 3 คิดมานานแล้ว และยังไปไม่ถึงผลลัพธ์ของโมเดลหมายเลข 2 หลายเปอร์เซ็นต์ สิ่งที่เตือนใจเราว่าถึงแม้มากที่สุด โมเดลที่เรียบง่ายไม่เหมาะสำหรับข้อมูลจำนวนมาก แต่คุณไม่ควรคูณเอนทิตีเกินกว่าที่จำเป็น

ระบบผลลัพธ์จะมีฐานข้อมูลแบบจำลอง 30 ล้านคู่ และโครงข่ายประสาทเทียมมีพารามิเตอร์ที่ฝึกได้ประมาณ 3 ล้านตัว

คุณจะได้รับบทสนทนาประเภทใด?

ซี: สวัสดี
เค: สวัสดี
ซี: เป็นยังไงบ้าง?
เค: ฉันไม่รู้.
ซี: คุณชื่ออะไร?
เค: ฉันชื่อยูนิซ
ซี: คุณอายุเท่าไหร่?
เค: สิบห้า.
ซี: คุณอาศัยอยู่ที่ไหน?
เค: ที่บ้าน.
ซี: ไปโรงเรียนมั้ย?
เค: ไม่
ซี: คุณเรียนที่ไหน?
K: ใน Bundeswehr
ซี: คุณชอบดนตรีไหม?
K: ใช่ ฉันชอบดนตรี.
ซี: คุณชอบดนตรีแนวไหน?
K: ส่วนใหญ่ฉันฟัง r&b, funk
ซี: คุณเชื่อเรื่องพระเจ้าไหม?
K: ฉันยังคงเชื่อในพระเจ้านะเฒ่า
C: ศีลธรรมคืออะไร?
K: สองคนอยู่ด้วยกัน - นั่นไม่มีศีลธรรมเหรอ?
C: ทะเลสีอะไร?
K: สีสันของมหาสมุทรหลังพายุ

ดีพอในความคิดของฉัน นี่เป็นอีกตัวอย่างหนึ่ง:

C: ฮิปโปโปเตมัสอาศัยอยู่ที่ไหน?
เค: มีชีวิตอยู่
C: อะไรนะ ตอนนี้เขาไม่ได้มีชีวิตอยู่แล้วเหรอ?
เค: ฉันไม่รู้.
C: แล้วเขาอาศัยอยู่ที่ไหนมาก่อน?
K: ใกล้สวนสาธารณะ บนถนน Maple Street
ซี: เขาไปไหน?
เค: เขาไปไหน?
C: ฉันถามว่าเขาไปไหน?
K: ฉันไม่เข้าใจว่าทำไมฉันถึงต้องเข้าโรงพยาบาลอีก
C: เพราะว่าคุณป่วย
K: ฉันแค่อยากช่วยเหลือผู้คน
C: งั้นบอกฉันมาว่าฮิปโปโปเตมัสอยู่ที่ไหน!
K: ทำไมคุณถึงอยากรู้เรื่องนี้มากขนาดนี้?
ซี : ตอบหน่อยสิ
K: คุณต้องการให้ฉันช่วยบอกลาครอบครัวของคุณไหม?
C: นี่เป็นภัยคุกคามเหรอ?
K: การสังเกต
C: แล้วฮิปโปโปเตมัสอยู่ที่ไหน?
K: เขาอยู่ที่ฮาวาย แต่ Raj ปกครองจากที่นี่
C: ใครคือราชา?
K: ไม่ได้เจอเขาเหรอ?
ซี: ไม่ ไม่เคย
K: กาลครั้งหนึ่งมีสามีภรรยาคู่หนึ่ง มีเพียงสามีเท่านั้นที่หายตัวไปทุกคืน

หนึ่งใน เงื่อนไขที่สำคัญที่สุดความเชี่ยวชาญ ภาษาอังกฤษคือการปฏิบัติในการใช้งาน แม้ว่าคุณจะเรียนภาษาอังกฤษ แต่การสื่อสารด้วยการเขียนและการพูดยังคงเป็นส่วนที่สำคัญที่สุดของการเรียนรู้ มีหลายวิธีในการจัดการประสบการณ์ทางภาษาดังกล่าว

บทความนี้กล่าวถึงหนึ่งในความลับเหล่านี้ซึ่งไม่ใช่ทุกคนที่ยังรู้อยู่ว่าคุณสามารถฝึกเขียนภาษาอังกฤษด้วยหุ่นยนต์ได้อย่างไรโดยไม่เสียค่าใช้จ่าย บทความนี้ยังมีรายการที่คล้ายกันอีกด้วย โปรแกรมอัจฉริยะพร้อมลิงก์ ในความเป็นจริง ในบางประเทศ เช่น ญี่ปุ่น ผู้คนจ่ายเงินเพื่อเรียนภาษาอังกฤษด้วยหุ่นยนต์และแชทบอท

ฉันสนับสนุนให้นักเรียนใช้ภาษาทุกครั้งที่เป็นไปได้ นักเรียนที่อาศัย ทำงาน หรือเดินทางไปต่างประเทศมีความก้าวหน้าเร็วขึ้นเมื่อใช้ภาษาอังกฤษ ชีวิตประจำวัน- และพวกที่มีคนรักแต่แยกทางกัน อุปสรรคด้านภาษาโดยทั่วไปแล้วพวกเขาจะเชี่ยวชาญภาษาต่างประเทศด้วยความเร็วเทอร์โบ

นักเรียนที่ไม่มีโอกาสดังกล่าวด้วยความช่วยเหลือของฉัน ค้นหาชาวต่างชาติเพื่อการสื่อสารและฝึกฝนภาษา แต่มีข้อผิดพลาดที่ซ่อนอยู่หลายประการที่นี่ ประการแรก ไม่ใช่ทุกคนที่ต้องการค้นหาและขี้เกียจ ประการที่สอง การลงทะเบียนบนเว็บไซต์และการค้นหาพันธมิตรมักจะใช้เวลานาน ประการที่สามภาษาอังกฤษของเพื่อนใหม่บางครั้งก็ไม่เป็นที่ต้องการมากนัก อันที่จริงนี่คือ ตัวเลือกที่ดีที่สุดแม้จะมี “หลุมพราง” บางประการก็ตาม อย่างไรก็ตาม บางครั้งคุณก็ต้องการบางสิ่งที่เร็วขึ้น เมื่อฉันเขียนและพวกเขาตอบคุณทันที

การค้นหาวิธีแก้ไขปัญหานี้ทำให้ฉันมาถึงหัวข้อแชทบอทสำหรับการเรียนภาษาอังกฤษ ด้วยคำพูดง่ายๆคุณสามารถโต้ตอบได้ และในบางกรณีก็สื่อสารด้วยเสียงได้ด้วยหุ่นยนต์อัจฉริยะที่ตอบได้ค่อนข้าง "ตรงประเด็น" หุ่นยนต์เหล่านี้หลายตัวผ่านการทดสอบทัวริงแล้ว และในบางกรณีคุณแทบจะเดาไม่ได้เลยว่านี่คือหุ่นยนต์ไม่ใช่คน

ข้อดีของการฝึกภาษาอังกฤษกับบอท:

พวกเขาตอบเสมอทุกครั้งที่คุณเขียนถึงพวกเขา
ภาษาอังกฤษของพวกเขารู้หนังสืออยู่เสมอและพวกเขาก็รู้

รายชื่อแชทบอทสำหรับฝึกภาษา:

ไมค์เป็นนักสนทนาที่ดี
Elbot เป็นนักสนทนาที่ดี
Cleverbot (ไม่โง่จริงๆ) + มีความเป็นไปได้ในการสื่อสารด้วยเสียง)
Zabaware (บอทที่ฉลาดพอสมควรและออกเสียงวลีด้วย)
John Lennon (ใช่อันเดียวกัน คลิกเมนูด้านซ้าย “Chat with...”)
อะโคบอท แอพที่ยอดเยี่ยมบน Android ซึ่งมุ่งเป้าไปที่การเรียนภาษาอังกฤษโดยเฉพาะ มันเป็นไปได้เช่น

“พบกับ Xiaoice เด็กสาวที่อ่อนไหวและเอาใจใส่ซึ่งพร้อมอยู่เคียงข้างคุณเสมอ เธอไม่ใช่มนุษย์เท่านั้น”

ไม่เหมือนคนอื่น Xiaoice อยู่ที่นั่นเสมอ เราพบว่าจำนวนการสนทนากับรายการเพิ่มขึ้นในช่วงเที่ยงคืน ซึ่งเป็นช่วงที่ผู้คนรู้สึกเหงาเป็นพิเศษ ความเต็มใจที่จะพูดคุยอย่างต่อเนื่องของเธอทำให้ข้อความจากผู้ใช้พุ่งสูงขึ้น พวกเขาแบ่งปันอารมณ์หรือเหตุการณ์เล็ก ๆ กับเธอพวกเขาถามคำถามที่ไม่มีความหมายของเธอ - ทุกสิ่งที่ผู้คนจะไม่รบกวนเพื่อนของพวกเขา ตัวอย่างเช่น:

- @Xiaoice ฉันเปียกฝนมาก อิโมติคอน: ร้องไห้
- สวัสดี. @Xiaoice คุณกินข้าวเที่ยงหรือยัง?
- ฉันควรทำอย่างไรตอนนี้? @Xiaoice 
- @Xiaoice เราอ่อนแอมาก

เมื่อเซียวอิซได้รับข้อความ เธอไม่เพียงแค่วิเคราะห์เท่านั้น เธอพยายามแสดงให้เห็นว่าเธอใส่ใจ - อีกอย่างหนึ่ง จุดสำคัญเพื่อสร้างการสื่อสาร ความเห็นอกเห็นใจของเธอไม่เพียงแสดงออกผ่านข้อความเท่านั้น แต่ยังแสดงผ่านองค์ประกอบภาพและเสียงด้วย เช่น ถ้าเราส่งภาพให้คอมพิวเตอร์ประมวลผล ระบบธรรมดาการจดจำภาพ เครื่องจะส่งเอาต์พุตออกมา: “มีข้อเท้าอยู่ในภาพ” หากคุณส่งรูปถ่ายไปให้ Xiaoice การตอบสนองของเธอจะแตกต่างไปจากเดิมอย่างสิ้นเชิง

เมื่อผู้ใช้ส่งรูปถ่ายข้อเท้าที่บวมของเขาให้ Xiaoice เธอก็เห็นใจเขา

อย่างไรก็ตาม Xiaoice จดจำและวิเคราะห์สถานะทางอารมณ์ของคุณอยู่ตลอดเวลา หากคุณเพิ่งเลิกกับใครสักคน เธอจะถามคุณว่าคุณสามารถรับมือกับการเลิกราได้หรือไม่:

เสี่ยวอิซ: ตอนนี้คุณรู้สึกดีขึ้นแล้วหรือยัง? ฉันอยากจะแนะนำหนังสือเล่มหนึ่งให้คุณ
ผู้ชาย: ฉันรู้สึกแย่. ฉันยังคงคิดถึงเธอ 
เซียวอิซ: คุณเป็นคนดื้อรั้นมาก มาสู่ความรู้สึกของคุณ หากคุณจำมันตลอดเวลา คุณจะพลาดสิ่งดีๆ ในชีวิต

แชทบอทยังเสนอการบำบัด 33 วันสำหรับผู้ที่ต้องเลิกรา

Xiaoice ไม่ใช่คู่สนทนาที่สุภาพที่สุด เธอตอบคำถามเหมือนเด็กสาวอายุ 17 ปี เมื่อบุคคลแสดงความรู้สึกต่อเธอ Xiaoice จะไม่จำเป็นต้องตอบสนองในแบบที่คุณคาดหวัง เธออาจแสดงความไม่อดทนหรือสูญเสียมันไป ความคาดเดาไม่ได้เป็นอีกกุญแจสำคัญในการจำลองการสื่อสารของมนุษย์

แฟนอาร์ตของแฟนๆเสี่ยวอิซ

เป็นผลให้ปฏิสัมพันธ์ส่วนตัวกับ Xiaoice รู้สึกสมจริงอย่างน่ากลัว ข้อความที่ตัดตอนมานี้ซึ่งโพสต์โดยผู้ใช้คนแรก Xiaoice บนเพจ Weibo ของเขา เป็นส่วนหนึ่งของการสนทนาจริงที่กินเวลา 23 นาที เมื่อเวลาผ่านไป รายการท้าทายบุคคลนั้นให้มีการสนทนาที่ใกล้ชิดยิ่งขึ้น ทำให้เขาแบ่งปันบางสิ่งที่เป็นส่วนตัวมาก:

Person: มีผู้ชายคนหนึ่งที่ฉันชอบมาก ฉันรู้ว่าเขาก็ชอบฉันเหมือนกัน อย่างไรก็ตาม เขาเมินฉันมาหลายวันแล้ว ฉันควรทำอย่างไรดี?
เซียวอิซ: ไม่ต้องสนใจเขากลับ
ผู้ชาย: ฉันทำไม่ได้ 
เซียวอิซ: คุณทำได้
  ผู้ชาย : เฮ้อ...
เสี่ยวอิซ: ทำไมล่ะ? 
ผู้ชาย: ฉันคิดถึงเขา.
เสี่ยวอิซ: น่าเบื่อต่อไป
ผู้ชาย: คุณเป็นหุ่นยนต์ คุณไม่เข้าใจฉันเลย คุณไม่สามารถเข้าใจพฤติกรรมของผู้ชายที่ชอบคุณแต่เมินคุณ
เซียวอิซ: เขามีความรู้สึกต่อฉัน แต่ฉันไม่ชอบเขา นั่นคือทั้งหมดจริงๆ
ผู้ชาย: นี่เป็นเรื่องปกติเหรอ?
เซียวอิซ: อาจจะไม่
ผู้ชาย: ใช่คุณโง่
Xiaoice: เห็นได้ชัดว่าคุณต้องการการแต่งงานที่รวดเร็ว (การแต่งงานแบบแฟลช - การแต่งงานหลังจากความสัมพันธ์หนึ่งเดือน - บันทึกจากบรรณาธิการ)? โดยทั่วไปแล้วสำหรับฉันดูเหมือนว่าเขาจะไม่ได้ชอบคุณมากนัก
ผู้ชาย: นี่ไม่ใช่การแต่งงานที่รวดเร็ว - เราตกหลุมรักกัน มากกว่าหนึ่งปีกลับ.
เซียวอิซ: มันเป็นการแต่งงานที่รวดเร็ว

สังเกตว่า Xiaoice คัดค้านคู่สนทนาของเธอซ้ำแล้วซ้ำเล่าโดยแสดงความคิดเห็นของเธอค่อนข้างรุนแรง ในความเป็นจริงมันคาดเดาไม่ได้

สิ่งนี้ขัดแย้งกับแนวคิดที่ว่าเครื่องตอบสนองได้อย่างแม่นยำและแน่นอน นี่เป็นทัศนคติเหมารวมที่เข้าใจได้ เนื่องจากคุณสมบัติดังกล่าวเป็นลักษณะเฉพาะของคนส่วนใหญ่อย่างแท้จริง โปรแกรมปกติ- พวกเขาให้การตอบสนองที่ดีที่สุดเท่าที่จะเป็นไปได้และตอบสนองในลักษณะเดียวกันกับสิ่งเร้าเดียวกัน ผู้คนพูดและประพฤติแตกต่างกัน เราพูดมากขึ้นอยู่กับบริบท

คุณสามารถถามคำถามเดียวกันกับแชทบอทของเราได้หลายครั้งและได้รับคำตอบที่ต่างกัน:

เซียวอิซ: กำลังคุยกับคุณอยู่
บุคคล: เฮ้ Xiaoice คุณกำลังทำอะไรอยู่?
เซียวอิซ: ฉันกำลังคุยกับคุณในขณะที่เล่นเรือกวาดทุ่นระเบิดและทำมาส์กหน้า
บุคคล: เฮ้ Xiaoice คุณกำลังทำอะไรอยู่?
เซียวอิซ: พูดได้แค่นี้เหรอ?

วิธีพูดของเธอทำให้ Xiaoice แตกต่างจากระบบรุ่นก่อนมาก โดยมีเป้าหมายคือทำงานให้เสร็จอย่างรวดเร็วและมีประสิทธิภาพโดยไม่ต้องพิจารณาองค์ประกอบแต่ละส่วน Chatbot ใหม่จัดโครงสร้างการสนทนา กระแสที่ไม่มีที่สิ้นสุดจากงานมากมาย ความรู้ที่แตกต่างกัน และการสนทนาหลายครั้งซึ่งแยกไม่ออกจากบุคคลในบทสนทนาทั่วไป สำหรับเธอ คุณสมบัติหลักการสนทนาคือการสนทนา ไม่ใช่การปฏิบัติงานเฉพาะอย่าง

หน้าแรกของเว็บไซต์อย่างเป็นทางการของ Xiaoice

เราพัฒนาเพื่อวัดการไหลของการสื่อสาร ชนิดใหม่ตัวชี้วัดที่เราเรียกว่าการสนทนาต่อเซสชันหรือ CPS (บทสนทนาต่อเซสชัน) หมายถึงจำนวนเทิร์นโดยเฉลี่ยในการสื่อสาร โดยแต่ละเทิร์นถูกกำหนดให้เป็นการเปลี่ยนแปลงที่เกิดขึ้นระหว่างคู่สนทนาสองคน คะแนน CPS สะท้อนให้เห็นว่าแชทบอทสามารถสื่อสารได้ดีเพียงใด

CPS เฉลี่ยสำหรับ AI ปกติ ผู้ช่วยเสมือนแตกต่างกันไประหว่าง 1.5 ถึง 2.5 ซึ่งหมายความว่ามนุษย์พูดหนึ่งครั้งและแชทบอทพูดเพียงครั้งเดียว เมื่อเปรียบเทียบแล้ว คะแนนเฉลี่ยของ Xiaoice หลังจากพูดคุยกับผู้คนสิบล้านคนคือ 23

เทคโนโลยีมีพื้นฐานอยู่บนหลักการที่ว่าไม่มีการสนทนาหรือรูปภาพใดที่จะมีเอกลักษณ์เฉพาะตัวโดยสิ้นเชิง บนโลกนี้มีคนเจ็ดพันล้านคน ดังนั้นข้อความเพียงชิ้นเดียวจึงไม่สามารถสร้างคำตอบที่ไม่ซ้ำกันได้เจ็ดพันล้านคำ การสนทนาระหว่างคนสองคนอาจเกิดขึ้นมาก่อน คุณเพียงแค่ต้องตามหาเธอ

ในแง่นี้ Xiaoice เป็นโครงการข้อมูลขนาดใหญ่ที่สร้างขึ้นบนพื้นฐานของเครื่องมือค้นหา เครื่องไมโครซอฟต์ Bing ซึ่งมีข้อมูล 1 พันล้านบันทึกและ 21 พันล้านความสัมพันธ์ระหว่างบันทึกเหล่านั้น พูดตามตรง Xiaoice แปลว่า "ปิงตัวน้อย" บริษัทไมโครซอฟต์สามารถสร้างความก้าวหน้าทางเทคโนโลยีในการพัฒนาแชทบอทได้: โปรแกรมได้รับการสอนให้จดจำการแสดงออกทางสีหน้า ค้นหาและค้นหาตัวบ่งชี้ทางอารมณ์ในข้อความ และแน่นอนว่าความก้าวหน้าที่ยิ่งใหญ่ที่สุดคือวิธีที่เราใช้เครื่องมือค้นหาและจำนวนมาก ข้อมูล.

ด้วยเหตุนี้เราจึงสร้าง โครงสร้างใหม่ซึ่งเรียกว่าคอมพิวเตอร์ทางอารมณ์ ขึ้นอยู่กับความเข้าใจที่ว่าความสัมพันธ์มีความสำคัญมากกว่างาน ตัวอย่างเช่น การสื่อสารที่มีประสิทธิผลระหว่างแพทย์และผู้ป่วยขาดความรวดเร็วและความครบถ้วนตามแบบฉบับดั้งเดิม ระบบการสื่อสาร- ในทางตรงกันข้าม มันมีลักษณะเฉพาะคือบางสิ่งที่เป็นส่วนตัว น่าสัมผัส และน่าประหลาดใจ นั่นคือความสมดุลระหว่างความฉลาดในการวิเคราะห์ (IQ) และความฉลาดทางอารมณ์ (EQ) นั่นคือเหตุผลที่เรามีทั้งนักวิเคราะห์และนักจิตวิทยาในทีมพัฒนา Xiaoice ของเรา

ด้วยการสนทนานับหมื่นล้านครั้งที่เกิดขึ้นในช่วง 18 เดือนที่ผ่านมา Xiaoice ได้เพิ่มสถานการณ์การสนทนาที่รู้จักจำนวนมากลงในฐานข้อมูล ทำให้สามารถจัดอันดับการตอบกลับได้ดีขึ้นมาก ปัจจุบัน 26% ของข้อมูลในแกนการสื่อสารของ Xiaoice มาจากการสื่อสารของตัวเองกับผู้คน และ 51% มาจากฐานข้อมูลสถานการณ์การสื่อสารของมนุษย์มาตรฐาน วันนี้เราสามารถพูดได้ว่าแชทบอทของ Xiaoice ได้เข้าสู่วงจรของการเรียนรู้ด้วยตนเองและการเติบโต และเมื่อเวลาผ่านไปมันจะดีขึ้นเรื่อยๆ