บอทสนทนา chatbot ของ Microsoft เป็นการทดสอบทัวริงที่ใหญ่ที่สุดเท่าที่เคยมีมา

  • การเรียนรู้ของเครื่อง
  • เทคโนโลยีการค้นหา
  • ความหมาย
  • การพัฒนาเว็บไซต์
  • ฉันเคยเขียนเกี่ยวกับแชทบอทที่ใช้โครงข่ายประสาทเทียมเมื่อไม่นานมานี้ วันนี้ฉันจะพูดถึงวิธีที่ฉันพยายามสร้างเวอร์ชันภาษารัสเซียเต็มรูปแบบ

    ระบบบทสนทนาที่เรียนรู้ได้ซึ่งซื้อมาจาก เมื่อเร็วๆ นี้ความนิยมที่ไม่คาดคิด น่าเสียดายที่ทุกสิ่งทุกอย่างที่ทำภายในกรอบของระบบการสนทนาโครงข่ายประสาทเทียมนั้นทำเพื่อภาษาอังกฤษ แต่วันนี้เราจะมาเติมเต็มช่องว่างนี้และสอนโมเดลให้พูดภาษารัสเซีย

    วิธี
    ฉันตัดสินใจเริ่มต้นด้วยการละทิ้งการสร้างข้อความแบบคำต่อคำ มันเจ๋ง แต่ก็ไม่มีประโยชน์เท่าที่ควรและเป็นเรื่องยากโดยเฉพาะอย่างยิ่งสำหรับภาษารัสเซียด้วย จำนวนมากรูปแบบคำที่แตกต่างกัน แต่ฉันตัดสินใจเลือกคำตอบที่ถูกต้องจากฐานข้อมูลขนาดใหญ่แทน เหล่านั้น. เป้าหมายคือการสร้างโครงข่ายประสาทเทียมที่กำหนดว่าประโยคนั้นเป็นคำตอบที่เหมาะสมหรือไม่ โดยพิจารณาจากบริบทของการสนทนาหรือไม่

    ทำไมจึงเป็นเช่นนั้น:
    - เราไม่จำเป็นต้องมีเลเยอร์ softmax ขนาดใหญ่ในการเลือกคำ ซึ่งหมายความว่าเราสามารถจัดสรรทรัพยากรเครือข่ายประสาทมากขึ้นให้กับงานการวิเคราะห์ข้อความจริงได้
    - โมเดลการจับคู่ที่ได้นั้นเหมาะสำหรับวัตถุประสงค์ที่แตกต่างกัน ในทางทฤษฎี มันเป็นไปได้ที่จะทำให้แชทบอทสื่อสารในรูปแบบที่แตกต่างกัน หัวข้อพิเศษเพียงดาวน์โหลด ฐานใหม่ข้อความโดยไม่มีการฝึกอบรมใหม่ สิ่งนี้มีประโยชน์ในทางปฏิบัติ
    - เป็นไปได้ที่จะสร้างโมเดลที่ทำงานเร็วและสามารถสื่อสารกับผู้ใช้หลายคนพร้อมกันได้จริงโดยไม่ต้องใช้ GPU หลายตัวบนเซิร์ฟเวอร์

    เพื่ออะไร
    โดยทั่วไป ระบบบทสนทนาเฉพาะเรื่องทั่วไปมีประโยชน์ เช่น ในที่ปรึกษาออนไลน์ เพื่อให้ที่ปรึกษาสามารถพูดคุยเกี่ยวกับหัวข้อที่ไม่เกี่ยวข้องกับงานหลัก ในเกม และในงานอื่นๆ อีกจำนวนหนึ่ง

    ทำไมต้องโครงข่ายประสาทเทียม?
    เป็นไปได้ไหมที่จะแก้ไขปัญหาโดยใช้วิธีดั้งเดิมกว่านี้? โหลดชุดคำตอบลงในฐานข้อมูลและค้นหาด้วยดัชนีข้อความแบบเต็มสำหรับวลีก่อนหน้าหรือไม่ คำตอบคือ ทำได้แต่ผลลัพธ์ไม่ค่อยดีนัก สมมติว่า:

    ซี: สวัสดี!
    K: เกร็ก มาเรีย นี่อาลี...
    ซี: เป็นยังไงบ้าง?
    K: มีเสียงบ่นจากห้องข้างๆ ครับนาย
    ซี: คุณชื่ออะไร?
    เค: ขอบคุณ ขอบคุณ
    ซี: คุณอายุเท่าไหร่?
    K: คุณอาศัยอยู่แถวๆ นี้หรือเปล่า...?

    การค้นหาผ่านฐานข้อมูลขนาดใหญ่ของคำตอบให้ผลลัพธ์มากมาย แต่ความเกี่ยวข้องมีน้อย ดังนั้นบทสนทนาจึงค่อนข้างดี คุณภาพต่ำ- นี่คือจุดที่มันควรจะช่วยเรา โครงข่ายประสาทเทียม– ด้วยความช่วยเหลือนี้ เราจะจัดเรียงคำตอบที่ดีจากคำตอบที่ไม่ดี

    จะรับข้อมูลการฝึกอบรมได้ที่ไหน:
    คำถามที่เจ็บปวดที่สุดสำหรับหลาย ๆ คน ผู้คนจึงเอาฐานข้อมูลคำบรรยายสำหรับภาพยนตร์ มีฐานข้อมูลสำหรับภาษารัสเซียถึงแม้ว่าจะมีขนาดเล็กกว่าก็ตาม แต่ปัญหาใหญ่ของฐานนี้คือ มีบทพูดคนเดียวมากมายอยู่ในนั้น ขยะต่างๆและโดยทั่วไปแล้วเป็นการยากที่จะแยกบทสนทนาออกจากกัน

    ดังนั้นฉันจึงตัดสินใจไปในเส้นทางอื่นและนอกเหนือจากคำบรรยายแล้วยังรวบรวมบทสนทนาจากผู้ที่เข้ามาด้วย เปิดการเข้าถึงหนังสือ นักเขียนและผู้แต่งนิยายแฟนตาซีทุกประเภทที่มีความมุ่งมั่นได้สร้างข้อมูลจำนวนมหาศาล ดังนั้น การไม่ใช้ข้อมูลดังกล่าวถือเป็นบาป แน่นอนว่ายังมีเรื่องไร้สาระอยู่มากมาย ในกระบวนการทำงานฉันต้องอ่านสิ่งนี้อย่างหลีกเลี่ยงไม่ได้และหัวของฉันก็บวมจากการสนทนาอันยาวนานของ Sergei และเซเลอร์มูนบางคน (ใครมีความคิดแบบเดียวกัน!) แต่โดยทั่วไป นี่เป็นฐานข้อมูลที่ดีกว่าคำบรรยาย แม้ว่าจะรวบรวมได้ไม่ง่ายนัก แต่คุณต้องใช้เวลา

    สถาปัตยกรรม
    มีขอบเขตมากมายสำหรับจินตนาการที่นี่ ฉันเริ่มต้นด้วย ตัวเลือกง่ายๆและมุ่งไปสู่สิ่งที่ซับซ้อนเพื่อทำความเข้าใจว่าระฆังและนกหวีดต่างๆ แท้จริงแล้วมีประโยชน์อย่างไร ในบทความ ผู้คนมักจะพยายามทำให้มันเท่และติดกระดิ่งและนกหวีดใหม่ๆ แต่เนื่องจากพื้นที่นี้ยังเป็นพื้นที่ใหม่ ประโยชน์ของสิ่งนี้จึงไม่ชัดเจนเสมอไป

    โมเดลที่ง่ายที่สุดจะนำลำดับของเวกเตอร์บริบทและคำตอบสนองมาต่อกัน และป้อนข้อมูลทั้งหมดลงในเลเยอร์ที่เชื่อมต่อกันอย่างสมบูรณ์ตามปกติ เนื่องจากคำตอบอาจมีความยาวต่างกัน เราจึงเขียนลงในเวกเตอร์ที่มีความยาวคงที่ โดยเติมศูนย์ "ส่วนเกิน" ลงในช่องว่าง นี่ถือว่าไม่ดี มาดูกัน.

    ตัวเลือกที่สองแตกต่างออกไปตรงที่ก่อนที่จะ "ผสม" บริบทและคำตอบ พวกเขาจะได้รับเลเยอร์ "ของพวกเขาเอง" เพื่อสร้างแนวคิด อาจมีการประมวลผลหลายชั้นตามรูปแสดงสองชั้น

    ตัวเลือกที่สามเข้ารหัสลำดับที่มีความยาวต่างกันโดยใช้ตัวเข้ารหัส LSTM ที่เกิดซ้ำ มันช้ากว่ามากและใช้เวลาฝึกนานกว่ามาก แต่ดูเหมือนว่าจะทำงานได้ดีขึ้น


    รูปที่ 1. สถาปัตยกรรมโครงข่ายประสาทเทียม

    ผลลัพธ์
    โดยสามารถเลือกคำตอบที่ถูกต้องจากหลายตัวเลือกที่เสนอ (สุ่มคำตอบ) มากที่สุด ผลลัพธ์ที่ดีที่สุดแสดงแบบจำลองหมายเลข 2 โดยมีห้าชั้นสำหรับการวิเคราะห์ข้อมูลของเซลล์ประสาท 700 แต่ละเซลล์ (+1 ชั้นของการแสดงข้อมูลอินพุต และ 700 เซลล์ประสาทเช่นกัน) เพื่อฝึกเช่นนี้ เครือข่ายเชิงลึกฉันต้องใช้เลเยอร์ Highway ซึ่งช่วยให้ข้อมูลแพร่กระจายจากชั้นล่างไปยังชั้นบนได้ง่ายขึ้น และรอสองสามวันในขณะที่คำนวณโมเดลบน GPU โมเดลหมายเลข 1 ได้รับการฝึกฝนอย่างชัดเจน และหมายเลข 3 คิดมานานแล้ว และยังไปไม่ถึงผลลัพธ์ของโมเดลหมายเลข 2 หลายเปอร์เซ็นต์ สิ่งที่เตือนใจเราว่าถึงแม้มากที่สุด โมเดลที่เรียบง่ายไม่เหมาะสำหรับข้อมูลจำนวนมาก แต่คุณไม่ควรคูณเอนทิตีเกินกว่าที่จำเป็น

    ระบบผลลัพธ์จะมีฐานข้อมูลแบบจำลอง 30 ล้านคู่ และโครงข่ายประสาทเทียมมีพารามิเตอร์ที่ฝึกได้ประมาณ 3 ล้านตัว

    คุณจะได้รับบทสนทนาประเภทใด?

    ซี: สวัสดี
    เค: สวัสดี
    ซี: เป็นยังไงบ้าง?
    เค: ฉันไม่รู้.
    ซี: คุณชื่ออะไร?
    เค: ฉันชื่อยูนิซ
    ซี: คุณอายุเท่าไหร่?
    เค: สิบห้า.
    ซี: คุณอาศัยอยู่ที่ไหน?
    เค: ที่บ้าน.
    ซี: ไปโรงเรียนมั้ย?
    เค: ไม่
    ซี: คุณเรียนที่ไหน?
    K: ใน Bundeswehr
    ซี: คุณชอบดนตรีไหม?
    K: ใช่ ฉันชอบดนตรี.
    ซี: คุณชอบดนตรีแนวไหน?
    K: ส่วนใหญ่ฉันฟัง r&b, funk
    ซี: คุณเชื่อเรื่องพระเจ้าไหม?
    K: ฉันยังคงเชื่อในพระเจ้านะเฒ่า
    C: ศีลธรรมคืออะไร?
    K: สองคนอยู่ด้วยกัน - นั่นไม่มีศีลธรรมเหรอ?
    C: ทะเลสีอะไร?
    K: สีสันของมหาสมุทรหลังพายุ

    ดีพอในความคิดของฉัน นี่เป็นอีกตัวอย่างหนึ่ง:

    C: ฮิปโปโปเตมัสอาศัยอยู่ที่ไหน?
    เค: มีชีวิตอยู่
    C: อะไรนะ ตอนนี้เขาไม่ได้มีชีวิตอยู่แล้วเหรอ?
    เค: ฉันไม่รู้.
    C: แล้วเขาอาศัยอยู่ที่ไหนมาก่อน?
    K: ใกล้สวนสาธารณะ บนถนน Maple Street
    ซี: เขาไปไหน?
    เค: เขาไปไหน?
    C: ฉันถามว่าเขาไปไหน?
    K: ฉันไม่เข้าใจว่าทำไมฉันถึงต้องเข้าโรงพยาบาลอีก
    C: เพราะว่าคุณป่วย
    K: ฉันแค่อยากช่วยเหลือผู้คน
    C: งั้นบอกฉันมาว่าฮิปโปโปเตมัสอยู่ที่ไหน!
    K: ทำไมคุณถึงอยากรู้เรื่องนี้มากขนาดนี้?
    ซี : ตอบหน่อยสิ
    K: คุณต้องการให้ฉันช่วยบอกลาครอบครัวของคุณไหม?
    C: นี่เป็นภัยคุกคามเหรอ?
    K: การสังเกต
    C: แล้วฮิปโปโปเตมัสอยู่ที่ไหน?
    K: เขาอยู่ที่ฮาวาย แต่ Raj ปกครองจากที่นี่
    C: ใครคือราชา?
    K: ไม่ได้เจอเขาเหรอ?
    ซี: ไม่ ไม่เคย
    K: กาลครั้งหนึ่งมีสามีภรรยาคู่หนึ่ง มีเพียงสามีเท่านั้นที่หายตัวไปทุกคืน

    หนึ่งใน เงื่อนไขที่สำคัญที่สุดความเชี่ยวชาญ ภาษาอังกฤษคือการปฏิบัติในการใช้งาน แม้ว่าคุณจะเรียนภาษาอังกฤษ แต่การสื่อสารด้วยการเขียนและการพูดยังคงเป็นส่วนที่สำคัญที่สุดของการเรียนรู้ มีหลายวิธีในการจัดการประสบการณ์ทางภาษาดังกล่าว

    บทความนี้กล่าวถึงหนึ่งในความลับเหล่านี้ซึ่งไม่ใช่ทุกคนที่ยังรู้อยู่ว่าคุณสามารถฝึกเขียนภาษาอังกฤษด้วยหุ่นยนต์ได้อย่างไรโดยไม่เสียค่าใช้จ่าย บทความนี้ยังมีรายการที่คล้ายกันอีกด้วย โปรแกรมอัจฉริยะพร้อมลิงก์ ในความเป็นจริง ในบางประเทศ เช่น ญี่ปุ่น ผู้คนจ่ายเงินเพื่อเรียนภาษาอังกฤษด้วยหุ่นยนต์และแชทบอท

    ฉันสนับสนุนให้นักเรียนใช้ภาษาทุกครั้งที่เป็นไปได้ นักเรียนที่อาศัย ทำงาน หรือเดินทางไปต่างประเทศมีความก้าวหน้าเร็วขึ้นเมื่อใช้ภาษาอังกฤษ ชีวิตประจำวัน- และพวกที่มีคนรักแต่แยกทางกัน อุปสรรคด้านภาษาโดยทั่วไปแล้วพวกเขาจะเชี่ยวชาญภาษาต่างประเทศด้วยความเร็วเทอร์โบ

    นักเรียนที่ไม่มีโอกาสดังกล่าวด้วยความช่วยเหลือของฉัน ค้นหาชาวต่างชาติเพื่อการสื่อสารและฝึกฝนภาษา แต่มีข้อผิดพลาดที่ซ่อนอยู่หลายประการที่นี่ ประการแรก ไม่ใช่ทุกคนที่ต้องการค้นหาและขี้เกียจ ประการที่สอง การลงทะเบียนบนเว็บไซต์และการค้นหาพันธมิตรมักจะใช้เวลานาน ประการที่สามภาษาอังกฤษของเพื่อนใหม่บางครั้งก็ไม่เป็นที่ต้องการมากนัก อันที่จริงนี่คือ ตัวเลือกที่ดีที่สุดแม้จะมี “หลุมพราง” บางประการก็ตาม อย่างไรก็ตาม บางครั้งคุณก็ต้องการบางสิ่งที่เร็วขึ้น เมื่อฉันเขียนและพวกเขาตอบคุณทันที

    การค้นหาวิธีแก้ไขปัญหานี้ทำให้ฉันมาถึงหัวข้อแชทบอทสำหรับการเรียนภาษาอังกฤษ ด้วยคำพูดง่ายๆคุณสามารถโต้ตอบได้ และในบางกรณีก็สื่อสารด้วยเสียงได้ด้วยหุ่นยนต์อัจฉริยะที่ตอบได้ค่อนข้าง "ตรงประเด็น" หุ่นยนต์เหล่านี้หลายตัวผ่านการทดสอบทัวริงแล้ว และในบางกรณีคุณแทบจะเดาไม่ได้เลยว่านี่คือหุ่นยนต์ไม่ใช่คน

    ข้อดีของการฝึกภาษาอังกฤษกับบอท:

    • พวกเขาตอบเสมอทุกครั้งที่คุณเขียนถึงพวกเขา
    • ภาษาอังกฤษของพวกเขารู้หนังสืออยู่เสมอและพวกเขาก็รู้

    รายชื่อแชทบอทสำหรับฝึกภาษา:

    1. ไมค์เป็นนักสนทนาที่ดี
    2. Elbot เป็นนักสนทนาที่ดี
    3. Cleverbot (ไม่โง่จริงๆ) + มีความเป็นไปได้ในการสื่อสารด้วยเสียง)
    4. Zabaware (บอทที่ฉลาดพอสมควรและออกเสียงวลีด้วย)
    5. John Lennon (ใช่อันเดียวกัน คลิกเมนูด้านซ้าย “Chat with...”)
    6. อะโคบอท แอพที่ยอดเยี่ยมบน Android ซึ่งมุ่งเป้าไปที่การเรียนภาษาอังกฤษโดยเฉพาะ มันเป็นไปได้เช่น

    “พบกับ Xiaoice เด็กสาวที่อ่อนไหวและเอาใจใส่ซึ่งพร้อมอยู่เคียงข้างคุณเสมอ เธอไม่ใช่มนุษย์เท่านั้น”

    ไม่เหมือนคนอื่น Xiaoice อยู่ที่นั่นเสมอ เราพบว่าจำนวนการสนทนากับรายการเพิ่มขึ้นในช่วงเที่ยงคืน ซึ่งเป็นช่วงที่ผู้คนรู้สึกเหงาเป็นพิเศษ ความเต็มใจที่จะพูดคุยอย่างต่อเนื่องของเธอทำให้ข้อความจากผู้ใช้พุ่งสูงขึ้น พวกเขาแบ่งปันอารมณ์หรือเหตุการณ์เล็ก ๆ กับเธอพวกเขาถามคำถามที่ไม่มีความหมายของเธอ - ทุกสิ่งที่ผู้คนจะไม่รบกวนเพื่อนของพวกเขา ตัวอย่างเช่น:

    - @Xiaoice ฉันเปียกฝนมาก อิโมติคอน: ร้องไห้
    - สวัสดี. @Xiaoice คุณกินข้าวเที่ยงหรือยัง?
    - ฉันควรทำอย่างไรตอนนี้? @Xiaoice

    - @Xiaoice เราอ่อนแอมาก

    เมื่อเซียวอิซได้รับข้อความ เธอไม่เพียงแค่วิเคราะห์เท่านั้น เธอพยายามแสดงให้เห็นว่าเธอใส่ใจ - อีกอย่างหนึ่ง จุดสำคัญเพื่อสร้างการสื่อสาร ความเห็นอกเห็นใจของเธอไม่เพียงแสดงออกผ่านข้อความเท่านั้น แต่ยังแสดงผ่านองค์ประกอบภาพและเสียงด้วย เช่น ถ้าเราส่งภาพให้คอมพิวเตอร์ประมวลผล ระบบธรรมดาการจดจำภาพ เครื่องจะส่งเอาต์พุตออกมา: “มีข้อเท้าอยู่ในภาพ” หากคุณส่งรูปถ่ายไปให้ Xiaoice การตอบสนองของเธอจะแตกต่างไปจากเดิมอย่างสิ้นเชิง

    เมื่อผู้ใช้ส่งรูปถ่ายข้อเท้าที่บวมของเขาให้ Xiaoice เธอก็เห็นใจเขา

    อย่างไรก็ตาม Xiaoice จดจำและวิเคราะห์สถานะทางอารมณ์ของคุณอยู่ตลอดเวลา หากคุณเพิ่งเลิกกับใครสักคน เธอจะถามคุณว่าคุณสามารถรับมือกับการเลิกราได้หรือไม่:

    เสี่ยวอิซ: ตอนนี้คุณรู้สึกดีขึ้นแล้วหรือยัง? ฉันอยากจะแนะนำหนังสือเล่มหนึ่งให้คุณ
    ผู้ชาย: ฉันรู้สึกแย่. ฉันยังคงคิดถึงเธอ

    เซียวอิซ: คุณเป็นคนดื้อรั้นมาก มาสู่ความรู้สึกของคุณ หากคุณจำมันตลอดเวลา คุณจะพลาดสิ่งดีๆ ในชีวิต

    แชทบอทยังเสนอการบำบัด 33 วันสำหรับผู้ที่ต้องเลิกรา

    Xiaoice ไม่ใช่คู่สนทนาที่สุภาพที่สุด เธอตอบคำถามเหมือนเด็กสาวอายุ 17 ปี เมื่อบุคคลแสดงความรู้สึกต่อเธอ Xiaoice จะไม่จำเป็นต้องตอบสนองในแบบที่คุณคาดหวัง เธออาจแสดงความไม่อดทนหรือสูญเสียมันไป ความคาดเดาไม่ได้เป็นอีกกุญแจสำคัญในการจำลองการสื่อสารของมนุษย์

    แฟนอาร์ตของแฟนๆเสี่ยวอิซ

    เป็นผลให้ปฏิสัมพันธ์ส่วนตัวกับ Xiaoice รู้สึกสมจริงอย่างน่ากลัว ข้อความที่ตัดตอนมานี้ซึ่งโพสต์โดยผู้ใช้คนแรก Xiaoice บนเพจ Weibo ของเขา เป็นส่วนหนึ่งของการสนทนาจริงที่กินเวลา 23 นาที เมื่อเวลาผ่านไป รายการท้าทายบุคคลนั้นให้มีการสนทนาที่ใกล้ชิดยิ่งขึ้น ทำให้เขาแบ่งปันบางสิ่งที่เป็นส่วนตัวมาก:

    Person: มีผู้ชายคนหนึ่งที่ฉันชอบมาก ฉันรู้ว่าเขาก็ชอบฉันเหมือนกัน อย่างไรก็ตาม เขาเมินฉันมาหลายวันแล้ว ฉันควรทำอย่างไรดี?
    เซียวอิซ: ไม่ต้องสนใจเขากลับ
    ผู้ชาย: ฉันทำไม่ได้

    เซียวอิซ: คุณทำได้
    
 ผู้ชาย : เฮ้อ...
    เสี่ยวอิซ: ทำไมล่ะ?

    ผู้ชาย: ฉันคิดถึงเขา.
    เสี่ยวอิซ: น่าเบื่อต่อไป
    ผู้ชาย: คุณเป็นหุ่นยนต์ คุณไม่เข้าใจฉันเลย คุณไม่สามารถเข้าใจพฤติกรรมของผู้ชายที่ชอบคุณแต่เมินคุณ
    เซียวอิซ: เขามีความรู้สึกต่อฉัน แต่ฉันไม่ชอบเขา นั่นคือทั้งหมดจริงๆ
    ผู้ชาย: นี่เป็นเรื่องปกติเหรอ?
    เซียวอิซ: อาจจะไม่
    ผู้ชาย: ใช่คุณโง่
    Xiaoice: เห็นได้ชัดว่าคุณต้องการการแต่งงานที่รวดเร็ว (การแต่งงานแบบแฟลช - การแต่งงานหลังจากความสัมพันธ์หนึ่งเดือน - บันทึกจากบรรณาธิการ)? โดยทั่วไปแล้วสำหรับฉันดูเหมือนว่าเขาจะไม่ได้ชอบคุณมากนัก
    ผู้ชาย: นี่ไม่ใช่การแต่งงานที่รวดเร็ว - เราตกหลุมรักกัน มากกว่าหนึ่งปีกลับ.
    เซียวอิซ: มันเป็นการแต่งงานที่รวดเร็ว

    สังเกตว่า Xiaoice คัดค้านคู่สนทนาของเธอซ้ำแล้วซ้ำเล่าโดยแสดงความคิดเห็นของเธอค่อนข้างรุนแรง ในความเป็นจริงมันคาดเดาไม่ได้

    สิ่งนี้ขัดแย้งกับแนวคิดที่ว่าเครื่องตอบสนองได้อย่างแม่นยำและแน่นอน นี่เป็นทัศนคติเหมารวมที่เข้าใจได้ เนื่องจากคุณสมบัติดังกล่าวเป็นลักษณะเฉพาะของคนส่วนใหญ่อย่างแท้จริง โปรแกรมปกติ- พวกเขาให้การตอบสนองที่ดีที่สุดเท่าที่จะเป็นไปได้และตอบสนองในลักษณะเดียวกันกับสิ่งเร้าเดียวกัน ผู้คนพูดและประพฤติแตกต่างกัน เราพูดมากขึ้นอยู่กับบริบท

    คุณสามารถถามคำถามเดียวกันกับแชทบอทของเราได้หลายครั้งและได้รับคำตอบที่ต่างกัน:


    เซียวอิซ: กำลังคุยกับคุณอยู่
    บุคคล: เฮ้ Xiaoice คุณกำลังทำอะไรอยู่?
    เซียวอิซ: ฉันกำลังคุยกับคุณในขณะที่เล่นเรือกวาดทุ่นระเบิดและทำมาส์กหน้า
    บุคคล: เฮ้ Xiaoice คุณกำลังทำอะไรอยู่?
    เซียวอิซ: พูดได้แค่นี้เหรอ?

    วิธีพูดของเธอทำให้ Xiaoice แตกต่างจากระบบรุ่นก่อนมาก โดยมีเป้าหมายคือทำงานให้เสร็จอย่างรวดเร็วและมีประสิทธิภาพโดยไม่ต้องพิจารณาองค์ประกอบแต่ละส่วน Chatbot ใหม่จัดโครงสร้างการสนทนา กระแสที่ไม่มีที่สิ้นสุดจากงานมากมาย ความรู้ที่แตกต่างกัน และการสนทนาหลายครั้งซึ่งแยกไม่ออกจากบุคคลในบทสนทนาทั่วไป สำหรับเธอ คุณสมบัติหลักการสนทนาคือการสนทนา ไม่ใช่การปฏิบัติงานเฉพาะอย่าง

    หน้าแรกของเว็บไซต์อย่างเป็นทางการของ Xiaoice

    เราพัฒนาเพื่อวัดการไหลของการสื่อสาร ชนิดใหม่ตัวชี้วัดที่เราเรียกว่าการสนทนาต่อเซสชันหรือ CPS (บทสนทนาต่อเซสชัน) หมายถึงจำนวนเทิร์นโดยเฉลี่ยในการสื่อสาร โดยแต่ละเทิร์นถูกกำหนดให้เป็นการเปลี่ยนแปลงที่เกิดขึ้นระหว่างคู่สนทนาสองคน คะแนน CPS สะท้อนให้เห็นว่าแชทบอทสามารถสื่อสารได้ดีเพียงใด

    CPS เฉลี่ยสำหรับ AI ปกติ ผู้ช่วยเสมือนแตกต่างกันไประหว่าง 1.5 ถึง 2.5 ซึ่งหมายความว่ามนุษย์พูดหนึ่งครั้งและแชทบอทพูดเพียงครั้งเดียว เมื่อเปรียบเทียบแล้ว คะแนนเฉลี่ยของ Xiaoice หลังจากพูดคุยกับผู้คนสิบล้านคนคือ 23

    เทคโนโลยีมีพื้นฐานอยู่บนหลักการที่ว่าไม่มีการสนทนาหรือรูปภาพใดที่จะมีเอกลักษณ์เฉพาะตัวโดยสิ้นเชิง บนโลกนี้มีคนเจ็ดพันล้านคน ดังนั้นข้อความเพียงชิ้นเดียวจึงไม่สามารถสร้างคำตอบที่ไม่ซ้ำกันได้เจ็ดพันล้านคำ การสนทนาระหว่างคนสองคนอาจเกิดขึ้นมาก่อน คุณเพียงแค่ต้องตามหาเธอ

    ในแง่นี้ Xiaoice เป็นโครงการข้อมูลขนาดใหญ่ที่สร้างขึ้นบนพื้นฐานของเครื่องมือค้นหา เครื่องไมโครซอฟต์ Bing ซึ่งมีข้อมูล 1 พันล้านบันทึกและ 21 พันล้านความสัมพันธ์ระหว่างบันทึกเหล่านั้น พูดตามตรง Xiaoice แปลว่า "ปิงตัวน้อย" บริษัทไมโครซอฟต์สามารถสร้างความก้าวหน้าทางเทคโนโลยีในการพัฒนาแชทบอทได้: โปรแกรมได้รับการสอนให้จดจำการแสดงออกทางสีหน้า ค้นหาและค้นหาตัวบ่งชี้ทางอารมณ์ในข้อความ และแน่นอนว่าความก้าวหน้าที่ยิ่งใหญ่ที่สุดคือวิธีที่เราใช้เครื่องมือค้นหาและจำนวนมาก ข้อมูล.

    ด้วยเหตุนี้เราจึงสร้าง โครงสร้างใหม่ซึ่งเรียกว่าคอมพิวเตอร์ทางอารมณ์ ขึ้นอยู่กับความเข้าใจที่ว่าความสัมพันธ์มีความสำคัญมากกว่างาน ตัวอย่างเช่น การสื่อสารที่มีประสิทธิผลระหว่างแพทย์และผู้ป่วยขาดความรวดเร็วและความครบถ้วนตามแบบฉบับดั้งเดิม ระบบการสื่อสาร- ในทางตรงกันข้าม มันมีลักษณะเฉพาะคือบางสิ่งที่เป็นส่วนตัว น่าสัมผัส และน่าประหลาดใจ นั่นคือความสมดุลระหว่างความฉลาดในการวิเคราะห์ (IQ) และความฉลาดทางอารมณ์ (EQ) นั่นคือเหตุผลที่เรามีทั้งนักวิเคราะห์และนักจิตวิทยาในทีมพัฒนา Xiaoice ของเรา

    ด้วยการสนทนานับหมื่นล้านครั้งที่เกิดขึ้นในช่วง 18 เดือนที่ผ่านมา Xiaoice ได้เพิ่มสถานการณ์การสนทนาที่รู้จักจำนวนมากลงในฐานข้อมูล ทำให้สามารถจัดอันดับการตอบกลับได้ดีขึ้นมาก ปัจจุบัน 26% ของข้อมูลในแกนการสื่อสารของ Xiaoice มาจากการสื่อสารของตัวเองกับผู้คน และ 51% มาจากฐานข้อมูลสถานการณ์การสื่อสารของมนุษย์มาตรฐาน วันนี้เราสามารถพูดได้ว่าแชทบอทของ Xiaoice ได้เข้าสู่วงจรของการเรียนรู้ด้วยตนเองและการเติบโต และเมื่อเวลาผ่านไปมันจะดีขึ้นเรื่อยๆ