เครื่องมือค้นหาหมายถึงอะไร - คำจำกัดความ ประวัติ และข้อเท็จจริงที่น่าสนใจ เครื่องมือค้นหาทางอินเทอร์เน็ตที่ดีที่สุด

นี่คืออะไร

DuckDuckGo เป็นเสิร์ชเอ็นจิ้นโอเพ่นซอร์สที่ค่อนข้างเป็นที่รู้จัก เซิร์ฟเวอร์ตั้งอยู่ในสหรัฐอเมริกา นอกเหนือจากโรบ็อตของมันเองแล้ว เสิร์ชเอ็นจิ้นยังใช้ผลลัพธ์จากแหล่งอื่น: Yahoo, Bing, Wikipedia

ยิ่งดี.

DuckDuckGo วางตำแหน่งตัวเองเป็นเครื่องมือค้นหาที่ให้ความเป็นส่วนตัวและการรักษาความลับสูงสุด ระบบจะไม่รวบรวมข้อมูลใด ๆ เกี่ยวกับผู้ใช้ ไม่จัดเก็บบันทึก (ไม่มีประวัติการค้นหา) และการใช้คุกกี้จะถูกจำกัดเท่าที่เป็นไปได้

DuckDuckGo จะไม่รวบรวมหรือแบ่งปันข้อมูลส่วนบุคคลจากผู้ใช้ นี่คือนโยบายความเป็นส่วนตัวของเรา

กาเบรียล ไวน์เบิร์ก ผู้ก่อตั้ง DuckDuckGo

ทำไมคุณถึงต้องการสิ่งนี้

เสิร์ชเอ็นจิ้นหลักทั้งหมดพยายามปรับแต่งตามข้อมูลเกี่ยวกับบุคคลที่อยู่หน้าจอมอนิเตอร์ ปรากฏการณ์นี้เรียกว่า "ฟองอากาศตัวกรอง": ผู้ใช้จะเห็นเฉพาะผลลัพธ์ที่สอดคล้องกับการตั้งค่าของเขาหรือที่ระบบเห็นว่าเป็นเช่นนั้น

DuckDuckGo สร้างภาพวัตถุประสงค์ที่ไม่ขึ้นอยู่กับพฤติกรรมที่ผ่านมาของคุณบนอินเทอร์เน็ตและกำจัดการโฆษณาตามธีมจาก Google และ Yandex ตามคำถามของคุณ ด้วย DuckDuckGo การค้นหาข้อมูลในภาษาต่างประเทศเป็นเรื่องง่าย: โดยค่าเริ่มต้น Google และ Yandex ให้ความสำคัญกับไซต์ภาษารัสเซียแม้ว่าจะป้อนข้อความค้นหาในภาษาอื่นก็ตาม


นี่คืออะไร

not Evil เป็นระบบที่ค้นหาเครือข่าย Tor ที่ไม่ระบุชื่อ หากต้องการใช้งานคุณต้องไปที่เครือข่ายนี้โดยเปิดตัวเครือข่ายพิเศษที่มีชื่อเดียวกัน

not Evil ไม่ใช่เครื่องมือค้นหาเดียวในประเภทนี้ มี LOOK (การค้นหาเริ่มต้นในเบราว์เซอร์ของ Tor ซึ่งสามารถเข้าถึงได้จากอินเทอร์เน็ตปกติ) หรือ TORCH (หนึ่งในเครื่องมือค้นหาที่เก่าแก่ที่สุดในเครือข่าย Tor) และอื่นๆ เราตัดสินว่าไม่ใช่ Evil เนื่องจากคำใบ้ที่ชัดเจนจาก Google (เพียงดูที่หน้าเริ่มต้น)

ยิ่งดี.

ค้นหาตำแหน่งที่ Google, Yandex และเครื่องมือค้นหาอื่นๆ ปิดโดยทั่วไป

ทำไมคุณถึงต้องการสิ่งนี้

เครือข่าย Tor มีทรัพยากรมากมายที่ไม่สามารถพบได้บนอินเทอร์เน็ตที่ปฏิบัติตามกฎหมาย และจำนวนของพวกเขาจะเพิ่มขึ้นเมื่อรัฐบาลควบคุมเนื้อหาอินเทอร์เน็ตที่เข้มงวดมากขึ้น Tor เป็นเครือข่ายประเภทหนึ่งภายในอินเทอร์เน็ตที่มีโซเชียลเน็ตเวิร์ก ตัวติดตามทอร์เรนต์ สื่อ แพลตฟอร์มการซื้อขาย บล็อก ห้องสมุด และอื่นๆ ของตัวเอง

3. ยาซี

นี่คืออะไร

YaCy เป็นเครื่องมือค้นหาแบบกระจายอำนาจที่ทำงานบนหลักการของเครือข่าย P2P คอมพิวเตอร์แต่ละเครื่องที่ติดตั้งโมดูลซอฟต์แวร์หลักจะสแกนอินเทอร์เน็ตอย่างอิสระ กล่าวคือ มันคล้ายคลึงกับโรบ็อตการค้นหา ผลลัพธ์ที่ได้รับจะถูกรวบรวมไว้ในฐานข้อมูลทั่วไปที่ผู้เข้าร่วม YaCy ทุกคนใช้

ยิ่งดี.

เป็นการยากที่จะบอกว่าสิ่งนี้ดีขึ้นหรือแย่ลง เนื่องจาก YaCy เป็นแนวทางที่แตกต่างอย่างสิ้นเชิงในการจัดการการค้นหา การไม่มีเซิร์ฟเวอร์เครื่องเดียวและบริษัทที่เป็นเจ้าของทำให้ผลลัพธ์ไม่ขึ้นอยู่กับความต้องการของใครก็ตาม ความเป็นอิสระของแต่ละโหนดช่วยลดการเซ็นเซอร์ YaCy สามารถค้นหาเว็บระดับลึกและเครือข่ายสาธารณะที่ไม่ได้จัดทำดัชนีได้

ทำไมคุณถึงต้องการสิ่งนี้

หากคุณเป็นผู้สนับสนุนซอฟต์แวร์โอเพ่นซอร์สและอินเทอร์เน็ตฟรี ที่ไม่อยู่ภายใต้อิทธิพลของหน่วยงานภาครัฐและองค์กรขนาดใหญ่ YaCy คือทางเลือกของคุณ นอกจากนี้ยังสามารถใช้เพื่อจัดระเบียบการค้นหาภายในองค์กรหรือเครือข่ายอัตโนมัติอื่นๆ และถึงแม้ว่า YaCy จะไม่มีประโยชน์ในชีวิตประจำวันมากนัก แต่ก็เป็นทางเลือกที่คุ้มค่าสำหรับ Google ในแง่ของกระบวนการค้นหา

4. พิพล

นี่คืออะไร

Pipl คือระบบที่ออกแบบมาเพื่อค้นหาข้อมูลเกี่ยวกับบุคคลใดบุคคลหนึ่งโดยเฉพาะ

ยิ่งดี.

ผู้เขียน Pipl อ้างว่าอัลกอริธึมพิเศษของพวกเขาค้นหาได้อย่างมีประสิทธิภาพมากกว่าเครื่องมือค้นหา "ปกติ" โดยเฉพาะอย่างยิ่งแหล่งข้อมูลที่มีลำดับความสำคัญ ได้แก่ โปรไฟล์เครือข่ายโซเชียล ความคิดเห็น รายชื่อสมาชิก และฐานข้อมูลต่างๆ ที่เผยแพร่ข้อมูลเกี่ยวกับบุคคล เช่น คำตัดสินของศาล ความเป็นผู้นำของ Pipl ในด้านนี้ได้รับการยืนยันจากการประเมินจาก Lifehacker.com, TechCrunch และสิ่งพิมพ์อื่น ๆ

ทำไมคุณถึงต้องการสิ่งนี้

หากคุณต้องการค้นหาข้อมูลเกี่ยวกับบุคคลที่อาศัยอยู่ในสหรัฐอเมริกา Pipl จะมีประสิทธิภาพมากกว่า Google มาก เห็นได้ชัดว่าฐานข้อมูลของศาลรัสเซียไม่สามารถเข้าถึงเครื่องมือค้นหาได้ ดังนั้นเขาจึงไม่สามารถรับมือกับพลเมืองรัสเซียได้ดีนัก

นี่คืออะไร

FindSounds เป็นอีกหนึ่งเครื่องมือค้นหาเฉพาะทาง ค้นหาเสียงต่างๆ (บ้าน ธรรมชาติ รถยนต์ ผู้คน ฯลฯ) ในโอเพ่นซอร์ส บริการนี้ไม่รองรับการสืบค้นในภาษารัสเซีย แต่มีรายการแท็กภาษารัสเซียที่น่าประทับใจที่คุณสามารถค้นหาได้

ยิ่งดี.

เอาต์พุตมีเพียงเสียงและไม่มีอะไรพิเศษ ในการตั้งค่าการค้นหา คุณสามารถตั้งค่ารูปแบบและคุณภาพเสียงที่ต้องการได้ เสียงทั้งหมดที่พบพร้อมให้ดาวน์โหลด มีการค้นหาเสียงตามรูปแบบ

ทำไมคุณถึงต้องการสิ่งนี้

หากคุณต้องการค้นหาเสียงปืนคาบศิลา เสียงนกหัวขวานดูดนม และเสียงร้องของ Homer Simpson อย่างรวดเร็ว บริการนี้เหมาะสำหรับคุณ และเราเลือกสิ่งนี้จากข้อความค้นหาภาษารัสเซียที่มีอยู่เท่านั้น ในภาษาอังกฤษ สเปกตรัมจะกว้างขึ้นอีก

แต่จริงๆ แล้ว บริการเฉพาะทางจำเป็นต้องมีผู้ชมที่เชี่ยวชาญเป็นพิเศษ แต่จะเกิดอะไรขึ้นถ้ามันมีประโยชน์สำหรับคุณเช่นกัน?

นี่คืออะไร

Wolfram|Alpha เป็นเครื่องมือค้นหาเชิงคำนวณ แทนที่จะลิงก์ไปยังบทความที่มีคำหลัก จะให้คำตอบสำเร็จรูปสำหรับคำขอของผู้ใช้ ตัวอย่างเช่น หากคุณป้อน "เปรียบเทียบประชากรของนิวยอร์กและซานฟรานซิสโก" ลงในแบบฟอร์มการค้นหาเป็นภาษาอังกฤษ Wolfram|Alpha จะแสดงตารางและกราฟพร้อมการเปรียบเทียบทันที

ยิ่งดี.

บริการนี้ดีกว่าบริการอื่นในการค้นหาข้อเท็จจริงและคำนวณข้อมูล Wolfram|Alpha รวบรวมและจัดระเบียบความรู้ที่มีอยู่บนเว็บจากหลากหลายสาขา รวมถึงวิทยาศาสตร์ วัฒนธรรม และความบันเทิง หากฐานข้อมูลนี้มีคำตอบสำเร็จรูปสำหรับคำค้นหา ระบบจะแสดงคำตอบนั้น หากไม่ใช่ ระบบจะคำนวณและแสดงผลลัพธ์ ในกรณีนี้ผู้ใช้จะเห็นเฉพาะข้อมูลที่จำเป็นและไม่มีอะไรฟุ่มเฟือย

ทำไมคุณถึงต้องการสิ่งนี้

ตัวอย่างเช่น หากคุณเป็นนักศึกษา นักวิเคราะห์ นักข่าว หรือนักวิจัย คุณสามารถใช้ Wolfram|Alpha เพื่อค้นหาและคำนวณข้อมูลที่เกี่ยวข้องกับงานของคุณได้ บริการนี้ไม่เข้าใจคำขอทั้งหมด แต่มีการพัฒนาและฉลาดขึ้นอย่างต่อเนื่อง

นี่คืออะไร

เอ็นจิ้น metasearch ของ Dogpile แสดงรายการผลลัพธ์รวมจากผลการค้นหาจาก Google, Yahoo และระบบยอดนิยมอื่น ๆ

ยิ่งดี.

ประการแรก Dogpile แสดงโฆษณาน้อยลง ประการที่สอง บริการใช้อัลกอริธึมพิเศษเพื่อค้นหาและแสดงผลลัพธ์ที่ดีที่สุดจากเครื่องมือค้นหาต่างๆ จากข้อมูลของนักพัฒนา Dogpile ระบบของพวกเขาสร้างผลการค้นหาที่สมบูรณ์ที่สุดบนอินเทอร์เน็ตทั้งหมด

ทำไมคุณถึงต้องการสิ่งนี้

หากคุณไม่พบข้อมูลบน Google หรือเครื่องมือค้นหามาตรฐานอื่นๆ ให้ค้นหาในเครื่องมือค้นหาหลายรายการพร้อมกันโดยใช้ Dogpile

นี่คืออะไร

BoardReader คือระบบสำหรับค้นหาข้อความในฟอรั่ม บริการคำถามและคำตอบ และชุมชนอื่นๆ

ยิ่งดี.

บริการนี้ช่วยให้คุณจำกัดช่องค้นหาของคุณให้แคบลงไปยังแพลตฟอร์มโซเชียล ด้วยตัวกรองพิเศษ คุณสามารถค้นหาโพสต์และความคิดเห็นของผู้ใช้ที่ตรงกับเกณฑ์ของคุณได้อย่างรวดเร็ว เช่น ภาษา วันที่ตีพิมพ์ และชื่อเว็บไซต์

ทำไมคุณถึงต้องการสิ่งนี้

BoardReader มีประโยชน์สำหรับผู้เชี่ยวชาญด้านประชาสัมพันธ์และผู้เชี่ยวชาญด้านสื่ออื่นๆ ที่สนใจความคิดเห็นของผู้ชมจำนวนมากในบางประเด็น

สรุปแล้ว

ชีวิตของเครื่องมือค้นหาทางเลือกมักจะเกิดขึ้นเพียงชั่วครู่ Lifehacker ถามอดีตผู้อำนวยการทั่วไปของ Yandex สาขายูเครน Sergei Petrenko เกี่ยวกับโอกาสระยะยาวของโครงการดังกล่าว


เซอร์เกย์ เพเตรนโก

อดีตผู้อำนวยการทั่วไปของ Yandex.Ukraine

สำหรับชะตากรรมของเครื่องมือค้นหาทางเลือกนั้นเป็นเรื่องง่าย: การเป็นโครงการเฉพาะกลุ่มที่มีผู้ชมจำนวนน้อยดังนั้นจึงไม่มีโอกาสทางการค้าที่ชัดเจนหรือในทางกลับกันมีความชัดเจนอย่างสมบูรณ์ถึงการขาดหายไป

หากคุณดูตัวอย่างในบทความคุณจะเห็นได้ว่าเครื่องมือค้นหาดังกล่าวมีความเชี่ยวชาญในช่องที่แคบ แต่ได้รับความนิยมซึ่งอาจยังไม่เติบโตพอที่จะสังเกตเห็นได้ในเรดาร์ของ Google หรือ Yandex หรือกำลังทดสอบ สมมติฐานดั้งเดิมในการจัดอันดับ ซึ่งยังไม่สามารถนำมาใช้กับการค้นหาทั่วไปได้

ตัวอย่างเช่นหากจู่ๆ การค้นหาบน Tor กลายเป็นที่ต้องการนั่นคือผลลัพธ์จากที่นั่นมีความต้องการโดยผู้ชมของ Google อย่างน้อยเปอร์เซ็นต์แน่นอนว่าเครื่องมือค้นหาทั่วไปจะเริ่มแก้ปัญหาวิธีการ ค้นหาและแสดงให้ผู้ใช้เห็น หากพฤติกรรมของผู้ชมแสดงให้เห็นว่าสำหรับผู้ใช้ในสัดส่วนที่มีนัยสำคัญในข้อความค้นหาจำนวนมาก ผลลัพธ์ที่ให้โดยไม่คำนึงถึงปัจจัยที่ขึ้นอยู่กับผู้ใช้นั้นดูมีความเกี่ยวข้องมากกว่า Yandex หรือ Google จะเริ่มสร้างผลลัพธ์ดังกล่าว

“ดีขึ้น” ในบริบทของบทความนี้ไม่ได้หมายความว่า “ดีขึ้นในทุกสิ่ง” ใช่ ในหลาย ๆ ด้านฮีโร่ของเราอยู่ห่างไกลจาก Google และ Yandex (แม้จะห่างไกลจาก Bing ด้วยซ้ำ) แต่บริการแต่ละอย่างเหล่านี้มอบบางสิ่งบางอย่างให้กับผู้ใช้ซึ่งยักษ์ใหญ่ในอุตสาหกรรมการค้นหาไม่สามารถให้ได้ แน่นอนว่าคุณคงรู้จักโครงการที่คล้ายกันเช่นกัน แบ่งปันกับเรา - มาพูดคุยกัน

ในช่วงไม่กี่ปีที่ผ่านมา บริการจาก Google และ Yandex ได้รับการยอมรับอย่างมั่นคงในชีวิตของเรา ในเรื่องนี้หลายคนคงสงสัยว่า Search Engine คืออะไร? พูดง่ายๆ ก็คือระบบซอฟต์แวร์ที่ออกแบบมาเพื่อค้นหาข้อมูลบนเวิลด์ไวด์เว็บ โดยปกติผลลัพธ์จะแสดงในรูปแบบรายการ ซึ่งมักเรียกว่าหน้าผลลัพธ์ของเครื่องมือค้นหา (SERP) ข้อมูลอาจเป็นการรวมกันของหน้าเว็บ รูปภาพ และไฟล์ประเภทอื่นๆ เครื่องมือค้นหาบางตัวยังมีข้อมูลที่มีอยู่ในฐานข้อมูลหรือไดเร็กทอรีสาธารณะ

ต่างจากไดเร็กทอรีเว็บซึ่งได้รับการสนับสนุนโดยบรรณาธิการของตนเองเท่านั้น เสิร์ชเอ็นจิ้นยังมีข้อมูลแบบเรียลไทม์โดยการรันอัลกอริทึมบนโปรแกรมรวบรวมข้อมูลเว็บ

ประวัติความเป็นมา

เครื่องมือค้นหาปรากฏขึ้นเร็วกว่าเวิลด์ไวด์เว็บ - ในเดือนธันวาคม 2533 บริการแรกดังกล่าวเรียกว่า Archie และค้นหาเนื้อหาของไฟล์ FTP โดยใช้คำสั่ง

เครื่องมือค้นหาทางอินเทอร์เน็ตคืออะไร? จนถึงเดือนกันยายน พ.ศ. 2536 เวิลด์ไวด์เว็บได้รับการจัดทำดัชนีด้วยตนเองทั้งหมด มีรายชื่อเว็บเซิร์ฟเวอร์ที่แก้ไขโดย Tim Berners-Lee ซึ่งโฮสต์อยู่บนเว็บเซิร์ฟเวอร์ของ CERN เมื่อเซิร์ฟเวอร์ออนไลน์มากขึ้นเรื่อยๆ บริการข้างต้นก็ไม่สามารถประมวลผลข้อมูลจำนวนมหาศาลได้ทัน

หนึ่งในเครื่องมือค้นหาแรกๆ ที่อิงจากการค้นหาเว็บคือ WebCrawler ซึ่งเปิดตัวในปี 1994 ต่างจากรุ่นก่อนตรงที่อนุญาตให้ผู้ใช้ค้นหาคำใดก็ได้บนหน้าเว็บใดก็ได้ อัลกอริธึมนี้ได้กลายเป็นมาตรฐานสำหรับเครื่องมือค้นหาหลักทั้งหมดตั้งแต่นั้นมา นอกจากนี้ยังเป็นการตัดสินใจครั้งแรกที่สาธารณชนทราบอย่างกว้างขวาง นอกจากนี้ในปี 1994 ก็มีการเปิดตัวบริการ Lycos ซึ่งต่อมาได้กลายเป็นโครงการเชิงพาณิชย์ขนาดใหญ่

หลังจากนั้นไม่นาน เสิร์ชเอ็นจิ้นจำนวนมากก็ปรากฏขึ้น และความนิยมก็เพิ่มขึ้นอย่างมาก เหล่านี้รวมถึง Magellan, Excite, Infoseek, Inktomi, Northern Light และ AltaVista ยาฮู! เป็นหนึ่งในวิธีที่ได้รับความนิยมมากที่สุดในการค้นหาหน้าเว็บที่สนใจ แต่อัลกอริธึมการค้นหาดำเนินการในสารบบเว็บของตัวเอง แทนที่จะเป็นสำเนาข้อความแบบเต็มของหน้าเว็บ ผู้ค้นหาข้อมูลยังสามารถเรียกดูไดเร็กทอรีแทนที่จะค้นหาด้วยคำหลัก

การพัฒนารอบใหม่

Google นำแนวคิดการขายคำค้นหามาใช้ในปี 1998 โดยเริ่มจากบริษัทเล็กๆ ชื่อ goto.com การย้ายครั้งนี้มีผลกระทบอย่างมีนัยสำคัญต่อธุรกิจ SEO ซึ่งเมื่อเวลาผ่านไปได้กลายเป็นหนึ่งในกิจกรรมที่ทำกำไรได้มากที่สุดบนอินเทอร์เน็ต

ประมาณปี 2000 เครื่องมือค้นหาของ Google เป็นที่รู้จักอย่างกว้างขวาง บริษัทได้รับผลลัพธ์ที่ดีขึ้นสำหรับการค้นหาจำนวนมากผ่านนวัตกรรมที่เรียกว่า PageRank อัลกอริธึมแบบวนซ้ำนี้จัดอันดับหน้าเว็บตามการเชื่อมต่อกับไซต์และเพจอื่นๆ โดยยึดตามสมมติฐานที่ผู้อื่นมักกล่าวถึงแหล่งข้อมูลที่ดีหรือพึงประสงค์ Google ยังคงรักษาอินเทอร์เฟซที่เรียบง่ายสำหรับเครื่องมือค้นหาของตน ในทางตรงกันข้ามคู่แข่งหลายรายได้สร้างเครื่องมือค้นหาลงในเว็บพอร์ทัล ในความเป็นจริง Google ได้รับความนิยมอย่างมากจนมีกลไกหลอกลวงเช่น Mystery Seeker เกิดขึ้น ปัจจุบันมีบริการนี้หลายเวอร์ชันในระดับภูมิภาคโดยเฉพาะเครื่องมือค้นหา Google.ru ที่ออกแบบมาสำหรับผู้ใช้ที่พูดภาษารัสเซีย

บริการเหล่านี้ทำงานอย่างไร?

การจัดอันดับและผลลัพธ์จะแสดงอย่างไร? เครื่องมือค้นหาคืออะไรจากมุมมองของอัลกอริธึมการกระทำ? พวกเขาได้รับข้อมูลผ่านการรวบรวมข้อมูลเว็บจากไซต์หนึ่งไปยังอีกไซต์หนึ่ง โรบ็อตหรือสไปเดอร์ตรวจสอบชื่อไฟล์ robots.txt มาตรฐานที่ส่งถึงชื่อไฟล์ก่อนที่จะส่งข้อมูลบางอย่างเพื่อทำดัชนี โดยมุ่งเน้นไปที่ปัจจัยหลายประการ ได้แก่ ส่วนหัว เนื้อหาของหน้า JavaScript Cascading Style Sheets (CSS) และมาร์กอัป HTML มาตรฐานของเนื้อหาที่ให้ข้อมูลหรือข้อมูลเมตาในเมตาแท็ก HTML

การจัดทำดัชนีหมายถึงการเชื่อมโยงคำและโทเค็นที่สามารถระบุตัวตนอื่นๆ ที่พบในหน้าเว็บด้วยชื่อโดเมนและฟิลด์ที่ใช้ HTML การเชื่อมโยงถูกสร้างขึ้นในฐานข้อมูลที่สาธารณชนสามารถเข้าถึงได้สำหรับคำค้นหาเว็บ คำขอจากผู้ใช้สามารถเป็นคำเดียวได้ ดัชนีช่วยให้คุณค้นหาข้อมูลที่เกี่ยวข้องกับแบบสอบถามได้โดยเร็วที่สุด

เทคนิคการจัดทำดัชนีและแคชบางอย่างเป็นความลับทางการค้า ในขณะที่การรวบรวมข้อมูลเว็บเป็นกระบวนการง่ายๆ ในการเยี่ยมชมเว็บไซต์ทั้งหมดอย่างเป็นระบบ

ระหว่างการเยี่ยมชมโรบ็อต เวอร์ชันแคชของเพจ (เนื้อหาบางส่วนหรือทั้งหมดที่จำเป็นในการแสดง) ที่จัดเก็บไว้ในหน่วยความจำการทำงานของเครื่องมือค้นหาจะถูกส่งไปยังผู้ใช้ที่ร้องขออย่างรวดเร็ว หากการเยี่ยมชมเกินกำหนด เครื่องมือค้นหาสามารถทำหน้าที่เป็นเว็บพรอกซีได้ ในกรณีนี้ เพจอาจแตกต่างจากดัชนีการค้นหา แหล่งที่มาที่แคชไว้จะแสดงเวอร์ชันที่มีการจัดทำดัชนีคำไว้ ดังนั้นจึงมีประโยชน์หากหน้าเว็บจริงสูญหายไป

สถาปัตยกรรมระดับสูง

โดยทั่วไปแล้ว ผู้ใช้ป้อนคำค้นหาลงในเครื่องมือค้นหาในรูปแบบของคำหลักหลายคำ ดัชนีมีชื่อไซต์ที่มีคำหลักเหล่านี้อยู่แล้ว และจะแสดงทันที ภาระงานที่แท้จริงคือการสร้างหน้าเว็บที่เป็นรายการผลการค้นหา แต่ละหน้าในรายการทั้งหมดจะต้องได้รับการจัดอันดับตามข้อมูลในดัชนี

ในกรณีนี้ องค์ประกอบผลลัพธ์อันดับต้นๆ จำเป็นต้องมีการค้นหา การสร้างใหม่ และการมาร์กอัปส่วนที่แสดงบริบทจากคำสำคัญที่ตรงกัน นี่เป็นเพียงส่วนหนึ่งของการประมวลผลหน้าเว็บแต่ละหน้าในผลการค้นหา และหน้าอื่นๆ (ถัดจากหน้านั้น) จำเป็นต้องใช้การประมวลผลส่วนใหญ่ในภายหลัง

นอกเหนือจากการค้นหาคำหลักแล้ว เสิร์ชเอ็นจิ้นยังมี GUI ของตนเองหรือตัวดำเนินการที่ขับเคลื่อนด้วยคำสั่งและพารามิเตอร์การค้นหาเพื่อปรับแต่งผลลัพธ์

โดยจะให้การควบคุมที่จำเป็นแก่ผู้ใช้ผ่านวงจรป้อนกลับ การกรอง และการถ่วงน้ำหนัก ในขณะเดียวกันก็ปรับแต่งข้อมูลที่ต้องการโดยอิงจากหน้าแรกของผลการค้นหาแรกๆ ตัวอย่างเช่น ตั้งแต่ปี 2007 Google.com ได้ทำให้สามารถกรองรายการผลลัพธ์ตามวันที่ได้โดยการคลิก "แสดงเครื่องมือค้นหา" ในคอลัมน์ซ้ายสุดของหน้าผลลัพธ์เดิม จากนั้นเลือกช่วงวันที่ที่คุณต้องการ

คำขอที่แตกต่างกัน

เครื่องมือค้นหาส่วนใหญ่สนับสนุนการใช้ตัวดำเนินการบูลีน AND, OR และ NOT เพื่อช่วยให้ผู้ใช้ปรับแต่งข้อความค้นหาของตน โอเปอเรเตอร์บางตัวได้รับการออกแบบสำหรับตัวอักษร ซึ่งอนุญาตให้ผู้ใช้ปรับแต่งและขยายข้อความค้นหา หุ่นยนต์ค้นหาคำหรือวลีในลักษณะเดียวกับการค้นหาคำสั่งที่ป้อน เครื่องมือค้นหาบางตัวมีคุณลักษณะการค้นหาขั้นสูงที่ช่วยให้ผู้ใช้สามารถกำหนดระยะห่างระหว่างคำหลักได้

นอกจากนี้ยังมีการค้นหาตามแนวคิด ซึ่งการวิจัยเกี่ยวข้องกับการใช้การวิเคราะห์ทางสถิติในหน้าที่มีคำหรือวลีที่คุณกำลังมองหา นอกจากนี้ ข้อความค้นหาที่เป็นภาษาธรรมชาติยังอนุญาตให้ผู้ใช้ป้อนคำถามในลักษณะเดียวกับที่เขาถามมนุษย์ (ตัวอย่างที่พบบ่อยที่สุดคือ Ask.com)

ประโยชน์ของเครื่องมือค้นหาขึ้นอยู่กับความเกี่ยวข้องของชุดผลลัพธ์ที่ส่งคืน อาจมีหน้าเว็บหลายล้านหน้าที่มีคำหรือวลีเฉพาะเจาะจง แต่บางหน้าอาจมีความเกี่ยวข้อง เป็นที่นิยม หรือน่าเชื่อถือมากกว่าหน้าอื่นๆ เครื่องมือค้นหาส่วนใหญ่ใช้วิธีการจัดอันดับเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

วิธีที่เสิร์ชเอ็นจิ้นตัดสินใจว่าหน้าใดที่ตรงกับข้อความค้นหามากที่สุด และลำดับแหล่งที่มาที่พบควรแสดงนั้นแตกต่างกันอย่างมากในโรบอตตัวหนึ่งไปยังอีกตัวหนึ่ง วิธีการเหล่านี้ยังเปลี่ยนแปลงไปตามกาลเวลาเมื่อการใช้อินเทอร์เน็ตเปลี่ยนแปลงและเทคโนโลยีใหม่ๆ พัฒนาขึ้น

เครื่องมือค้นหาคืออะไร: พันธุ์

เครื่องมือค้นหามีสองประเภทหลัก ประการแรกคือระบบของคำหลักที่กำหนดไว้ล่วงหน้าและเรียงลำดับตามลำดับชั้นซึ่งผู้คนตั้งโปรแกรมไว้เป็นจำนวนมาก ประการที่สองคือระบบที่สร้าง "ดัชนีกลับหัว" โดยการวิเคราะห์ข้อความที่พบ

เสิร์ชเอ็นจิ้นส่วนใหญ่เป็นบริการเชิงพาณิชย์ที่ได้รับการสนับสนุนจากรายได้จากการโฆษณา ดังนั้นบางรายการจึงอนุญาตให้ผู้ลงโฆษณาจัดอันดับในผลลัพธ์ที่แสดงโดยเสียค่าธรรมเนียม บริการที่ไม่รับเงินสำหรับการจัดอันดับจะสร้างรายได้โดยการแสดงโฆษณาตามบริบทถัดจากไซต์ที่พวกเขาแสดง วันนี้การโปรโมตในเครื่องมือค้นหาเป็นหนึ่งในรายได้ที่ทำกำไรได้มากที่สุดบนอินเทอร์เน็ต

บริการใดที่พบบ่อยที่สุด?

Google เป็นเครื่องมือค้นหาที่ได้รับความนิยมมากที่สุดในโลกโดยมีส่วนแบ่งตลาด 80.52% ณ เดือนมีนาคม 2017

  • กูเกิล - 80.52%
  • ปิง - 6.92%
  • ไป่ตู้ - 5.94%
  • ยาฮู! - 5.35%

เครื่องมือค้นหาในรัสเซียและเอเชียตะวันออก

ในรัสเซียและบางประเทศในเอเชียตะวันออก Google ไม่ใช่บริการที่ได้รับความนิยมมากที่สุด ในหมู่ผู้ใช้ชาวรัสเซีย เครื่องมือค้นหา Yandex ได้รับความนิยม (61.9%) เมื่อเทียบกับ Google (28.3%) ในประเทศจีน Baidu เป็นบริการที่ได้รับความนิยมมากที่สุด Naver พอร์ทัลการค้นหาของเกาหลีใต้ถูกใช้สำหรับ 70% เปอร์เซ็นต์ของการค้นหาออนไลน์ในประเทศ ยาฮู! ในญี่ปุ่นและไต้หวันเป็นเครื่องมือที่ได้รับความนิยมมากที่สุดในการค้นหาข้อมูลที่จำเป็น

เครื่องมือค้นหาอื่น ๆ ของรัสเซียที่มีชื่อเสียง ได้แก่ Mail และ Rambler เมื่อเริ่มต้นการพัฒนา Runet พวกเขาได้รับความนิยมอย่างกว้างขวาง แต่ตอนนี้พวกเขาสูญเสียตำแหน่งไปอย่างมาก

ข้อจำกัดและเกณฑ์การค้นหา

แม้ว่าเครื่องมือค้นหาจะได้รับการตั้งโปรแกรมให้จัดอันดับเว็บไซต์ตามความนิยมและความเกี่ยวข้อง แต่การวิจัยเชิงประจักษ์ชี้ไปที่เกณฑ์ทางการเมือง เศรษฐกิจ และสังคมที่แตกต่างกันในการเลือกข้อมูลที่ให้ อคติเหล่านี้อาจเป็นผลลัพธ์โดยตรงทางเศรษฐกิจ (เช่น บริษัทที่โฆษณาเครื่องมือค้นหาอาจได้รับความนิยมมากขึ้นในผลการค้นหาทั่วไป) และกระบวนการทางการเมือง (เช่น การลบผลการค้นหาเนื่องจากกฎหมายท้องถิ่น) ตัวอย่างเช่น Google จะไม่แสดงไซต์นีโอนาซีบางแห่งในฝรั่งเศสและเยอรมนี ซึ่งการปฏิเสธการฆ่าล้างเผ่าพันธุ์ถือเป็นสิ่งผิดกฎหมาย

เครื่องมือค้นหาคริสเตียน อิสลาม และยิว

การเติบโตทั่วโลกของอินเทอร์เน็ตและสื่ออิเล็กทรอนิกส์ในโลกมุสลิมในช่วงทศวรรษที่ผ่านมาได้กระตุ้นให้ผู้นับถือศาสนาอิสลามในตะวันออกกลางและอนุทวีปเอเชียพยายามสร้างเครื่องมือค้นหาของตนเองและกรองพอร์ทัลที่จะอนุญาตให้ผู้ใช้ดำเนินการค้นหาที่ปลอดภัย

บริการดังกล่าวมีตัวกรองที่จัดประเภทเว็บไซต์เพิ่มเติมว่าเป็น “ฮาลาล” หรือ “ฮาราม” ตามการตีความ “กฎหมายอิสลาม” ของผู้เชี่ยวชาญสมัยใหม่

พอร์ทัล ImHalal ปรากฏทางออนไลน์ในเดือนกันยายน พ.ศ. 2554 และ Halalgoogling ในเดือนกรกฎาคม พ.ศ. 2556 พวกเขาใช้ตัวกรอง Haram ตามอัลกอริทึมจาก Google และ Bing

เครื่องมือค้นหาอื่น ๆ ที่เน้นศาสนา ได้แก่ Jewgle (Google เวอร์ชันยิว) และ SeekFind.org ที่ใช้คริสเตียน พวกเขากรองไซต์ที่ปฏิเสธหรือลดความศรัทธาของตนออกไป

เครื่องมือค้นหาทางอินเทอร์เน็ตที่ดีที่สุด เครื่องมือค้นหาทางอินเทอร์เน็ต เหล่านี้เป็นโปรแกรมค้นหาพิเศษที่ติดตั้งในเครื่องพิเศษทุกประเภท พูดง่ายๆ ก็คือเป็นเว็บไซต์เดียวกันกับชุดโปรแกรม เฉพาะในเครื่องมือค้นหาพิเศษ (เซิร์ฟเวอร์) ด้วยความช่วยเหลือของเครื่องมือค้นหาที่คุณค้นหาข้อมูลทั้งหมดที่คุณต้องการ มีเครื่องมือค้นหามากมาย

1. เครื่องมือค้นหาทางอินเทอร์เน็ตคืออะไร

2. เสิร์ชเอ็นจิ้นยอดนิยมในประเทศเรา

3. เสิร์ชเอ็นจิ้นยอดนิยมในต่างประเทศ

4. เครื่องมือค้นหาที่ผิดปกติ

5. วิธีค้นหาข้อมูลบนอินเทอร์เน็ตอย่างถูกต้อง

มากที่สุด พีที่ดีที่สุดระบบค้นหาในประเทศของเรา:

http://www.yandex.ru

http://www.google.com

http://www.aport.ru

http://www.rambler.ru/

http://go.mail.ru

http://www.webalta.ru/

เครื่องมือค้นหาที่ไม่มีใครรักและล่วงล้ำที่สุด

เสิร์ชเอ็นจิ้นยอดนิยมในต่างประเทศ

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

แต่ละประเทศมีเครื่องมือค้นหายอดนิยมของตนเอง

เครื่องมือค้นหาที่ผิดปกติ

  • เป็ดเป็ดGo (https://duckduckgo.com/) - เครื่องมือค้นหาแบบไฮบริดพร้อมนโยบายความเป็นส่วนตัวสำหรับผู้ใช้และคำค้นหาของเขา

  • ตินอาย (http://tineye.com/) เป็นเครื่องมือค้นหาที่เชี่ยวชาญในการค้นหาภาพบนอินเทอร์เน็ต เพิ่งสูญเสียความเกี่ยวข้องไปหลังจากที่ Google เปิดตัวฟังก์ชั่นเดียวกันในการค้นหารูปภาพ

  • เกนอน (http://www.genon.ru/) เป็นเครื่องมือค้นหาที่รวบรวมและสร้างเนื้อหาบนเว็บไซต์

ในเกือบทุกเครื่องมือค้นหานอกจากช่องค้นหาแล้วยังมี ลิงค์ไปยังเว็บไซต์ข่าวยอดนิยม และเว็บไซต์บางหัวข้อ

วิธีค้นหาข้อมูลบนอินเทอร์เน็ตอย่างถูกต้อง

เครื่องมือค้นหาแต่ละอันมีอัลกอริธึม (กฎ) ของตัวเองสำหรับการค้นหาข้อมูล

ในการค้นหาข้อมูลบางอย่างบนอินเทอร์เน็ตผ่านเครื่องมือค้นหาคุณต้องป้อนในช่องค้นหา ขอ- หากคุณป้อนคำเดียว คำขอนี้จะให้ลิงก์นับพันไปยังไซต์ที่มีการกล่าวถึงคำนี้

ดังนั้นจึงจำเป็นต้องป้อนข้อความค้นหาที่เจาะจงที่สุดเท่าที่จะเป็นไปได้ ซึ่งประกอบด้วยวลีสอง สามวลีขึ้นไป

ลองดูตัวอย่างข้อความค้นหาของเครื่องมือค้นหา ยานเดกซ์.

สมมติว่าคุณต้องการหาข้อมูลในการซื้อคอมพิวเตอร์ หากคุณเขียนหนึ่งคำในช่องค้นหา “ คอมพิวเตอร์"แล้วคุณจะได้คำตอบ 133 ล้านคำตอบ"

คุณต้องขอคำขอที่เฉพาะเจาะจงมากขึ้น เป็นการดีกว่าที่จะระบุว่าคุณต้องการซื้อคอมพิวเตอร์เครื่องใดและที่ไหน (ในเมืองใด)

จากนั้นเครื่องมือค้นหาจะให้คำตอบสำหรับคำถามของคุณน้อยลงมาก

เครื่องมือค้นหาไม่สนใจเลยไม่ว่าคุณจะป้อนข้อความค้นหาด้วยตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็ก

ยานเดกซ์แยกความแตกต่างระหว่างคำนามและคำคุณศัพท์ แต่ไม่สนใจตอนจบโดยสิ้นเชิง

เขาไม่แยแสกับคดี พหูพจน์ และสิ่งที่คล้ายคลึงกันโดยสิ้นเชิง

เพื่อให้การค้นหาแม่นยำยิ่งขึ้น คุณต้องใส่ข้อความค้นหาในเครื่องหมายคำพูดหรือใส่เครื่องหมายอัศเจรีย์หน้าคำ

ตอนนี้ดูที่ข้อความค้นหาเดียวกัน แต่ไม่มีเครื่องหมายอัศเจรีย์

คุณเห็นความแตกต่างหรือไม่? ด้วยเครื่องหมายอัศเจรีย์จำนวนคำตอบไม่ใช่ 2 ล้าน แต่เป็น 186,000

หากคุณใส่เครื่องหมายอัศเจรีย์หน้าคำที่เป็นตัวพิมพ์ใหญ่ คุณจะได้รับคำตอบซึ่งคำเฉพาะที่มีตัวพิมพ์ใหญ่นี้จะปรากฏขึ้น

หากคำนั้นอยู่ในรูปแบบการเสนอชื่อ และคุณต้องการข้อมูลเกี่ยวกับคำนั้นอย่างแน่นอน และวิธีการเขียนของคุณ ให้ใส่เครื่องหมายอัศเจรีย์ 2 อันไว้หน้าคำนี้ ตัวอย่างเช่น: !!ลูกบอล .

การค้นหาจะให้คำตอบแก่คุณสำหรับคำนี้อย่างแน่นอน " ลูกบอล"อย่างที่คุณเขียน ไม่ " ลูกบอล", ไม่ " ลูกบอล"และด้วยตัวพิมพ์ใหญ่

หากเขียนวลีด้วยคำว่า " บน" จากนั้นยานเดกซ์จะเพิกเฉย " บน- ตัวอย่างเช่น: " บนชั้นวาง- การค้นหาจะดำเนินการโดยใช้คำว่า "เท่านั้น ชั้นวาง ».

เพื่อให้เขาคำนึงถึงและไม่ละเลยต้องนำหน้าคำว่า “ บน» ใส่เครื่องหมายบวก – « +เปิด ».

เครื่องมือค้นหาแต่ละรายการมีอัลกอริธึมการค้นหาของตัวเอง ดังนั้นหากคุณใช้เครื่องมือค้นหาเฉพาะและต้องการเรียนรู้วิธีเขียนข้อความค้นหาอย่างถูกต้อง คุณเพียงแค่ต้องพิมพ์ “ กฎการค้นหาในGoogle " หรือ " กฎการค้นหาใน Yandex " ไปที่ลิงก์เพื่อตอบสนองต่อคำขอของคุณและอ่านข้อมูลที่จำเป็น

ทุกช่วงเวลาคนตัดสินใจ ผลลัพธ์: เคลื่อนไปข้างหน้า วุ่นวายอยู่กับที่ หรือเคลื่อนไหวในพื้นที่ข้อมูล แต่ที่ไหนล่ะ? เครื่องมือค้นหาหมายถึงอะไร?

การมองเห็นที่ดี การได้ยิน การทำงานของประสาทสัมผัสทั้งหมดที่เชื่อถือได้ และการรับรู้ตามความเป็นจริงตามความเป็นจริง ส่วนใหญ่จะเป็นตัวกำหนดการใช้ประสบการณ์และความรู้ที่สะสมมาอย่างถูกต้อง และเปิดโอกาสให้สัญชาตญาณได้แสดงออก แต่คำตอบที่ถูกต้องนั้นไม่เพียงเป็นผลมาจากคำถามที่ถูกต้องเท่านั้น แต่ยังรวมถึงข้อมูลที่รวบรวมอย่างถูกต้องเพื่อแก้ไขด้วย (นี่คือขอบเขตของเกณฑ์)

เครื่องมือค้นหาเข้าใจอะไรสั้น ๆ ? ประวัติการค้นหาทางอินเทอร์เน็ต

ในช่วงเวลาที่คอมพิวเตอร์และอินเทอร์เน็ตเป็นเพียงส่วนน้อยที่ได้รับการคัดเลือก ตรรกะของบรรณารักษ์ทั่วไปถือเป็นที่ต้องการ เหตุใดการแก้ปัญหาจึงซับซ้อน ในเมื่อแค็ตตาล็อกของไฟล์ ข้อมูล โซลูชัน โปรแกรม และทุกสิ่งที่ทำและอาจมีประโยชน์ ก็เพียงพอที่จะนำทางในพื้นที่ข้อมูล

ผู้ใช้ไม่ควรสร้างอนุสาวรีย์ใช่ไหม ให้เราจำไว้ว่ามันเป็นหน้าที่ของแฟนคอมพิวเตอร์ที่เครือข่าย แค็ตตาล็อก โอกาสในการสื่อสารและการสะสม "หลัก":

  • ทุนข้อมูล
  • รากฐานของแนวคิดสมัยใหม่ (พวกเขาจมลงสู่การลืมเลือน แต่รูปลักษณ์ที่หายวับไปของพวกมันก่อให้เกิดมุมมองระยะยาว)

พลังและความสามารถของคอมพิวเตอร์ได้ย้ายจากขอบเขตการประมวลผลไปสู่ขอบเขตการประมวลผลข้อมูลอย่างรวดเร็ว อินเทอร์เน็ตเริ่มพิชิตดินแดนใหม่อย่างรวดเร็วทั้งในด้านการใช้งานและในใจผู้คน บรรณารักษ์ธรรมดาได้ย้ายไปยังกลไกที่ซับซ้อนของเครื่องมือค้นหาทันที

กองทัพผู้ค้นหา หุ่นยนต์ "แมงมุม" และอัลกอริธึมอื่น ๆ จำนวนมากเริ่มตรวจสอบทุกสิ่งที่เข้ามาในพื้นที่อินเทอร์เน็ต บางทีอาจเป็นพวกเขาที่ทำให้ชัดเจนว่าเครื่องมือค้นหาคืออะไร การค้นหาทำงานอย่างไร และอินเทอร์เน็ตคืออะไร พวกเขาเรียนรู้ที่จะจัดทำดัชนีข้อมูลและทำความเข้าใจว่าสิ่งใดสามารถใช้ได้และควรใช้อย่างไร

มันเป็น "โลกยุคก่อนสารสนเทศ" โบราณ อาวุธโบราณ เทคนิคการรวบรวมแบบดั้งเดิม เช่นเดียวกับการตกปลาและการล่าสัตว์ในช่วงเวลาที่ผู้คนเพิ่งเริ่มนำเสนอบางสิ่งทางสังคม มีความสำคัญทางสังคม แยกออกจากธรรมชาติตามเกณฑ์ของความมีเหตุผล

การจัดทำดัชนี: เราไม่ใช่ทาส แต่เรายังไม่มีอะไรเลย

การจัดทำดัชนีพื้นที่ข้อมูลวิธีการวางแนวในข้อมูลที่รวบรวมและความสามารถในการปรับสิ่งที่มีอยู่อย่างถูกต้องเนื่องจากการเปลี่ยนแปลงที่ตรวจพบในสภาพแวดล้อมภายนอก (อินเทอร์เน็ต) กลายเป็นพื้นฐานเพื่อความอยู่รอด นี่เป็นธรรมเนียมโดยธรรมชาติและพื้นที่อินเทอร์เน็ตก็ได้รับชีวิตจริงเป็นของตัวเองแล้ว

มีบางสิ่งในประวัติศาสตร์ที่สามารถจดจำได้เสมอ แต่คำถามก็เกิดขึ้นเสมอ: เป็นเช่นนั้นหรือไม่ “ความเป็นอยู่” ทางประวัติศาสตร์นั้นเชื่อมโยงกับผู้คนจริงและความทรงจำที่น่าจดจำหรือไม่?

บางทีเพื่อนบ้านในปล่องบันไดอาจเป็นผู้สร้าง Google หรือกำหนดหลักการพื้นฐานของความเจริญรุ่งเรืองของยานเดกซ์ แต่หลายคนอ้างถึงปี 1945 ว่าเป็นจุดที่แนวคิดเรื่องไฮเปอร์เท็กซ์เริ่มต้นขึ้น และการเรียกข้อความอัตโนมัติ Magic ของ Salton ถือเป็นบิดาแห่งเทคโนโลยีการค้นหาสมัยใหม่

ตั้งแต่นั้นมาน้ำจำนวนมากไหลผ่านใต้สะพานและรายชื่อเครื่องมือค้นหาแรกอัลกอริธึมและแนวคิดโบราณแรก ๆ มีขนาดใหญ่มากจนเป็นงานค้นหาที่ดีในการจัดระบบและจัดทำดัชนีอดีต

ไม่มีเหตุผลที่จะยืนยันว่าเหตุผลที่ Google เป็นปรากฏการณ์และระบบสมัยใหม่ไม่ได้เป็นเพียงบุคคลจริง เพื่อนและแฟนสาวของเขาเท่านั้น เหตุใดจึงไม่เป็นจุดที่แตกต่างไปจากเดิมอย่างสิ้นเชิงในพื้นที่ข้อมูลที่ทำให้เกิดการสะท้อนหรือการเชื่อมโยงที่ต้องการได้สำเร็จ

จิตสำนึกสาธารณะโดยรวมยังคงเป็นจักรวาลอันมืดมิดซึ่งอยู่ห่างไกลจากหลอดไฟของเอดิสันในเวอร์ชันของมันมาก

ปี 2537 บอทตัวไหนเอ่ยคำว่า “แม่”?

ในโลกสมัยใหม่เป็นเรื่องยากที่จะเชื่อในอดีต แต่การคำนึงถึงความถูกต้องของวันที่และการมีส่วนร่วมของบุคลิกภาพที่แท้จริงควรสังเกตว่ารูปลักษณ์ของคำหลักยังไม่เป็นแกนกลางของความหมาย

ความหมายของเครื่องมือค้นหาเมื่อปลายศตวรรษที่ผ่านมานั้นชัดเจนอยู่แล้ว: มันเป็นเครื่องมือค้นหายอดนิยมหลายสิบรายการที่มีอันดับการแข่งขันในการต่อสู้เพื่อลูกค้า บางคนชอบ Yahoo, Aport คนอื่น ๆ, Rambler คนอื่น ๆ แต่สุดท้ายแล้ว Google และ Yandex ก็ยังคงอยู่

ทั้งหมดนี้คือคำพูด ความคิดเห็น ความชอบ และข้อเท็จจริงที่น่าสนใจ อย่างไรก็ตาม สัตว์ประหลาดแห่งธุรกิจการค้นหาได้ถูกสร้างขึ้น สร้างรากฐานพื้นฐาน วางความรู้ที่เป็นรูปธรรมและประสบการณ์ที่มั่นคงในการทำความเข้าใจ:

  • กลไกการค้นหา
  • คำสำคัญ;
  • แกนความหมาย

ไฮเปอร์เท็กซ์ไม่เพียงแต่เริ่มต้นเท่านั้น แต่ยังกลายเป็นพื้นฐานของการเขียนโปรแกรมอินเทอร์เน็ตและปูทางไปสู่เทคโนโลยีที่จริงจังที่เกี่ยวข้อง

สิ่งสำคัญ: ไม่สำคัญว่าเราจะเข้าใจสิ่งที่เกิดขึ้นอย่างไร สิ่งสำคัญคือต้องมีทิศทางการเคลื่อนไหวและถูกต้อง ความผันผวนของอัตราแลกเปลี่ยนเป็นเรื่องปกติ หากไม่มีความผันผวน ก็ไม่มีเหตุผลที่จะปรับเกณฑ์ให้เหมาะสม และหลักเกณฑ์ทั้งคำถามและคำตอบเป็นสิ่งสำคัญที่สุด

ปี 1989: การฟื้นฟูที่ถูกลืม

การย้อนกลับเป็นกลไกทางประวัติศาสตร์ที่พิเศษและเป็นข้อเท็จจริงที่น่าสนใจอยู่เสมอ ผู้คน โดยเฉพาะนักวิทยาศาสตร์และผู้เชี่ยวชาญที่มีคุณสมบัติเหมาะสม มักจะลืมสาระสำคัญของสิ่งต่างๆ และเข้าสู่ฝันกลางวัน โลกแห่งสงคราม กลาดิเอเตอร์ และการต่อสู้อันเลวร้ายนั้นสนุกเมื่อเปรียบเทียบกับการแข่งขันที่เกิดขึ้นในที่สาธารณะและส่วนตัว มีอาณาจักรแห่งความมืดอยู่ที่นี่ แต่เราต้องก้าวไปข้างหน้า และมันเป็นไปไม่ได้หากปราศจากชัยชนะในทุกย่างก้าว

หลักการทำงานของเครื่องมือค้นหาเป็นพื้นฐานของอัลกอริทึม มีการนำอัลกอริธึมไปใช้งานจริงมากมาย มีเพียงไม่กี่คนที่รอดชีวิต แต่นี่คือสิ่งที่ทำให้ชุมชนอินเทอร์เน็ตทั้งหมดแตกแยกกัน การต่อสู้เพื่ออุดมคติในด้านการค้นหามีความสำคัญอยู่แล้ว แต่ถึงแม้ประวัติโดยย่อของการพัฒนาเสิร์ชเอ็นจิ้นก็ไม่ได้รับความสนใจจากผู้บริโภค

ผู้ใช้ต้องการคำตอบ ไม่ใช่ความสำเร็จของนักวิทยาศาสตร์และผู้เชี่ยวชาญ ผู้บริโภคต้องการทราบวิธีการตั้งคำถามอย่างถูกต้องเพื่อให้ได้คำตอบที่เพียงพอ และต้องแน่ใจว่ากลไกการค้นหาทำงานอย่างถูกต้องและใช้เกณฑ์วัตถุประสงค์

ใครสนใจข้อเท็จจริงที่น่าสนใจว่า OOP และคลาวด์ถูกประดิษฐ์ขึ้นในปี 1989-1991 ไม่มีใครอย่างแน่นอน! แต่เมื่อหลายสิบปีก่อนมีการย้อนกลับ: ตอนนี้เป็นไปไม่ได้หากไม่มี OOP และเทคโนโลยีคลาวด์ แต่การย้อนกลับ "ไม่ได้ย้าย" ไปในทิศทางที่ถูกต้อง ดังนั้นจึงไม่มีคำตอบเฉพาะสำหรับคำถามที่ว่าเครื่องมือค้นหาหมายถึงอะไร ไม่มีอะไรใหม่เกิดขึ้น แต่มีบางสิ่งที่ไม่จำเป็น

ความหมายของการค้นหาและเครื่องมือค้นหา

เมื่อเครื่องคิดเลขปรากฏขึ้น ผู้คนคิดว่าพวกเขาจะลืมกฎการบวก การคูณ และการหาร เวลาผ่านไปและความกลัวก็หายไป เครื่องคิดเลขยังมีชีวิตอยู่และผู้คนยังไม่ลืมวิธีดำเนินการทางคณิตศาสตร์อย่างง่ายในคอลัมน์

ในช่วงเวลาที่ Google และ Yandex ทำงานและมีเครื่องมือค้นหาที่มีชื่อเสียงจำนวนไม่มาก มีความเห็น: การค้นหาเป็นอัลกอริทึมของคอมพิวเตอร์ และเครื่องมือค้นหา (คำจำกัดความของคำและความหมายของคำ) เป็นซอฟต์แวร์และ ฮาร์ดแวร์ที่ซับซ้อน พร้อมเว็บอินเตอร์เฟส ให้ความสามารถในการค้นหาข้อมูลบนอินเทอร์เน็ต

ผลลัพธ์ของเครื่องมือค้นหา

ไม่ยากเลยที่จะจินตนาการว่าเครื่องมือค้นหาหมายถึงอะไร มีสตริงข้อความค้นหา ผู้เยี่ยมชมเขียนคำหลัก คลิกปุ่ม "ค้นหา" และรับผลลัพธ์ แต่ผลการค้นหาไม่ใช่คำตอบ และคำหลักไม่ใช่คำถาม

ในชีวิตปกติคน ๆ หนึ่งจะไม่ใช้คำหลักและไม่เคยได้รับผลลัพธ์ใด ๆ ถ้าลูกอยากกินเขาจะบอกแม่หรือพ่อให้ฟัง ทุกอย่างขึ้นอยู่กับสิ่งที่ทารกต้องการจริงๆ: กินจริงๆ หรือหาเงินซื้อไอศกรีม คำตอบของผู้ปกครองอาจไร้คำพูด แต่การกระทำจะตามมา

พนักงานจะไม่ติดต่อนายจ้างด้วยคำสำคัญ มิฉะนั้นผลลัพธ์จะถูกไล่ออกโดยไม่มีคำพูด

ทั้งหมดนี้เป็นข้อเท็จจริง แต่บุคคลและระบบคอมพิวเตอร์มีความสัมพันธ์ที่แตกต่างกัน ตราบใดที่มีความคิดที่ชัดเจนว่าเครื่องมือค้นหาหมายถึงอะไร - สิ่งเหล่านี้ไม่ใช่คำถาม คำตอบ เกณฑ์ แต่เป็นคำหลักและผลลัพธ์ของเครื่องมือค้นหา (ผลการค้นหา)

ประโยชน์ที่แท้จริงของขณะปัจจุบัน

ความหลงใหลในการทำ SEO, การเติบโตอย่างรวดเร็วของจำนวนสตูดิโอเว็บ, การพัฒนาโฆษณา, การจัดเก็บแนวคิด, สแปมและขยะมากมายในผลการค้นหา - ทั้งหมดนี้เป็นไปตามธรรมชาติและเป็นเรื่องปกติ ถึงเวลาต่อสู้กับสแปม แฮกเกอร์ และสิ่งไม่ดี ต้องทำอย่างระมัดระวัง แต่ประโยชน์ที่แท้จริงจากสถานการณ์ปัจจุบันเป็นเพียงอีกก้าวหนึ่งของการพัฒนาธุรกิจการค้นหา

คำสำคัญ - ยอดเยี่ยม แกนหลักของเว็บไซต์นั้นยอดเยี่ยมมาก คอมพิวเตอร์สามารถแปลข้อความเป็นภาษาต่างๆ และแยกประโยคที่เป็นธรรมชาติได้ ภาษา SQL ได้กลายเป็นภาษาโดยพฤตินัยสำหรับการ "สื่อสาร" กับฐานข้อมูล SQL มีภาษาท้องถิ่นมากมาย และนี่คือตัวบ่งชี้ที่แท้จริง ภาษาประดิษฐ์ใช้งานได้แล้ว! ภาษาสามารถให้การเข้าถึงข้อมูลที่เป็นระบบจำนวนมหาศาล

Oracle และผู้นำด้านฐานข้อมูลรายใหญ่อื่นๆ ใช้เวลาหลายทศวรรษในการนำเสนอข้อมูล Google - เกี่ยวกับกลไกการรวบรวมและจัดทำดัชนีข้อมูล ตระกูล Linux ยึดมั่นถือมั่น Windows ยังคงลอยนวลและจำนวนภาษาการเขียนโปรแกรมก็แคบลงให้อยู่ในระดับที่เพียงพอ

ปัญญาประดิษฐ์ได้เข้าสู่โลกแห่งความฝัน นักพัฒนาและผู้บริโภคต่างเร่งรีบเข้าสู่โลกแห่งการจัดการข้อมูลที่สร้างสรรค์และการใช้งาน

ผลการค้นหา: สำคัญและไม่มีประโยชน์

การจัดระบบผลการค้นหาไม่ใช่เรื่องยาก แต่ก็ไม่มีการเปลี่ยนแปลงในช่วงสิบปีที่ผ่านมา โดยพื้นฐานแล้ว - จริง หากแถบค้นหามีคำหลักไม่ใช่คำถาม แล้วเราจะพูดถึงคำตอบประเภทใด เครื่องมือค้นหาสมัยใหม่ทั้งหมดมีเกณฑ์ พวกเขาได้รับการปฏิบัติด้วยความเข้าใจ แต่เหตุใดจึงจำกัดผู้บริโภค

สิ่งสำคัญคือปฏิกิริยาของผู้ใช้ต่อส่วนใดของผลการค้นหาที่เขาเลือก นี่คือความคิดเห็นของเขาเกี่ยวกับผลลัพธ์ของเครื่องมือค้นหา เครื่องมือค้นหาชื่นชมสิ่งนี้และคำนึงถึงไม่เพียงเฉพาะในคำขอเฉพาะเท่านั้น แต่ยังรวมถึงโดยทั่วไปด้วย

สตรีมคำหลักและสตรีม SERP มีทั้งขยะข้อมูล นี่เป็นเหตุผลในการกำหนดหลักเกณฑ์ด้วย งานค้นหาไม่สามารถถือเป็นการใช้คำสำคัญและอัลกอริธึมกับข้อมูลที่สะสมได้ เป็นการปรับแต่งข้อมูลที่สะสม

เกี่ยวกับผู้มีโอกาสเป็นลูกค้า: จากการค้นหาสู่โซลูชัน

ทางออกที่ดีที่สุดคือไม่ต้องตัดสินใจใดๆ ไม่ว่านักพัฒนาเครื่องมือค้นหาจะเข้าใจสิ่งนี้หรือไม่ แต่ความจริงก็ยังคงอยู่: เครื่องมือค้นหาคืออะไรนักพัฒนารู้ในบริบทของการตอบสนองต่อคำหลักในฐานะดัชนีในบริบทของการดึงข้อมูลจากข้อมูลที่มีอยู่แล้วและจัดระบบ

ผู้บริโภคจะเลือกสิ่งที่เขาเห็นว่าจำเป็นจากผลการค้นหาและทำการตัดสินใจ เครื่องมือค้นหาจะคำนึงถึงสิ่งนี้และจดจำสิ่งนี้ วิธีที่บุคคลจะใช้ข้อมูลที่ได้รับจะเป็นคำสำคัญถัดไป

นี่คือวิธีที่เครื่องมือค้นหาเรียนรู้ที่จะตัดสินใจ และบุคคลเรียนรู้ที่จะกำหนดคำถาม ในตอนนี้ คำเหล่านี้คือคำหลัก และผลลัพธ์ของคำตอบคือผลการค้นหา แต่ปริมาณจะกลายเป็นคุณภาพเสมอ

เครื่องมือค้นหาทางอินเทอร์เน็ตคืออะไร? ความจริงที่มีพื้นฐานมาจากการเคลื่อนไหวไปข้างหน้า มีปัญหาในทางปฏิบัติไม่มากนักที่ต้องใช้สติปัญญาจากระบบคอมพิวเตอร์ ในกรณีส่วนใหญ่ แค่ตอบคำถามที่ถูกตั้งไว้อย่างถูกต้องก็เพียงพอแล้ว

เพื่อที่จะรักษาและพัฒนาบล็อกของเราได้สำเร็จ ก่อนอื่นเราต้องรู้ว่าบล็อกเหล่านั้นทำงานด้วยอัลกอริธึมอะไร ความเข้าใจที่ชัดเจนในคำตอบสำหรับคำถามเหล่านี้จะช่วยให้เราแก้ไขปัญหาการโปรโมตเว็บไซต์ในเครื่องมือค้นหาได้สำเร็จ แต่การสนทนาเกี่ยวกับการเพิ่มประสิทธิภาพกลไกค้นหาของเว็บไซต์ยังคงอยู่ข้างหน้า แต่สำหรับตอนนี้มีทฤษฎีเล็กน้อยเกี่ยวกับเครื่องมือค้นหา

เครื่องมือค้นหาทางอินเทอร์เน็ตคืออะไร?

ถ้าเราหันไปหา Wikipedia นี่คือสิ่งที่เราค้นพบ:

“เสิร์ชเอ็นจิ้นคือซอฟต์แวร์และฮาร์ดแวร์ที่ซับซ้อนซึ่งมีเว็บอินเตอร์เฟสที่ให้ความสามารถในการค้นหาข้อมูลบนอินเทอร์เน็ต”

และตอนนี้เป็นภาษาที่เราเข้าใจ สมมติว่าเราต้องการข้อมูลอย่างเร่งด่วนในหัวข้อใดหัวข้อหนึ่ง เพื่อให้เราสามารถค้นหาได้อย่างรวดเร็วเครื่องมือค้นหาได้ถูกสร้างขึ้น - ไซต์ที่โดยการป้อนคำค้นหาในแบบฟอร์มการค้นหาเราจะได้รับรายชื่อไซต์ที่เราจะพบสิ่งที่เรามีโอกาสสูง กำลังมองหา รายการนี้เรียกว่าผลการค้นหา สามารถประกอบด้วยหลายล้านหน้า โดยแต่ละไซต์มี 10 ไซต์ หน้าที่หลักของผู้ดูแลเว็บคือการติดสิบอันดับแรกเป็นอย่างน้อย

โปรดจำไว้ว่าเมื่อคุณค้นหาบางสิ่งบนอินเทอร์เน็ต คุณมักจะพบสิ่งนั้นในหน้าแรกของผลการค้นหา โดยแทบจะไม่เลื่อนไปที่หน้าที่สอง และเลื่อนไปยังหน้าถัดไปน้อยมาก ซึ่งหมายความว่ายิ่งเว็บไซต์มีอันดับสูงเท่าใด ผู้เยี่ยมชมก็จะเข้าชมหน้าต่างๆ มากขึ้นเท่านั้น และการเข้าชมที่สูง (จำนวนผู้เข้าชมต่อวัน) ก็เป็นโอกาสในการทำได้ดีเช่นกัน

เครื่องมือค้นหาทางอินเทอร์เน็ตค้นหาข้อมูลบนอินเทอร์เน็ตได้อย่างไร และพวกมันกระจายสถานที่ในผลการค้นหาบนพื้นฐานใด

พูดได้ไม่กี่คำ เครื่องมือค้นหาทางอินเทอร์เน็ต- นี่คือเว็บทั้งหมดที่หุ่นยนต์สไปเดอร์สแกนเครือข่ายอย่างต่อเนื่องและจดจำข้อความทั้งหมดที่เข้าสู่อินเทอร์เน็ต การวิเคราะห์ข้อมูลที่ได้รับ เครื่องมือค้นหาจะเลือกเอกสารที่ตรงกับคำค้นหามากที่สุด เช่น เอกสารที่เกี่ยวข้องซึ่งจะสร้างผลการค้นหาขึ้นมา

สิ่งที่น่าสนใจที่สุดคือเครื่องมือค้นหาไม่สามารถอ่านได้ แล้วพวกเขาจะหาข้อมูลได้อย่างไร? อัลกอริธึมของเครื่องมือค้นหามีหลักการพื้นฐานบางประการ ก่อนอื่นพวกเขาให้ความสนใจกับชื่อและคำอธิบายของบทความ ส่วนหัวของย่อหน้า การเน้นความหมายในข้อความ และความหนาแน่นของคำหลัก ซึ่งจะต้องสอดคล้องกับหัวข้อของบทความ ยิ่งการจับคู่นี้แม่นยำมากขึ้นเท่าใด ไซต์ก็จะปรากฏในผลการค้นหาก็จะยิ่งสูงขึ้นเท่านั้น นอกจากนี้ จะต้องคำนึงถึงปริมาณข้อมูลและปัจจัยอื่นๆ อีกหลายประการด้วย ตัวอย่างเช่น สิทธิ์ของทรัพยากรบนเว็บ ซึ่งขึ้นอยู่กับจำนวนและสิทธิ์ของไซต์ที่ลิงก์ไป ยิ่งมีอำนาจมากเท่าใดอันดับก็ยิ่งสูงขึ้นเท่านั้น

ชุดมาตรการที่มุ่งเพิ่มตำแหน่งของเว็บไซต์ในผลการค้นหาสำหรับข้อความค้นหาบางคำเรียกว่าการเพิ่มประสิทธิภาพกลไกค้นหา ตอนนี้เป็นวิทยาศาสตร์ทั้งหมด -. แต่จะเพิ่มเติมในภายหลัง

ในขณะนี้มีเครื่องมือค้นหามากมายในโลก ฉันจะตั้งชื่อสิ่งที่ได้รับความนิยมมากที่สุด ทางตะวันตก ได้แก่ Google, Bing และ Yahoo ใน Runet - Yandex, Mail.ru, Rambler และ Nigma โดยพื้นฐานแล้วผู้ใช้ให้ความสำคัญกับผู้นำระดับโลกและระบบยานเดกซ์ก็กลายเป็นระบบที่ได้รับความนิยมมากที่สุดบนอินเทอร์เน็ตภาษารัสเซีย

ประวัติเล็กน้อย. Google ก่อตั้งขึ้นในปี 1997 โดยชาวมอสโกโดยกำเนิด เซอร์เกย์ บรินและเพื่อนชาวอเมริกันของเขา แลร์รี่ เพจระหว่างการศึกษาที่มหาวิทยาลัยสแตนฟอร์ด

ลักษณะเฉพาะของ Google คือการนำผลการค้นหาที่เกี่ยวข้องมากที่สุดตามลำดับตรรกะมาอยู่ในตำแหน่งแรกในผลการค้นหา ในขณะที่เครื่องมือค้นหาอื่นๆ เพียงเปรียบเทียบคำในข้อความค้นหากับคำบนหน้าเว็บ

เมื่อวันที่ 23 กันยายนของปีเดียวกัน มีการประกาศระบบยานเดกซ์ซึ่งตั้งแต่ปี 2543 เริ่มมีอยู่ในฐานะบริษัท "ยานเดกซ์" ที่แยกจากกัน

ฉันจะไม่ทำให้คุณเบื่ออีกต่อไป ฉันหวังว่ามันคงจะชัดเจนขึ้นอีกหน่อย เครื่องมือค้นหาทางอินเทอร์เน็ตคืออะไร- เป็นเรื่องที่ควรค่าแก่การกล่าวว่าอัลกอริธึมของเครื่องมือค้นหามีการพัฒนาอย่างต่อเนื่อง ทุกๆ วัน เสิร์ชเอ็นจิ้นเริ่มดีขึ้นในการระบุความต้องการของผู้ใช้ และแสดงข้อมูลที่เกี่ยวข้องมากที่สุดในผลการค้นหา โดยพิจารณาจากหลายปัจจัย (ภูมิภาค คำถามที่ผู้ใช้ร้องขอไปแล้ว เว็บไซต์ใดที่เขาเยี่ยมชมในระหว่างกระบวนการค้นหา เขาไปจากพวกเขาที่ไหน ฯลฯ)

ในไม่ช้า Google และ Yandex จะรู้ดีกว่าเราว่าเราต้องการอะไรและคิดอย่างไร!