วิธีค้นหาหน้าที่ไม่มีอยู่ใน Odnoklassniki พวกเขาอยู่ที่ไหน ดูอย่างไร และทำอย่างไรจึงจะได้ความสำเร็จใน Odnoklassniki

ล่าสุดมีคนเข้ามาถามฉันเกี่ยวกับเรื่องหนึ่ง คุณลักษณะของ Google- เรากำลังพูดถึงการจัดทำดัชนีไซต์ Google ได้เพิ่มหน้าเว็บที่ไม่มีอยู่ซึ่งมี URL ที่แปลกประหลาดลงในดัชนี ยิ่งไปกว่านั้น ส่วนมากถูกปิดใน robots.txt ตอบคำถามเพื่อช่วยผู้อ่านเว็บไซต์ของฉัน ฉันไม่ได้สังเกตว่าฉันเขียนบทความสั้น ๆ อย่างไร

คำถามกลายเป็นคำถามที่ฉันคุ้นเคยมาก สองสามปีที่แล้ว ฉันเองก็มองหาคำตอบสำหรับคำถามนี้ให้หนักขึ้น เมื่อฉันมีหน้าที่จัดอัตราส่วนของหน้าที่จัดทำดัชนีสำหรับหลายๆ ไซต์ในดัชนีเครื่องมือค้นหา ก่อนที่จะสร้างรายได้จากพวกเขา ไม่ว่าฉันจะทำอะไรก็ตาม ลบมันออกจากดัชนี ปิดมันใน robots.txt แก้ไขเทมเพลตไซต์ และ ไฟล์ต้นฉบับเครื่องยนต์ ไม่มีอะไรช่วยได้อย่างแน่นอนและเพื่อนร่วมงานที่มีประสบการณ์มากกว่าของฉันก็ไม่ได้ช่วยฉันในเวลานั้น

ปัญหานี้เกิดขึ้นทุกที่ แต่มีคนไม่มากที่ให้ความสนใจ Google ไม่ได้ทำสำเนาที่บันทึกไว้ของหน้าที่ปิดใน robots.txt แต่จะเพิ่ม URL ที่พบทั้งหมดลงในฐานข้อมูล หากคุณค้นหาจากทุกหน้าในเว็บไซต์ Google จะแสดงหน้าเว็บที่ไม่มีอยู่จำนวนมาก รหัส 404 และการปิดใน robots.txt ไม่ได้ช่วยอะไร นั่นเป็นสาเหตุว่าทำไมหากคุณรวบรวมข้อมูลจากเว็บไซต์ต่างๆ จำนวนหลายสิบหน้า จำนวนหน้าที่จัดทำดัชนีใน Google จะเพิ่มขึ้น บางครั้งอาจมากกว่า 2-3 หน้า และสำหรับเว็บไซต์ขนาดใหญ่ ความแตกต่างอาจสูงถึงหลายร้อยหน้า

ในตัวคุณ ดัชนีของกูเกิลเพิ่ม URL ทั้งหมดที่พบลิงก์อย่างแน่นอน ในกรณีส่วนใหญ่ ลิงค์ภายใน(เนื่องจากข้อผิดพลาดในการปรับใช้ CMS บนเซิร์ฟเวอร์ อาจมีลิงก์เสียในโค้ด ซึ่งมักเกิดขึ้นเมื่อกำหนดค่า CNC ไม่ถูกต้อง) อาจเป็นได้ ลิงค์ภายนอก(มีคนเขียนลิงก์ไปยังเว็บไซต์ของคุณในฟอรัมบางแห่งและสะกดผิด)

นอกจากนี้ หน้าบางหน้ามักถูกลบบนไซต์ - URL มีการเปลี่ยนแปลงหรือเนื้อหาถูกลบออกแล้ว หน้าจะยังคงอยู่ในดัชนี และบันทึกเป็นลิงก์ว่างเท่านั้น

ไม่ว่าในกรณีใด "หน้าจำลอง" เหล่านี้จะไม่ปรากฏในผลลัพธ์สำหรับข้อความค้นหาใดๆ เว้นแต่เราจะดูจำนวนหน้าทั้งหมดที่จัดทำดัชนีไว้ ความแตกต่างระหว่างจำนวนหน้าจริงบนไซต์และหน้าที่ได้รับการจัดทำดัชนีจะมีบทบาทเฉพาะเมื่อสร้างรายได้จากไซต์เท่านั้น หากมีช่องว่างมาก พื้นที่ขายลิงค์จะขายหมดเร็ว

วิธีการควบคุมและป้องกัน

มีวิธีหลีกเลี่ยงสถานการณ์ดังกล่าว ลองพิจารณาวิธีแก้ปัญหา:

  1. ในแผง ผู้ดูแลเว็บของ Googleคุณสามารถลบเพจที่ไม่ต้องการออกจากดัชนีได้ หากหน้าเว็บถูกปิดใน robots.txt หรือแสดงรหัสข้อผิดพลาด 404 เมื่อได้รับคำขอให้ลบ หน้าเว็บจะออกจากดัชนีภายในสองสามวัน หากมี "หน้าจำลอง" จำนวนมาก วิธีนี้ไม่เหมาะ เนื่องจากในแต่ละหน้าคุณต้องส่งใบสมัครแยกกัน ซึ่งโดยรวมจะใช้เวลานานมาก
  2. วิธีที่สองนั้นซับซ้อนกว่า แต่จะกำจัดปัญหาที่อธิบายไว้อย่างถาวร คุณต้องซ่อนเพจจากการจัดทำดัชนีโดยใช้โครงสร้างโรบ็อต ซึ่งเขียนไว้ในส่วนหัวของเพจโดยตรง นี่คือสิ่งที่ดูเหมือน:


    คุณต้องกำหนดค่าเอ็นจิ้นไซต์เพื่อให้เมื่อมีข้อผิดพลาด 404 จะมีการโหลดต้นขั้ว - หน้าของตัวเองมีข้อผิดพลาด (สามารถกำหนดค่าได้ด้วยบรรทัดเดียวใน .htaccess บนโฮสติ้ง Unix) ในส่วนหัวของหน้าต้นขั้วนี้ เราเขียนโค้ดด้านบน ในตอนนี้ เมื่อ Google ตรวจพบลิงก์ที่เสียหาย ก็จะไม่เพิ่มลิงก์เหล่านั้นลงในดัชนี

เช่น แนวทางเดิมการจัดทำดัชนี นักพัฒนาซอฟต์แวร์ของ Googleอธิบายได้จากข้อเท็จจริงที่ว่าบ่อยครั้งที่หน้าเว็บที่สร้างรหัสข้อผิดพลาด 404 ไม่สามารถเข้าถึงได้เพียงช่วงเวลาสั้นๆ เนื่องจากข้อผิดพลาด การตั้งค่าไม่ถูกต้องเซิร์ฟเวอร์หรือฐานข้อมูลล้มเหลว ในขณะเดียวกัน บ่อยครั้งมากที่หน้าเว็บดังกล่าวมีเนื้อหาที่เป็นประโยชน์ Google เพิ่มหน้าดังกล่าวลงในดัชนีด้วยความหวังว่าจะใช้งานได้ในที่สุด แต่นี่คือสาเหตุที่ Google เพิกเฉยต่อคำสั่งของ robots.txt - ไม่มีคำอธิบายที่เป็นกลางสำหรับเรื่องนี้ แต่ในทางปฏิบัติ สิ่งนี้มักจะเกิดขึ้น

สวัสดี! วันนี้เป็นโพสต์เกี่ยวกับปัญหาที่เจ็บปวดสำหรับผู้สร้างเว็บไซต์มือใหม่ส่วนใหญ่ ฉันต้องตอบคำถามเดียวกันบ่อยมากในความคิดเห็น - วิธีลบหน้าออกจากการค้นหาซึ่งได้รับการจัดทำดัชนีไว้ก่อนหน้านี้ แต่เนื่องจากสถานการณ์ปัจจุบันจึงถูกลบออกไปและไม่มีอยู่อีกต่อไป แต่ยังคงอยู่ในดัชนี เครื่องมือค้นหา- หรือการค้นหามีหน้าเว็บที่ถูกห้ามไม่ให้จัดทำดัชนี

คุณไม่สามารถขยายความคิดเห็นออกไปได้จริงๆ ดังนั้นหลังจากคำถามถัดไป ฉันจึงตัดสินใจให้ความสนใจเป็นพิเศษในหัวข้อนี้ ขั้นแรก เรามาดูกันว่าหน้าดังกล่าวจะลงเอยด้วยการค้นหาได้อย่างไร ฉันจะยกตัวอย่างตาม ประสบการณ์ของตัวเองดังนั้นหากฉันลืมอะไรกรุณากรอกให้ครบถ้วน

เหตุใดเพจจึงถูกปิดและถูกลบในการค้นหา

อาจมีสาเหตุหลายประการ และฉันจะพยายามเน้นบางส่วนในรูปแบบของรายการเล็กๆ พร้อมคำอธิบาย ก่อนที่เราจะเริ่มต้น ฉันจะอธิบายความหมายของหน้า “พิเศษ” (ปิด) ได้แก่ หน้าบริการหรือหน้าอื่นๆ ที่ถูกห้ามไม่ให้จัดทำดัชนีตามกฎหรือเมตาแท็ก

หน้าที่ไม่มีอยู่จะถูกค้นหาด้วยเหตุผลต่อไปนี้:

  • สิ่งที่พบบ่อยที่สุดคือเพจถูกลบไปแล้วและไม่มีอยู่อีกต่อไป
  • การแก้ไขที่อยู่หน้าเว็บด้วยตนเอง ส่งผลให้เอกสารที่อยู่ในการค้นหาไม่สามารถดูได้ ความสนใจเป็นพิเศษประเด็นนี้ควรมอบให้กับผู้เริ่มต้นที่ละเลยการทำงานของทรัพยากรเนื่องจากมีความรู้น้อย
  • คิดเรื่องโครงสร้างต่อ ขอเตือนไว้ก่อนว่าตามค่าเริ่มต้น การติดตั้งเวิร์ดเพรสไม่ตรงตามข้อกำหนดสำหรับการโฮสต์ การเพิ่มประสิทธิภาพภายในและประกอบด้วยตัวระบุตัวอักษรและตัวเลข นี่เป็นเพราะ CNC และมีที่อยู่ที่ไม่ทำงานจำนวนมากปรากฏขึ้น ซึ่งจะยังคงอยู่ในดัชนีเครื่องมือค้นหาเป็นเวลานาน ดังนั้น ให้ใช้กฎพื้นฐาน: หากคุณตัดสินใจที่จะเปลี่ยนโครงสร้าง ให้ใช้การเปลี่ยนเส้นทาง 301 จากที่อยู่เก่าไปยังที่อยู่ใหม่ ตัวเลือกที่เหมาะสมที่สุดคือทำการตั้งค่าไซต์ทั้งหมดให้เสร็จสิ้นก่อนเปิดเซิร์ฟเวอร์ภายในเครื่องจะมีประโยชน์สำหรับสิ่งนี้
  • เซิร์ฟเวอร์ไม่ได้รับการกำหนดค่าอย่างถูกต้อง หน้าที่ไม่มีอยู่ควรส่งคืนรหัสข้อผิดพลาด 404 หรือ 3xx

หน้าพิเศษจะปรากฏในดัชนีภายใต้เงื่อนไขต่อไปนี้:

  • ดูเหมือนว่าเพจต่างๆ จะถูกปิด แต่จริงๆ แล้วเพจเหล่านั้นเปิดอยู่ หุ่นยนต์ค้นหาและมีการค้นหาโดยไม่มีข้อจำกัด (หรือเขียน robots.txt ไม่ถูกต้อง) หากต้องการตรวจสอบสิทธิ์การเข้าถึงหน้า PS ให้ใช้เครื่องมือที่เหมาะสมสำหรับ
  • มีการจัดทำดัชนีก่อนที่จะปิดด้วยวิธีที่มีอยู่
  • หน้าเหล่านี้เชื่อมโยงไปยังเว็บไซต์อื่นหรือ หน้าภายในภายในหนึ่งโดเมน

ดังนั้นเราจึงทราบสาเหตุ เป็นที่น่าสังเกตว่าหลังจากกำจัดสาเหตุไปแล้วไม่มีหรือ หน้าพิเศษมากกว่า เป็นเวลานานอาจยังคงอยู่ในฐานข้อมูลการค้นหา - ทั้งหมดขึ้นอยู่กับความถี่ของการเยี่ยมชมไซต์โดยหุ่นยนต์

วิธีลบหน้าออกจากเครื่องมือค้นหา Yandex

สำหรับ ลบ URLจากยานเดกซ์เพียงคลิกลิงก์แล้วใส่ที่อยู่ของหน้าที่คุณต้องการลบออกจากผลการค้นหาลงในช่องข้อความของแบบฟอร์ม

สภาพหลัก คำขอสำเร็จหากต้องการลบ:

  • หน้าจะต้องปิดจากการจัดทำดัชนีตามกฎของโรบ็อตหรือเมตาแท็ก noindex บนหน้านี้ - หากมีหน้านั้นอยู่ แต่ไม่ควรมีส่วนร่วมในผลการค้นหา
  • เมื่อพยายามเข้าถึงเพจ เซิร์ฟเวอร์ควรส่งคืนข้อผิดพลาด 404 - หากเพจถูกลบไปแล้วและไม่มีอยู่อีกต่อไป

ครั้งถัดไปที่โรบ็อตรวบรวมข้อมูลไซต์ คำขอลบจะเสร็จสมบูรณ์และเพจต่างๆ จะหายไปจากผลการค้นหา

วิธีลบเพจออกจากเครื่องมือค้นหาของ Google

หากต้องการลบหน้าออก ให้ดำเนินการในลักษณะเดียวกัน เปิดเครื่องมือของผู้ดูแลเว็บและค้นหาตัวเลือกลบ URL ในรายการแบบเลื่อนลงการเพิ่มประสิทธิภาพแล้วไปที่ลิงก์

เบื้องหน้าเราคือรูปแบบพิเศษที่เราสร้างขึ้น คำขอใหม่หากต้องการลบ:

คลิกดำเนินการต่อและปฏิบัติตามคำแนะนำเพิ่มเติมเพื่อเลือกเหตุผลในการลบ ในความเห็นของผม คำว่า "เหตุผล" ไม่ค่อยเหมาะกับเรื่องนี้ แต่นั่นไม่ใช่ประเด็น...

จากตัวเลือกที่นำเสนอต่อเรา เรามี:

  • การลบหน้าเพจออกจากผลลัพธ์ ค้นหาโดย Googleและจากแคชของเครื่องมือค้นหา
  • ลบเฉพาะหน้าออกจากแคช
  • การลบไดเร็กทอรีที่มีที่อยู่ทั้งหมดรวมอยู่ในนั้น

มาก ฟังก์ชั่นที่สะดวกการลบแค็ตตาล็อกทั้งหมด เมื่อคุณต้องลบหลายหน้า เช่น จากหมวดหมู่เดียว คุณสามารถตรวจสอบสถานะคำขอลบของคุณได้ในหน้าเครื่องมือเดียวกันพร้อมตัวเลือกในการยกเลิก เพื่อความสำเร็จ การลบหน้าออกจาก Googleจำเป็นต้องมีเงื่อนไขเดียวกันกับ โดยปกติแล้วคำขอจะดำเนินการใน โดยเร็วที่สุดและหน้านั้นก็หายไปจากผลการค้นหาทันที

— ระยะเวลาการจัดเก็บไฟล์ที่อัพโหลดไปยังบริการโฮสต์ไฟล์หมดอายุแล้ว

— การเปลี่ยนโครงสร้างของบล็อก/ไซต์

— การเปลี่ยนที่อยู่หน้าบนเว็บไซต์หรือการนำ CNC ไปใช้

— ที่อยู่ของหน้าเว็บไซต์ที่คุณลิงก์ไปมีการเปลี่ยนแปลง

ในกระบวนการของการเปลี่ยนแปลงดังกล่าว อาจมีเพจที่ไม่มีอยู่หลายสิบหน้าซึ่งทรัพยากรของคุณจะลิงก์ไป

ง่ายต่อการค้นหาหน้าเว็บที่ไม่มีอยู่จริง การรู้จักบริการหลายอย่างและสามารถใช้งานได้ก็เพียงพอแล้ว

เราจะดูวิธีการหลัก 4 วิธีในการตรวจสอบไซต์ว่ามีลิงก์เสียและคุณจะตัดสินใจว่าจะใช้วิธีใดสำหรับตัวคุณเอง

บริการออนไลน์สำหรับตรวจสอบลิงค์ที่เสีย:

ฉันพบมากในเน็ต บริการที่แตกต่างกันแต่ฉันแนะนำได้เพียง 2 รายการที่สามารถระบุลิงก์ที่มีปัญหาได้ในเชิงคุณภาพ:

createonline.com

anybrowser.com

ฉันจะไม่อธิบายหลักการทำงานของพวกเขา ทุกอย่างง่ายมาก ป้อน URL ที่คุณสนใจลงในแบบฟอร์มการยืนยันแล้วกดปุ่มยืนยัน หลังจากผ่านไปช่วงระยะเวลาหนึ่ง หน้าเว็บพร้อมผลการสแกนจะปรากฏขึ้น

การใช้ยานเดกซ์

ใน แผงผู้ดูแลเว็บเราปฏิบัติตามเส้นทาง – – หน้าที่แยกออกและติดตามสถานะ HTTP ของลิงก์: ไม่พบทรัพยากร (404) ภาพหน้าจอแสดงเส้นทาง

หลังจากที่คุณคลิกลิงก์ หน้าต่างจะเปิดขึ้น ที่ด้านล่างจะมีรายการลิงก์ไปยังหน้าที่ไม่มีอยู่จากเว็บไซต์ของคุณ ในหน้าต่างเดียวกันก็จะมีข้อมูลเกี่ยวกับ การเข้าชมครั้งล่าสุดหน้าโรบ็อตและลิงก์ไปยังหน้าที่มีปัญหาซึ่งระบุด้วยสี่เหลี่ยมเล็กๆ พร้อมลูกศรลง ตอนนี้คุณต้องติดตามลิงก์เหล่านี้และแก้ไขสถานการณ์

ผ่านทาง Google

ในทำนองเดียวกันเราผ่านการอนุญาตใน แผงผู้ดูแลเว็บและปฏิบัติตามเส้นทาง - การสแกน - ข้อผิดพลาดในการสแกน ในครึ่งล่างของหน้า เราจะเห็นรายการลิงก์ไปยังหน้าที่ไม่มีอยู่จริง ในแผง ผู้ดูแลเว็บของ Googleมีตัวเลือกที่ยอดเยี่ยมตัวหนึ่งที่ช่วยให้คุณสามารถทำเครื่องหมายลิงก์ไปยังหน้าที่ไม่มีอยู่ซึ่งคุณได้แก้ไขไว้ก่อนหน้านี้ ฉันแสดงให้เธอเห็น

โปรแกรม Xenu Link Sleuth

ตามลิงค์และ ดาวน์โหลดโปรแกรม จากนั้นเราก็ติดตั้งมัน เมื่อการติดตั้งเสร็จสมบูรณ์ ให้รันโปรแกรมและป้อนที่อยู่ของทรัพยากรที่กำลังตรวจสอบ คลิกปุ่ม OK จากนั้นโปรแกรมจะเริ่มรวบรวมข้อมูล

ไม่ว่าง – เข้าคิวเพื่อตรวจสอบ

หลังจากรวบรวมข้อมูลเรียบร้อยแล้วโปรแกรมจะ บี๊บเสร็จสิ้นการทำงานและคุณสามารถดูรายงานการทำงานที่เสร็จสมบูรณ์ได้ มาก โปรแกรมที่ดีฉันใช้มันตลอดเวลา

และวิธีการสุดท้ายที่เราจะดูคือการตรวจสอบไซต์ว่ามีลิงก์เสียหรือไม่โดยใช้ปลั๊กอิน Broken Link Checker

สำหรับสิ่งนี้ ดาวน์โหลดปลั๊กอินเปิดใช้งานและไปที่ที่อยู่ – ตัวเลือก – ตรวจสอบลิงก์ และไปที่แท็บขั้นสูงที่เราคลิก ตรวจสอบทุกหน้าอีกครั้ง