HTML แผนผังเว็บไซต์เปรียบเทียบ วิธีสร้าง Sitemap XML สำหรับ Yandex และ Google: คำแนะนำทีละขั้นตอน รูปแบบที่รองรับโดย Yandex Webmaster

ไฟล์ sitemap.xml เป็นเครื่องมือที่ช่วยให้เว็บมาสเตอร์แจ้งเครื่องมือค้นหาเกี่ยวกับหน้าต่างๆ บนไซต์ของตนที่พร้อมสำหรับการจัดทำดัชนี นอกจากนี้ ในแมป XML คุณสามารถระบุพารามิเตอร์ของหน้าเพิ่มเติมได้: วันที่อัปเดตครั้งล่าสุด ความถี่ของการอัปเดต และลำดับความสำคัญที่สัมพันธ์กับหน้าอื่น ข้อมูลใน sitemap.xml สามารถส่งผลต่อพฤติกรรมของโปรแกรมรวบรวมข้อมูลการค้นหา และโดยทั่วไปต่อกระบวนการจัดทำดัชนีเอกสารใหม่ แผนผังไซต์มีคำสั่งสำหรับการรวมหน้าไว้ในคิวสำหรับการรวบรวมข้อมูลและเสริม robots.txt ซึ่งมีคำสั่งสำหรับการยกเว้นหน้า

ในคู่มือนี้ คุณจะพบคำตอบของทุกคำถามเกี่ยวกับการใช้ sitemap.xml

ฉันจำเป็นต้องมี sitemap.xml หรือไม่

เครื่องมือค้นหาใช้แผนผังเว็บไซต์เพื่อค้นหาเอกสารใหม่บนเว็บไซต์ (ซึ่งอาจเป็นเอกสาร HTML หรือเนื้อหาสื่อ) ที่ไม่สามารถเข้าถึงได้ผ่านการนำทาง แต่จำเป็นต้องรวบรวมข้อมูล การมีลิงก์ไปยังเอกสารใน sitemap.xml ไม่ได้รับประกันว่าจะมีการรวบรวมข้อมูลหรือจัดทำดัชนี แต่ส่วนใหญ่แล้วไฟล์จะช่วยให้เว็บไซต์ขนาดใหญ่จัดทำดัชนีได้ดีขึ้น นอกจากนี้ ข้อมูลจากแมป XML ยังใช้เพื่อกำหนดหน้าตามรูปแบบบัญญัติ เว้นแต่จะระบุไว้โดยเฉพาะในแท็ก rel=canonical

Sitemap.xml มีความสำคัญสำหรับไซต์ที่:

  • บางส่วนไม่สามารถเข้าถึงได้ผ่านเมนูนำทาง
  • มีเพจแยกจำนวนมากหรือเพจที่เชื่อมต่อไม่ดี
  • มีการใช้เทคโนโลยีที่เครื่องมือค้นหาไม่สนับสนุน (เช่น Ajax, Flash หรือ Silverlight)
  • มีหลายหน้าและมีโอกาสที่โปรแกรมรวบรวมข้อมูลการค้นหาจะพลาดเนื้อหาใหม่

หากไม่ใช่กรณีของคุณ เป็นไปได้มากว่าคุณไม่จำเป็นต้องมี sitemap.xml สำหรับไซต์ที่ทุกเพจสำคัญสำหรับการจัดทำดัชนีสามารถใช้ได้ภายใน 2 คลิก โดยที่เทคโนโลยี JavaScript หรือ Flash ไม่ได้ใช้ในการแสดงเนื้อหา โดยที่แท็ก Canonical และแท็กภูมิภาคจะถูกใช้หากจำเป็น และเนื้อหาใหม่จะปรากฏขึ้นไม่บ่อยเกินกว่าที่โรบอตจะเข้าชมไซต์ ในไฟล์ sitemap.xml ไม่จำเป็น

สำหรับโปรเจ็กต์ขนาดเล็ก หากมีปัญหาเฉพาะกับการซ้อนเอกสารจำนวนมาก ก็สามารถแก้ไขได้อย่างง่ายดายโดยใช้แผนผังไซต์ HTML โดยไม่ต้องใช้แมป XML แต่ถ้าคุณตัดสินใจว่ายังต้องการ sitemap.xml โปรดอ่านคู่มือนี้ให้ครบถ้วน

ข้อมูลทางเทคนิค

  • Sitemap.xml เป็นไฟล์ข้อความในรูปแบบ XML อย่างไรก็ตาม เครื่องมือค้นหายังรองรับรูปแบบข้อความด้วย (ดูหัวข้อถัดไป)
  • แต่ละแผนผังไซต์สามารถมีได้สูงสุด ที่อยู่ 50,000 แห่งและไม่มีน้ำหนักอีกต่อไป 50MB(10MB สำหรับยานเดกซ์)
  • คุณสามารถใช้การบีบอัด gzip เพื่อลดขนาดของไฟล์ sitemap.xml และเพิ่มความเร็วการถ่ายโอนได้ ในกรณีนี้ ให้ใช้ส่วนขยาย gz (sitemap.xml.gz) ในขณะเดียวกัน ข้อจำกัดด้านน้ำหนักยังคงมีอยู่สำหรับแผนผังเว็บไซต์ที่ไม่มีการบีบอัด
  • ตำแหน่งของแผนผังไซต์จะกำหนดชุดของ URL ที่สามารถรวมไว้ในแผนผังไซต์ได้ แผนที่ที่มีที่อยู่ของหน้าต่างๆ ของทั้งไซต์ควรอยู่ในรูท หากแผนผังไซต์อยู่ในโฟลเดอร์ URL ทั้งหมดในแผนผังไซต์นี้ควรอยู่ในโฟลเดอร์นี้หรือลึกกว่านั้น ()
  • ที่อยู่ใน sitemap.xml จะต้องเป็นแบบสัมบูรณ์
  • ความยาว URL สูงสุดคือ 2,048 อักขระ (1,024 อักขระสำหรับ Yandex)
  • อักขระพิเศษใน URL (เช่น เครื่องหมายและ "&" ​​หรือเครื่องหมายคำพูด) จะต้องถูกปิดบังในเอนทิตี HTML
  • หน้าเว็บที่ระบุในแผนที่จะต้องแสดงรหัสสถานะ http 200
  • ที่อยู่ที่แสดงในแผนที่ไม่ควรปิดในไฟล์ robots.txt หรือใน meta-robots
  • ไม่ควรปิดแผนผังเว็บไซต์ใน robots.txt ไม่เช่นนั้นเครื่องมือค้นหาจะไม่รวบรวมข้อมูล ตัวไฟล์อาจอยู่ในดัชนี ซึ่งเป็นเรื่องปกติ

รูปแบบแผนที่ XML

เครื่องมือค้นหาสนับสนุนรูปแบบแผนผังเว็บไซต์แบบข้อความธรรมดา ซึ่งเพียงแต่แสดงรายการ URL ของหน้าโดยไม่มีพารามิเตอร์เพิ่มเติม ในกรณีนี้ ไฟล์จะต้องเข้ารหัส UTF-8 และมีนามสกุล .txt.

เครื่องมือค้นหายังรองรับโปรโตคอล XML มาตรฐานด้วย Google ยังสนับสนุนแผนผังไซต์สำหรับรูปภาพ วิดีโอ และข่าวสารอีกด้วย

แผนผังเว็บไซต์ตัวอย่างที่มีที่อยู่เพียงแห่งเดียว

https://сайт/ 2018-06-14 daily 0.9

แท็ก XML
urlset
URL(จำเป็น) - แท็กหลักสำหรับแต่ละ URL
สถานที่(จำเป็น) - URL ของเอกสารต้องเป็นค่าสัมบูรณ์
ล่าสุด- วันที่แก้ไขเอกสารครั้งล่าสุดในรูปแบบ Datetime
เปลี่ยนความถี่- ความถี่ของการเปลี่ยนแปลงหน้า (ทุกครั้ง, รายชั่วโมง, รายวัน, รายสัปดาห์, รายเดือน, รายปี, ไม่เคยเลย) ความหมายของแท็กนี้เป็นคำแนะนำสำหรับเครื่องมือค้นหา ไม่ใช่คำสั่ง
ลำดับความสำคัญ- ลำดับความสำคัญของ URL สัมพันธ์กับที่อยู่อื่น (ตั้งแต่ 0 ถึง 1) สำหรับลำดับการสแกน หากไม่ได้ระบุ ค่าเริ่มต้นคือ 0.5

แผนที่ XML สำหรับรูปภาพ

เครื่องมือเพิ่มประสิทธิภาพบางตัวจะแทรกลิงก์ไปยังรูปภาพลงใน sitemap.xml ในลักษณะเดียวกับลิงก์ไปยังเอกสาร HTML ซึ่งสามารถทำได้ แต่จะดีกว่าสำหรับ Google ที่จะใช้ส่วนขยายของโปรโตคอลมาตรฐานและส่งข้อมูลเพิ่มเติมเกี่ยวกับรูปภาพพร้อมกับ URL การสร้างแมปรูปภาพ XML มีประโยชน์หากจำเป็นต้องสแกนและจัดทำดัชนีรูปภาพ และในขณะเดียวกัน บอตไม่สามารถเข้าถึงรูปภาพเหล่านั้นได้โดยตรง (เช่น ใช้ JavaScript)

ตัวอย่างของแผนผังไซต์ที่มีหนึ่งหน้าและรูปภาพที่เกี่ยวข้อง

http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

แท็ก XML
ภาพ:ภาพ(จำเป็น) - ข้อมูลเกี่ยวกับภาพหนึ่งภาพ สามารถใช้รูปภาพได้สูงสุด 1,000 ภาพ
ภาพ:loc(จำเป็น) - เส้นทางไปยังไฟล์รูปภาพ หากใช้ CDN ก็อนุญาตให้ลิงก์ไปยังโดเมนอื่นได้หากได้รับการยืนยันในแผงควบคุมของผู้ดูแลเว็บ
ภาพ:คำบรรยายภาพ- คำบรรยายภาพ (อาจมีข้อความยาว)
ภาพ:หัวเรื่อง- รูปภาพชื่อ (โดยปกติจะเป็นข้อความสั้น)
ภาพ:geo_location-สถานที่ถ่ายทำ.
ภาพ:ใบอนุญาต- URL ลิขสิทธิ์รูปภาพ ใช้สำหรับการค้นหารูปภาพขั้นสูง

แผนที่ XML สำหรับวิดีโอ

เช่นเดียวกับแผนที่รูปภาพ Google ยังมีส่วนขยายแผนผังเว็บไซต์วิดีโอซึ่งคุณสามารถระบุข้อมูลโดยละเอียดเกี่ยวกับเนื้อหาวิดีโอที่ส่งผลต่อลักษณะที่ปรากฏในการค้นหาวิดีโอ แผนผังเว็บไซต์วิดีโอเป็นสิ่งจำเป็นเมื่อไซต์ใช้วิดีโอที่โฮสต์ในเครื่อง และเมื่อจัดทำดัชนีวิดีโอเหล่านี้เป็นเรื่องยากเนื่องจากเทคโนโลยีที่ใช้ หากคุณกำลังฝังวิดีโอจาก YouTube บนเว็บไซต์ของคุณ ก็ไม่จำเป็นต้องมีแผนผังเว็บไซต์วิดีโอที่นี่

แผนผังไซต์ข่าวสาร

หากคุณมีเนื้อหาข่าวบนไซต์ของคุณและเข้าร่วมใน Google News การใช้แผนผังไซต์สำหรับข่าวสารจะมีประโยชน์ ดังนั้น Google จะค้นหาเนื้อหาล่าสุดของคุณอย่างรวดเร็วและจัดทำดัชนีบทความข่าวทั้งหมด ในกรณีนี้ แผนผังไซต์ควรมีเฉพาะที่อยู่ของหน้าที่เผยแพร่ในช่วง 2 วันที่ผ่านมา และมี URL ไม่เกิน 1,000 รายการ

การใช้บัตรหลายใบ

หากจำเป็น คุณสามารถใช้แผนผังเว็บไซต์หลายรายการ โดยรวมเป็นแผนผังเว็บไซต์ดัชนีเดียว มีการใช้ sitemap.xml หลายรายการในกรณีที่:

  • ไซต์นี้ใช้เอ็นจิ้นหลายตัว (CMS)
  • เว็บไซต์มีมากกว่า 50,000 หน้า
  • จำเป็นต้องตั้งค่าการติดตามข้อผิดพลาดที่สะดวกในส่วนต่างๆ

ในกรณีหลัง แต่ละส่วนขนาดใหญ่ของไซต์จะมี sitemap.xml ของตัวเอง และส่วนทั้งหมดจะถูกเพิ่มลงในแผงควบคุมสำหรับผู้ดูแลเว็บ ซึ่งสะดวกต่อการดูว่าส่วนใดมีข้อผิดพลาดมากที่สุด (ดูส่วนการค้นหาข้อผิดพลาดใน แผนผังเว็บไซต์)

หากคุณมีแผนผังเว็บไซต์ 2 รายการขึ้นไป จะต้องรวมกันเป็นแผนผังเว็บไซต์ดัชนี ซึ่งจะมีลักษณะเหมือนกับแผนผังเว็บไซต์ปกติ (ยกเว้นการมีแผนผังเว็บไซต์และแท็กแผนผังเว็บไซต์แทน urlset และ url) มีข้อจำกัดที่คล้ายกันและสามารถลิงก์ได้เท่านั้น ไปยังแมป XML ปกติ (ไม่ใช่แมปดัชนี)

ตัวอย่างดัชนีแผนผังไซต์:

http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

แผนผังเว็บไซต์(บังคับ) - ระบุมาตรฐานโปรโตคอลปัจจุบัน
แผนผังเว็บไซต์(บังคับ) - มีข้อมูลเกี่ยวกับแผนผังเว็บไซต์แยกต่างหาก
สถานที่(จำเป็น) - ตำแหน่งแผนผังเว็บไซต์ (ในรูปแบบ xml, txt หรือ rss สำหรับ Google)
ล่าสุด- เวลาที่มีการเปลี่ยนแปลงแผนผังเว็บไซต์ ช่วยให้เครื่องมือค้นหาสามารถค้นพบ URL ใหม่บนเว็บไซต์ขนาดใหญ่ได้อย่างรวดเร็ว

วิธีสร้าง sitemap.xml

วิธีการสร้างแผนผังไซต์ XML:

  • เครื่องมือ CMS ภายใน CMS จำนวนมากรองรับการสร้างแผนผังเว็บไซต์แล้ว หากต้องการทราบ โปรดอ่านเอกสารประกอบสำหรับ CMS ของคุณ ดูรายการเมนูในแผงผู้ดูแลระบบ หรือติดต่อฝ่ายสนับสนุนด้านเทคนิคของเครื่องยนต์ อัปโหลดไฟล์ https://yoursite.com/sitemap.xml บนเว็บไซต์ของคุณ อาจมีอยู่แล้วและกำลังถูกสร้างขึ้นแบบไดนามิก
  • ปลั๊กอินภายนอกหาก CMS ไม่มีฟังก์ชันการสร้างแผนผังเว็บไซต์และรองรับปลั๊กอิน ให้ google ทราบว่าปลั๊กอินใดครอบคลุมคำถาม sitemap.xml สำหรับเครื่องยนต์ของคุณและติดตั้ง ในบางกรณี คุณต้องติดต่อโปรแกรมเมอร์เพื่อเขียนปลั๊กอินที่คล้ายกันให้กับคุณ
  • แยกสคริปต์บนเว็บไซต์เมื่อทราบโปรโตคอลแมป XML และข้อจำกัดทางเทคนิคแล้ว คุณสามารถสร้าง sitemap.xml ได้ด้วยตัวเองโดยการเพิ่มสคริปต์การสร้างลงใน CRON หากคุณไม่ใช่โปรแกรมเมอร์ ให้ใช้รายการอื่นๆ ในรายการนี้
  • ตัวสร้างแผนผังไซต์มีเครื่องมือสร้าง sitemap.xml มากมายที่สแกนไซต์ของคุณและให้แผนที่สำเร็จรูปแก่คุณเพื่อดาวน์โหลด ข้อเสียคือทุกครั้งที่มีการอัปเดตไซต์ คุณจะต้องสร้างแผนผังไซต์ด้วยตนเอง
  • พาร์เซอร์โปรแกรมเดสก์ท็อปที่ออกแบบมาเพื่อการวิเคราะห์ทางเทคนิคของเว็บไซต์มักจะให้โอกาสในการดาวน์โหลด sitemap.xml ซึ่งสร้างขึ้นจากหน้าที่รวบรวมข้อมูล มันทำงานคล้ายกับเครื่องมือสร้างแผนผังเว็บไซต์ เพียงแต่ทำงานบนเครื่องของคุณเท่านั้น

เครื่องมือสร้างแผนผังเว็บไซต์ออนไลน์ยอดนิยม

XML-Sitemaps.com

ช่วยให้คุณได้รับ sitemap.xml ได้ในไม่กี่คลิก รองรับรูปแบบ XML, HTML, TXT และ GZ สะดวกในการใช้งานสำหรับไซต์ขนาดเล็ก (สูงสุด 500 หน้า)

เครื่องมือสร้างที่คล้ายกัน แต่มีการตั้งค่าเพิ่มเติมเล็กน้อยและช่วยให้คุณสร้างแผนที่ได้สูงสุด 2,000 หน้าฟรี

มีการตั้งค่ามากมาย ให้คุณนำเข้า URL จากไฟล์ CSV ได้ สแกน URL ได้สูงสุด 500 รายการฟรี

ไม่มีการจำกัดจำนวนหน้าในการสแกน แต่สำหรับไซต์ขนาดใหญ่ กระบวนการสร้างอาจหยุดทำงานเป็นเวลาหลายสิบนาที

โปรแกรมท้องถิ่นสำหรับการสร้างแผนผังไซต์ XML

เครื่องมือสร้างแผนผังเว็บไซต์ G-Mapper

เครื่องมือสร้างแผนผังเว็บไซต์เวอร์ชันเดสก์ท็อปฟรีสำหรับ Windows

แมงมุม SEO กบกรีดร้อง

เครื่องมือสร้างแผนผังเว็บไซต์ที่ยืดหยุ่นพร้อมการตั้งค่ามากมาย สะดวกหากคุณใช้ Screamin Frog สำหรับงาน SEO อื่นๆ อยู่แล้ว หลังจากสแกนไซต์แล้ว ให้ใช้รายการเมนูแผนผังไซต์ -> สร้างแผนผังไซต์ XML

เน็ตพีค สไปเดอร์

โซลูชันที่ยืดหยุ่นน้อยกว่าแต่ยังสะดวกสำหรับการสร้าง sitemap.xml อย่างรวดเร็ว หลังจากสแกนไซต์แล้ว คุณต้องใช้รายการเมนู เครื่องมือ -> สร้างแผนผังไซต์

แผนผังไซต์คือหน้า html ของไซต์หรือไฟล์ xml พิเศษซึ่งแสดงลิงก์ไปยังหน้าสำคัญทั้งหมดของไซต์ หากต้องการทำความเข้าใจว่าแผนผังเว็บไซต์คืออะไร เพียงจินตนาการถึงสารบัญของหนังสือ สารบัญก็จะชัดเจนขึ้นทันที ทำไมคุณต้องมีแผนผังเว็บไซต์- แผนผังเว็บไซต์ช่วยให้ผู้เยี่ยมชม ไม่ว่าจะเป็นบุคคลหรือโรบ็อตการค้นหา ค้นหาหน้าใดๆ บนไซต์ได้อย่างรวดเร็ว โดยมีจำนวนการเปลี่ยนน้อยที่สุด บนไซต์ขนาดเล็กที่เรียบง่าย คุณสามารถเข้าถึงทุกหน้าได้ภายใน 1-2 คลิกจากหน้าหลัก แต่จะเกิดอะไรขึ้นหากไซต์มีขนาดใหญ่และโครงสร้างของมันซับซ้อน? ไซต์ดังกล่าวไม่เพียงแต่จะไม่สะดวกสำหรับผู้เยี่ยมชมเท่านั้น แต่ยังจะไม่ชัดเจนต่อเครื่องมือค้นหาอีกด้วย

มีแผนผังเว็บไซต์ประเภทใดบ้าง?

โปรแกรมค้นหาจะค่อยๆ จัดทำดัชนีเว็บไซต์ ทีละระดับ เริ่มจากหน้าหลัก หากไซต์มีการซ้อนหน้าหลายระดับ จะต้องใช้เวลาหลายเดือนในการจัดทำดัชนีหน้าทั้งหมดของไซต์ ดังนั้นจึงมีความจำเป็น สร้างแผนผังเว็บไซต์ซึ่งจะมีลิงก์ทั้งหมดไปยังทุกหน้าของไซต์พร้อมกันเพื่อให้หุ่นยนต์ไม่เสียเวลาในการนำทางผ่านระดับการซ้อนใช่ไหม? ใช่และไม่ใช่ คำตอบขึ้นอยู่กับว่าเหตุใดจึงสร้างแผนที่ขึ้นมาและจะเป็นอย่างไร มาดูกันดีกว่า แผนผังเว็บไซต์มีกี่ประเภท?.

แผนผังเว็บไซต์ HTML แผนผังเว็บไซต์

Sitemap แบ่งออกเป็น 2 ประเภทหลักหรือรูปแบบ: แผนผังเว็บไซต์ htmlและไฟล์ xml แผนผังเว็บไซต์ แผนผังเว็บไซต์ HTML คือหน้าเว็บไซต์ซึ่งแสดงรายการลิงก์ โดยปกติแล้วลิงก์เหล่านี้คือลิงก์ไปยังส่วนและหน้าที่สำคัญที่สุดของเว็บไซต์ แผนผังเว็บไซต์ HTML ได้รับการออกแบบมาเพื่อผู้คนมากขึ้นแทนที่จะเป็นโรบ็อตและช่วยให้คุณไปยังส่วนหลักของไซต์ได้อย่างรวดเร็ว สำหรับแผนผังเว็บไซต์ในรูปแบบของหน้า HTML มีข้อจำกัดร้ายแรงเกี่ยวกับจำนวนลิงก์ในหนึ่งหน้า หากมีลิงก์มากเกินไปในหน้าเว็บ ลิงก์บางรายการอาจไม่ได้รับการจัดทำดัชนี หรือหน้าแผนผังเว็บไซต์อาจถูกแยกออกจากการค้นหาว่ามีลิงก์มากเกินไป แม้กระทั่ง

เพื่อให้แผนผังไซต์ html ได้รับการจัดทำดัชนีอย่างถูกต้องและผู้เข้าชมสามารถรับรู้ได้อย่างเพียงพอ คุณไม่ควรวางลิงก์มากกว่า 100 ลิงก์บนหน้าเว็บ นี่เกินพอที่จะวางส่วนและส่วนย่อยทั้งหมดที่ไม่พอดีกับเมนูหลักลงบนหน้า

โดยปกติ, แผนผังเว็บไซต์ในรูปแบบ HTMLมีโครงสร้างแบบต้นไม้ซึ่งมีการระบุส่วนที่ขยายและส่วนย่อย แผนผังเว็บไซต์ HTML ขนาดใหญ่โดยไม่จำเป็นมักได้รับการออกแบบด้วยองค์ประกอบกราฟิก สไตล์ CSS และเสริมด้วยสคริปต์ Java อย่างไรก็ตาม แผนผังเว็บไซต์ html มีคุณค่าเพียงเล็กน้อยต่อเครื่องมือค้นหา

แผนผังเว็บไซต์ HTML ไม่ใช่แผนผังเว็บไซต์เต็มรูปแบบ จะทำอย่างไรถ้าไซต์มีหลายร้อย, พัน, หมื่นหน้า? ในการดำเนินการนี้ คุณจะต้องวางลิงก์ไปยังหน้าทั้งหมดในแผนผังเว็บไซต์ในรูปแบบ xml

แผนผังไซต์ XML

แผนผังไซต์ XML เป็นไฟล์ในรูปแบบ xml เช่น sitemap.xmlซึ่งโดยปกติจะอยู่ที่รากของไซต์ แผนผังเว็บไซต์ในรูปแบบ xml มีข้อดีมากกว่าแผนผังเว็บไซต์ html หลายประการ Sitemap xml เป็นรูปแบบแผนผังเว็บไซต์พิเศษซึ่งกำหนดโดยเครื่องมือค้นหายอดนิยมทั้งหมด เช่น Google และ Yandex คุณสามารถระบุลิงก์ได้สูงสุด 50,000 ลิงก์ในแผนผังเว็บไซต์ xml- นอกจากนี้ ในแผนผังไซต์ xml คุณสามารถระบุลำดับความสำคัญและความถี่ของการอัปเดตเพจได้

เป็นเรื่องที่ควรกล่าวว่าเนื้อหาของแผนผังเว็บไซต์เป็นเพียงคำแนะนำสำหรับโรบ็อตการค้นหาเท่านั้น ตัวอย่างเช่น หากคุณกำหนดความถี่ในการอัปเดตรายปีสำหรับหน้าเว็บไซต์ โรบ็อตการค้นหาจะยังคงเข้าชมบ่อยขึ้น และหากคุณตั้งค่าอัตราการรีเฟรชหน้าเป็นรายชั่วโมง ไม่ได้หมายความว่าโรบอตจะจัดทำดัชนีหน้าทุกชั่วโมง

แผนผังเว็บไซต์ xml มีไวยากรณ์เฉพาะ มาดูโครงสร้างของแผนผังเว็บไซต์ xml โดยละเอียดกันดีกว่า

ตัวอย่างไฟล์แผนผังเว็บไซต์ sitemap.xml

sitemap.xml ที่ถูกต้องจะต้องเข้ารหัส UTF8- เนื้อหาของไฟล์ sitemap.xml มีลักษณะดังนี้:

http://mysite.ru/ 2014-09-18T18:54:13+04:00 always 1.0 http://mysite.ru/category/ 2014-09-18T18:57:09+04:00 hourly 0.8 http://mysite.ru/page/ 2014-09-18T18:59:37+04:00 daily 0.6

ในกรณีที่มีการใช้แท็กที่จำเป็นต่อไปนี้:

  • — แท็กพาเรนต์ ประกอบด้วย URL ทั้งหมด
  • — тег, в котором указываются сведения о конкретном url-адресе;
  • https://redcomrade.ru/th/ — в данном теге указывается непосредственно url.
  • — этот тег заключает в себе дату последнего изменения страницы;
  • — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Так же, в файле карты сайта в формате xml должно содержаться указание на пространство имен языка XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

http://mysite.ru/sitemaps/sitemap01.xml 2014-09-18T18:54:13+04:00 http://mysite.ru/sitemaps/sitemap02.xml 2014-09-18T18:54:13+04:00

Здесь используются уже знакомые нам теги https://redcomrade.ru/th/ и , а так же обязательные теги:

  • — родительский тег, в который заключаются адреса всех карт сайта;
  • — тег, в котором заключается параметры для каждой карты сайта.

Пример файла карты сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://mysite.ru/ 2. http://mysite.ru/page/ 3. http://mysite.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Как создать карту сайта

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта . Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше — файл карты сайта размещается в корне сайта . Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта , провести анализ карты сайта на корректность , соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта — это .

Sitemap: http://mysite.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Напрмер xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать программу-генератор карты сайта . Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс).
  5. Создание карты сайта вручную .

Карта сайта — один из важнейших инструментов . Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или . А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

С помощью нашего генератора карты сайта создайте файлы в формате XML, которые могут быть представлены в Google, Яндекс, Bing, Yahoo и других поисковых системах, чтобы помочь им индексировать ваш сайт.

Сделайте это за три простых шага:

  • Введите полный URL веб-сайта в форму.
  • Нажмите кнопку "Начать" и дождитесь, пока сайт полностью просканируется. При этом Вы увидете полное количество работающих и неработающих ссылок.
  • Нажав кнопку "Sitemap.xml", сохраните файл в удобном месте.

  • Sitemap – это карта сайта в формате XML, который В 2005 году поисковик Google стал использовать для индексации страниц сайтов. Файл Sitemap представляет собой способ организации веб-сайта, выявление адреса и данные по каждому разделу. Ранее карты сайта в основном были направлены для пользователей сайта. Формат XML был разработан для поисковых систем, что позволяет им найти данные быстрее и эффективнее.

    Новый протокол Sitemap был разработан в ответ на увеличения размера и сложности веб-сайтов. Бизнес-сайты часто содержат тысячи продуктов в своих каталогах, популярность блогов, форумов, досок объявлений вынуждают вебмастеров обновлять свои материалы, по крайней мере один раз в день. Поисковым системам все труднее отслеживать весь материал. Через протокол XML поисковые системы могут более эффективно отслеживать адреса, оптимизируя их поиск путем размещения всей информации на одной странице. XML также показывает, как часто обновляется определенный веб-сайт, и записывает последние изменения. XML карты не являются инструментом для поисковой оптимизации. Это не влияет на ранжирование, но это позволяет поисковым системам сделать более точные рейтинги и поисковые запросы. Это происходит путем предоставления данных, удобных для считывания поисковыми системами.

    Общее признание протокола XML означает, что разработчикам веб-сайтов больше не нужно создавать различные типы карт сайта для различных поисковых системах. Они могут создать один файл для представления, а затем обновить его, когда они внесли изменения на сайте. Это упрощает весь процесс тонкой настройки и расширения веб-сайта. Сами Вебмастера начали видеть преимущества использования этого формата. Поисковые системы ранжируют страницы в соответствии с релевантностью содержания конкретных ключевых слов, но до формата XML часто содержимое страниц не было правильно представлено. Это часто расстраивает вебмастерам, которые понимают, что их усилия по созданию веб-сайта были оставлены незамеченными. Блоги, дополнительные страницы, добавление мультимедийных файлов занимают несколько часов. Через файл XML эти часы не будут потрачены впустую, их увидят все известные поисковые системы.

    Чтобы создать свой Sitemap в формате XML и держать поисковые системы в курсе всех изменений вашего сайта, попробуйте наш бесплатный генератор карты сайта.

    Яндекс Вебмастер позволяет:

    • добавить Sitemap;
    • обновить;
    • удалить;
    • анализировать.

    Как добавить Sitemap в Яндекс Вебмастер

    Чтобы добавить файл Sitemap в очередь на индексирование, вам нужно, как и всегда, зайти в сервис Вебмастера — webmaster.yandex.ru. Далее:

    1. В разделе «Индексирование» вы найдете пункт «Файлы Sitemap».
    2. Добавьте полный адрес файлы Sitemap, например, https://сайт/sitemap.xml.
    3. Нажмите «Добавить».
    4. Ждите, пока Яндекс Вебмастер проверит файл.

    После добавления, файл попадает в очередь на обработку. Робот добавит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в индекс Sitemap, обрабатывается роботом отдельно.

    После загрузки напротив каждой карты сайта вы увидите в Яндекс Вебмастере один из статусов:

    Статус Описание Примечание
    «OK» Файл сформирован правильно и загружен в базу робота Напротив файла отобразится дата последней загрузки.Проиндексированные страницы появятся в результатах поиска в течение двух недель
    « » Указанный URL перенаправляет на другой адрес Удалите редирект и сообщите роботу об обновлении
    «Ошибка» Файл сформирован неправильно Нажмите ссылку Ошибка, чтобы узнать подробности. После внесения изменений в файл сообщите роботу об обновлении
    «Не проиндексирован» При обращении к Sitemap сервер возвращает HTTP-код, отличный от 200 Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.Если файл доступен, сообщите роботу об обновлении
    Доступ к файлу запрещен в robots.txt с помощью директивы Disallow Разрешите доступ к Sitemap и сообщите роботу об обновлении

    Обновить Sitemap

    Когда в Sitemap происходят изменения, его не нужно удалять из Яндекс Вебмастера и добавлять заново. Поисковик время от времени сам проверяет его на изменения и ошибки.

    Если ваш Sitemap не проиндексирован, то это можно ускорить. Нужно зайти в раздел «Индексирование», далее в пункт «Файлы Sitemap». Нажать на значок обновления напротив нужноq карты сайта. Яндекс загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.

    Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.

    Удалить Sitemap из Вебмастера

    В интерфейсе Яндекс.Вебмастера можно удалить те файлы, которые были добавлены на странице «Файлы Sitemap» :

    Если для Sitemap была добавлена директива в файле robots.txt, удалите ее. После внесения изменений информация о Sitemap пропадет из базы робота и Яндекс.Вебмастера в течение нескольких недель.

    Поддерживаемые Яндекс Вебмастером форматы

    Яндекс принимает Sitemap в форматах:

    XML-формат Sitemap

    Предпочтительней передавать в формате XML, т.к. в нем можно передать дополнительные данные.

    Яндекс поддерживает протокол Sitemap . Используйте этот формат, если хотите сообщить о:

    • дате последнего обновления страницы (элемент lastmod);
    • частоте изменения страницы (элемент changefreq);
    • значимости страницы (элемент priority) - робот загружает страницы поочередно с учетом наличия и значения коэффициента от 0.0 до 1.0. Укажите коэффициент для тех URL, которые наиболее важны для сайта.

    https://сайт/ssylki-v-yandex-webmaster/ 2018-06-06 monthly 0.8 ...

    แผนผังไซต์รูปแบบ TXT

    ในรูปแบบนี้ คุณสามารถส่งได้เฉพาะที่อยู่เพจเท่านั้น นั่นคือทั้งหมดที่ ใช่ เศร้าและเสียใจ ใช้ XML ดีกว่า :)

    ใช้รูปแบบนี้เพื่อรายงานที่อยู่หน้าเท่านั้น

    https://site/ssylki-v-yandex-webmaster/ https://site/zerkala-sajta-v-yandex-webmaster/

    หากต้องการส่งข้อมูลเกี่ยวกับวิดีโอ ให้ระบุลิงก์ไปยังฟีด XML ในแผนผังไซต์ (ดูรายละเอียดในวิธีใช้บริการ Ya.Video)
    การค้นหาไม่สนับสนุนการแบ่งปันข้อมูลรูปภาพ, RSS และ Atom โดยใช้แผนผังไซต์

    Sitemap จำเป็นเมื่อใด?

    ยานเดกซ์กำลังพัฒนาอัลกอริธึมพิเศษซึ่งหุ่นยนต์จัดทำดัชนีเรียนรู้เกี่ยวกับไซต์ ตัวอย่างเช่นการใช้ลิงก์ภายในและภายนอก - การย้ายจากหน้าหนึ่งไปอีกหน้าหนึ่ง บางครั้งหุ่นยนต์อาจข้ามหน้าต่างๆ ใช้แผนผังไซต์หากไซต์ของคุณ:

    • จำนวนมากหน้า
    • แต่ละหน้าที่ไม่มีลิงก์การนำทาง
    • การทำรังลึก

    วิธีการสร้างไฟล์


    เพิ่ม Sitemap.xml ไปยัง Yandex Webmaster - วิดีโอ

    [yt=DMa9XmYfqTI]

    คุณสามารถสร้างแผนผังไซต์ของคุณได้อย่างง่ายดาย ขั้นแรกให้พิมพ์ URL ของคุณ จากนั้นเลือกพารามิเตอร์ที่คุณอาจต้องการเปลี่ยนแปลง (เปลี่ยนความถี่ วันที่แก้ไขครั้งล่าสุด และลำดับความสำคัญของหน้า นอกจากนี้คุณยังสามารถเปลี่ยนการตั้งค่าเริ่มต้นสำหรับการยกเว้นส่วนขยาย ไม่ต้องแยกวิเคราะห์ส่วนขยายและรหัสเซสชัน ในฟิลด์ถัดไป คุณสามารถประกาศว่า URL ใดที่คุณต้องการยกเว้นจากแผนผังไซต์ (ดูตัวอย่างด้านล่าง) สุดท้ายนี้ คุณสามารถเลือกจำนวนหน้าสูงสุดและระดับความลึกได้ คุณสามารถเลือกสร้างแผนผังเว็บไซต์เพิ่มเติมได้ เช่น แผนผังเว็บไซต์ ROR, แผนผังเว็บไซต์ HTML หรือแผนผังเว็บไซต์ TXT

    “ความถี่ในการเปลี่ยนหน้า” คืออะไร ?
    ความถี่ในการเปลี่ยนแปลงส่งผลต่อเวลาและความถี่ที่สไปเดอร์ของเครื่องมือค้นหาเข้าชมหน้าเว็บไซต์ของคุณ โดยอาจมีค่าใดค่าหนึ่งจากเจ็ดค่า: เสมอ รายชั่วโมง รายวัน รายสัปดาห์ รายเดือน รายปี ไม่เคยเลย ข้อมูลนี้จะบอกเครื่องมือค้นหาว่าแต่ละหน้ามีการอัปเดตบ่อยแค่ไหน การอัปเดตหมายถึงการเปลี่ยนแปลงจริงในโค้ด HTML หรือข้อความของเพจ

    "วันที่แก้ไขล่าสุด" คืออะไร?
    พารามิเตอร์นี้สามารถรับหนึ่งในสามค่าถัดไป:
    การตอบสนองของเซิร์ฟเวอร์กำหนดวันที่แก้ไขไฟล์ครั้งล่าสุดโดยใช้ส่วนหัวการตอบกลับของเซิร์ฟเวอร์ ค่านี้จะให้ข้อมูลแก่โปรแกรมรวบรวมข้อมูลเพื่อไม่ให้รวบรวมข้อมูลเอกสารที่ไม่มีการเปลี่ยนแปลงซ้ำ เราขอแนะนำให้เก็บการตั้งค่านี้ไว้
    เวลาปัจจุบัน.กำหนดวันที่แก้ไขไฟล์ครั้งล่าสุดโดยใช้วันที่และเวลาปัจจุบัน
    ไม่มี.อย่าใช้ค่าใด ๆ สำหรับการแก้ไขไฟล์ครั้งล่าสุด

    "ลำดับความสำคัญของหน้า" คืออะไร?
    ลำดับความสำคัญถูกตั้งค่าเป็นตัวเลขระหว่างศูนย์ถึงหนึ่ง หากไม่ได้กำหนดหมายเลข ลำดับความสำคัญจะถูกตั้งไว้ที่ 0.5 ตัวเลขนี้จะกำหนดลำดับความสำคัญของ URL หนึ่งๆ ที่เกี่ยวข้องกับหน้าอื่นๆ บนไซต์เดียวกัน หน้าที่มีความสำคัญสูงอาจถูกจัดทำดัชนีบ่อยกว่าและปรากฏเหนือหน้าอื่นๆ จากไซต์เดียวกันในผลการค้นหา ลำดับความสำคัญอัตโนมัติจะลดลำดับความสำคัญของเพจโดยขึ้นอยู่กับระดับความลึก

    "ระดับความลึก" คืออะไร?
    ระดับความลึกของหน้าหมายถึงจำนวนการคลิกไปยังหน้านี้จากหน้าแรก

    "ยกเว้นส่วนขยาย" คืออะไร
    ไฟล์ที่มีนามสกุลเหล่านี้ที่พบในหน้าเว็บไซต์ของคุณจะไม่รวมอยู่ในแผนผังไซต์ (ไม่มีการรวบรวมข้อมูล) แยกค่าอินพุตด้วยช่องว่าง

    "อย่าแยกวิเคราะห์ส่วนขยาย" คืออะไร
    ไฟล์ที่มีนามสกุลเหล่านี้จะไม่ถูกดึงมาเพื่อประหยัดแบนด์วิธ เนื่องจากไม่ใช่ไฟล์ html และไม่มีลิงก์แบบฝัง แต่จะรวมไว้ในแผนผังไซต์ แยกค่าอินพุตด้วยช่องว่าง

    "รหัสเซสชัน" คืออะไร
    หาก URL บนไซต์ของคุณมีรหัสเซสชัน คุณต้องลบออก การรวมรหัสเซสชันใน URL อาจส่งผลให้การรวบรวมข้อมูลไซต์ของคุณไม่สมบูรณ์และซ้ำซ้อน รหัสเซสชันทั่วไป: PHPSESSID, sid, osCsid คั่นด้วยช่องว่าง.

    "ยกเว้น URL" คืออะไร
    URL ที่มีสตริงเหล่านี้ (หรือ regex) จะไม่รวมอยู่ในแผนผังไซต์ ป้อนค่าหนึ่งรายการต่อบรรทัด
    เช่น 1 ใช้สตริง: ส่วนประกอบ/ เพื่อแยกหน้าทั้งหมดออก www.yoursite.com/component/
    หากเป็น regex ให้เติมต่อท้าย: \s* (ตัวอย่าง: blo\s*)
    เช่น 2 หากคุณมีเว็บไซต์ใด ๆ ต่อไปนี้ คุณอาจยกเว้นสตริงเหล่านี้: (คัดลอกและวางลงในช่องยกเว้น URL)