Allegory sitemap html. Paano lumikha ng Sitemap XML para sa Yandex at Google: sunud-sunod na mga tagubilin. Mga format na sinusuportahan ng Yandex Webmaster

Ang sitemap.xml file ay isang tool na nagbibigay-daan sa mga webmaster na ipaalam sa mga search engine ang tungkol sa mga pahina ng site na magagamit para sa pag-index. Gayundin, sa mapa ng XML maaari mong tukuyin ang mga karagdagang parameter ng pahina: petsa ng huling pag-update, dalas ng mga pag-update at priyoridad na nauugnay sa iba pang mga pahina. Maaaring maimpluwensyahan ng impormasyon sa sitemap.xml ang pag-uugali ng crawler ng paghahanap at, sa pangkalahatan, ang proseso ng pag-index ng mga bagong dokumento. Ang sitemap ay naglalaman ng mga direktiba para sa pagsasama ng mga pahina sa queue para sa pag-crawl at umakma sa robots.txt, na naglalaman ng mga direktiba para sa pagbubukod ng mga pahina.

Sa gabay na ito makikita mo ang mga sagot sa lahat ng tanong tungkol sa paggamit ng sitemap.xml.

Kailangan ko ba ng sitemap.xml

Ang mga search engine ay gumagamit ng sitemap upang maghanap ng mga bagong dokumento sa site (ito ay maaaring mga html na dokumento o nilalaman ng media) na hindi naa-access sa pamamagitan ng nabigasyon, ngunit kailangang i-crawl. Ang pagkakaroon ng link sa isang dokumento sa sitemap.xml ay hindi ginagarantiya na ito ay mako-crawl o mai-index, ngunit kadalasan ang file ay makakatulong sa malalaking site na mas mai-index. Bilang karagdagan, ang data mula sa XML na mapa ay ginagamit upang matukoy ang mga canonical na pahina, maliban kung partikular na ipinahiwatig sa rel=canonical na tag.

Sitemap.xml ay mahalaga para sa mga site kung saan:

  • Ang ilang mga seksyon ay hindi naa-access sa pamamagitan ng menu ng nabigasyon.
  • Mayroong maraming mga nakahiwalay na pahina o mahinang konektadong mga pahina.
  • Ginagamit ang mga teknolohiyang hindi gaanong sinusuportahan ng mga search engine (halimbawa, Ajax, Flash o Silverlight).
  • Mayroong maraming mga pahina at may pagkakataon na ang search crawler ay makaligtaan ng bagong nilalaman.

Kung hindi ito ang iyong kaso, malamang na hindi mo kailangan ng sitemap.xml. Para sa mga site kung saan ang bawat page na mahalaga para sa pag-index ay available sa loob ng 2 pag-click, kung saan ang mga teknolohiyang JavaScript o Flash ay hindi ginagamit upang magpakita ng nilalaman, kung saan ang mga canonical at rehiyonal na tag ay ginagamit kung kinakailangan, at ang sariwang nilalaman ay lumalabas nang hindi mas madalas kaysa sa isang robot na bumisita sa site, sa file na sitemap.xml ay hindi kinakailangan.

Para sa maliliit na proyekto, kung mayroon lamang problema sa malaking antas ng pagpupugad ng dokumento, madali itong malutas gamit ang HTML sitemap, nang hindi gumagamit ng XML na mapa. Ngunit kung magpasya kang kailangan mo pa rin ng sitemap.xml, basahin ang gabay na ito sa kabuuan nito.

Teknikal na impormasyon

  • Ang Sitemap.xml ay isang text file sa XML na format. Gayunpaman, sinusuportahan din ng mga search engine ang format ng teksto (tingnan ang susunod na seksyon).
  • Ang bawat sitemap ay maaaring maglaman ng maximum 50,000 address at hindi na timbangin 50MB(10MB para sa Yandex).
  • Maaari mong gamitin ang gzip compression upang bawasan ang laki ng sitemap.xml file at pataasin ang bilis ng paglipat nito. Sa kasong ito, gamitin ang extension ng gz (sitemap.xml.gz). Kasabay nito, nananatili ang mga paghihigpit sa timbang para sa mga hindi naka-compress na sitemap.
  • Tinutukoy ng lokasyon ng Sitemap ang hanay ng mga URL na maaaring isama sa Sitemap. Ang mapa na naglalaman ng mga address ng mga pahina ng buong site ay dapat na matatagpuan sa ugat. Kung ang sitemap ay matatagpuan sa isang folder, ang lahat ng mga URL sa sitemap na ito ay dapat na matatagpuan sa folder na ito o mas malalim ().
  • Ang mga address sa sitemap.xml ay dapat na ganap.
  • Ang maximum na haba ng URL ay 2048 character (1024 character para sa Yandex).
  • Ang mga espesyal na character sa URL (gaya ng ampersand "&" o mga quote) ay dapat na naka-mask sa HTML entity.
  • Ang mga pahinang tinukoy sa mapa ay dapat magpakita ng 200 http status code.
  • Ang mga address na nakalista sa mapa ay hindi dapat isara sa robots.txt file o sa meta-robots.
  • Hindi dapat isara ang sitemap sa robots.txt, kung hindi, hindi ito iko-crawl ng search engine. Ang file mismo ay maaaring nasa index, ito ay normal.

Mga format ng mapa ng XML

Sinusuportahan ng mga search engine ang isang simpleng format ng text sitemap, na naglilista lamang ng mga URL ng pahina nang walang karagdagang mga parameter. Sa kasong ito, ang file ay dapat na naka-encode ng UTF-8 at may extension .txt.

Sinusuportahan din ng mga search engine ang karaniwang XML protocol. Sinusuportahan din ng Google ang mga sitemap para sa mga larawan, video, at balita.

Isang halimbawang sitemap na naglalaman lamang ng isang address.

https://сайт/ 2018-06-14 daily 0.9

Mga XML tag
urlset
url(kinakailangan) - Ang parent na tag para sa bawat URL.
loc(kinakailangan) - URL ng Dokumento, dapat ay ganap.
lastmod- petsa ng huling pagbabago ng dokumento sa format na Datetime.
changefreq- dalas ng mga pagbabago sa pahina (palagi, oras-oras, araw-araw, lingguhan, buwanan, taon-taon, hindi kailanman). Ang kahulugan ng tag na ito ay isang rekomendasyon sa mga search engine, hindi isang command.
priority- Priyoridad ng URL na nauugnay sa iba pang mga address (mula 0 hanggang 1) para sa pagkakasunud-sunod ng pag-scan. Kung hindi tinukoy, ang default ay 0.5.

XML na mapa para sa mga imahe

Ang ilang mga optimizer ay naglalagay ng mga link sa mga larawan sa sitemap.xml sa parehong paraan tulad ng mga link sa mga HTML na dokumento. Magagawa ito, ngunit mas mainam para sa Google na gumamit ng extension ng karaniwang protocol at magpadala ng karagdagang impormasyon tungkol sa mga larawan kasama ng mga URL. Ang paglikha ng mga mapa ng imahe ng XML ay kapaki-pakinabang kung ang mga imahe ay kailangang i-scan at i-index, at sa parehong oras, ang mga ito ay hindi direktang naa-access sa bot (halimbawa, ang JavaScript ay ginagamit).

Isang halimbawa ng isang sitemap na naglalaman ng isang pahina at mga nauugnay na larawan nito

http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

Mga XML tag
larawan: larawan(kinakailangan) - impormasyon tungkol sa isang larawan. Maaaring gumamit ng maximum na 1000 mga larawan.
larawan:loc(kinakailangan) - landas sa file ng imahe. Kung gumamit ng CDN, katanggap-tanggap na mag-link sa isa pang domain kung ito ay na-verify sa panel ng webmaster.
larawan:caption- caption para sa larawan (maaaring naglalaman ng mahabang teksto).
larawan:pamagat- larawan ng pamagat (karaniwang maikling teksto).
larawan:geo_location- lokasyon ng pagbaril.
larawan:lisensya- URL ng lisensya ng imahe. Ginagamit para sa advanced na paghahanap ng imahe.

XML na mapa para sa video

Katulad ng mapa ng imahe, mayroon ding extension ng video sitemap ang Google kung saan maaari mong tukuyin ang detalyadong impormasyon tungkol sa nilalaman ng video na nakakaapekto sa kung paano ito lumilitaw sa mga paghahanap ng video. Ang isang video sitemap ay kinakailangan kapag ang site ay gumagamit ng mga video na lokal na naka-host, at kapag ang pag-index ng mga video na ito ay mahirap dahil sa mga teknolohiyang ginamit. Kung nag-e-embed ka ng video mula sa YouTube sa iyong website, hindi kailangan ang isang video-sitemap dito.

Sitemap ng Balita

Kung mayroon kang nilalamang balita sa iyong site at lumahok sa Google News, kapaki-pakinabang na gumamit ng Sitemap para sa mga balita, kaya mabilis na mahahanap ng Google ang iyong mga pinakabagong materyales at mai-index ang lahat ng mga artikulo ng balita. Sa kasong ito, ang Sitemap ay dapat maglaman lamang ng mga address ng mga pahinang na-publish sa huling 2 araw at naglalaman ng hindi hihigit sa 1000 mga URL.

Paggamit ng maraming card

Kung kinakailangan, maaari kang gumamit ng ilang mga sitemap, pagsasama-sama ang mga ito sa isang index na sitemap. Maramihang sitemap.xml ay ginagamit sa mga kaso kung saan:

  • Ang site ay gumagamit ng ilang mga makina (CMS).
  • Ang site ay may higit sa 50,000 mga pahina.
  • Kinakailangang mag-set up ng maginhawang pagsubaybay sa error sa mga seksyon.

Sa huling kaso, ang bawat malaking seksyon ng site ay may sariling sitemap.xml at lahat ng mga ito ay idinagdag sa panel para sa mga webmaster, kung saan ito ay maginhawa upang makita kung aling seksyon ang may pinakamaraming error (tingnan ang seksyon para sa paghahanap ng mga error sa sitemap).

Kung mayroon kang 2 o higit pang mga sitemap, kailangang pagsamahin ang mga ito sa isang index na sitemap, na kapareho ng hitsura ng isang regular na sitemap (maliban sa pagkakaroon ng sitemapindex at mga tag ng sitemap sa halip na urlset at url), ay may mga katulad na paghihigpit at maaari lamang mag-link sa mga regular na mapa ng XML (hindi mga index na mapa) .

Halimbawang Sitemap Index:

http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

sitemapindex(mandatory) - tumutukoy sa kasalukuyang pamantayan ng protocol.
sitemap(mandatory) - naglalaman ng impormasyon tungkol sa isang hiwalay na sitemap.
loc(kinakailangan) - lokasyon ng sitemap (sa xml, txt o rss na format para sa Google).
lastmod- oras ng pagbabago ng sitemap. Nagbibigay-daan sa mga search engine na mabilis na tumuklas ng mga bagong URL sa malalaking site.

Paano gumawa ng sitemap.xml

Mga pamamaraan para sa paglikha ng XML Sitemap:

  • Panloob na mga tool sa CMS. Sinusuportahan na ng maraming CMS ang paggawa ng sitemap. Upang malaman, basahin ang dokumentasyon para sa iyong CMS, tingnan ang mga item sa menu sa admin panel, o makipag-ugnayan sa teknikal na suporta ng engine. I-upload ang file na https://yoursite.com/sitemap.xml sa iyong site ay maaaring mayroon na at dynamic na nabuo.
  • Mga panlabas na plugin. Kung walang functionality ang CMS para sa pagbuo ng sitemap, at sinusuportahan nito ang mga plugin, sinasaklaw ng Google kung aling plugin ang sitemap.xml na tanong para sa iyong engine at i-install ito. Sa ilang mga kaso, kailangan mong makipag-ugnayan sa mga programmer upang magsulat ng katulad na plugin para sa iyo.
  • Paghiwalayin ang script sa site. Alam ang XML map protocol at mga teknikal na limitasyon, maaari kang lumikha ng sitemap.xml sa pamamagitan ng pagdaragdag ng generation script sa CRON. Kung hindi ka programmer, gamitin ang iba pang mga item sa listahang ito.
  • Mga generator ng sitemap. Mayroong maraming mga generator ng sitemap.xml na nag-scan sa iyong site at nagbibigay sa iyo ng isang handa na mapa upang i-download. Ang kawalan dito ay sa tuwing ina-update ang site, kailangan mong manu-manong bumuo ng sitemap.
  • Mga parser. Ang mga desktop program na idinisenyo para sa teknikal na pagsusuri ng isang website ay karaniwang nagbibigay ng pagkakataong mag-download ng sitemap.xml, na nabuo batay sa mga na-crawl na pahina. Gumagana ito nang katulad sa mga generator ng sitemap, tanging ito ay tumatakbo nang lokal sa iyong makina.

Mga sikat na online sitemap generators

XML-Sitemaps.com

Binibigyang-daan kang makakuha ng sitemap.xml sa ilang mga pag-click. Sinusuportahan ang mga format ng XML, HTML, TXT at GZ. Maginhawang gamitin para sa maliliit na site (hanggang sa 500 mga pahina).

Ang isang katulad na generator, ngunit may kaunti pang mga setting at nagbibigay-daan sa iyong lumikha ng mapa ng hanggang 2000 mga pahina nang libre.

Mayroong maraming mga setting, nagbibigay-daan sa iyong mag-import ng mga URL mula sa isang CSV file. Nag-scan ng hanggang 500 URL nang libre.

Walang limitasyon sa bilang ng mga pahina upang i-scan. Ngunit para sa malalaking site, ang proseso ng pagbuo ay maaaring mag-freeze ng ilang sampu-sampung minuto.

Mga lokal na programa para sa pagbuo ng XML Sitemap

G-Mapper Sitemap Generator

Libreng desktop na bersyon ng sitemap generator para sa Windows.

Screaming Frog SEO Spider

Flexible na tool sa pagbuo ng sitemap na may maraming mga setting. Maginhawa kung gumagamit ka na ng screamin frog para sa iba pang mga gawain sa SEO. Pagkatapos i-scan ang site, gamitin ang menu item na Sitemaps -> Lumikha ng XML Sitemap.

Netpeak Spider

Isang hindi gaanong nababaluktot, ngunit maginhawa din na solusyon para sa mabilis na pagbuo ng sitemap.xml. Pagkatapos i-scan ang site, kailangan mong gamitin ang menu item na Mga Tool -> Bumuo ng Sitemap.

Ang sitemap ay isang html na pahina ng isang site o isang espesyal na xml file, na nagpapakita ng mga link sa lahat ng mahahalagang pahina ng site. Upang maunawaan kung ano ang isang mapa ng site, isipin lamang ang talaan ng mga nilalaman ng isang libro at agad itong magiging malinaw bakit kailangan mo ng site map. Ang mapa ng site ay tumutulong sa isang bisita, maging isang tao o isang robot sa paghahanap, na mabilis na mahanap ang anumang pahina sa site, na gumagawa ng isang minimum na bilang ng mga transition. Sa simple at maliliit na site, lahat ng page ay maa-access sa loob ng 1-2 click mula sa main page, ngunit paano kung ang site ay malaki at ang istraktura nito ay kumplikado? Ang ganitong site ay hindi lamang magiging abala para sa mga bisita, ngunit hindi rin halata sa mga search engine.

Anong mga uri ng sitemap ang mayroon?

Ini-index ng mga search engine ang site nang paunti-unti, sa bawat antas, simula sa pangunahing pahina. Kung ang site ay may maraming antas ng nesting ng mga pahina, pagkatapos ay aabutin ng maraming buwan hanggang sa ma-index ang lahat ng mga pahina ng site. Kaya kailangan gumawa ng site map, kung saan magkakaroon ng lahat ng mga link sa lahat ng mga pahina ng site nang sabay-sabay, upang ang robot ay hindi mag-aksaya ng oras sa pag-navigate sa mga antas ng nesting, tama ba? Oo at hindi. Ang sagot ay depende sa kung bakit ginagawa ang mapa at kung ano ang magiging hitsura nito. Tingnan natin ano ang mga uri ng mga sitemap?.

Sitemap HTML Sitemap

Ang mga sitemap ay nahahati sa 2 pangunahing uri o format: sitemap html at isang sitemap xml file. Ang HTML sitemap ay isang pahina ng site, na naglilista ng mga link. Kadalasan ang mga ito ay mga link sa pinakamahalagang seksyon at pahina ng site. Ang HTML sitemap ay mas idinisenyo para sa mga tao sa halip na mga robot at tinutulungan kang mabilis na mag-navigate sa mga pangunahing seksyon ng site. Para sa isang sitemap sa anyo ng isang HTML na pahina, may mga seryosong paghihigpit sa bilang ng mga link sa isang pahina. Kung napakaraming link sa isang pahina, hindi lahat ng link ay maaaring ma-index, o ang pahina ng mapa ng site ay maaaring hindi kasama sa paghahanap para sa labis na bilang ng mga link, kahit na .

Upang ang html sitemap ay ma-index nang tama at sapat na napagtanto ng mga bisita, hindi ka dapat maglagay ng higit sa 100 mga link sa pahina. Ito ay higit pa sa sapat upang ilagay sa pahina ang lahat ng mga seksyon at mga subseksyon na hindi akma sa pangunahing menu.

Karaniwan, mapa ng site sa format na HTML ay may istraktura ng puno, kung saan ipinahiwatig ang mga pinalawak na seksyon at subsection. Ang mga hindi kinakailangang napakalaking HTML na mapa ng site ay kadalasang idinisenyo gamit ang mga graphic na elemento, mga istilo ng CSS at dinadagdagan ng Java script. Gayunpaman, ang isang html sitemap ay maliit na halaga sa mga search engine.

Ang isang HTML sitemap ay hindi isang ganap na sitemap. Ano ang gagawin kung ang site ay may daan-daan, libu-libo, sampu-sampung libong mga pahina? Upang gawin ito, kailangan mong maglagay ng mga link sa lahat ng pahina sa sitemap sa xml na format.

XML Sitemap

Ang XML sitemap ay isang file sa xml format, tulad ng sitemap.xml, na karaniwang matatagpuan sa ugat ng site. Ang isang sitemap sa xml format ay may maraming mga pakinabang kaysa sa isang html sitemap. Ang sitemap xml ay isang espesyal na format ng sitemap, na tinutukoy ng lahat ng sikat na search engine, gaya ng Google at Yandex. Maaari kang tumukoy ng hanggang 50,000 link sa xml sitemap. Bukod dito, sa sitemap xml maaari mong tukuyin ang kamag-anak na priyoridad at dalas ng mga pag-update ng pahina.

Ito ay nagkakahalaga na sabihin na ang mga nilalaman ng mapa ng site ay mga rekomendasyon lamang para sa robot ng paghahanap. Halimbawa, kung magtatakda ka ng taunang dalas ng pag-update para sa isang pahina ng website, mas madalas pa ring bibisita ang mga search robot. At kung itatakda mo ang rate ng pag-refresh ng page na maging oras-oras, hindi ito nangangahulugan na ii-index ng mga robot ang pahina bawat oras.

Ang isang xml sitemap ay may partikular na syntax, tingnan natin ang istraktura ng isang xml sitemap nang mas detalyado.

Halimbawa ng file ng sitemap sitemap.xml

Ang tamang sitemap.xml ay dapat na naka-encode ng UTF8. Ang mga nilalaman ng sitemap.xml file ay ganito ang hitsura:

http://mysite.ru/ 2014-09-18T18:54:13+04:00 always 1.0 http://mysite.ru/category/ 2014-09-18T18:57:09+04:00 hourly 0.8 http://mysite.ru/page/ 2014-09-18T18:59:37+04:00 daily 0.6

Kung saan ginagamit ang mga sumusunod na kinakailangang tag:

  • — parent tag, naglalaman ito ng lahat ng URL;
  • — тег, в котором указываются сведения о конкретном url-адресе;
  • https://redcomrade.ru/tl/ — в данном теге указывается непосредственно url.
  • — этот тег заключает в себе дату последнего изменения страницы;
  • — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Так же, в файле карты сайта в формате xml должно содержаться указание на пространство имен языка XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

http://mysite.ru/sitemaps/sitemap01.xml 2014-09-18T18:54:13+04:00 http://mysite.ru/sitemaps/sitemap02.xml 2014-09-18T18:54:13+04:00

Здесь используются уже знакомые нам теги https://redcomrade.ru/tl/ и , а так же обязательные теги:

  • — родительский тег, в который заключаются адреса всех карт сайта;
  • — тег, в котором заключается параметры для каждой карты сайта.

Пример файла карты сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://mysite.ru/ 2. http://mysite.ru/page/ 3. http://mysite.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Как создать карту сайта

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта . Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше — файл карты сайта размещается в корне сайта . Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта , провести анализ карты сайта на корректность , соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта — это .

Sitemap: http://mysite.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Напрмер xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать программу-генератор карты сайта . Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс).
  5. Создание карты сайта вручную .

Карта сайта — один из важнейших инструментов . Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или . А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

С помощью нашего генератора карты сайта создайте файлы в формате XML, которые могут быть представлены в Google, Яндекс, Bing, Yahoo и других поисковых системах, чтобы помочь им индексировать ваш сайт.

Сделайте это за три простых шага:

  • Введите полный URL веб-сайта в форму.
  • Нажмите кнопку "Начать" и дождитесь, пока сайт полностью просканируется. При этом Вы увидете полное количество работающих и неработающих ссылок.
  • Нажав кнопку "Sitemap.xml", сохраните файл в удобном месте.

  • Sitemap – это карта сайта в формате XML, который В 2005 году поисковик Google стал использовать для индексации страниц сайтов. Файл Sitemap представляет собой способ организации веб-сайта, выявление адреса и данные по каждому разделу. Ранее карты сайта в основном были направлены для пользователей сайта. Формат XML был разработан для поисковых систем, что позволяет им найти данные быстрее и эффективнее.

    Новый протокол Sitemap был разработан в ответ на увеличения размера и сложности веб-сайтов. Бизнес-сайты часто содержат тысячи продуктов в своих каталогах, популярность блогов, форумов, досок объявлений вынуждают вебмастеров обновлять свои материалы, по крайней мере один раз в день. Поисковым системам все труднее отслеживать весь материал. Через протокол XML поисковые системы могут более эффективно отслеживать адреса, оптимизируя их поиск путем размещения всей информации на одной странице. XML также показывает, как часто обновляется определенный веб-сайт, и записывает последние изменения. XML карты не являются инструментом для поисковой оптимизации. Это не влияет на ранжирование, но это позволяет поисковым системам сделать более точные рейтинги и поисковые запросы. Это происходит путем предоставления данных, удобных для считывания поисковыми системами.

    Общее признание протокола XML означает, что разработчикам веб-сайтов больше не нужно создавать различные типы карт сайта для различных поисковых системах. Они могут создать один файл для представления, а затем обновить его, когда они внесли изменения на сайте. Это упрощает весь процесс тонкой настройки и расширения веб-сайта. Сами Вебмастера начали видеть преимущества использования этого формата. Поисковые системы ранжируют страницы в соответствии с релевантностью содержания конкретных ключевых слов, но до формата XML часто содержимое страниц не было правильно представлено. Это часто расстраивает вебмастерам, которые понимают, что их усилия по созданию веб-сайта были оставлены незамеченными. Блоги, дополнительные страницы, добавление мультимедийных файлов занимают несколько часов. Через файл XML эти часы не будут потрачены впустую, их увидят все известные поисковые системы.

    Чтобы создать свой Sitemap в формате XML и держать поисковые системы в курсе всех изменений вашего сайта, попробуйте наш бесплатный генератор карты сайта.

    Яндекс Вебмастер позволяет:

    • добавить Sitemap;
    • обновить;
    • удалить;
    • анализировать.

    Как добавить Sitemap в Яндекс Вебмастер

    Чтобы добавить файл Sitemap в очередь на индексирование, вам нужно, как и всегда, зайти в сервис Вебмастера — webmaster.yandex.ru. Далее:

    1. В разделе «Индексирование» вы найдете пункт «Файлы Sitemap».
    2. Добавьте полный адрес файлы Sitemap, например, https://сайт/sitemap.xml.
    3. Нажмите «Добавить».
    4. Ждите, пока Яндекс Вебмастер проверит файл.

    После добавления, файл попадает в очередь на обработку. Робот добавит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в индекс Sitemap, обрабатывается роботом отдельно.

    После загрузки напротив каждой карты сайта вы увидите в Яндекс Вебмастере один из статусов:

    Статус Описание Примечание
    «OK» Файл сформирован правильно и загружен в базу робота Напротив файла отобразится дата последней загрузки.Проиндексированные страницы появятся в результатах поиска в течение двух недель
    « » Указанный URL перенаправляет на другой адрес Удалите редирект и сообщите роботу об обновлении
    «Ошибка» Файл сформирован неправильно Нажмите ссылку Ошибка, чтобы узнать подробности. После внесения изменений в файл сообщите роботу об обновлении
    «Не проиндексирован» При обращении к Sitemap сервер возвращает HTTP-код, отличный от 200 Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.Если файл доступен, сообщите роботу об обновлении
    Доступ к файлу запрещен в robots.txt с помощью директивы Disallow Разрешите доступ к Sitemap и сообщите роботу об обновлении

    Обновить Sitemap

    Когда в Sitemap происходят изменения, его не нужно удалять из Яндекс Вебмастера и добавлять заново. Поисковик время от времени сам проверяет его на изменения и ошибки.

    Если ваш Sitemap не проиндексирован, то это можно ускорить. Нужно зайти в раздел «Индексирование», далее в пункт «Файлы Sitemap». Нажать на значок обновления напротив нужноq карты сайта. Яндекс загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.

    Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.

    Удалить Sitemap из Вебмастера

    В интерфейсе Яндекс.Вебмастера можно удалить те файлы, которые были добавлены на странице «Файлы Sitemap» :

    Если для Sitemap была добавлена директива в файле robots.txt, удалите ее. После внесения изменений информация о Sitemap пропадет из базы робота и Яндекс.Вебмастера в течение нескольких недель.

    Поддерживаемые Яндекс Вебмастером форматы

    Яндекс принимает Sitemap в форматах:

    XML-формат Sitemap

    Предпочтительней передавать в формате XML, т.к. в нем можно передать дополнительные данные.

    Яндекс поддерживает протокол Sitemap . Используйте этот формат, если хотите сообщить о:

    • дате последнего обновления страницы (элемент lastmod);
    • частоте изменения страницы (элемент changefreq);
    • значимости страницы (элемент priority) - робот загружает страницы поочередно с учетом наличия и значения коэффициента от 0.0 до 1.0. Укажите коэффициент для тех URL, которые наиболее важны для сайта.

    https://сайт/ssylki-v-yandex-webmaster/ 2018-06-06 monthly 0.8 ...

    Sitemap na format ng TXT

    Sa format na ito, maaari ka lamang magpadala ng mga address ng pahina. Iyon lang. Oo, kalungkutan at kalungkutan, mas mahusay na gumamit ng XML :)

    Gamitin ang format na ito upang mag-ulat ng mga address ng pahina lamang.

    https://site/ssylki-v-yandex-webmaster/ https://site/zerkala-sajta-v-yandex-webmaster/

    Upang magpadala ng impormasyon tungkol sa mga video, tukuyin ang mga link sa mga XML feed sa Sitemap (tingnan ang mga detalye sa Tulong sa serbisyo ng Ya.Video).
    Hindi sinusuportahan ng paghahanap ang pagbabahagi ng impormasyon ng larawan, RSS, at Atom feed gamit ang isang Sitemap.

    Kailan kailangan ang isang Sitemap?

    Gumagawa ang Yandex ng mga espesyal na algorithm kung saan natututo ang indexing robot tungkol sa site. Halimbawa, gamit ang panloob at panlabas na mga link - paglipat mula sa isang pahina patungo sa isa pa. Minsan maaaring laktawan ng robot ang mga pahina. Gamitin ang Sitemap kung ang iyong site:

    • isang malaking bilang ng mga pahina;
    • indibidwal na mga pahina na walang mga link sa nabigasyon;
    • malalim na pugad.

    Paano gumawa ng file


    Magdagdag ng Sitemap.xml sa Yandex Webmaster - video

    [yt=DMa9XmYfqTI]

    Madali mong magagawa ang iyong sitemap. I-type muna ang iyong URL at pagkatapos ay piliin ang mga parameter na maaaring gusto mong baguhin. (dalas ng pagbabago, petsa ng huling pagbabago at priyoridad ng page. Maaari mo ring baguhin ang mga default na setting para sa pagbubukod ng mga extension, huwag i-parse ang mga extension at session id. Sa susunod na mga field maaari mong ideklara kung aling mga URL ang gusto mong ibukod mula sa sitemap (tingnan ang halimbawa sa ibaba). Sa wakas, maaari mong piliin ang maximum na bilang ng mga pahina at ang antas ng lalim. Opsyonal na maaari mong piliin upang lumikha ng mga karagdagang sitemap, tulad ng ROR sitemap, HTML sitemap o TXT sitemap.

    Ano ang "Dalas ng pagbabago ng page" ?
    Nakakaapekto ang dalas ng pagbabago kung kailan at gaano kadalas bumibisita ang mga spider ng search engine sa mga pahina ng iyong site. Maaaring mayroon itong isa sa pitong halaga: palagi, oras-oras, araw-araw, lingguhan, buwanan, taun-taon, hindi kailanman. Sinasabi nito sa mga search engine kung gaano kadalas ina-update ang bawat pahina. Ang isang update ay tumutukoy sa mga aktwal na pagbabago sa HTML code o teksto ng pahina.

    Ano ang "Huling petsa ng pagbabago" ?
    Maaaring tumagal ang parameter na ito ng isa sa susunod na tatlong value:
    Tugon ng server. Itakda ang petsa ng huling pagbabago ng file gamit ang mga header ng tugon ng server. Ang halagang ito, ay nagbibigay sa mga crawler ng impormasyon sa hindi muling pag-crawl ng mga dokumentong hindi nagbago. Inirerekomenda naming panatilihin ang setting na ito.
    Kasalukuyang oras. Itakda ang petsa ng huling pagbabago ng file gamit ang kasalukuyang petsa at oras.
    wala. Huwag gumamit ng anumang halaga para sa Huling pagbabago ng mga file.

    Ano ang "Priyoridad ng page" ?
    Ang Priyoridad ay nakatakda sa isang numero sa pagitan ng zero at isa. Kung walang itinalagang numero, itatakda ang priyoridad sa 0.5. Tinutukoy ng numerong ito ang priyoridad ng isang partikular na URL na nauugnay sa iba pang mga pahina sa parehong site. Ang isang mataas na priyoridad na pahina ay maaaring ma-index nang mas madalas at lumitaw sa itaas ng iba pang mga pahina mula sa parehong site sa mga resulta ng paghahanap. Binabawasan ng awtomatikong priyoridad ang priyoridad ng isang pahina depende sa antas ng lalim.

    Ano ang "Depth Level"?
    Ang depth level ng isang page ay nangangahulugan kung gaano karaming mga click ang layo ng page na ito mula sa homepage.

    Ano ang "Ibukod ang mga extension" ?
    Ang mga file na may ganitong mga extension na makikita sa iyong mga pahina ng website ay hindi kasama sa sitemap (hindi na-crawl). Paghiwalayin ang mga halaga ng input na may mga puwang.

    Ano ang "Huwag i-parse ang mga extension" ?
    Ang mga file na may ganitong mga extension ay hindi kukunin upang makatipid ng bandwidth, dahil ang mga ito ay hindi mga html na file at walang mga naka-embed na link ngunit isasama sa sitemap. Paghiwalayin ang mga halaga ng input na may mga puwang.

    Ano ang "Mga Session ID" ?
    Kung may mga session ID ang mga URL sa iyong site, dapat mong alisin ang mga ito. Ang pagsasama ng mga session ID sa mga URL ay maaaring magresulta sa hindi kumpleto at paulit-ulit na pag-crawl ng iyong site. Mga karaniwang session ID: PHPSESSID, sid, osCsid. Paghiwalayin ng mga puwang.

    Ano ang "Ibukod ang mga URL" ?
    Ang mga URL na naglalaman ng mga string na ito (o regex) ay hindi isasama sa sitemap. Mga halaga ng input ng isa sa bawat linya.
    hal. 1 Gumamit ng string: sangkap/ upang maibukod ang lahat ng pahina sa www.yoursite.com/component/
    Kung regex, idagdag sa dulo: \s* (halimbawa: blo\s*)
    hal. 2 Kung mayroon kang alinman sa mga sumusunod na website, maaari mong ibukod ang mga string na ito: (kopyahin at i-paste sa kahon na Ibukod ang mga URL)