Как найти sitemap xml на сайте

Обычно sitemap.xml располагается по стандартному адресу domain.com/sitemap.xml но вообще её можно расположить по другому адресу и добавить в Яндекс Вебмастер и Гугл Search Console вручную этот путь.

Вопрос: есть второй вариант и путь нестандартный можно ли как-то узнать есть ли на сайте sitemap.xml или нет? Может запрос в поиске какой-то задать особый?


  • Вопрос задан

    более трёх лет назад

  • 39923 просмотра

Открыть главную сайта, например https://toster.ru и в конце добавить /sitemap.xml — вот так https://toster.ru/sitemap.xml. Если видишь то же, что и у тостера — сайтмапа нет. Если увидешь код с разметкой xml — большая вероятность, что это он. Чтобы подтвердить эту вероятность — надо его прочитать.

Еще вполне может быть, что он физически есть, но криворукость администратора сервера или того, кто работает с ftp не позволяет открывать этот файл, ибо, к примеру нет прав)

Думаю нет. Проблема в том, что сайтмап не попадает в поисковую выдачу, соответственно их нельзя найти ни по каким запросам. Кроме того на них (как правило) нет ссылок с сайта так что по ссылке их тоже не найдешь. Если нет доступа к файлам сайта или вебмастеру – все это выглядит затруднительно.

Пробить все вероятные пути, если путь уникальный то никак

Если адреса не знаете, то никак

Пригласить эксперта

Как вариант – проверить /robots.txt, там обычно указывают директиву Sitemap.

LinkChecker не забудьте крюкнуть “Нравится”


  • Показать ещё
    Загружается…

21 мая 2023, в 06:28

1500 руб./за проект

21 мая 2023, в 03:18

10000 руб./за проект

21 мая 2023, в 01:51

500 руб./за проект

Минуточку внимания

There is no standard, so there is no guarantee. With that said, its common for the sitemap to be self labeled and on the root, like this:

example.com/sitemap.xml

Case is sensitive on some servers, so keep that in mind. If its not there, look in the robots file on the root:

example.com/robots.txt

If you don’t see it listed in the robots file head to Google and search this:

site:example.com filetype:xml

This will limit the results to XML files on your target domain. At this point its trial-and-error and based on the specifics of the website you are working with. If you get several pages of results from the Google search phrase above then try to limit the results further:

filetype:xml site:example.com inurl:sitemap

or

filetype:xml site:example.com inurl:products

If you still can’t find it you can right-click > "View Source" and do a search (aka: “control find” or Ctrl + F) for .xml to see if there is a reference to it in the code.

Файл «sitemap.xml» генерируется автоматически для всех опубликованных сайтов и доступен по адресу вида: http(s)://имя-сайта/sitemap.xml. В него попадают все страницы сайта.

Примечание:

  • В Google Search Console при добавлении карты сайта указывается имя файла «sitemap.xml» (без слеша и адреса сайта).
  • В Яндекс.Вебмастер указывается полный адрес файла.

Попробуйте прямо сейчас!

Создать сайт

Помогла ли вам статья?

Да
Нет

Статья оказалась полезной для 142 человек

Читайте также

  • Интерфейс uKit
  • Как добавить файл на сайт?
  • Как опубликовать сайт?
  • Тарифы uKit
  • Как добавить свой HTML-код?
  • Что такое SSL и HTTPS?
  • Как отредактировать файл robots.txt?

Писать на форуме DIAFAN.CMS могут только зарегистрированные пользователи. Войдите или зарегистрируйтесь.

    • Наталья
      (natalya21)

  • 11 июля 2011 г.

  • Извините за глупый вопрос, но раздел вроде для новичков. Где находится файл Sitemap, чтобы мне его в поисковики добавить? До этого пользовалась шоп-скрипт, там прямо в админке есть функция “обновить файл Sitemap” и адрес файла виден. А на диафане я что-то даже и найти его не могу.

      • Артем Романов
        (romanovart)


      • 1
    • 12 июля 2011 г.

    • Его нет физически, он автоматом генерируется диафаном, а адрес карты сайта находится всегда по site.ru/sitemap.xml и спокойно скармливается поисковикам

      • Андрей
        (seodoka)



    • 12 июля 2011 г.

    • Адрес файла мне подсказали, можете посмотреть вроде как так.

      http://www.site.ru/?rewrite=sitemap.xml

      Но нужно ли этот адрес давать поисковикам – не знаю, наверное нет.

        • Виталий
          (DIAFAN.CMS)


        • 854

      • 12 июля 2011 г.

      • Адрес сайтмапа классический http://www.site.ru/sitemap.xml

    • Андрей
      (seodoka)



  • 12 июля 2011 г.

  • И появляется в нем много несуществующих по факту страниц.

    пустых, кривых, не нужных, 404-х и т.д.

    Чтобы поисковики кушали наши правильные сайтмепы, создаваемые умными программами-роботами, пришлось в

    убрать из .htaccess RewriteRule ^(.*)sitemap.xml$ index.php?rewrite=sitemap.xml [QSA]

    А то приходилось сначала закрывать в роботсе

    Disallow: /map.html

    Disallow: /search.html

    Disallow: /shop.html

    Disallow: /shop/basket.html

    Disallow: /shop/order.html

    Disallow: /files.html

    Disallow: /tags.html

    Disallow: /photo.html

    Disallow: /registration.html

    Disallow: /reminding.html

    Так что или нужно дорабатывать генерацию этого файла. Или не советую пользоваться другим, а то поисковики обидятся на мусор, который им подсовываем

      • Марина Дорохина
        (DIAFAN.CMS)


      • 10
    • 12 июля 2011 г.

    • По поводу “пустых, кривых, не нужных и 404-х” хотелось бы уточнить. А то Вы вот знаете про них, а мы нет. Из-за этого только Вы не используете sitemap.xml.

      Страницы “Карта сайта, поиск и т. д.” можно из карты сайта исключить с помощью опции “Не показывать на карте сайта” при редактировании страницы сайта.

        • Владимир
          (Chemist)


        • 2
      • 16 сентября 2012 г.

      • Подскажите пожалуйста, а где эта опция “Не показывать на карте сайта”. В упор не вижу.

          • Евгений
            (adsged)



          • 13

        • 17 сентября 2012 г.

        • В режиме редактирования страницы кликнуть на Дополнительные параметры, и смотреть чуть ниже прав доступа

      • Виталий
        (DIAFAN.CMS)


      • 854

    • 12 июля 2011 г.

    • Это Вы про шоп-скрипт? Или про диафан?

      Если про нас, то давайте подробнее, какие кривые и несуществующие страницы генерит sitemap.xml?

      Не голословьте, не клевещите, а приведите хоть один пример, когда в sitemap.xml, автоматически генерируемом diafan.CMS выдаются пустые, кривые или 404 страницы!?

      Понятие “не нужные”, которые Вы употребили – понятие относительное и Ваше сугубо субъективное, об этом также нужно писать с приставкой “имхо”. А фантазии насчет “обид поисковиков” вообще смешные.

    • Андрей
      (seodoka)



  • 12 июля 2011 г.

  • Господа,

    Спокойнее )

    И простите меня за некий сарказм.

    Мне очень нравится Ваша ЦМС. Почему уже что-то переделал из сайтов, и еще на очереди заказал переверстку несколько сайтов именно на ней.

    Но недоработки есть.

    К примеру в сайт-мепе генерируется

    http://site.ru/tags/show1/

    http://site.ru/faq.html

    http://site.ru/forum/cat2/

    Ну например, если форум и прочие модули отключены, то зачем генерируются их страницы?

    А в админке я не нашел, где галочка “Не показывать на карте сайта” для форума, например.

    Если он отключен, то и не должен генерироваться по-умолчанию. Я так понимаю.

    Модуль магазина используется, как каталог товаров только, без онлайн-заказа. Нет на сайте корзинки. Но записи

    /shop/basket.html

    /shop/order.html

    генерируются.

    Нет внутренней ссылки на сайте нигде на адрес /shop.html

    Тем не менее он генерируется. А поскольку шаблон для такой страницы не разрабатывался за ненужностью, то такая страница индексируется поисковиками, но выглядит вкривь и вкось.

    Поставить галочку “не показывать на карте” – не могу. Тогда все страницы типа

    /shop/razdel/tovar.html не попадут в карту сайта.

    Вот дилема.

    Поисковики, как известно, не любят сайты со страницами ошибочными, например с 404-й ошибкой.

    “Обидятся” – придут, увидят 404-ю, и некий минус сайту поставят.

    А на страницы, на которые ссылок на сайте нет внутренних, ненужные и соответственно не сверстанные правильно, могут зайти люди, или (не дай бог) асессоры, если они имеются в файле сайт-мепа и проиндексируются поисковиками. Асессор явно не даст положительную оценку сайту за это.

    В Вашей ЦМС нет огромного мусора вариантов адресов страниц, которые генерируют некоторые другие ЦМС. Это сильно радует.

    Но с генерацией сайтмепа есть отдельные недочеты.

    Какой выход? Не знаю. Я не программист, а оптимизатор-пользователь. Пока просто отключили ее и делаем сайт-меп сторонними программами, которые по фактическим ссылкам ходят и генерируют также с учетом запрета индексации в роботсе.

    Но как бы было удобно, если бы Ваш встроенный сайт-меп работал, как надо. Особенно актуально для крупных и новостных порталов.

    Возможно достаточно, чтобы программа, генерирующая файл учитывала запреты в robots.txt хотя бы. Может это было бы оптимальным решением. Генерирует что-то не так, запретил что-то, уже чистый и правильный сайт-меп поисковики кушать будут.

    Спасибо.

      • Виталий
        (DIAFAN.CMS)


      • 854

    • 12 июля 2011 г.

    • К примеру в сайт-мепе генерируется

      http://site.ru/tags/show1/

      http://site.ru/faq.html

      http://site.ru/forum/cat2/

      Ну например, если форум и прочие модули отключены, то зачем генерируются их страницы?

      Если форум и прочие модули отключены, то они бы не показывались. Отключены – это когда страницы нет, или она серая (неактивная). В иных случаях страница на сайте существует. Если она не показана в меню, это не значит, что страницы нет.

      Вот нажмите на лампочку у страницы “форум”, страница станет серой в админке и исчезнет с сайта и с сайтмапа.

      Модуль магазина используется, как каталог товаров только, без онлайн-заказа. Нет на сайте корзинки. Но записи

      /shop/basket.html

      /shop/order.html

      генерируются.

      Это же касается корзины, страницы заказа. Эти страницы вложены в страницу “Магазин” и также активны и существуют. И совершенно справедливо показываются в сайтмапе.

      Нет внутренней ссылки на сайте нигде на адрес /shop.html

      Тем не менее он генерируется.

      И что, что нет ссылки? Где она может быть? В меню? Пожалуй. Ее можно там поставить и тогда ссылка на магазин будет в главном меню сайта. Но бывают ситуации, когда на магазин должен ссылаться большой баннер, а в меню должны быть другие ссылки. Тогда в меню магазин не показан, а ссылка на него ставится вручную с баннера в шаблоне.

      Если Вы не поставили ссылку на страницу магазина – это не значит, что сттраницы нет на сайте!!! Она есть! И задача сайтмапа как раз показать все ссылки на все АКТИВНЫЕ страница сайта.

      Вот если бы Вы сказали, что Вы деактивировали страницу, а она показывается на сайтмапе, то да – это косяк. Но этого нет! Если Вы не оформили какие-то активные страницы, то причем тут мы? 🙂

      Поисковики, как известно, не любят сайты со страницами ошибочными, например с 404-й ошибкой.

      Покажите пример, когда на нашем сайтмапе выводится ссылка на 404!!!

        • Андрей
          (seodoka)



      • 12 июля 2011 г.

      • Если форум и прочие модули отключены, то они бы не показывались.

        Показываются, пока не поставишь галочку “не показывать”, хоть и отключены (серые).

        Скрины (можете сами проверить):

        – серая

        – генерируется (посмотрите на дату еще)

        возможно из-за того, что внутри по-умолчанию стоит не серая

        Но сам-то форум отключен.

        Как раз /forum/cat2/ и выдает 404-ю ошибку

        Тоже самое с /tags/show1/, хотя модуль тегов отключен, внутри его что-то остается не отключенным и 404-я ошибка вылезает, но в карту сайта эта страница попадает.

        Если она не показана в меню, это не значит, что страницы нет.

        Мне именно эта страница /shop.html не нужна. Нет ни корзины, ни регистрации пользователей.

        /shop/basket.html

        /shop/order.html

        /reminding.html

        /registration.html

        Я на них нигде ссылку на сайте не показываю, зачем они мне в списке? Страницы категорий и прочие же – нужны.

        задача сайтмапа как раз показать все ссылки на все АКТИВНЫЕ страница сайта

        Задача другая – показать все НУЖНЫЕ страницы для индексации, а не нужные не показывать.

        Файл Sitemap — это файл, расположенный на сайте, с дополнительной информацией о страницах сайта, подлежащих индексированию. – см. в ндексе

        Зачем поисковику кушать страницу с таким содержанием

        Наименование Количество Цена, руб. Сумма, руб. Удалить ИТОГО 0 0

        если на сайте нет корзины, а только структурированный каталог?

        Тоже самое со страницами типа /photo.html

        Если я поставил ссылки в меню только на 2 альбома фотогалереи, а эта (“коренная”) страница никакой полезной инфо не несет кроме 2-х ссылок на те же альбомы. А поисковики не любят сайты со страницами без содержания (фактически пустые)… То ее я НЕ хочу отдавать поисковику на индексацию, и не хочу, чтобы она была в сайтмепе соответственно.

        А значит, ИМХО должна быть предусмотрена возможность какой-то настройки встроенного в ЦМС авто-сайтмепа.

          • Виталий
            (DIAFAN.CMS)


          • 854

        • 12 июля 2011 г.

        • Показываются, пока не поставишь галочку “не показывать”, хоть и отключены (серые).

          Скрины (можете сами проверить):

          – серая

          – генерируется (посмотрите на дату еще)

          возможно из-за того, что внутри по-умолчанию стоит не серая

          Но сам-то форум отключен.

          Как раз /forum/cat2/ и выдает 404-ю ошибку

          Какая версия CMS? Какой URL сайта?

          Задача другая – показать все НУЖНЫЕ страницы для индексации, а не нужные не показывать.

          Это все относительно. Вам ненужные, а кто-то за лишнюю страницу глотку перегрызет. Вы считаете, что не надо Яндексу кормить страницы с двумя ссылками на фотогалерею, кто-то считает, что надо страницу и с одной ссылкой кормить, а кто-то закрывает от индексации все тексты, которые меньше 1000 символов.

          У нас по факту если есть страница, то она есть.

          Если надо, обратитесь в ТП, Вам подскажут, как подправить sitemap.xml, чтобы он не выводил ссылки на страницы, если на них нет контента, т.е. переменная $row[“text”] не нулевая. Тогда у Вас вообще будут чисто уникальные информационные контентные супер-страницы сайта доступны. Только сомневаюсь, что Яндекс Вам медаль даст за заботу об его индексе 🙂

    • Наталья
      (natalya21)

  • 21 августа 2011 г.

  • Что-то у меня Яндекс столько ошибок понаходил в Sitemap. Я не знаю, насколько это критично, но Яндекс считает за ошибку неизвестный тег </b> и <br/>

    Указанный тег не должен встречаться в данном контексте согласно Яндексу. Из-за этого 35 ошибок.

      • Виталий
        (DIAFAN.CMS)


      • 854

    • 22 августа 2011 г.

    • Это откуда у Вас в файле sitemap.xml эти теги???

      У нас там выводится только

      echo '<url>'

      .'<loc>'. BASE_PATH.$l["name"].$link.'</loc>'

      .'<lastmod>'.date('Y-m-d', $row["timeedit"]).'</lastmod>'

      .'</url>';

      Там физически не может быть тегов!!!

      Вы может что-то там правили-тестили и забыли убрать?

      /includes/sitemap.xml.php

      Посмотрите, где там строки вроде

      и удалите их

        • Наталья
          (natalya21)

      • 22 августа 2011 г.

      • Не, если я не в теме, то ничего не правлю без консультации на форуме. А я не в теме. Верстку мне Диафан делал.

        В /includes/sitemap.xml.php строк типа echo “<br/>” нет, но вот мой сайтмэп http://www.krestilnoe.ru/sitemap.xml – там и <br/>, и <b>…

          • Виталий
            (DIAFAN.CMS)


          • 854

        • 23 августа 2011 г.

        • А у Вас “Режим разработки” в настройках сайта включен? Его бы выключить.

            • Наталья
              (natalya21)

          • 23 августа 2011 г.

          • Спасибище большое! Помогло.

    • Кирилл
      (K-S)

  • 07 апреля 2013 г.

  • Здравствуйте! На моем сайте файл sitemap.xml выглядит так:

    http://site.ru/2012-11-14http://site.ru/map/2011-08-01http://site.ru/contacts/2011-09-23http://site.ru/news/2011-09-09http://site.ru/provedenyi-montazhnyie-rabotyi-vivapak/2011-10-16http://site.ru/abonentskogo-obsluzhivanie-konsalt-garant/2011-10-16http://site.ru/abonentskogo-obsluzhivanie-tl-trans/2011-10-16http://site.ru/abonentskogo-obsluzhivanie-bebiko/2011-10-16http://site.ru/provedenyi-montazhnyie-rabotyifeniks-market/2011-10-16http://site.ru/abonentskoe-obsluzhivanie-aero-kamov/2011-10-16http://site.ru/abonentskoe-obsluzhivanie-v2v-gruppa-ekspert-mediarama/2011-10-16http://site.ru/provedenyi-montazhnyie-rabotyi-po-postroeniyu-lvs-partnertrejd/2011-10-16http://site.ru/provedeny_montazhnye_raboty_v_zao_torgovye_tsentry/2011-10-16http://site.ru/abonentskogo_obsluzhivanie_ooo_sbs_optim-best/2011-10-16http://site.ru/abonentskogo_obsluzhivanie_fguz_tsentr_gigieny_i_e/2011-10-16http://site.ru/provedeny_montazhnye_raboty_v_ooo_partnertreyd/2011-10-16http://site.ru/news/1s-programmist-bystryj-start/2013-01-30http://site.ru/news/programmy-obsluzhivanija-ustrojstv-komp’jutera/2013-02-10http://site.ru/news/osobennosti-obsluzhivanija-serverov/2013-03-20http://site.ru/news/proektirovanie-sks/2013-03-25http://site.ru/faq/show1/2011-08-01http://site.ru/faq/show2/2011-08-01http://site.ru/faq/show3/2011-08-01http://site.ru/faq/show4/2011-08-01http://site.ru/faq/show5/2011-08-01http://site.ru/faq/show6/2011-08-01http://site.ru/faq/show7/2011-08-01http://site.ru/faq/show8/2011-08-01http://site.ru/faq/show10/2011-08-01http://site.ru/faq/show11/2011-08-01http://site.ru/tags/eagle/2011-10-13http://site.ru/tags/bird/2011-10-13http://site.ru/tags/yellow/2011-10-13http://site.ru/tags/mouse/2011-10-13http://site.ru/tags/penguin/2011-10-13http://site.ru/tags/spring/2011-10-13http://site.ru/tags/beaver/2011-10-13http://site.ru/tags/purple/2011-10-13http://site.ru/tags/elephant/2011-10-13http://site.ru/tags/butterfly/2011-10-13http://site.ru/tags/fly/2011-10-13http://site.ru/tags/big/2011-10-13http://site.ru/tags/crawl/2011-10-13http://site.ru/photo/extroverts/2011-08-01http://site.ru/photo/introverts/2011-08-01http://site.ru/page2/2011-08-01http://site.ru/reminding/2011-08-01http://site.ru/1s-programming/2012-11-14http://site.ru/lan/2012-11-14http://site.ru/montazh-kabelnih-setei-sks/2012-04-08http://site.ru/price-1/2012-10-05http://site.ru/obsluzhivanie-serverov/2012-11-14http://site.ru/price-2/2012-11-14http://site.ru/about-company/2011-10-16http://site.ru/reference/2012-01-23http://site.ru/contacts39/2012-01-23http://site.ru/systemnii_administrator/2012-11-14http://site.ru/it_outsourcing/2012-11-14

    Как мне его привести в нормальный вид?

      • Виталий
        (DIAFAN.CMS)


      • 854

    • 08 апреля 2013 г.

    • Это нормальный вид. Для браузера. Хотите посмотреть с переносами, смотрите HTML-источник

    • Владимир
      (Chemist)


    • 2
  • 09 апреля 2013 г.

  • Что-то я не понял, у меня нормально в броузере все отображается.

    • Ксения
      (ksushao)

  • 19 декабря 2014 г.

  • CMS формирует вторую страницу категории товаров такого вида: www.site.ru/shop/katalog/page2

    но sitemap формирует ее в виде www.site.ru/page2

    естественно поисковики отдают на это 404 ошибку.

    Как добиться корректного прописывания вторых и последующих страниц в сайтмапе?

      • Валерий Викторович
        (Sherrlok)



      • 155
    • 19 декабря 2014 г.

    • Написать в ТП

        • Виталий
          (DIAFAN.CMS)


        • 854

      • 20 декабря 2014 г.

      • Там у нее 5.0, одна из первых. Этой ошибки нет уже как пару лет

        • Ксения
          (ksushao)

      • 24 декабря 2014 г.

      • Спасибо огромное! ТП решили вопрос.

        Диафан и ТП супер!!!

    • Станислав
      (stas1969)

  • 16 февраля 2017 г.

  • При проверке в мастере

    Вылезает вот такая ошибка. Я так понимаю на пробел ругается перед точкой .html

    Что делать? Как лечить? Где что править?

    На странице в самой где прописывается адрес нет пробела

    В браузерной адресной строке нет пробела

    В index.html тоже нет.

    А в карте есть

      • Dmitry
        (afonnikov10)


      • 244

    • 16 февраля 2017 г.

    • Евгений Михайлович
      (abaimov7)


    • 1
  • 16 марта 2017 г.

  • Ребят, а мне подскажите, у меня все нормально настроено в вебмастере?

    при проверке пишут норм – http://joxi.ru/n2YdpkMCN5OZm6

    а вот тут какие то редиректы – http://joxi.ru/p27Rp5jcax6Jm7

    а в роботсе прописано так – http://joxi.ru/bmoYyWeIZXvXAy

    успокойте меня, все ли нормально?

      • Dmitry
        (afonnikov10)


      • 244

    • 16 марта 2017 г.

    • если сайт c SSL – то в хосте пропиши с https://

    • Алексей
      (alexfender)

  • 07 сентября 2017 г.

  • Добрый день!

    В сайтмапе несуществующие страницы.

    https://perfosklad.ru/sitemap.xml

    <url>

    <loc>

    https://perfosklad.ru/shop/palatki/mobilnye-bani/banya-pokhodnaya-n/

    </loc>

    <lastmod>2016-09-07</lastmod>

    <changefreq>always</changefreq>

    </url>

    <url>

    <loc>

    https://perfosklad.ru/shop/palatki/mobilnye-bani/banya-mobilnaya-s-karkasom/

    </loc>

    <lastmod>2016-09-07</lastmod>

    <changefreq>always</changefreq>

    </url>

    <url>

    <loc>

    https://perfosklad.ru/shop/palatki/kempingovye/palatka-kerri-4-v2/

    </loc>

    <lastmod>2016-09-07</lastmod>

    <changefreq>always</changefreq>

    </url>

    <url>

    Нету на сайте таких страниц, в админке тоже, видимо из демо попали. Но как их убрать?

      • Виталий NVGPRO
        (DIAFAN.CMS)


      • 354


    • 07 сентября 2017 г.

    • Указанные ссылки относятся к каталогу товаров, а не к страницам сайта, которые определяются в административной части сайта, в разделе “Страницы сайта”.

    • Dmitry
      (afonnikov10)


    • 244

  • 07 сентября 2017 г.

  • Какая версия сборки?

      • Алексей
        (alexfender)

    • 07 сентября 2017 г.

    • DIAFAN.CMS версия 6.0

    • Dmitry
      (afonnikov10)


    • 244

  • 07 сентября 2017 г.

  • Тестирование и исправление в админке сайта делали?

    Корзина пустая с удаленными эл-ми от демо?

      • Алексей
        (alexfender)

    • 07 сентября 2017 г.

    • В общем почистил корзину, сделал исправление, ошибок не обнаружено, но что то результата нет

      • Алексей
        (alexfender)

    • 07 сентября 2017 г.

    • Может в базе глянуть?

        • Виталий NVGPRO
          (DIAFAN.CMS)


        • 354


      • 07 сентября 2017 г.

      • В таблице {rewrite} хранятся все псевдоссылки.

          • Алексей
            (alexfender)

        • 08 сентября 2017 г.

        • Хм. Посмотрел, там нет этих ссылок, там вполне адекватные ссылки в этой таблице…

    • Dmitry
      (afonnikov10)


    • 244

  • 07 сентября 2017 г.

  • Кеш удалили?

      • Алексей
        (alexfender)

    • 07 сентября 2017 г.

    • У меня кеширование отключено сейчас, но все равно очистил кеш.

        • Dmitry
          (afonnikov10)


        • 244

      • 07 сентября 2017 г.

      • Тогда если не затрагивали механизмы работы cms пишите в Техподдержку

    • Станислав
      (kytyzov)



    • 4
  • 08 сентября 2017 г.

  • Попробуйте удалить и снова установить модуль “Карта сайта”.

      • Алексей
        (alexfender)

    • 08 сентября 2017 г.

    • Спасибо, это сработало! теперь обновляется динамически сразу при изменении страниц

Новости

  • 13 марта

  • Привет, друзья и партнёры!
    Хоть и поздновато, но новая сборка все же подъехала. DIAFAN.CMS 7.0.0.6 – с ней система станет ещё стабильнее и надежнее.

  • 02 августа 2022 г.

  • Хорошая новость: Diafan стал официальным партнером Яндекс Бизнеса – сервиса для автоматического запуска рекламы в интернете. Теперь у вас есть возможность воспользоваться этим сервисом на выгодных условиях.

  • 20 апреля 2022 г.

  • На днях вышла очередная сборка: DIAFAN.CMS 7.0.0.5

Блоги

  • 3.01.2022

  • Сдавая сайт заказчику, я, как правило, помогаю ему с его наполнением на первых порах. И на данном отрезке развития сайта хорошо видно, как большинство пользователей работают с контентом, т.к. заполняются разделы, пишутся статьи и новости. И наблюдая за типичными ошибками в работе с редактором, я разработал дополнение к визуальному редактору TinyMCE, которое бонусом устанавливал всем своим клиентам. А теперь вот решил описать эти ошибки в данной статье.

Блоги

  • 29.12.2021

  • 2021-ый год доживает свои последние часы, а значит самое время подвести итоги. Все подводят и мы подведем, раз уж есть такая традиция 🙂

    На самом деле, год выдался невероятно тяжелый и напряженный. Ограничения, связанные с пандемией, рост цен поставщиков цифровых услуг, растущая все сильнее и сильнее конкуренция. Но были и события, которыми мы гордимся. По мелочам таких много, но глобальных, масштабных и особенно значимых – всего три. О них и хочется рассказать, подводя итоги года.

Форум

    • Георгий

  • 06:05 19.05.2023

    • Дмитрий

  • 20:05 17.05.2023

    • Елена

  • 20:04 30.04.2023

Finding the sitemap of any website is relatively easy to do and here we will help you to accomplish this mission. We will start with the most common sitemap format which is XML and then cover a few others. First, let’s begin with the basics.

What is a Sitemap?

An XML sitemap is a list of the pages on a website aimed to help the different search engines. It provides important information about the URLs on your website including pages, videos, images, files and what’s their relation. Along with the pages, XML sitemaps also include additional metadata about each URL:

  • last updated date
  • how often it changes and
  • its priority compared to the other pages.

When it comes to SEO best practices, a sitemap should be optimized to include only indexable and quality content. Any broken (404), redirecting or duplicate page inside it could confuse search engines.

The sitemap is like an outline of a website. It’s constructed in a code format and usually looks like this:

SEOcrawl sitemap

Or like this:

Sitemap XML

Why Do You Need to Find a Sitemap?

We have already covered the sitemaps basics, including their main purpose. Let’s now see why we may want to find these files in the first place.

As we discussed above, sitemaps are an irreplaceable and simple way to inform search engines and in particular their crawlers (ex. Googlebot) about the important content on our website.

First of all, you may want to check whether you have an XML sitemap at all. If you have one, the next step is to inspect it and see whether it’s properly created and containing the right information.

Finally, if you don’t have a sitemap, you may want to create one and submit it to search engines. Take into account that XML sitemaps are not mandatory by any means. Still they help search crawlers find, index and ultimately rank new websites and pages in a faster way.

Now it is time to dive deep into the detective work and find those sitemaps!

Ready? Let’s go!

Simple Ways to Find your Sitemap

Let’s start our journey with some of the easiest ways to find the sitemap of a website.

1) Manually Check Common XML Sitemap Locations

One of the most common (and simple) ways to locate the XML sitemap of a website is to
manually check a few standard locations. This is dead simple and all you need to do is enter your website URL in the browser and then try with a few different variations. Let me show you:

  • www.YourWebsiteUrl.com/sitemap.xml

This is the most popular location, but not the only one. Therefore, if we are not lucky with our first attempt, here are a few more quick checks to try:

  • /sitemap_index.xml (which is the index of all the sitemaps in case a website has more than one).

This is the case with our own XML sitemap on this blog. Let me show you:

URL del sitemap SEOcrawl

And here is how it looks like:

Listado de sitemaps de SEOcrawl

Basically, these are all separate sitemap sitemaps divided by the type of posts they have inside.

Now, if we are still unlucky, let’s try some more options:

  • /sitemap-index.xml
  • /sitemap.php
  • /sitemap.txt
  • /sitemap.xml.gz
  • /sitemap/
  • /sitemap/sitemap.xml
  • /sitemapindex.xml
  • /sitemap/index.xml
  • /sitemap1.xml

Note: XML files are only one of the ways to describe a sitemap. There are also RSS and Atom formats.

Hence, we need to add a few more possible sitemap locations:

  • /rss/
  • /rss.xml
  • /atom.xml

We will talk more about them later.

Just to confirm- we should put the domain name of the websites before the “/” while trying the various alternatives.

2) Check the Robots.txt File

If you are still with us, that means you either failed to find the file which is the main purpose of our article or you are just curious and passionate to learn more.

Actually, no matter which is the exact reason, I have good news for you – We will continue our journey with another very simple tip.

Robots.txt is a special file known to SEOs (and programmers as well) which provides useful directives to search engine crawlers. What’s more, this is also the place where you can very often find a link to the sitemap of a website.

The idea is that as search engines visit these robots.txt files, adding a link to the sitemap there, makes perfect sense. That way, it will be easier for them to detect the sitemap in the first place and crawl the website.

Are you ready for another good news?! Here it is- to access the robots.txt file of a website you just need to add /robots.txt to your domain name in the browser and hit “Enter”. This is similar to the previous step where we were adding the different possible sitemap routes.

What works better than a real-life example? See the URL address of our very own robots.txt file:

https://seocrawl.com/robots.txt

It’s a tiny but simple and useful file with some important functions. In case you’ve already opened it, you will be able to see almost instantly the little gem you are looking for- the sitemap file:

Voilà! I promised you it would be easy 🙂

3) Check Google Search Console

Okay, sitemap still not found? No problem! We have more tips for you that will help us find our way.

Let me show you another easy and quick way.

Google Search Console (also known as Webmaster Tools in the past) is one more place to find the path we are looking for. Of course, for this to be possible, you have to be an owner of the website or to have been granted access.

If you meet one of these criteria, the next step is to login to GSC and from the menu on the left to choose Sitemaps:

Sitemaps in Google Search Console

Now, in case the sitemap (or sitemaps) is already submitted by someone else in the past, you will be able to see it right away:

Submitted sitemaps

Along with the sitemap exact URL address, there is additional information like the type of sitemap (index files containing other sitemaps in them or regular sitemaps with the pages of the website), when it was submitted, last read, status and how many URLs are inside.

TIP: If you are serious about SEO and improving your organic website performance, Google Search Console is a must-to-have tool. The insights you can get from it are numerous.

Plus, one added bonus is that having GSC allows you to try our powerful tool- SEOcrawl

4) Check Bing Webmaster Tools

The good news is that Bing Webmaster Tools works pretty much the same way as Google Search Console. It’s not surprising the latter used to be called Google Webmaster Tools as they have a lot in common.

Again, you need to login and then navigate to the left sidebar, where you will have the “Sitemaps” section available.

Sitemaps in Bing Webmaster Tools

Click on it, and in case there was a sitemap/sitemaps already submitted, you will be able to explore them further.

Submited sitemaps in Bing Webmaster Tools

Advanced Ways to Find Your Sitemap

Still with us? Okay, that means you are either still looking for that precious sitemap file location, or you are very brave to enter the advanced section. In both cases, I want to congratulate you for reaching so far and wish you luck 🙂

I promise it won’t be that complicated and scary! Let’s go!

5) Use Google Search Operators

Google search operators (also known as commands) could be very powerful for various SEO goals (ex. finding link building opportunities, content ideas, discovering technical issues, and more). However, in this case, we will use them to find the XML sitemap of the website we are examining.

For that, we will need to take advantage of the “filetype:” command. It could be really useful when we combine it with the “site:” command. Basically, the combination of both will look for specific file types only in the website we want to.

Example: site:chess.com filetype:xml

And here is what this search will bring in Google:

Use Google Search Operators to find sitemaps

Here we have it! All the indexed sitemaps of the website are shown in Google and we can explore them further.

In case there are some irrelevant results showing, you can refine your search even further. This time we will add the “inurl” operator in our arsenal.

For example: site:uefa.com filetype:xml inurl:sitemap

Operator inurl to find sitemaps

Note: as we mentioned above sitemaps could also be text files. To find them, we can do a similar search but with a different extension.

For example: site:WebsiteURL inurl:sitemap filetype:txt

And this will result in the following:

Operator filetype to find sitemaps

TIP: These commands will reveal the location of the sitemap only if it is indexed by Google. Some WP plugins that create sitemaps automatically add the no follow, no index tag to Sitemaps. So, if you end up with no results found, do not worry!

Let us continue with the next idea.

SEO Site checkup

6) Use an Online Tool

Another technique is to try with an online tool like SEO Site Checkup where you only need to paste your website URL and hit Checkup. Then you will get something like this:Note: The way this tool works is by checking the standard sitemap locations we mentioned earlier (sitemap.xml, sitemap1.xml, sitemapindex.xml and so on). Therefore, it may not find your website in other specific cases.

7) Check the CMS of the Website

Depending on the content management system the site is running on, XML sitemaps might be located at different places. The good news is that the most popular CMSes have default locations that you may want to start your search from.

First, we need to identify the CMS of the website. It’s a fairly simple process and we can use both online tools or browser extensions.

For example, one useful addon is Built With which identifies not only the CMS but many more softwares and programs the website is using. Here is how it displays the info you are looking for:

Addon Built With to identify de CMS

If you prefer an online tool, one possible solution is WhatCMS:

What CMS para SEOcrawl

An alternative is CMS Detect:

CMS detect SEOcrawl

Now, when we know the exact CMS, let’s explore some of the most popular content management systems and where they usually keep the XML files.

WordPress

Before 2020, the way sitemaps were created was mainly via plugins. However, nowadays, with the built-in WP functionality, they should be located at /wp-sitemap.xml.

Still, in case the website you are examining, is using a plugin for the creation of the sitemap, you can try with some of the following locations:

  • /sitemap.xml
  • /tag-sitemap.xml
  • /sitemap_index/xml
  • /category-sitemap.xml

Alternatively, you can check the plugin’s settings and find the path there.

Wix, Shopify, Joomla, Squarespace, Magento

The good news is that all these automatically generate the XML sitemaps for their users.
Therefore, the default location (if not modified additionally) is:
/sitemap.xml

With the note that the domain name goes before the “/” part.

BONUS: A Bookmarklet for Instant Sitemap.xml Discovery

In case you are a fan of productivity and saving time from every little task (aren’t all us SEOs like that?!), then you may find a useful quick bookmarklet to instantly check the XML sitemap of a website.

You only need to add this javascript code:

javascript:void(location.href=’http://’ + location.host + ‘/sitemap.xml’)

Bookmark it and every time you click on it will open the Sitemap file in case it’s located in the default /sitemap.xml location.

Quick and easy!

Finding Other Types of Sitemaps

We talked mainly about XML sitemaps as they are the most common format to show crawlers what’s happening on your domain. Still, it’s worth mentioning the other types that can also be found on some websites.

  • HTML. These are usually made to ease the users and they are very helpful especially for larger websites.

For example, Ebay provide their visitors a virtual “map” with the main pages and categories: https://pages.ebay.com/sitemap.html

  • RSS. In some cases websites use an RSS feed as a sitemap which is usually located at: /rss/ or /rss.xml.
  • Atom. The same applies for Atom feed and you can usually find it as: /atom.xml
  • TXT. This is a standard text file as we already discussed one such example. Location: /sitemap.txt

No sitemap? What to Do in This Case?

After going over the different options for finding a sitemap, it’s good to say a few words about what to do if there is no sitemap already created. This will be the case with most of the brand new websites that have been online for a short period. Or some very small and tiny sites.

Also, take into account that not all websites need sitemaps. If the website has just a few pages, you will be doing all right even without one.

Still, if you are willing to create your XML sitemap, you can simply use a plugin compatible with your CMS system. A few good examples for WP are:

  • Rank Math Sitemap Plugin
  • WP Sitemap Plugin
  • Google XML Sitemaps
  • WordPress SEO by Yoast

Alternatively, you can create a sitemap manually or use a crawler to go over your website and export a sitemap for upload.

To Sum Up:

I hope these tips helped you to dive deeper into the world of Sitemaps and you are now more familiar with how they work, why we need them… and of course how to find them.

Let us know in the comments if there is anything else you would like to know about or just to share your experience 🙂

Good luck!

Добавить комментарий