Как найти файл sitemap своего сайта

Файл «sitemap.xml» генерируется автоматически для всех опубликованных сайтов и доступен по адресу вида: http(s)://имя-сайта/sitemap.xml. В него попадают все страницы сайта.

Примечание:

  • В Google Search Console при добавлении карты сайта указывается имя файла «sitemap.xml» (без слеша и адреса сайта).
  • В Яндекс.Вебмастер указывается полный адрес файла.

Попробуйте прямо сейчас!

Создать сайт

Помогла ли вам статья?

Да
Нет

Статья оказалась полезной для 142 человек

Читайте также

  • Интерфейс uKit
  • Как добавить файл на сайт?
  • Как опубликовать сайт?
  • Тарифы uKit
  • Как добавить свой HTML-код?
  • Что такое SSL и HTTPS?
  • Как отредактировать файл robots.txt?

Обычно sitemap.xml располагается по стандартному адресу domain.com/sitemap.xml но вообще её можно расположить по другому адресу и добавить в Яндекс Вебмастер и Гугл Search Console вручную этот путь.

Вопрос: есть второй вариант и путь нестандартный можно ли как-то узнать есть ли на сайте sitemap.xml или нет? Может запрос в поиске какой-то задать особый?


  • Вопрос задан

    более трёх лет назад

  • 39878 просмотров

Открыть главную сайта, например https://toster.ru и в конце добавить /sitemap.xml — вот так https://toster.ru/sitemap.xml. Если видишь то же, что и у тостера — сайтмапа нет. Если увидешь код с разметкой xml — большая вероятность, что это он. Чтобы подтвердить эту вероятность — надо его прочитать.

Еще вполне может быть, что он физически есть, но криворукость администратора сервера или того, кто работает с ftp не позволяет открывать этот файл, ибо, к примеру нет прав)

Думаю нет. Проблема в том, что сайтмап не попадает в поисковую выдачу, соответственно их нельзя найти ни по каким запросам. Кроме того на них (как правило) нет ссылок с сайта так что по ссылке их тоже не найдешь. Если нет доступа к файлам сайта или вебмастеру – все это выглядит затруднительно.

Пробить все вероятные пути, если путь уникальный то никак

Если адреса не знаете, то никак

Пригласить эксперта

Как вариант – проверить /robots.txt, там обычно указывают директиву Sitemap.

LinkChecker не забудьте крюкнуть “Нравится”


  • Показать ещё
    Загружается…

18 мая 2023, в 01:51

400 руб./за проект

17 мая 2023, в 21:51

800 руб./за проект

17 мая 2023, в 21:34

500 руб./в час

Минуточку внимания

There is no standard, so there is no guarantee. With that said, its common for the sitemap to be self labeled and on the root, like this:

example.com/sitemap.xml

Case is sensitive on some servers, so keep that in mind. If its not there, look in the robots file on the root:

example.com/robots.txt

If you don’t see it listed in the robots file head to Google and search this:

site:example.com filetype:xml

This will limit the results to XML files on your target domain. At this point its trial-and-error and based on the specifics of the website you are working with. If you get several pages of results from the Google search phrase above then try to limit the results further:

filetype:xml site:example.com inurl:sitemap

or

filetype:xml site:example.com inurl:products

If you still can’t find it you can right-click > "View Source" and do a search (aka: “control find” or Ctrl + F) for .xml to see if there is a reference to it in the code.

URL недоступны

Google не удалось просканировать адреса из файла Sitemap. Проверьте, доступны ли URL в нем нашему роботу, с помощью этого инструмента.

Переход по URL не выполнен

Google не удалось просканировать все URL, указанные в файле Sitemap. Возможные причины:

  • При переходе по URL слишком много раз выполняется переадресация, и поисковые роботы Google останавливаются, не достигая цели. Рекомендуем заменить все URL переадресации на адреса непосредственно тех страниц, которые нужно просканировать.
    • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянную переадресацию.
    • Рекомендуем отказаться от переадресации с помощью JavaScript или метатега refresh.
  • Роботам Google не удается просканировать относительные URL в вашем файле Sitemap. По возможности используйте абсолютные ссылки вместо относительных. Например, для перехода на другую страницу своего сайта указывайте URL https://www.example.com/mypage.html, а не просто mypage.html.

Нельзя использовать URL

Некоторые из перечисленных вами URL находятся в другом домене или на более высоком уровне по сравнению с файлом Sitemap.

Более высокий уровень. Если файл расположен по адресу http://www.example.com/mysite/sitemap.xml, то недействительны следующие URL:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – находится в соседнем каталоге (необходимо перейти на более высокий уровень, а затем на более низкий).

Другой домен. Убедитесь, что все URL начинаются с того же домена, в котором хранится ваш файл Sitemap. Например, если файл расположен по адресу http://www.example.com/sitemap.xml, то недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан префикс протокола https вместо http.

Ошибка сжатия

Произошла ошибка при попытке восстановить сжатый файл Sitemap. Выполните повторное сжатие файла (например, с помощью gzip), после чего загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Исправьте это.

Превышен максимальный размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе Sitemap, а затем отправьте нам этот индекс.

Неверное значение атрибута

У атрибута в теге XML недопустимое значение. Проверьте файлы Sitemap и убедитесь, что в них есть все необходимые атрибуты с действительными значениями (согласно техническим требованиям к таким файлам), а также что отсутствуют опечатки.

Неправильно введена дата

Как минимум одна дата в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Введите все даты в одном из допустимых форматов W3C:

2005-02-21 
2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. п.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или ошибки, например имеет префикс htp:// вместо http://.

Убедитесь, что URL в файле Sitemap указаны в правильной кодировке и должным образом экранированы. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, будет ли загружена страница.

Неполные URL в файле индекса Sitemap

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится индекс. Например, если индекс расположен по адресу http://www.example.com/folder1/sitemap_index.xml и указывает на файл sitemap.xml (без символа / впереди), то Google ищет этот файл Sitemap по адресу http://www.example.com/folder1/sitemap.xml. Если найти его не удается, показывается сообщение об ошибке.

Добавьте в индекс Sitemap полные URL всех нужных файлов Sitemap и отправьте его ещё раз.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и отправьте файл Sitemap ещё раз.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки, с которой связана проблема. Сведения об обязательных тегах можно найти в этой статье.

Отсутствует URL значка видео

В некоторых записях о видео нет ссылки на значок. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех значков видео.

Отсутствует название видео

В некоторых записях о видео отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео.

Вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap. Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на индексы.

Удалите записи, указывающие на индексы Sitemap, и повторно отправьте файл.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Зачастую это происходит из-за неэкранированных символов в URL. Во всех файлах XML в любых значениях данных (включая URL) необходимо экранировать символы &, ‘, “, <, > и некоторые другие. Проверьте, правильно ли выполнено экранирование в URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться даже через несколько часов, отправьте файл Sitemap ещё раз.

Слишком много файлов Sitemap

В файле индекса упомянуто более 50 000 файлов Sitemap. Разделите его на несколько, в каждом из которых должно быть указано не более 50 000 файлов Sitemap.

Слишком много URL

В файле Sitemap упомянуто более 50 000 URL. Разделите его на несколько, в каждом из которых должно быть указано до 50 000 адресов. Для удобства можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл.

Чтобы избежать самых частых ошибок XML, проверьте следующее:

  • В файлах Sitemap должны быть правильные заголовки. Например, если файл содержит информацию о видео, заголовок должен быть следующим:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (‘) или двойные (“) кавычки, которые должны быть только прямыми. Обратите внимание, что текстовые редакторы, например Microsoft Word, могут автоматически менять кавычки на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (пример: http://example.com/sitemap.xml), однако этот префикс есть в URL, которые перечислены в файле (пример: http://www.example.com/myfile.html).

Удалите префикс www из всех URL внутри файла.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (пример: http://www.example.com/sitemap.xml), однако этого префикса нет в URL, которые перечислены в файле (пример: http://example.com/myfile.xml).

Добавьте префикс www во все URL внутри файла.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Ниже приведены примеры.

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файлов Sitemap

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с объявления пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.

Указанная проблема не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандарту XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP [код ошибки]

При попытке скачать файл Sitemap произошла ошибка HTTP уровня 400. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Общая ошибка HTTP

Произошла ошибка HTTP, которую невозможно отнести ни к одной из приведенных в этом списке. Вы можете воспользоваться инструментом проверки URL, чтобы воспроизвести ошибку, однако она может быть временной. Подождите немного и посмотрите, будет ли она повторяться при дополнительных попытках сканирования.

Слишком большой значок видео

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google. Подробнее о том, как добавить в файл Sitemap информацию о видео…

Слишком маленький значок видео

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap. Подробнее о том, как добавить в файл Sitemap информацию о видео…

Адреса видео и страницы воспроизведения совпадают

URL видео и страницы проигрывателя, указанные в файле Sitemap для видео, не должны совпадать. Если используются одновременно тег <video:player_loc> и тег <video:content_loc>, то URL в них должны различаться. Подробнее о том, как добавить в файл Sitemap информацию о видео…

URL видео указывает на страницу воспроизведения

URL в теге <video:content_loc> в файле Sitemap для видео указывает на страницу, где размещен проигрыватель. Подробнее о том, как добавить в файл Sitemap информацию о видео…

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию запрещен в файле robots.txt. Воспользуйтесь инструментом проверки URL, чтобы выяснить, на какой именно файл влияет блокировка доступа, и внесите в директивы robots.txt необходимые изменения.

GET https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/sitemaps
 ? [parent_id=<sitemap id (string)>]
 & [limit=<int32>]
 & [from=<sitemap id (string)>]
user-id Тип: int64. ID пользователя. Необходим для вызова любых ресурсов API Яндекс Вебмастера. Чтобы получить его, используйте метод GET /v4/user.
host-id Тип: host id (string). ID сайта. Чтобы получить его, используйте метод GET /v4/user/{user-id}/hosts.
parent_id ID родительского Sitemap.
limit

Количество записей (1-100). Значение по умолчанию: 10.

from

Получить файлы Sitemap, отсчитывая от указанного (исключительно).

В случае успеха сервер возвращает 200 OK и список файлов Sitemap сайта.

{
  "sitemaps": [
    {
      "sitemap_id": "c7-fe:80-c0",
      "sitemap_url": "some url",
      "last_access_date": "2016-01-01T00:00:00,000+0300",
      "errors_count": 1,
      "urls_count": 1,
      "children_count": 1,
      "sources": [
        "ROBOTS_TXT"
      ], ...
      "sitemap_type": "SITEMAP"
    }, ...
  ]
}

Имя Обязательный Тип Описание
sitemap_id Да string ID файла Sitemap.
sitemap_url Да string URL файла Sitemap.
last_access_date Нет datetime Дата последней загрузки файла.
errors_count Да int32 Количество ошибок в файле.
urls_count Да int64 Количество ссылок в файле.
children_count Да int32 Количество дочерних файлов Sitemap.
source Да string (ApiSitemapSource ) Источники, из которых робот узнал об этом файле.
sitemap_type Да string (ApiExplicitVerificationType ) Тип файла Sitemap.
Источник Описание
ROBOTS_TXT Sitemap указан в файле robots.txt сайта.
WEBMASTER Sitemap добавлен пользователем в Яндекс Вебмастере.
INDEX_SITEMAP Sitemap найден в другом (индексном) файле Sitemap.
Тип Описание
SITEMAP Обычный файл Sitemap, содержащий URL страниц сайта.
INDEX_SITEMAP Индексный файл Sitemap, содержащий URL других файлов Sitemap.

Чтобы посмотреть структуру ответа подробнее, нажмите на причину.

Код Причина Описание
200 OK
403

INVALID_USER_ID

ID пользователя, выдавшего токен, отличается от указанного в запросе. В примерах ниже {user_id} указан правильный uid владельца OAuth-токена.

{
  "error_code": "INVALID_USER_ID",
  "available_user_id": 1,
  "error_message": "Invalid user id. {user_id} should be used."
}

<Data>
    <error_code>INVALID_USER_ID</error_code>
    <available_user_id>1</available_user_id>
    <error_message>Invalid user id. {user_id} should be used.</error_message>
</Data>

404 HOST_NOT_VERIFIED

Не подтверждены права на управление сайтом.

{
  "error_code": "HOST_NOT_VERIFIED",
  "host_id": "http:ya.ru:80",
  "error_message": "some string"
}

<Data>
  <error_code>HOST_NOT_VERIFIED</error_code>  
  <host_id>http:ya.ru:80</host_id>
  <error_message>some string</error_message>
</Data>

Добавить комментарий