Что такое сканирование сайта
Сканирование в SEO — это как бы считывание и анализ страницы поисковыми роботами перед тем, как отправить её на индексирование. Давайте разберём процесс с самого начала.
Когда в интернете появляется новая страница, поисковые системы о ней ещё не знают. Её нельзя найти в поиске по запросу. Пользователи могут перейти на неё только по прямой ссылке с другого сайта или с другой страницы этого же сайта.
Страницу можно будет найти только тогда, когда поисковые роботы добавят её в индекс. Но до этого должно произойти следующее:
-
робот должен найти новую страницу;
-
робот должен её просканировать и проанализировать контент.
Это можно представить так:
Краулер находит страницы:
-
через Google Search Console и Яндекс Вебмастер;
-
с помощью счётчиков аналитики Яндекс Метрики и Google Analytics;
-
по ссылкам с уже известных роботу страниц;
-
через карту сайта Sitemap.
Что сканируют роботы:
-
контент страницы: заголовки, описания, текст, картинки и видео;
-
технические параметры и код страницы;
-
ссылки, которые есть на странице.
Собранную информацию робот обрабатывает, разбирает на удобные для базы данных части, и в итоге получается файл с обработанным содержанием и файл с набором ссылок. В таком виде информация передаётся на индексацию.
Теперь, когда пользователь наберёт в поисковой строке запрос, поисковая система посмотрит в индекс, найдёт подходящие запросу страницы, отсортирует их по релевантности и покажет результат выдачи.
Что запомнить
- Сканирование в SEO — это как бы считывание и анализ страницы поисковыми роботами перед тем, как отправить её на индексирование;
- Страницу можно будет найти только тогда, когда поисковые роботы добавят её в индекс. Для этого робот должен найти страницу, просканировать её и проанализировать контент;
- Краулер находит страницы через Google Search Console и Яндекс Вебмастер или карту сайта Sitemap, с помощью счётчиков аналитики Яндекс Метрики и Google Analytics, по ссылкам с уже известных роботу страниц;
- Роботы сканируют контент, технические параметры и код страницы, ссылки, которые есть на ней.