7 документов по ранжированию выдачи Google в рамках антимонопольного дела
Министерство юстиции США опубликовало несколько новых вещественных доказательств в ходе антимонопольного процесса, включая внутренние презентации Google, документы и электронные письма, связанные с ранжированием сайтов.
В этих семи документах много информации о ранжировании выдачи Google:
-
«Все дело в клике» (взаимодействие с пользователем).
-
Q4 «Обыскать всех!»: работа с документами.
-
Исследование ранжирования.
-
«Волшебный» Google.
-
Протоколирование и ранжирование.
-
Рассылка по ранжированию.
-
Ключевые моменты в презентации для Сундара (CEO Google Сундар Пичаи — прим. ред.).
1. Какие данные о взаимодействии пользователей с сайтом учитывает Google
Презентация Google: «Все дело в клике» (взаимодействие с пользователями), 15 мая 2017 (PDF)
Речь идёт о сильно отредактированной презентации, которая была составлена специалистом Google Эриком Леманом. В ней, как и в большинстве других документов, отсутствует полный контекст. Тем не менее она будет интересна SEO‑специалистам.
На слайде «3 столпа ранжирования» Google выделяет три ключевых компонента:
-
Тело: что документ говорит о себе.
-
Анкор ссылки: что интернет говорит о документе.
-
Взаимодействие с пользователями: что пользователи говорят о документе.
Google добавил примечание относительно взаимодействия с пользователями:
На слайде «Сигналы взаимодействия с пользователем» Google наглядно показывает взаимосвязь запросов, взаимодействий и результатов поиска, а также результаты по запросу:
Google упоминает конкретные взаимодействия, которые влияют на результаты ранжирования:
-
чтение;
-
клики;
-
пролистывание;
-
наведение курсора мыши.
В сентябре Леман дал показания в ходе антимонопольного разбирательства о том, что Google использует клики при ранжировании сайтов. Но важно понимать, что отдельные клики сами по себе являются «шумным», то есть не очень надёжным сигналом. Google публично заявил, что использует данные о кликах для обучения, оценки, контролируемых экспериментов и персонализации.
2. Как Google распознаёт документы
Презентация Google: Q4 «Обыскать всех!», 8 декабря 2016 (PDF)
Эта информация из масштабной презентации Q4 «Обыскать всех!», подготовленной Леманом в 2016 году.
На одном из слайдов Google заявляет: «Мы не распознаём документы, а делаем вид, что распознаём».
Далее раскрывается источник «магии» Google:
Вот как это работает: каждый новый пользователь получает данные о документе, исходя из ответов других пользователей. Затем его взаимодействие с документом становится основой для данных, которые покажут будущим пользователям.
Google объясняет, как «каждый поисковик извлекает пользу из ответов прошлых пользователей... и вносит свой вклад в ответы, которые приносят пользу будущим пользователям»:
В общем, Google смотрит на конечных пользователей и на их взаимодействие с результатами поиска — причём не как на индивидуумов, а как на единое целое.
3. Как Google ранжирует контент
Презентация Google: исследование ранжирования, 16 ноября 2018 (PDF)
Непонятно, кто автор этой презентации, но она содержит несколько интересных моментов.
В ней Google рассказывает о 18 аспектах качества поиска:
-
актуальность;
-
качество страницы;
-
популярность;
-
свежесть;
-
локализация;
-
язык;
-
централизация;
-
тематическое разнообразие;
-
персонализация;
-
веб‑экосистема;
-
адаптация под мобильные устройства;
-
социальная справедливость;
-
опционализация;
-
отсутствие порнографии;
-
отсутствие спама;
-
авторитет;
-
конфиденциальность;
-
пользовательский контроль над проверкой правописания.
Дальше представлены недостатки оценки живого трафика. По сути, Google говорит о том, что клики не являются хорошим сигналом, так как их сложно интерпретировать (как уже было выявлено выше).
Данный слайд приводит другой пример ранжирования результатов в поиске Google:
Презентация содержит другие интересные моменты, которые не связаны с ранжированием. Вот что особенно интересно для SEO‑специалиста:
-
«Изощренные попытки манипулировать результатами поиска носят постоянный характер и хорошо спонсируются. Информация о работе поисковика должна оставаться тайной». (Слайд 5)
-
«Продолжайте утверждать, что алгоритм работы поиска является тайной информацией. Все, что мы сливаем, будет использовано против нас SEO‑специалистами, патентными троллями, конкурентами и т. д.». (Слайд 10)
-
«Не обсуждайте использование кликов в поиске — только по служебной необходимости. Google придерживается публичной позиции, но, пожалуйста, не создавайте сами себе трудности». (Слайд 11)
4. Как работает поисковый алгоритм Google
Презентация Google: «Волшебный Google», 30 октября 2017 (PDF)
В этой презентации рассказано, как на самом деле работает алгоритм поиска.
Здесь мы видим, как НЕ работает поиск:
Вот как Google это поясняет:
«Кажется, что поиск работает так:
-
Мы получаем запрос.
-
Различные скоринговые системы передают данные.
-
Мы создаем UX и отправляем его пользователю.
На самом деле поисковая система, разработанная подобным образом, не сможет полноценно функционировать».
На следующем слайде показан настоящий принцип работы поисковика:
Комментарий Google:
«Ключевым моментом является второй поток информации в обратном направлении. Когда люди взаимодействуют с поиском, их действия дают нам представление о мире.
Например, клик может рассказать нам, что изображение оказалось лучше, чем веб‑результат. Или долгий просмотр страницы может означать, что она заинтересовала пользователя. Мы регистрируем эти действия, а затем с помощью скоринговых команд выделяем определенные закономерности».
Далее открывается источник «магии» Google:
Вот каким образом Google учится на пользовательском взаимодействии:
«Пользователи задают вопросы, а Google на них отвечает. Это наша основная задача, для выполнения которой нам нужно незаметно поменяться ролями с ним. Несколько способов сделать это:
-
задать косвенный вопрос пользователю,
-
предоставить необходимую справочную информацию,
-
дать пользователю возможность сообщить ответ».
На следующем слайде представлены 10 синих ссылок — страница выдачи.
Первая страница выдачи косвенно задаёт пользователю вопрос: «Какой результат лучше?»
Предварительный просмотр результатов даёт необходимые сведения о странице. И ответом на вопрос станет клик на определённую ссылку.
Следующий слайд посвящён поиску изображений:
Напоследок поговорим о карте знаний:
Всё об алгоритме Google: как думает поисковая система
5. Какую роль в поиске играют протоколирование и ранжирование
Презентация Google: протоколирование и ранжирование, 8 мая 2020 (PDF)
В данной презентации обсуждается «критическая роль, которую играет протоколирование» в ранжировании и поиске.
Этот знакомый слайд вновь называет двусторонний диалог главным секретом успеха Google. Вот что написано в примечаниях ниже:
Данный слайд посвящён интерпретации поведения пользователей. Далее следует пояснение:
«Журналы с записями о действиях не содержат прямые оценочные суждения относительно того, какой результат поиска был хорошим, а какой плохим. Каким‑то образом нам нужно интерпретировать поведение пользователей, что на деле непросто. Это то, над чем усердно работают специалисты уже более 15 лет.
Это важно потому, что именно оценочные суждения являются основой поиска Google. Если мы можем извлечь из сессии хоть немного больше смысла, то на следующий день мы получим в миллиард раз больше. Вся фишка заключается в том, что вы начинаете с небольшого количества достоверных данных, что „вот это на странице поиска хорошо, это плохо, это лучше, чем то“.
Затем вы смотрите на все связанные с ними модели поведения пользователей и говорите: „Вот как пользователь реагирует на полезный контент! А вот как на плохой!“ Безусловно, все люди разные. Все, на что мы можем опираться, — это статистические корреляции. Никаких гарантий.
Приведём пример. Если человек кликает на три результата поиска, какой из них считается плохим? Скорее всего, все, в противном случае у пользователя не возникла бы необходимость кликать на три результата. Сложность заключается в определении самого перспективного из них».
Наконец, здесь обсуждается, как протоколирование поддерживает ранжирование и поиск. Из примечаний:
«На журналах действий построено множество систем ранжирования. Это не просто традиционные системы, как та, что я демонстрировал раньше, а самые современные системы машинного обучения, многие из которых мы представили на внешнем рынке: RankBrain, RankEmbed и DeepRank.
Веб‑ранжирование — это только часть поиска, но многие поисковые функции используют веб‑результаты для интерпретации запроса и соответствующего ответа. Таким образом, поддержка ранжирования поддерживает поиск в целом. Но и помимо этого, технологии, разработанные в области поиска, распространяются по всей компании — в Ads, YouTube, Play и других платформах.
Итак, я не финансист, но считаю, что огромная часть бизнеса Google завязана на использовании протоколирования при ранжировании».
6. Чем различается ранжирование сайтов на мобильных и десктопных устройствах
В этом письме подробно рассмотрены различия в ранжировании поиска между десктопными и мобильными устройствами, намерениями пользователей и их удовлетворённостью в моменты, когда мобильный трафик начал превосходить десктопный.
Google провел сравнение показателей:
-
CTR;
-
ручная доработка;
-
количество запросов на задачу;
-
длина запроса (в символах);
-
длина запроса (в словах);
-
отказ;
-
средняя позиция клика;
-
дубликаты.
И вот что Google решил на основе полученных выводов:
Как оптимизировать сайт под мобильные устройства
7. Как работает BERT
Документ Google: «Ключевые моменты в презентации для Сундара», 17 сентября 2019 (PDF)
В этом документе нет ничего особенного и неясно, кто его автор. Нас интересует один пункт о BERT:
Ещё по теме👇
Поиск и искусственный интеллект: как это повлияет на SEO