Катим в ТОП 07.12.2023

7 документов по ранжированию выдачи Google в рамках антимонопольного дела

Министерство юстиции США опубликовало несколько новых вещественных доказательств в ходе антимонопольного процесса, включая внутренние презентации Google, документы и электронные письма, связанные с ранжированием сайтов.

1. Какие данные о взаимодействии пользователей с сайтом учитывает Google

2. Как Google распознаёт документы

3. Как Google ранжирует контент

Презентация Google: исследование ранжирования, 16 ноября 2018 (PDF)

4. Как работает поисковый алгоритм Google

5. Какую роль в поиске играют протоколирование и ранжирование

6. Чем различается ранжирование сайтов на мобильных и десктопных устройствах

7. Как работает BERT

Ещё по теме👇

В этих семи документах много информации о ранжировании выдачи Google:

«Все дело в клике» (взаимодействие с пользователем).
Q4 «Обыскать всех!»: работа с документами.
Исследование ранжирования.
«Волшебный» Google.
Протоколирование и ранжирование.
Рассылка по ранжированию.
Ключевые моменты в презентации для Сундара (CEO Google Сундар Пичаи — прим. ред.).

❗️ Это перевод и адаптация статьи Дэнни Гудвина для Search Engine Land. Все документы и скриншоты в статье — на английском языке.

1. Какие данные о взаимодействии пользователей с сайтом учитывает Google

Презентация Google: «Все дело в клике» (взаимодействие с пользователями), 15 мая 2017 (PDF)

Речь идёт о сильно отредактированной презентации, которая была составлена специалистом Google Эриком Леманом. В ней, как и в большинстве других документов, отсутствует полный контекст. Тем не менее она будет интересна SEO‑специалистам.

На слайде «3 столпа ранжирования» Google выделяет три ключевых компонента:

Тело: что документ говорит о себе.
Анкор ссылки: что интернет говорит о документе.
Взаимодействие с пользователями: что пользователи говорят о документе.

Google добавил примечание относительно взаимодействия с пользователями:

«В некоторых местах мы можем использовать клики в качестве замены взаимодействия с пользователем, которое включает клики, внимание к результату, пролистывание карусели и ввод нового запроса».

На слайде «Сигналы взаимодействия с пользователем» Google наглядно показывает взаимосвязь запросов, взаимодействий и результатов поиска, а также результаты по запросу:

Google упоминает конкретные взаимодействия, которые влияют на результаты ранжирования:

чтение;
клики;
пролистывание;
наведение курсора мыши.

В сентябре Леман дал показания в ходе антимонопольного разбирательства о том, что Google использует клики при ранжировании сайтов. Но важно понимать, что отдельные клики сами по себе являются «шумным», то есть не очень надёжным сигналом. Google публично заявил, что использует данные о кликах для обучения, оценки, контролируемых экспериментов и персонализации.

2. Как Google распознаёт документы

Презентация Google: Q4 «Обыскать всех!», 8 декабря 2016 (PDF)

Эта информация из масштабной презентации Q4 «Обыскать всех!», подготовленной Леманом в 2016 году.

На одном из слайдов Google заявляет: «Мы не распознаём документы, а делаем вид, что распознаём».

«Мы просто наблюдаем за реакцией людей на тот или иной документ и запоминаем их ответы».

Далее раскрывается источник «магии» Google:

«Миллиард раз в день люди обращаются к нам с просьбой найти документы, соответствующие их запросу. Если речь не идёт о каких‑то базовых понятиях, то мы практически не смотрим на документы. Мы смотрим на людей. Если документ получает положительную реакцию, он считается релевантным. Если же реакция негативная, то, вероятно, документ неподходящий. Грубо говоря, в этом и заключается весь секрет Google».

Вот как это работает: каждый новый пользователь получает данные о документе, исходя из ответов других пользователей. Затем его взаимодействие с документом становится основой для данных, которые покажут будущим пользователям.

Google объясняет, как «каждый поисковик извлекает пользу из ответов прошлых пользователей... и вносит свой вклад в ответы, которые приносят пользу будущим пользователям»:

«Поиск осуществляется путем индукции. При разработке пользовательского интерфейса НЕДОСТАТОЧНО просто ОБСЛУЖИВАТЬ пользователя. Необходимо разработать взаимосвязи, которые также позволят нам УЧИТЬСЯ у пользователей. Именно так мы предоставляем нужную информацию будущим пользователям, поддерживаем индукцию и иллюзию того, что мы всё понимаем. Заглядывая в будущее: я считаю, что обучение у пользователей станет ключом к ИСТИННОМУ пониманию языка».

В общем, Google смотрит на конечных пользователей и на их взаимодействие с результатами поиска — причём не как на индивидуумов, а как на единое целое.

3. Как Google ранжирует контент

Презентация Google: исследование ранжирования, 16 ноября 2018 (PDF)

Непонятно, кто автор этой презентации, но она содержит несколько интересных моментов.

В ней Google рассказывает о 18 аспектах качества поиска:

актуальность;
качество страницы;
популярность;
свежесть;
локализация;
язык;
централизация;
тематическое разнообразие;
персонализация;
веб‑экосистема;
адаптация под мобильные устройства;
социальная справедливость;
опционализация;
отсутствие порнографии;
отсутствие спама;
авторитет;
конфиденциальность;
пользовательский контроль над проверкой правописания.

Слайд презентации об исследовании ранжирования

Дальше представлены недостатки оценки живого трафика. По сути, Google говорит о том, что клики не являются хорошим сигналом, так как их сложно интерпретировать (как уже было выявлено выше).

«Взаимосвязь между наблюдаемым поведением пользователей и качеством результатов поиска неубедительна. Нам необходим большой трафик, чтобы сделать выводы, а отдельные примеры сложно трактовать».

Данный слайд приводит другой пример ранжирования результатов в поиске Google:

Презентация содержит другие интересные моменты, которые не связаны с ранжированием. Вот что особенно интересно для SEO‑специалиста:

«Изощренные попытки манипулировать результатами поиска носят постоянный характер и хорошо спонсируются. Информация о работе поисковика должна оставаться тайной». (Слайд 5)
«Продолжайте утверждать, что алгоритм работы поиска является тайной информацией. Все, что мы сливаем, будет использовано против нас SEO‑специалистами, патентными троллями, конкурентами и т. д.». (Слайд 10)
«Не обсуждайте использование кликов в поиске — только по служебной необходимости. Google придерживается публичной позиции, но, пожалуйста, не создавайте сами себе трудности». (Слайд 11)

4. Как работает поисковый алгоритм Google

Презентация Google: «Волшебный Google», 30 октября 2017 (PDF)

В этой презентации рассказано, как на самом деле работает алгоритм поиска.

Здесь мы видим, как НЕ работает поиск:

Вот как Google это поясняет:

«Кажется, что поиск работает так:

Мы получаем запрос.
Различные скоринговые системы передают данные.
Мы создаем UX и отправляем его пользователю.

На самом деле поисковая система, разработанная подобным образом, не сможет полноценно функционировать».

На следующем слайде показан настоящий принцип работы поисковика:

Комментарий Google:

«Ключевым моментом является второй поток информации в обратном направлении. Когда люди взаимодействуют с поиском, их действия дают нам представление о мире.

Например, клик может рассказать нам, что изображение оказалось лучше, чем веб‑результат. Или долгий просмотр страницы может означать, что она заинтересовала пользователя. Мы регистрируем эти действия, а затем с помощью скоринговых команд выделяем определенные закономерности».

Далее открывается источник «магии» Google:

«Весь секрет Google заключается в двустороннем диалоге с пользователями. С каждым запросом мы отдаём частичку знаний и получаем знания в ответ. Затем мы отдаём чуть больше и получаем ещё чуть больше взамен. Это не единственный способ получения новой информации, но самый эффективный».

Вот каким образом Google учится на пользовательском взаимодействии:

«Пользователи задают вопросы, а Google на них отвечает. Это наша основная задача, для выполнения которой нам нужно незаметно поменяться ролями с ним. Несколько способов сделать это:

задать косвенный вопрос пользователю,
предоставить необходимую справочную информацию,
дать пользователю возможность сообщить ответ».

На следующем слайде представлены 10 синих ссылок — страница выдачи.

Первая страница выдачи косвенно задаёт пользователю вопрос: «Какой результат лучше?»

Предварительный просмотр результатов даёт необходимые сведения о странице. И ответом на вопрос станет клик на определённую ссылку.

Следующий слайд посвящён поиску изображений:

«Поиск изображений задаёт аналогичный вопрос: „Что вам нравится больше?“ Миниатюры предоставляют справочную информацию, а ответ пользователя регистрируется в виде наведения курсора, щелчка или дальнейшего взаимодействия».

Напоследок поговорим о карте знаний:

«Некоторые карты знаний требуют дополнительного нажатия для открытия. Дополнительное нажатие слева означает, что пользователь хочет увидеть больше результатов и обзор. Справа — у пользователя слишком мало исходной информации. Пользователям сложно принять правильное решение, поэтому нажатия и клики — весьма характерные события в журналах, мы должны наделять каждое это действие смыслом».

Всё об алгоритме Google: как думает поисковая система

5. Какую роль в поиске играют протоколирование и ранжирование

Презентация Google: протоколирование и ранжирование, 8 мая 2020 (PDF)

В данной презентации обсуждается «критическая роль, которую играет протоколирование» в ранжировании и поиске.

Слайд презентации о протоколировании и ранжировании

Этот знакомый слайд вновь называет двусторонний диалог главным секретом успеха Google. Вот что написано в примечаниях ниже:

«Поиск чем‑то напоминает обед в складчину, где каждый приносит своё блюдо к общему столу. Всё работает только потому, что каждый вносит свой небольшой вклад. Аналогичным образом поиск опирается на огромную массу знаний. Но не Google их создаёт. Каждый, кто осуществляет поиск, вносит немного знаний в систему, из которой каждый может извлечь пользу».

Данный слайд посвящён интерпретации поведения пользователей. Далее следует пояснение:

«Журналы с записями о действиях не содержат прямые оценочные суждения относительно того, какой результат поиска был хорошим, а какой плохим. Каким‑то образом нам нужно интерпретировать поведение пользователей, что на деле непросто. Это то, над чем усердно работают специалисты уже более 15 лет.

Это важно потому, что именно оценочные суждения являются основой поиска Google. Если мы можем извлечь из сессии хоть немного больше смысла, то на следующий день мы получим в миллиард раз больше. Вся фишка заключается в том, что вы начинаете с небольшого количества достоверных данных, что „вот это на странице поиска хорошо, это плохо, это лучше, чем то“.

Затем вы смотрите на все связанные с ними модели поведения пользователей и говорите: „Вот как пользователь реагирует на полезный контент! А вот как на плохой!“ Безусловно, все люди разные. Все, на что мы можем опираться, — это статистические корреляции. Никаких гарантий.

Приведём пример. Если человек кликает на три результата поиска, какой из них считается плохим? Скорее всего, все, в противном случае у пользователя не возникла бы необходимость кликать на три результата. Сложность заключается в определении самого перспективного из них».

Наконец, здесь обсуждается, как протоколирование поддерживает ранжирование и поиск. Из примечаний:

«На журналах действий построено множество систем ранжирования. Это не просто традиционные системы, как та, что я демонстрировал раньше, а самые современные системы машинного обучения, многие из которых мы представили на внешнем рынке: RankBrain, RankEmbed и DeepRank.

Веб‑ранжирование — это только часть поиска, но многие поисковые функции используют веб‑результаты для интерпретации запроса и соответствующего ответа. Таким образом, поддержка ранжирования поддерживает поиск в целом. Но и помимо этого, технологии, разработанные в области поиска, распространяются по всей компании — в Ads, YouTube, Play и других платформах.

Итак, я не финансист, но считаю, что огромная часть бизнеса Google завязана на использовании протоколирования при ранжировании».

6. Чем различается ранжирование сайтов на мобильных и десктопных устройствах

Email команды Google по ранжированию Панду Найяку. Тема: Ранжирование сайтов, 11–15 августа, 2014, обновлено 16 августа 2014 (PDF)

В этом письме подробно рассмотрены различия в ранжировании поиска между десктопными и мобильными устройствами, намерениями пользователей и их удовлетворённостью в моменты, когда мобильный трафик начал превосходить десктопный.

Google провел сравнение показателей:

CTR;
ручная доработка;
количество запросов на задачу;
длина запроса (в символах);
длина запроса (в словах);
отказ;
средняя позиция клика;
дубликаты.

И вот что Google решил на основе полученных выводов:

«Мобильные запросы задаются с разными целями, и нам потребуется включить дополнительные сигналы, отражающие эти цели, в свою систему ранжирования. Желательно, чтобы эти сигналы могли правильно обрабатывать сбои на локальном уровне».

Как оптимизировать сайт под мобильные устройства

7. Как работает BERT

Документ Google: «Ключевые моменты в презентации для Сундара», 17 сентября 2019 (PDF)

В этом документе нет ничего особенного и неясно, кто его автор. Нас интересует один пункт о BERT:

«Первые эксперименты с BERT, применённые к нескольким другим областям поиска, включая веб‑ранжирование, предполагают значительные улучшения в понимании запросов, документов и намерений пользователей. Хотя BERT является революционным инструментом, это всего лишь начало скачка в технологиях распознавания естественного языка».

❗️BERT — языковая модель Google, которая предназначена для предобучения языковых представлений с целью их последующего применения в обработке естественного языка.

Ещё по теме👇

Поиск и искусственный интеллект: как это повлияет на SEO

EEAT‑факторы для сайта салона красоты: кейс + чек‑лист

Что такое юзабилити и как его улучшить

Теги:

#google