Чистка семантики после сбора — процесс медитативный, но чертовски долгий. Особенно когда нужно выловить фразы, которые выглядят по-разному, но значат одно и то же. Мы решили, что ваше время дороже, и добавили в Тулбокс Удаление неявных дублей. Рассказываем, как это работает.
Что такое неявные дубли и зачем их удалять
Неявные дубли — это запросы, которые состоят из одних и тех же слов, но в разном порядке или с разными окончаниями. Например: «заказать бутерброд», «бутерброд заказать» и «заказать бутерброды».
Для поисковика это одно и то же, а для SEO‑специалиста — лишний шум в проекте, который раздувает бюджет на проверку позиций и мешает собирать чистую аналитику. Инструмент находит такие пары и оставляет в списке только одну, каноническую фразу.
Умный алгоритм и свобода настроек
Инструмент не просто сравнивает слова, а использует стемминг и эвристику. Проще говоря: инструмент «откусывает» у слов окончания и суффиксы, выделяя основу, и понимает, что перед ним дубль.
В настройках можно выбрать:
-
Игнорировать порядок слов. Чтобы фразы «доставка пиццы спб» и «спб доставка пиццы» считались одинаковыми.
-
Игнорировать стоп‑слова. Чтобы алгоритм не спотыкался о предлоги и местоимения.
Инструмент полностью бесплатный и доступен по API.
А ещё подключить кешбэк. Подписчикам нашего канала возвращается 1% от всех их трат на платформе.
Как почистить ядро в действующем проекте
Инструмент работает внутри Тулбокса. Чтобы привести в порядок запросы, с которыми уже работаете:
-
Экспортируйте список запросов из проекта.
-
Добавьте его в Тулбокс и после работы инструмента нажмите Импортировать в проект запросы из окна Исключено, обязательно выбрав Переносить дубли.
В окне настроек можно выбрать, что делать с дублями: Пропускать или Переносить. Второй вариант соберёт по всему ядру запросы, которые мы импортируем в проект, и добавит в новую отдельную группу. Уже после можно будет удалить её или выключить, чтобы не тратить лишние деньги на проверку.
Алгоритм не смотрит на частотность запросов. Если важно оставить в ядре самый популярный вариант фразы, сначала проверьте частоту, а потом запускайте чистку дублей.
Попробовать новый инструмент можно по ссылке, а узнать больше подробностей — в Справке.
Как вам обновление? Ставьте робота 🤖, если уже планируете генеральную уборку в своих проектах, или котика 😻, если просто рады полезной фиче!
Читайте также
- Топвизор‑Журнал 2:0: теперь статьи можно не только читать, но и слушать, а ещё ставить котиков в реакциях
- Новый инструмент в коллекции Топвизора — Проверка релевантности в Яндексе и Google 👑
- В Топвизоре появилось отслеживание колдунщиков (SERP Features) в Google 🔮
- Встречайте новый инструмент в Тулбоксе — Подбор слов 🔥
- В Проверке позиций Топвизора появилась новая фича — массовая перепроверка запросов 📊