Прощайте, лишние фразы: запустили удаление неявных дублей в Тулбоксе

Добавили новый инструмент, который наводит порядок в семантическом ядре за пару секунд.

Прощайте, лишние фразы: запустили удаление неявных дублей в Тулбоксе

Чистка семантики после сбора — процесс медитативный, но чертовски долгий. Особенно когда нужно выловить фразы, которые выглядят по-разному, но значат одно и то же. Мы решили, что ваше время дороже, и добавили в Тулбокс Удаление неявных дублей. Рассказываем, как это работает.

Что такое неявные дубли и зачем их удалять

Неявные дубли — это запросы, которые состоят из одних и тех же слов, но в разном порядке или с разными окончаниями. Например: «заказать бутерброд», «бутерброд заказать» и «заказать бутерброды».

Для поисковика это одно и то же, а для SEO‑специалиста — лишний шум в проекте, который раздувает бюджет на проверку позиций и мешает собирать чистую аналитику. Инструмент находит такие пары и оставляет в списке только одну, каноническую фразу.

Умный алгоритм и свобода настроек

Инструмент не просто сравнивает слова, а использует стемминг и эвристику. Проще говоря: инструмент «откусывает» у слов окончания и суффиксы, выделяя основу, и понимает, что перед ним дубль.

В настройках можно выбрать:

  • Игнорировать порядок слов. Чтобы фразы «доставка пиццы спб» и «спб доставка пиццы» считались одинаковыми.

  • Игнорировать стоп‑слова. Чтобы алгоритм не спотыкался о предлоги и местоимения.

Инструмент полностью бесплатный и доступен по API.

Интерфейс инструмента в Тулбоксе
Интерфейс инструмента в Тулбоксе
Подписывайтесь на канал Топвизора в Телеграме, чтобы первыми узнавать новости сервиса 🔥

А ещё подключить кешбэк. Подписчикам нашего канала возвращается 1% от всех их трат на платформе.


Как почистить ядро в действующем проекте

Инструмент работает внутри Тулбокса. Чтобы привести в порядок запросы, с которыми уже работаете:

  1. Экспортируйте список запросов из проекта. 

  2. Добавьте его в Тулбокс и после работы инструмента нажмите Импортировать в проект запросы из окна Исключено, обязательно выбрав Переносить дубли.

В окне настроек можно выбрать, что делать с дублями: Пропускать или Переносить. Второй вариант соберёт по всему ядру запросы, которые мы импортируем в проект, и добавит в новую отдельную группу. Уже после можно будет удалить её или выключить, чтобы не тратить лишние деньги на проверку.

Интерфейс настроек при переносе в проект
Интерфейс настроек при переносе в проект
Важный нюанс
Алгоритм не смотрит на частотность запросов. Если важно оставить в ядре самый популярный вариант фразы, сначала проверьте частоту, а потом запускайте чистку дублей.

Попробовать новый инструмент можно по ссылке, а узнать больше подробностей — в Справке.

Как вам обновление? Ставьте робота 🤖, если уже планируете генеральную уборку в своих проектах, или котика 😻, если просто рады полезной фиче!

Читайте также