Прежде чем приступить к работе, важно прислушаться к этому предупреждению: впереди математика! Если от выполнения математических вычислений и изучения уравнений у вас кружится голова или вам хочется сесть и съесть целый торт, приготовьтесь (или возьмите торт). Но если вам нравится математика, если вам нравятся уравнения и вы действительно верите, что k=N (вы садист!), о, эта статья вас заинтересует, поскольку мы исследуем гибридный поиск более глубоко.
В течение многих лет (десятилетий) SEO жило в едином цикле обратной связи. Мы оптимизировали, ранжировали и отслеживали. Все имело смысл, потому что Google предоставил нам табло. (Я упрощаю, но суть вы поняли.)
Теперь помощники ИИ находятся над этим слоем. Они суммируют, цитируют и отвечают на вопросы еще до того, как произойдет клик. Ваш контент может быть опубликован, перефразирован или проигнорирован, и ничего из этого не отобразится в аналитике.
Это не делает SEO устаревшим. Это означает, что новый вид видимости теперь работает параллельно с ним. В этой статье представлены идеи о том, как измерить эту видимость без кода, специального доступа или разработчика и как оставаться на том, что мы действительно знаем.
Содержание
Почему это важно
Поисковые системы по-прежнему привлекают почти весь измеримый трафик. только Google ручки почти 4 миллиарда поисков в день. Для сравнения, Perplexity сообщает: общий годовой объем запросов составляет около 10 млрд.
Так что да, помощники по сравнению с ними все еще маленькие. Но они формируют то, как интерпретируется информация. Вы уже можете увидеть это, когда ChatGPT Search или Perplexity отвечает на вопрос и ссылается на его источники. Эти цитаты показывают, каким блокам контента (кускам) и доменам доверяют модели в настоящее время.
Проблема в том, что у маркетологов нет собственной информационной панели, которая могла бы показать, как часто это происходит. Google недавно добавил данные о производительности режима AI в консоль поиска. По данным Google документацияПоказы, клики и позиции в режиме AI теперь включаются в общий тип поиска «Интернет».
Это включение имеет значение, но оно смешано. В настоящее время нет способа изолировать трафик режима AI. Данные есть, просто сложены в большую корзину. Никакого процентного разделения. Нет линии тренда. Еще нет.
Пока эта видимость не улучшится, я предлагаю использовать прокси-тест, чтобы понять, где помощники и поиск совпадают, а где расходятся.
Две поисковые системы, два способа найти
Традиционные поисковые системы используют лексический поиск, при котором они напрямую сопоставляют слова и фразы. Доминирующий алгоритм BM25 уже много лет используется в таких решениях, как Elasticsearch и подобные системы. Он также используется в современных поисковых системах.
Помощники ИИ полагаются на семантический поиск. Вместо точных слов они отображают смысл через вложенияматематические отпечатки текста. Это позволяет им находить концептуально связанные отрывки, даже если точные слова различаются.
Каждая система допускает разные ошибки. Лексический поиск пропускает синонимы. Семантический поиск может связывать несвязанные идеи. Но в сочетании они дают лучшие результаты.
Внутри большинства гибридных поисковых систем эти два метода объединяются с помощью правила, называемого Взаимное слияние рангов (РРФ). Вам не обязательно уметь его запускать, но понимание концепции поможет вам интерпретировать то, что вы будете измерять позже.
RRF на простом английском языке
Гибридный поиск объединяет несколько ранжированных списков в один сбалансированный список. Математика, лежащая в основе этого слияния, — RRF.
Формула проста: балл равен единице, разделенной на k плюс ранг. Это записывается как 1 ÷ (k + ранг). Если элемент появляется в нескольких списках, вы суммируете эти оценки.
Здесь «ранг» означает позицию элемента в этом списке, начиная с 1 как верхней. «k» — константа, которая сглаживает разницу между предметами высшего и среднего ранга. Большинство систем обычно используют значение около 60, но каждая может настраивать его по-своему.
Стоит помнить, что векторная модель не ранжирует результаты путем подсчета совпадений слов. Он измеряет, насколько близко каждый документ встраивание заключается в встраивании запроса в многомерное пространство. Затем система сортирует эти оценки сходства от самого высокого к самому низкому, эффективно создавая ранжированный список. Это похоже на рейтинг в поисковых системах, но оно определяется математика расстоянийнет частота термина.

Давайте сделаем это осязаемым с помощью небольших цифр и двух ранжированных списков. Один из BM25 (релевантность ключевых слов) и один из векторной модели (семантическая релевантность). Для ясности мы будем использовать k = 10.
Документ А занимает первое место в BM25 и третье место в списке векторов.
Из БМ25: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Из векторного списка: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Сложите их: 0,0909 + 0,0769 = 0,1678.
Документ Б занимает 2-е место в BM25 и 1-е место в списке векторов.
Из БМ25: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Из векторного списка: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Сложите их: 0,0833 + 0,0909 = 0,1742.
Документ С занимает 3-е место в BM25 и 2-е место в списке векторов.
Из БМ25: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Из векторного списка: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Сложите их: 0,0769 + 0,0833 = 0,1602.
Документ Б здесь побеждает, поскольку занимает высокие места в обоих списках. Если вы повысите k до 60, различия уменьшатся, что приведет к более гладкой и менее тяжелой смеси.
Этот пример носит чисто иллюстративный характер. Каждая платформа настраивает параметры по-своему, и ни одна общедоступная документация не подтверждает, какие значения k использует тот или иной движок. Думайте об этом как об аналогии того, как несколько сигналов усредняются.
Где на самом деле живет эта математика
Вам никогда не придется кодировать его самостоятельно, поскольку RRF уже является частью современных стеков поиска. Вот примеры систем такого типа от их основных поставщиков. Если вы прочитаете все это, вы получите более глубокое понимание того, как такие платформы, как Perplexity, делают то, что они делают:
Все они следуют одному и тому же базовому процессу: получение с помощью BM25, получение с помощью векторов, оценка с помощью RRF и объединение. Приведенная выше математика объясняет концепцию, а не буквальную формулу внутри каждого продукта.
Наблюдение за гибридным поиском в дикой природе
Маркетологи не могут видеть эти внутренние списки, но мы можем наблюдать, как системы ведут себя на поверхности. Хитрость заключается в том, чтобы сравнить то, что ранжирует Google, с тем, что цитирует помощник, а затем измерить совпадение, новизну и последовательность. Эта внешняя математика — эвристика, показатель наглядности. Это не та математика, которую платформы рассчитывают внутри себя.
Шаг 1. Соберите данные
Выберите 10 запросов, которые важны для вашего бизнеса.
Для каждого запроса:
- Запустите его в Google Поиске и скопируйте 10 лучших органических URL-адресов.
- Запустите его в помощнике, который показывает цитаты, например Perplexity или ChatGPT Search, и скопируйте каждый цитируемый URL-адрес или домен.
Теперь у вас есть два списка для каждого запроса: Google Top 10 и Assistant Citations.
(Имейте в виду, что не каждый помощник отображает полные цитаты, и не каждый запрос их запускает. Некоторые помощники могут суммировать, вообще не перечисляя источники. В этом случае пропустите этот запрос, поскольку его просто невозможно измерить таким образом.)
Шаг 2. Посчитайте три вещи
- Пересечение (I): сколько URL-адресов или доменов отображается в обоих списках.
- Новинка (Н): сколько цитат помощников не входят в топ-10 Google.
Если у ассистента шесть цитат и три перекрытия, N = 6 − 3 = 3. - Частота (Ф): как часто каждый домен появляется во всех 10 запросах.
Шаг 3. Превратите подсчеты в быстрые показатели
Для каждого набора запросов:
Общий коэффициент видимости (SVR) = I ÷ 10.
Это показывает, какая часть топ-10 Google также появляется в цитатах помощника.
Коэффициент видимости уникальных помощников (UAVR) = N ÷ общее количество цитирований помощников по этому запросу.
Это показывает, сколько нового материала вводит ассистент.
Количество повторных цитирований (RCC) = (сумма F для каждого домена) ÷ количество запросов.
Это отражает то, насколько последовательно домен цитируется в разных ответах.
Пример:
Топ-10 Google = 10 URL-адресов. Цитаты помощника = 6. Три пересекаются.
I = 3, N = 3, F (например.com) = 4 (появляется в четырех ответах помощника).
СВР = 3 ÷ 10 = 0,30.
Uср = 3 ÷ 6 = 0,50.
ПКК = 4 ÷ 10 = 0,40.
Теперь у вас есть числовое представление о том, насколько близко помощники отражают результаты поиска или расходятся с ним.
Шаг 4. Интерпретируйте
Эти оценки ни в коем случае не являются отраслевыми ориентирами, а просто предлагают вам отправную точку. Не стесняйтесь вносить изменения по мере необходимости:
- Высокий SVR (> 0,6) означает, что ваш контент соответствует обеим системам. Лексическая и семантическая релевантность синхронизированы.
- Умеренный SVR (0,3–0,6) с высоким RCC предполагает, что ваши страницы семантически надежны, но нуждаются в более четкой разметке или более сильных ссылках.
- Низкий SVR (<0,3) при высоком UAVR показывает, что ассистенты доверяют другим источникам. Это часто сигнализирует о проблемах со структурой или ясностью.
- Высокий RCC у конкурентов указывает на то, что модель неоднократно цитирует их домены, поэтому стоит изучить подсказки по схеме или дизайну контента.
Шаг 5. Действуйте
Если SVR низкий, улучшите заголовки, ясность и удобство сканирования. Если RCC низкий для вашего бренда, стандартизируйте поля автора, схему и временные метки. Если UAVR высок, отслеживайте эти новые домены, поскольку они, возможно, уже обладают семантическим доверием в вашей нише.
(Этот подход не всегда работает так, как описано. Некоторые помощники ограничивают количество цитат или варьируют их в зависимости от региона. Результаты могут различаться в зависимости от географии и типа запроса. Относитесь к этому как к наблюдательному упражнению, а не как к жесткой схеме.)
Почему эта математика важна
Эта математика дает маркетологам возможность количественно оценить согласие и разногласие между двумя поисковыми системами. Это диагностическая математика, а не ранжирующая математика. Он не говорит вам, почему помощник выбрал источник; он говорит вам, что это происходило и насколько последовательно.
Эта закономерность является видимой границей невидимой гибридной логики, действующей за кулисами. Думайте об этом как о наблюдении за погодой, наблюдая за движением деревьев. Вы не моделируете атмосферу, а просто считываете ее эффекты.
Работа на странице, помогающая гибридному поиску
Как только вы увидите, как проявляются совпадения и новизна, следующим шагом будет ужесточение структуры и ясности.
- Пишите короткими блоками утверждений и доказательств по 200–300 слов.
- Используйте четкие заголовки, маркеры и устойчивые анкоры, чтобы BM25 мог найти точные термины.
- Добавляйте структурированные данные (часто задаваемые вопросы, инструкции, продукт, техническая статья), чтобы векторы и помощники понимали контекст.
- Сохраняйте стабильность канонических URL-адресов и отмечайте обновления контента с метками времени.
- Публикация канонических PDF-версий по темам с высоким уровнем доверия; помощники часто сначала ссылаются на фиксированные, поддающиеся проверке форматы.
Эти шаги поддерживают как сканеры, так и LLM, поскольку они используют один и тот же язык. структура.
Отчетность и исполнительное планирование
Руководители не столько заботятся о BM25 или внедрении, сколько о прозрачности и доверии.
Ваши новые показатели (SVR, UAVR и RCC) могут помочь перевести абстрактную информацию во что-то измеримое: какая часть вашего существующего SEO-присутствия влияет на обнаружение ИИ, и где вместо этого упоминаются конкуренты.
Сопоставьте эти результаты с общими показателями эффективности режима AI в Search Console, но помните: в настоящее время вы не можете отделить данные режима AI от обычных веб-кликов, поэтому рассматривайте любую оценку, специфичную для AI, как направленную, а не окончательную. Также стоит отметить, что по-прежнему могут существовать региональные ограничения на доступность данных.
Однако эти ограничения не делают математику менее полезной. Они помогают сохранить реалистичность ожиданий, а также дают вам конкретный способ обсудить с руководством прозрачность, основанную на искусственном интеллекте.
Подведение итогов
Разрыв между поиском и помощниками — не стена. Это скорее разница в сигнале. Поисковые системы ранжируют страницы после того, как станет известен ответ. Помощники извлекают фрагменты еще до того, как появится ответ.
Математика в этой статье представляет собой представление о том, как наблюдать этот переход без инструментов разработчика. Это не математика платформы; это доверенное лицо маркетолога, которое помогает сделать невидимое видимым.
В конце концов, основы остаются прежними. Вы по-прежнему оптимизируете ради ясности, структуры и авторитетности.
Теперь вы можете измерить, как этот авторитет перемещается между системами ранжирования и поисковыми системами, и делать это с реалистичными ожиданиями.
Эта видимость, подсчитанная и контекстуализированная, позволяет современному SEO оставаться привязанным к реальности.
Дополнительные ресурсы:
Этот пост был первоначально опубликован на Дуэйн Форрестер декодирует.
Рекомендованное изображение: Роман Самборский/Shutterstock