Актуальность в отношении алгоритмов ранжирования поиска стала представлять интерес для SEO после того, как в недавнем подкасте Google Search Off The Record было упомянуто о существовании основных систем актуальности как части алгоритмов ранжирования, поэтому может быть полезно подумать о том, какими могут быть эти системы и что они означают для SEO.

Не так много известно о том, что может быть частью этих основных систем актуальности, но можно предположить, что это за системы. Документация Google для их коммерческого облачного поиска предлагает определение актуальности, которое, хотя и не находится в контексте их собственной поисковой системы, все же дает полезное представление о том, что Google может иметь в виду, когда говорит о основных системах актуальности.

Вот как это облачная документация определяет актуальность:

«Актуальность относится к релевантности результата поиска исходным условиям запроса».

Это хорошее объяснение взаимосвязи веб-страниц с поисковыми запросами в контексте результатов поиска. Нет смысла усложнять это еще больше.

Как добиться релевантности?

Отправной точкой для понимания того, что может быть компонентом систем актуальности Google, является то, как поисковые системы понимают поисковые запросы и представляют темы в документах веб-страниц.

  • Понимание поисковых запросов
  • Понимание тем

Понимание поисковых запросов

Можно сказать, что понимание того, что имеют в виду пользователи, заключается в понимании темы, которая интересует пользователя. Существует таксономическое свойство того, как люди выполняют поиск, заключающееся в том, что пользователь поисковой системы может использовать неоднозначный запрос, когда на самом деле он имеет в виду что-то более конкретное.

Первой системой искусственного интеллекта, которую развернула Google, была RankBrain, которая была развернута для лучшего понимания концепций, заложенных в поисковых запросах. Слово «концепция» шире слова «тема», поскольку концепции являются абстрактными представлениями. Система, которая понимает концепции в поисковых запросах, может затем помочь поисковой системе возвращать релевантные результаты по правильной теме.

ЧИТАТЬ  Google оценивает созданную искусственным интеллектом статью «Звездные войны» без EEAT

Google объяснил работу RankBrain следующим образом:

«RankBrain помогает нам находить информацию, которую мы не могли найти раньше, более широко понимая, как слова в поиске соотносятся с реальными концепциями. Например, если вы ищете «какова должность потребителя на самом высоком уровне пищевой цепи», наши системы узнают, видя эти слова на разных страницах, что концепция пищевой цепи может быть связана с животными, а не с потребителями-людьми. Понимая и сопоставляя эти слова с соответствующими им концепциями, RankBrain понимает, что вы ищете то, что обычно называют «хищником высшего уровня».

BERT — это модель глубокого обучения, которая помогает Google понимать контекст слов в запросах, чтобы лучше понять общую тему текста.

Понимание тем

Я не думаю, что современные поисковые системы больше используют тематическое моделирование из-за глубокого обучения и искусственного интеллекта. Однако в прошлом поисковые системы использовали метод статистического моделирования под названием тематическое моделирование, чтобы понять, о чем веб-страница, и сопоставить ее с поисковыми запросами. Скрытое распределение Дирихле (LDA) было прорывной технологией середины 2000-х годов, которая помогла поисковым системам понимать темы.

Примерно в 2015 году исследователи опубликовали статьи о нейронной вариационной модели документов (NVDM), которая стала еще более мощным способом представления основных тем документов.

Одна из последних исследовательских работ называется Beyond Yes and No: Improving Zero-Shot LLM Rankers via Scoring Fine-Grained Relevance Labels. Эта исследовательская работа посвящена улучшению использования больших языковых моделей для ранжирования веб-страниц, процессу оценки релевантности. Она включает в себя выход за рамки бинарного ранжирования «да» или «нет» к более точному способу с использованием таких меток, как «Высоко релевантный», «Несколько релевантный» и «Не релевантный».

В данной исследовательской работе говорится:

«Мы предлагаем включить детальные метки релевантности в запрос для ранжировщиков LLM, что позволит им лучше различать документы с разным уровнем релевантности запросу и, таким образом, выводить более точный рейтинг».

Избегайте редукционистского мышления

Поисковые системы выходят за рамки поиска информации и (уже давно) движутся в направлении ответов на вопросы, ситуация, которая ускорилась в последние годы и месяцы. Это было предсказано в статье 2001 года под названием «Переосмысление поиска: превращение дилетантов в экспертов в предметной области», где они предложили необходимость полностью включиться в возвращение ответов на уровне человека.

ЧИТАТЬ  Microsoft Designer: как создавать графику с помощью подсказок искусственного интеллекта и DALL-E | зона Мартех

Статья начинается так:

«Когда пользователи испытывают потребность в информации, они хотят взаимодействовать с экспертом в предметной области, но часто вместо этого обращаются к системе поиска информации, например, к поисковой системе. Классические системы поиска информации не отвечают на информационные потребности напрямую, а вместо этого предоставляют ссылки на (надеюсь, авторитетные) ответы. Успешные системы ответов на вопросы предлагают ограниченный корпус, созданный по запросу экспертами-людьми, что не является ни своевременным, ни масштабируемым. Предварительно обученные языковые модели, напротив, способны напрямую генерировать прозу, которая может отвечать на информационную потребность, но в настоящее время они скорее дилетанты, чем эксперты в предметной области — у них нет истинного понимания мира…»

Главный вывод заключается в том, что применение редукционистского мышления к тому, как Google ранжирует веб-страницы, путем чего-то вроде преувеличенного акцента на ключевых словах, элементах заголовка и заголовках, является саморазрушительным. Базовые технологии быстро движутся к пониманию мира, поэтому, если кто-то думает о системах Core Topicality, то полезно поместить это в контекст, который выходит за рамки традиционных «классических» систем поиска информации.

Методы, которые Google использует для понимания тем на веб-страницах, соответствующих поисковым запросам, становятся все более сложными, и было бы неплохо ознакомиться с тем, как Google делал это в прошлом и как он, возможно, делает это в настоящем.

Главное изображение от Shutterstock/Cookie Studio



Source link