На сеансе Google SEO-клиники Дуй Нгуен из Google из команды качества поиска ответил на вопрос о ссылках на спам-сайтах и о том, как с ними связано доверие.
Было интересно, как гуглеры сказали, что будут защищать текстовый сигнал привязки. Это не то, что обычно обсуждается.
Завоевать доверие Google — важный аспект для многих издателей и SEO-специалистов.
Существует идея, что «доверие» помогает веб-сайту правильно индексироваться и ранжироваться.
Также хорошо известно, что не существует метрики «доверия», что иногда сбивает с толку некоторых участников поискового сообщества.
Как можно доверять алгоритму, если он ничего не измеряет?
Гуглеры на самом деле не отвечают на этот вопрос, но есть патенты и исследовательские работы, которые дают представление.
Содержание
Google не доверяет ссылкам со спам-сайтов
Человек, задавший вопрос в SEO-офис, спросил:
«Если домен оштрафован, повлияет ли это на исходящие ссылки?»
Сотрудник Google Дуй Нгуен ответил:
«Я предполагаю, что под «наказанием» вы подразумеваете, что домен был понижен в соответствии с нашими алгоритмами спама или ручными действиями.
Как правило, да, мы не доверяем ссылкам с сайтов, которые, как нам известно, являются спамом.
Это помогает нам поддерживать качество наших якорных сигналов».
доверие и ссылки
Гуглеры говорят о доверии, и ясно, что они говорят о том, что их алгоритмы доверяют чему-то или не доверяют чему-то.
В данном случае речь идет не о том, чтобы не учитывать ссылки на спам-сайтах, особенно не о том, чтобы не учитывать сигнал анкорного текста.
Сообщество SEO говорит о «укреплении доверия», но в данном случае речь идет о том, чтобы не создавать спам.
Как Google определяет, что веб-сайт является спамом?
Не каждый веб-сайт наказывается или подвергается ручному действию. Некоторые веб-сайты даже не индексируются, и это работа Google Spam Brain, платформы искусственного интеллекта, которая анализирует веб-страницы на разных этапах, начиная со времени сканирования.
Spam Brain Platform работает как:
- Ориентировочный гейткипер
Spam Brain блокирует веб-сайты во время сканирования, включая контент, обнаруженный через консоль поиска и карты сайта. - Отслеживает проиндексированный спам
Spam Brain также отлавливает спам, который был проиндексирован в то время, когда сайты рассматриваются для ранжирования.
Платформа Spam Brain работает, обучая ИИ знаниям Google о спаме.
Google прокомментировал, как работает Spam Brain:
«Объединив наши глубокие знания о спаме с искусственным интеллектом, мы смогли в прошлом году разработать собственный антиспамовый искусственный интеллект, который невероятно эффективно выявляет как известные, так и новые тенденции спама».
Мы не знаем, что»знание спамаGoogle говорит, но есть различные патенты и исследовательские работы по этому поводу.
Тем, кто хочет углубиться в эту тему, следует прочитать статью, которую я написал о концепции алгоритмов ранжирования по расстоянию между ссылками, методе ранжирования ссылок.
Я также опубликовал исчерпывающую статью о нескольких исследовательских работах, описывающих алгоритмы, связанные со ссылками, которые могут объяснить, что такое алгоритм Penguin.
Хотя многие патенты и исследовательские работы относятся к последнему десятилетию, с тех пор поисковые системы и университетские исследователи ничего больше не публиковали.
Важность этих патентов и исследовательских работ заключается в том, что они могут оказаться в алгоритме Google в других формах, таких как обучение и ИИ, такие как Spam Brain.
Патент, обсуждаемый в статье о ранжировании ссылок, описывает, как процесс присваивает баллы ранжирования для страниц на основе расстояний между набором доверенных «домашних страниц» и страницами, на которые они ссылаются. Исходные сайты — это отправные точки для определения того, какие сайты нормальные, а какие нет (например, спам).
Интуиция подсказывает, что чем дальше сайт от исходного сайта, тем больше вероятность того, что этот сайт можно будет считать спамом. Эта часть, касающаяся определения спама по расстоянию между ссылками, описана в научных статьях, цитируемых в статье Penguin, на которую я ссылался ранее.
Патент (Ранжируйте страницы, используя расстояния в диаграмме веб-ссылок), пояснил:
«Затем система назначает длину ссылкам на основе свойств ссылок и свойств страниц, прикрепленных к ссылкам.
Затем система вычисляет кратчайшие расстояния от набора начальных страниц до каждой страницы в наборе страниц на основе длин ссылок между страницами.
Затем, на основе рассчитанных кратчайших расстояний, система определяет рейтинг каждой страницы в группе страниц».
Уменьшенный граф ссылок
В том же патенте также упоминается то, что известно как сокращенный граф соединений.
Но это не просто патент, в котором обсуждается графен с уменьшенными связями. Сокращенные графы ссылок также исследовались за пределами Google.
Граф ссылок похож на карту Интернета, составленную путем сопоставления ссылок.
В свернутой диаграмме ссылок некачественные ссылки и связанные с ними страницы удаляются.
Остается так называемый редуцированный граф связей.
Вот цитата из упомянутого выше патента Google:
«Сокращенный граф ссылок
Обратите внимание, что ссылки, участвующие в k кратчайших путях от семян к страницам, представляют собой подграф, содержащий все ссылки, упорядоченные по «потоку» от семян.
Хотя этот подграф содержит гораздо меньше ссылок, чем исходный граф ссылок, k кратчайших путей от семян к каждой стороне в этом подграфе имеют ту же длину, что и пути в исходном графе.
… Кроме того, ранговый поток в каждую сторону можно проследить до ближайших k семян по путям на этой поддиаграмме».
Google не доверяет ссылкам с оштрафованных сайтов
Совершенно очевидно, что Google не доверяет ссылкам с оштрафованных сайтов.
Но иногда вы не знаете, была ли страница оштрафована Spam Brain или помечена как спам.
Перед попыткой получить ссылку с сайта рекомендуется провести небольшое исследование, чтобы убедиться, что сайту нельзя доверять.
На мой взгляд, сторонние метрики не следует использовать для таких бизнес-решений, поскольку расчеты, используемые для создания оценки, скрыты.
Если сайт уже ссылается на потенциально спам-сайты, которые сами имеют входящие ссылки с потенциально платных ссылок, таких как PBN (сети частных блогов), скорее всего, это спам-сайт.
Избранное изображение с сайта Shutterstock/Krakeimages.com
Ознакомьтесь с графиком работы отдела SEO: