Отпразднуйте праздники с лучшими статьями SEJ 2023 года.

Наша серия «Праздничные воспоминания» проходит с 21 декабря по 5 января и включает ежедневные чтения о важных событиях, фундаментальных принципах, действенных стратегиях и мнениях лидеров мнений.

2023 год был довольно насыщенным в индустрии SEO, и наши авторы подготовили несколько выдающихся статей, чтобы идти в ногу со временем и отражать эти изменения.

Ознакомьтесь с лучшими книгами 2023 года, чтобы у вас было много поводов для размышлений в преддверии 2024 года.


Когда-то PageRank был в основе поиска – и именно он сделал Google такой империей, которой она является сегодня.

Даже если вы считаете, что поиск вышел из PageRank, нельзя отрицать, что это уже давно широко распространенная концепция в отрасли.

Каждый SEO-специалист должен хорошо понимать, что такое PageRank и каким он остается сегодня.

В этой статье мы рассмотрим:

  • Что такое PageRank?
  • История развития PageRank.
  • Как PageRank произвел революцию в поиске.
  • PageRank панели инструментов и PageRank.
  • Как работает PageRank.
  • Как PageRank передается между страницами.
  • PageRank все еще используется?

Давайте погрузимся.

Что такое PageRank?

PageRank, созданный основателями Google Ларри Пейджем и Сергеем Брином, представляет собой алгоритм, основанный на совокупной относительной силе всех гиперссылок в Интернете.

Большинство людей утверждают, что имя было основано на фамилии Ларри Пейджа, в то время как другие полагают, что «Пейдж» относится к веб-странице. Обе позиции, вероятно, верны, и совпадение, вероятно, было преднамеренным.

Когда Пейдж и Брин учились в Стэнфордском университете, они написали статью под названием: Рейтинг цитируемости PageRank: наведение порядка в сети.

Опубликованная в январе 1999 года статья демонстрирует относительно простой алгоритм оценки прочности веб-страниц.

Изображение с сайта Patents.google.com, апрель 2023 г.патент на PageRank: начальные страницы

Газета впоследствии стала патент в США (но не в Европе, где математические формулы не патентоспособны).

от начала до конца процесса ранжирования страницИзображение с сайта Patents.google.com, апрель 2023 г.от начала до конца процесса ранжирования страниц

Стэнфордский университет владеет патентом и передал его Google. В настоящее время срок действия патента истекает в 2027 году.

процесс определения рейтинга страницыИзображение с сайта Patents.google.com, апрель 2023 г.процесс определения рейтинга страницы

История развития PageRank

Во время своего пребывания в Стэнфорде в конце 1990-х годов Брин и Пейдж изучали методы поиска информации.

ЧИТАТЬ  10 эвристик Якоба Нильсена для оценки юзабилити

В то время использование ссылок для определения того, насколько «важна» каждая страница по отношению к другой, было революционным способом упорядочивания страниц. Это было вычислительно сложно, но ни в коем случае не невозможно.

Идея быстро превратилась в Google, который на тот момент был пескарем в мире поиска.

Некоторые стороны настолько сильно поверили в подход Google, что компания изначально запустила свою поисковую систему, не имея возможности получать доход.

И хотя Google (известный в то время как «BackRub») был поисковой системой, PageRank был алгоритмом, который он использовал для ранжирования страниц в результатах поиска (SERP).

Google танец

Одна из проблем PageRank заключалась в том, что математические вычисления, хотя и простые, требовали итеративной обработки. Расчет выполняется несколько раз для каждой страницы и каждой ссылки в Интернете. На рубеже тысячелетий обработка этой математики занимала несколько дней.

За это время поисковая выдача Google менялась вверх и вниз. Эти изменения часто были беспорядочными, поскольку для каждой страницы рассчитывался новый PageRank.

Это было известно как «Танец Google», и оно, как известно, останавливало SEO-профессионалов того времени каждый раз, когда Google начинал свое ежемесячное обновление.

(Позже «Танец Google» стал названием ежегодной вечеринки, которую Google проводил для экспертов по SEO в своей штаб-квартире в Маунтин-Вью.)

Надежные семена

В более поздней версии PageRank была представлена ​​идея набора «доверенных начальных чисел» для запуска алгоритма, а не присвоения каждой странице в Интернете одинакового начального значения.

Разумный серфер

Другая версия модели представила идею «разумного серфера».

Эта модель предполагает, что PageRank страницы может не распределяться поровну между страницами, на которые она ссылается, но может взвешивать относительную ценность каждой ссылки в зависимости от того, насколько вероятно, что пользователь нажмет на нее.

Падение PageRank

Первоначально считалось, что алгоритм Google не допускает спама, поскольку важность страницы диктуется не только ее содержанием, но и своего рода «системой голосования», создаваемой ссылками на страницу.

Однако доверие Google длилось недолго.

PageRank начал становиться проблематичным по мере роста индустрии обратных ссылок. Поэтому Google удалил его из публичного доступа, но продолжал использовать его в своих алгоритмах ранжирования.

Панель инструментов PageRank была отменена к 2016 году, и в конечном итоге весь публичный доступ к PageRank был ограничен. Но к этому времени Majestic (инструмент SEO), в частности, смог достаточно хорошо соотнести свои собственные расчеты с PageRank.

До января 2017 года компания Google в течение многих лет убеждала профессионалов SEO отказаться от манипулирования ссылками с помощью своей документации «Руководства Google» и советов своей спам-команды, возглавляемой Мэттом Каттсом.

ЧИТАТЬ  Добавить функцию тестирования поиска Google

Алгоритмы Google также менялись за это время.

Компания меньше полагалась на PageRank, и после покупки MetaWeb и ее собственной Knowledge Graph (названной в 2014 году Freebase) Google начала индексировать мировую информацию различными способами.

Рейтинг страницы панели инструментов по сравнению с. Рейтинг страницы

Изначально Google настолько гордился своим алгоритмом, что был рад публично поделиться результатом своих расчетов со всеми, кто хотел его увидеть.

Наиболее заметным примером было расширение панели инструментов для таких браузеров, как Firefox, которое показывало оценку от 0 до 10 для каждой страницы в Интернете.

По правде говоря, PageRank имеет гораздо более широкий диапазон оценок, но от 0 до 10 дает SEO-профессионалам и потребителям возможность мгновенно оценить важность любой страницы в Интернете.

Панель инструментов PageRank сделала алгоритм чрезвычайно наглядным, что также сопровождалось сложностями. В частности, это означало, что стало ясно, что ссылки — это самый простой способ «обыграть» Google.

Чем больше ссылок (или, точнее, чем лучше ссылка), тем выше рейтинг страницы в поисковой выдаче Google по любому целевому ключевому слову.

Это означало, что сформировался вторичный рынок, на котором покупка и продажа ссылок оценивалась на основе PageRank URL-адреса, по которому ссылка была продана.

Эта проблема усугубилась, когда Yahoo запустила бесплатный инструмент под названием Yahoo Search Explorer, который позволил любому человеку начать находить ссылки на любую страницу.

Позже два инструмента — Moz и Majestic — основывались на бесплатном варианте, создавая собственные индексы в Интернете и раздельно оценивая ссылки.

Как PageRank произвел революцию в поиске

Другие поисковые системы в значительной степени полагались на анализ содержимого каждой страницы индивидуально. Эти методы мало что позволяли определить разницу между влиятельной страницей и страницей, просто написанной случайным (или манипулятивным) текстом.

Это означало, что SEO-специалистам было чрезвычайно легко манипулировать методами поиска других поисковых систем.

Алгоритм Google PageRank, таким образом, был революционным.

В сочетании с относительно простой концепцией «нграммыЧтобы обеспечить релевантность, Google нашел формулу успеха.

Вскоре она обогнала основных игроков того времени, таких как AltaVista и Inktomi (которые, среди прочего, работали на MSN).

Работая на уровне страниц, Google также нашел гораздо более масштабируемое решение, чем подход, основанный на «каталогах», принятый Yahoo, а затем и DMOZ – хотя DMOZ (также называемый проектом Open Directory) изначально смог предоставить Google проект с открытым исходным кодом. собственный каталог.

Как работает PageRank

Формула PageRank имеет несколько форм, но ее можно объяснить в нескольких предложениях.

Первоначально каждой странице в Интернете присваивается приблизительный рейтинг PageRank. Это может быть любое число. Исторически PageRank представлялся публике как оценка от 0 до 10, но на практике оценки не обязательно должны начинаться с этого диапазона.

ЧИТАТЬ  Как легко отложенно загружать комментарии в WordPress (метод без кода)

PageRank этой страницы затем делится на количество ссылок со страницы, в результате чего получается меньшая доля.

Затем PageRank распределяется по связанным страницам – и то же самое делается для каждой другой страницы в Интернете.

Затем для следующей итерации алгоритма новая оценка PageRank для каждой страницы представляет собой сумму всех долей страниц, ссылающихся на каждую данную страницу.

Формула также содержит «коэффициент затухания», который был описан как вероятность того, что человек, просматривающий веб-страницы, может вообще перестать пользоваться серфингом.

Перед началом каждой последующей итерации алгоритма предлагаемый новый PageRank уменьшается на коэффициент демпфирования.

Эта методология повторяется до тех пор, пока показатели PageRank не достигнут устойчивого равновесия. Полученные числа затем для удобства обычно транспонировались в более узнаваемый диапазон от 0 до 10.

Один из способов представить это математически:

Формула PageRankИзображение автора, апрель 2023 г.Формула PageRank

Где:

  • PR = PageRank в следующей итерации алгоритма.
  • d = коэффициент демпфирования.
  • j = номер страницы в Интернете (если каждая страница имеет уникальный номер).
  • n=общее количество страниц в Интернете.
  • i = итерация алгоритма (изначально установлено как 0).

Формулу также можно выразить в матричной форме.

Проблемы и итерации формулы

Формула имеет некоторые проблемы.

Если страница не ссылается ни на одну другую страницу, формула не достигнет равновесия.

Таким образом, в этом случае PageRank будет распределяться между каждой страницей в Интернете. Таким образом, даже страница без входящих ссылок может попасть некоторый PageRank – но он не накопится достаточно, чтобы стать значимым.

Еще одна менее документированная проблема заключается в том, что новые страницы, хотя и потенциально более важнее, чем старые страницы, будет иметь более низкий PageRank. Это означает, что со временем старый контент может иметь непропорционально высокий PageRank.

Время существования страницы в алгоритме не учитывается.

Как PageRank перемещается между страницами

Если страница начинается со значения 5 и имеет 10 ссылок, то каждой странице, на которую она ссылается, присваивается 0,5 PageRank (за вычетом коэффициента демпфирования).

Таким образом, PageRank перемещается по Интернету между итерациями.

Когда новые страницы появляются в Интернете, они начинаются с очень небольшого PageRank. Но когда другие страницы начинают ссылаться на эти страницы, их PageRank со временем увеличивается.

PageRank все еще используется?

Хотя публичный доступ к PageRank был закрыт в 2016 году, считается, что этот рейтинг по-прежнему доступен поисковым инженерам Google.

Утечка коэффициентов, используемых Яндексом, показала, что PageRank остался фактором, который он мог использовать.

Инженеры Google предположили, что первоначальная форма PageRank была заменена новой аппроксимацией, для расчета которой требуется меньше вычислительной мощности. Хотя эта формула менее важна для ранжирования страниц Google, она остается постоянной для каждой веб-страницы.

И независимо от того, какие еще алгоритмы Google может использовать, PageRank, вероятно, остается встроенным во многие системы поискового гиганта и по сей день.

Диксон более подробно объясняет, как работает PageRank, в этом видео:



Оригинальные патенты и документы для более глубокого чтения:

Дополнительные ресурсы:


Рекомендованное изображение: VectorMine/Shutterstock



Source link