Второй день Google Search Central Live Apac 2025 начался с короткой связи с глубоким погружением в предыдущий день в ползание, прежде чем перейти к индексации.

Черри ПРОМАВИН Открыт, пропустив нас через то, как Google анализирует HTML и выделяет ключевые этапы индексации:

  1. HTML SAINING.
  2. Рендеринг и выполнение JavaScript.
  3. Дедупликация.
  4. Извлечение функций.
  5. Извлечение сигнала.

Это установило тему до конца дня.

Cherry отметил, что Google сначала нормализует необработанный HTML в DOM, затем ищет элементы заголовка и навигации и определяет, какой раздел содержит основной контент. Во время этого процесса он также извлекает такие элементы, как REL = Canonical, Hreflang, Links и Anchors, а также теги Meta-Robots.

«Нет никаких предпочтений между адаптивными веб -сайтами по сравнению с динамическими/адаптивными веб -сайтами. Google не пытается обнаружить это и не имеет преимущественного взвешивания». — Черри Пурмавин

Ссылки остаются центральными в структуре Интернета, как для Discovery, так и для ранжирования:

«Ссылки по -прежнему являются важной частью Интернета и используются для обнаружения новых страниц и для определения структуры сайта, и мы используем их для ранжирования». — Черри Пурмавин

Контроль индексации с правилами роботов

Гэри Иллиес Уточнить, где robots.txt и Robots -Meta теги вписываются в поток:

  • Robots.txt управляет тем, что сканеры могут принести.
  • Meta Robot Tags Управляйте тем, как эти извлеченные данные используются вниз по течению.

Он выделил несколько менее известных директив:

  • никто: Эквивалентно noindex,nofollow объединено в одно правило. Есть ли выгода для этого? Хотя функционально идентично, использование одной директивы вместо двух может упростить управление тегами.
  • Notranslate: Если установить, Chrome больше не будет предлагать переводить страницу.
  • noimageindex: Также относится к видео -активам.
  • Недоступно после: Несмотря на то, что его представлены инженерами, которые с тех пор пошли дальше, это все еще работает. Это может быть полезно для снижения постов в блоге, таких как сделки с ограниченным времени и рекламные акции, поэтому они не сохраняются в функциях искусственного интеллекта Google и рискам вводить пользователей или нанести ущерб восприятию бренда.
ЧИТАТЬ  На скольких экранах вы можете транслировать Disney+? | Цифровые тенденции

Понимание того, что на странице

Гари Иллиес подчеркнул, что основной контент, определенный в соответствии с руководящими принципами качества Google, является наиболее важным элементом в ползании и индексации. Это может быть текст, изображения, видео или богатые функции, такие как калькуляторы.

Он показал, как перемещение темы в основную область контента может повысить рейтинг.

В одном примере перемещение ссылок на «Hugo 7» с боковой панели в центральное (основное) содержание привело к измеримому увеличению видимости.

«Если вы хотите ранжировать за определенные вещи, поместите эти слова и темы в важные места (на странице)». — Гэри Иллиес

Токенизация для поиска

Вы не можете сбросить необработанный HTML в индекс, доступный для поиска в масштабе. Google разбивает его на «токены», отдельные слова или фразы, и хранит их в своем индексе.

Первая система сегментации HTML восходит к Токио Инженерному офису Google 2001 года, и те же методы токенаризации питают свои продукты ИИ, поскольку «Зачем заново изобрести колесо».

Когда основной контент имеет тонкое или низкое значение, то, что Google помечает как «мягкий 404», он отмечен аннотацией центральной части, чтобы показать, что этот дефицит лежит в основе страницы, а не только в периферийном разделе.

Обработка веб -дублирования

Изображение от автора, июль 2025 г.

Cherry Prommawin объяснил дедупликацию в трех областях фокуса:

  1. Кластеризация: Использование перенаправлений, сходства контента и REL = канонического для групповых дубликатов страниц.
  2. Проверки контента: Контрольные суммы, которые игнорируют шаблон и ловят много страниц мягких ошибок. Обратите внимание, что мягкие ошибки могут сбить целый кластер.
  3. Локализация: Когда страницы различаются только по локали (например, через гео -переосмысление), Hreflang зажигает их без штрафа.

Она контрастировала с постоянными и временными перенаправлениями: оба играют роль в ползании и кластеризации, но только постоянные перенаправления влияют на то, что URL выбирается в качестве канонического кластера.

Google сначала приоритет риска угона, второй пользовательский опыт и сигналы владельца сайта (например, ваш rel = канонический) третий при выборе репрезентативного URL.

Геотаргетинг

Геотаргезинг позволяет вам сигнализировать Google, какую страну или регион ваш контент наиболее актуален, и он работает иначе, чем простой языковой таргетинг.

Prommawin подчеркнул, что вам не нужно скрывать дублированный контент на двух конкретных странах; Hreflang будет справляться с этими альтернативами для вас.

ГеотаргетингИзображение от автора, июль 2025 г.

Если вы обслуживаете дублированный контент на нескольких региональных URL -адресах без локализации, вы рискуете смущать как скалеров, так и пользователей.

ЧИТАТЬ  Google срезает новую подсказку cookie в Chrome

К геотарже эффективно убедитесь, что в каждой версии есть уникальный, локализованный контент, адаптированный к ее конкретной аудитории.

Основной геотаргетинг сигнализирует Google Использование:

  1. Странный домен высшего уровня (CCTLD): Домены, такие как .sg или .au указывают на целевую страну.
  2. Аннотации Hreflang: Использовать Теги, заголовки HTTP или записи Sitemap для объявления языка и региональных альтернатив.
  3. Местоположение сервера: IP -адрес или место хостинга вашего сервера может выступать в качестве географического подсказка.
  4. Дополнительные местные сигналытакой как Язык и валюта на странице, ссылки с других региональных веб -сайтов и сигналы из вашего местного бизнес -профиля, все это усиливает ваш целевой регион.

Объединяя эти сигналы с действительно локализованным контентом, вы помогаете Google служить правильной версии вашего сайта для нужных пользователей и избегаете ловушек непреднамеренных дублирующих кластеров.

Структурированные данные и носители

Гэри Иллиес представил фазу извлечения признаков, которая работает после дедупликации и является вычислительно дорогой. Он начинается с HTML, затем начинается отдельная, асинхронная индексация медиа для изображений и видео.

Если ваш HTML находится в индексе, но ваши средства массовой информации — это просто означает, что медиа -трубопровод все еще работает.

Сессии в этом треке включали:

  • Структурированные данные с Уильямом Прабаво.
  • Использование изображений с Яном Хуангом.
  • Привлечение пользователей с видео с Уильямом Прабаво.

Вопросы и ответы на схему

Наметка схемы может помочь Google понять отношения между сущностями и обеспечить функции, управляемые LLM.

Но чрезмерная или избыточная схема только добавляет раздувание страницы и не имеет дополнительных преимуществ рейтинга. И схема не используется как часть процесса ранжирования.

Расчет сигналов

Во время извлечения сигнала, также часть индексации, Google вычисляет смесь:

  • Косвенные сигналы (ссылки, упоминания на других страницах).
  • Прямые сигналы (слов и размещения на страницах).
Расчет сигналовИзображение от автора, июль 2025 г.

Иллиес подтвердил, что Google все еще использует PageRank внутри. Это не точный алгоритм из белой бумаги 1996 года, но он носит одно и то же имя.

Обработка спама

Системы Google идентифицируют около 40 миллиардов страниц спама каждый день, основанные на их «спам -мозге» на основе LLM.

Обработка спамаИзображение от автора, июль 2025 г.

Кроме того, Иллиес подчеркнул, что EAET не является индексацией или рейтингом. Это объяснительный принцип, а не вычисленный показатель.

ЧИТАТЬ  Логотип теста поиска Google выровнен по левому краю на панели знаний

Решая, что индексируется

Выбор индекса сводится к качеству, определяемый как сочетание достоверности и утилиты для конечных пользователей. Страницы отбрасываются из индекса для четких отрицательных сигналов:

  • noindex Директивы.
  • Истек срок действия или ограниченный по времени контент.
  • Мягкие 404 и проскальзывающие дубликаты.
  • Чистый спам или нарушения политики.

Если страница ползала, но не проиндексирована, это средство улучшения качества контента.

Внутреннее связывание может помочь, но только в том случае, поскольку это делает страницу по -настоящему более полезной. Цель Google — вознаградить, ориентированные на пользователя улучшения, а не манипулирование сигналом.

Google не волнует, если ваши изображения сгенерированы AI

Изображения, сгенерированные AI, стали обычным явлением в маркетинге, образовании и дизайне. Эти визуальные эффекты производятся моделями глубокого обучения, обученных массовым коллекциям изображений.

Во время сеанса Хуан рассказал, что Google не заботится о том, генерируются ли ваши изображения ИИ или людьми, если они точно и эффективно передают информацию или рассказывают историю, которую вы намерены.

Пока изображения понятны, их происхождение ИИ не имеет значения. Основной целью является эффективное общение с вашей аудиторией.

Хуан подчеркнул пример изображения ИИ, используемого командой Google в течение первого дня конференции, который при тщательном осмотре имеет некоторые визуальные ошибки, но в качестве «опоры» его задача состояла в том, чтобы представлять график и не был основным содержанием слайда, поэтому эти ошибки не имеют значения.

Google Search Central Apac 2025: все с 2 -го дняИзображение от автора, июль 2025 г.

Мы можем принять аналогичный подход к нашему использованию изображений, сгенерированных AI. Если изображение передает сообщение и не является основным содержанием страницы, незначительные проблемы не приведут к наказанию и не будут использования изображений, сгенерированных AI в целом.

Изображения должны пройти быстрый обзор человека, чтобы выявить очевидные ошибки, которые могут предотвратить ошибки производства.

Постоянный надзор остается необходимым для поддержания доверия к вашим визуальным эффектам и защиты честности вашего бренда.

Google Trends API объявил

Наконец, Даниэль Вайсберг и Хадас Якоби обнародовали новый API Google Trends (Alpha). Ключевые особенности нового API будут включать в себя:

  • Последовательно масштабируемые данные о интересах поиска, которые не возвращаются при изменении запросов.
  • Пятилетнее прокатное окно, обновленное до 48 часов назад, для сезонных и исторических сравнений.
  • Гибкая агрегация времени (еженедельно, ежемесячно, ежегодно).
  • Регион и подрегионные расстройства.

Это открывает мир программного анализа тенденций с надежными, сопоставимыми показателями с течением времени.

Это завершает второй день. Завтра мы освещаем последний день в третьем дне в Google Search Central Live, с более широкими новостями и пониманием.

Больше ресурсов:


Избранное изображение: Дэн Тейлор/Соль. Агентность



Source link