Google объявил об обновлении документации своего сканера, добавив дополнительную информацию о кэшировании, которая должна помочь лучше понять, как оптимизировать работу сканера Google. Следуя новым рекомендациям по реализации правильных заголовков HTTP-кэширования, оптимизаторы и издатели могут повысить эффективность сканирования и оптимизировать ресурсы сервера.

Обновленная документация сканера

В документации сканера теперь есть раздел, в котором объясняется, как сканеры Google используют механизмы HTTP-кэширования, которые помогают экономить вычислительные ресурсы как издателей, так и Google во время сканирования.

Дополнения к документации значительно расширяют предыдущую версию.

Механизмы кэширования

Google рекомендует включать кеширование с такими заголовками, как ETag и If-None-Match, а также (при необходимости) Last-Modified и If-Modified-Since, чтобы сигнализировать об изменении содержимого. Это может помочь сократить ненужное сканирование и сэкономить ресурсы сервера, что является выигрышем как для издателей, так и для сканеров Google.

В новой документации говорится:

«Инфраструктура сканирования Google поддерживает эвристическое HTTP-кэширование, как это определено стандартом HTTP-кэширования, в частности, через заголовок запроса ETag-ответ и If-None-Match, а также заголовок запроса Last-Modified response- и If-Modified-Since».

Предпочтение Google для предпочтения ETag

Google рекомендует использовать ETag вместо Last-Modified, поскольку ETag менее подвержен ошибкам, таким как проблемы с форматированием даты, и обеспечивает более точную проверку контента. Он также объясняет, что произойдет, если будут обработаны оба заголовка ответа ETag и Last-Modified:

«Если в ответе HTTP присутствуют поля заголовка ответа ETag и Last-Modified, сканеры Google используют значение ETag, как того требует стандарт HTTP».

В новой документации также указано, что другие директивы кэширования HTTP не поддерживаются.

Переменная поддержка для сканеров

В новой документации поясняется, что поддержка кэширования у разных сканеров Google различается. Например, Googlebot поддерживает кэширование для повторного сканирования, а Storebot-Google имеет ограниченную поддержку кэширования.

ЧИТАТЬ  Обзор Flash: впечатляющее растение для лица супергероя | цифровые тренды

Гугл объясняет:

«Отдельные сканеры и сборщики Google могут использовать или не использовать кеширование, в зависимости от потребностей продукта, с которым они связаны. Например, Googlebot поддерживает кеширование при повторном сканировании URL-адресов для поиска Google, а Storebot-Google поддерживает кеширование только при определенных условиях».

Руководство по реализации

В новой документации Google рекомендуется обращаться за помощью к поставщикам хостинга или CMS. Он также предполагает (но не требует), чтобы издатели установили поле max-age в заголовке ответа Cache-Control, чтобы сканеры знали, когда сканировать определенные URL-адреса.

Совершенно новый пост в блоге

Google также опубликовал новую запись в блоге:

Сканирование в декабре: HTTP-кэширование

Прочтите обновленную документацию:

HTTP-кэширование

Рекомендованное изображение: Shutterstock/Asier Romero



Source link