Google незаметно обновил документацию Центра поиска Google, отметив, что теперь они индексируют файлы .csv.

Это открывает новый способ сканирования, а если издатель не хочет, чтобы его файлы .csv сканировались, это может означать обновление файла robots.txt, чтобы исключить эти файлы.

Значения, разделенные запятыми (CSV)

Файлы со значениями, разделенными запятыми (CSV), представляют собой текстовые файлы, в которых сохраняются данные в табличном формате, который можно отобразить в виде электронной таблицы.

Файлы CSV содержат данные в виде обычного текста. Это означает, что файлы CSV не содержат элементов стиля, таких как шрифты, а также изображений или активных ссылок.

Они полезны для таких вещей, как загрузка списка URL-адресов для сканирования в такое программное обеспечение, как Screaming Frog.

Но они также полезны для организации данных в электронной таблице.

Индексирование CSV-файлов — это новинка

Возможность Google индексировать файлы CSV — это новая функция, поскольку поиск файлов CSV в Google по типу файла в настоящее время не возвращает файлы CSV.

Поиски, подобные приведенным ниже, в настоящее время не возвращают файлы CSV:

  • тип файла:csv сайт:.gov
  • Тип файла:csv Сайт:.edu
  • Тип файла:csv Сайт:.com

Google уже косвенно использовал файлы CSV

Что-то любопытное в индексировании CSV-файлов Google заключается в том, что при поиске в наборе данных Google уже использовались файлы CSV, но, по-видимому, только тогда, когда они описаны со структурированными данными.

Документация по структурированным данным набора данных в старой документации Google для разработчиков (видимый на Archive.org) утверждает, что файлы CSV являются приемлемым стандартом для использования в функциях поиска набора данных.

ЧИТАТЬ  Google заявляет, что сайты, на которых появилось полезное обновление контента, могут улучшиться со следующим основным обновлением

Использование табличных данных в качестве внешнего вида поиска восходит к 2018 году, когда Google объявил, что они будут показывать такие данные в поиске, когда данные сопровождаются структурированными данными.

Согласно исходной документации:

«Наборы данных легче найти, если вы предоставляете вспомогательную информацию, такую ​​как их название, описание, создатель и форматы распространения, которые предоставляются в виде структурированных данных…

Вот несколько примеров того, что можно квалифицировать как набор данных:

  • Таблица или CSV-файл с некоторыми данными.
  • Организованная коллекция таблиц
  • Файл в собственном формате, содержащий данные.
  • Коллекция файлов, которые вместе составляют некоторый значимый набор данных.
  • Структурированный объект с данными в каком-либо другом формате, который вы, возможно, захотите загрузить в специальный инструмент для обработки.
  • Изображения, фиксирующие данные
  • Файлы, относящиеся к машинному обучению, такие как обученные параметры или определения структуры нейронной сети.
  • Все, что для вас выглядит как набор данных».

Google обновил вышеуказанную документацию в 2022 году и перенаправил ее в новую документацию Search Central.

Обновленная документация проясняет, что Google полагается на структурированные данные при использовании файлов CSV при поиске в наборах данных.

Но будет ли это изменение означать, что Google в конечном итоге будет сканировать файлы CSV и использовать их для отображения в результатах поиска (в дополнение к табличным данным, записанным в структурированных данных)?

Это то, что текущая документация объясняет сегодня:

«Наборы данных легче найти, если вы предоставляете вспомогательную информацию, такую ​​как их название, описание, форматы создания и распространения, в виде структурированных данных.

Подход Google к обнаружению наборов данных использует Schema.org и другие стандарты метаданных, которые можно добавлять на страницы, описывающие наборы данных…

Вот несколько примеров того, что можно квалифицировать как набор данных:

Таблица или CSV-файл с какими-то данными…»

Google индексирует CSV, связанный с недавним обновлением?

Определение обновления основного алгоритма — это когда Google вносит «значительные» и «широкие изменения» в свой основной алгоритм.

ЧИТАТЬ  Beeper Mini теперь предлагает пользователям Android возможность общаться с помощью iMessage на iOS

Возможно, это совпадение, что индексирование файлов CSV и обновление основного алгоритма произошли практически в одно и то же время.

Но, возможно, стоит задуматься о том, улучшил ли Google свою систему сканирования, чтобы иметь возможность индексировать CSV, или такая возможность уже существовала.

Прочтите обновленный список индексируемых типов файлов:

Типы файлов, индексируемые Google

Прочтите документацию по набору данных Google Search Central:

Структурированные данные набора данных (Dataset, DataCatalog, DataDownload).

Рекомендованное изображение: Shutterstock/Джейн Келли



Source link