Джон Мюллер из Google ответил на вопрос о llms.txt, предлагаемом стандарте для показы контента веб -сайта агентам и сканерам, преуменьшая его полезность и сравнивая его с Metaly Meta Tag, подтверждая его, подтвердив его.
Llms.txt
Llms.txt сравнивался как robots.txt для крупных языковых моделей, но это на 100% неверно. Основная цель robots.txt — контролировать, как боты ползут веб -сайт. Предложение для llms.txt не о контроле ботов. Это было бы излишним, потому что стандарт для этого уже существует с robots.txt.
Предложение для llms.txt, как правило, заключается в том, чтобы показать контент LLMS с текстовым файлом, который использует формат разметки, чтобы они могли потреблять только основной контент веб -страницы, полностью лишенной рекламы и навигации на сайте. Язык разметки-это читаемый формат человека и машины, который указывает заголовки с знаком фунта (#) и списками со знаком минус (-). Llms.txt делает несколько других вещей, похожих на эту функциональность, и это все, о чем.
Что такое llms.txt:
- Llms.txt не способ контролировать ботов ИИ.
- Llms.txt — это способ показать основной контент для ботов ИИ.
- Llms.txt — это просто предложение, а не широко используемый и принятый стандарт.
Эта последняя часть важна, потому что это связано с тем, что сказал Джон Мюллер из Google:
Llms.txt сравнимо с метагом ключевых слов
Кто -то начал обсуждение Reddit о llms.txt, чтобы спросить, поделился ли кто -нибудь еще свой опыт, что боты ИИ не проверяют свои файлы llms.txt.
Они написали:
«Я отправил в root моего блога файл llm.txt в начале этого месяца, но я пока не вижу никакого влияния на мои журналы Crawl. Просто любопытно узнать, была ли у кого -нибудь система отслеживания, E или просто, если вы взяли на что -то, что происходит после реализации.
Если вы еще не реализовали это, мне любопытно услышать ваши мысли об этом ».
Один человек в этой дискуссии поделился тем, что они содержат более 20 000 доменов и что ни один агенты ИИ или боты загружают файлы llms.txt, только нишевые боты, такие как один из встроенных с этими файлами.
Комментатор написал:
«В настоящее время проводятся около 20 тыс. Доменов. Можно подтвердить, что ни один боты действительно не захватывают их помимо некоторых нишевых пользовательских агентов…»
Джон Мюллер ответил:
«Afaik, ни одна из служб искусственного интеллекта не сказала, что они используют llms.txt (и вы можете сказать, когда вы смотрите на журналы ваших серверов, что они даже не проверяют его). Для меня это сравнимо с мета-тегом ключевых слов-это то, что владелец сайта утверждает, что не так ли, что их сайт прямо на сайте?). Ну, вы можете проверить его.
Он прав, ни одна из основных служб искусственного интеллекта, антроп, Openai и Google не объявила о поддержке предлагаемого стандарта LLMS.TXT. Так что, если ни один из них на самом деле не использует его, то какой смысл?
Мюллер также поднимает то, что файл llms.txt является избыточным, потому что зачем использовать этот файл разметки, если исходное содержимое (и структурированные данные) уже загружено? Бот, который использует llms.txt, должен будет проверить другой контент, чтобы убедиться, что это не спам, так зачем беспокоиться?
Наконец, что может помешать издателю или SEO показать один набор контента в LLMS.TXT для агентов Spam AI и другого набора контента для пользователей и поисковых систем? Таким образом, это слишком легко генерировать спам, по сути, маскировку для LLMS.
В связи с этим очень похоже на метатеги из ключевых слов, которые ни одна поисковая система использует, потому что было бы слишком отрывочным, чтобы доверять сайту, что на самом деле речь идет об этих ключевых словах, и поисковые системы в настоящее время лучше и более изощренны в отношении разбора контента, чтобы понять, о чем он.
Прочитайте обсуждение LinkedIn здесь:
Показанное изображение от Shutterstock/Jemastock