Google объявил прошлой ночью, что он хочет разработать дополнительный протокол к 30-летнему протоколу robots.txt. Это связано со всеми новыми технологиями генеративного ИИ, которые выпускают Google и другие компании.
Это объявление появилось вскоре после новостей о том, что Open AI получает доступ к платному контенту для своего сервиса ChatGPT. Но я знаю, что многие из вас не удивлены тем, что Google и другие изучают альтернативы robots.txt со всей этой генеративной технологией искусственного интеллекта, распространяющейся по сети.
Сегодня ничего не меняется, все, что Google объявил, это то, что в «ближайшие месяцы» они проведут обсуждения с «сообществом», чтобы придумать новые идеи для нового решения.
Google написал: «Сегодня мы начинаем публичную дискуссию, приглашая членов веб-сообщества и сообществ ИИ высказать свое мнение о подходах к дополнительным протоколам. Мы хотели бы услышать широкий спектр мнений от веб-издателей, гражданского общества, научных кругов и другие области со всего мира, чтобы присоединиться к обсуждению, и мы будем привлекать тех, кто заинтересован в участии, в ближайшие месяцы».
Google добавил, что считает, что «пришло время для сообщества Интернета и ИИ изучить дополнительные машиночитаемые средства для выбора и контроля веб-издателей для новых вариантов использования ИИ и исследований».
Что все это значит прямо сейчас, я не знаю. Но вот несколько ответов на мой твит об этом:
Как насчет разрешения регулярных выражений в robots.txt? Бьюсь об заклад, это решит 75% проблем с директивами сканирования, с которыми сталкиваются SEO-специалисты.
— Эрик Хайкен (@EricHeiken) 6 июля 2023 г.
Я думаю, что он работает нормально, хотя, возможно, через 30 лет он должен стать robots.xml или чем-то еще, поскольку было добавлено много материала, а структурированный файл может быть более подвержен случайным ошибкам.
— Милош Милеуснич (@mileusna) 6 июля 2023 г.
«Теперь, когда мы уже обучили наших LLM всему вашему проприетарному и защищенному авторским правом контенту, мы, наконец, начнем думать о том, чтобы дать вам возможность отказаться от любого вашего будущего контента, который будет использоваться для нашего обогащения». https://t.co/dda8hHQPfq
— Барри Адамс ? (@badams) 6 июля 2023 г.
Гэри Иллиес из Google, много лет работавший над этим протоколом, написал в LinkedIn«Пришло время. Почти 30 лет назад был создан файл robots.txt, и все это время он хорошо служил Интернету. С появлением технологий искусственного интеллекта нам необходимо дополнить его новыми инструкциями (правилами), которые были разработаны специально для приложений искусственного интеллекта».
И Джон Мюллер:
Я очень рад видеть, что это происходит. https://t.co/UTdmeCVwhl
— Джон Мюллер (официальный) · Не #30D (@JohnMu) 6 июля 2023 г.
Сегодня мы начинаем публичное обсуждение, чтобы изучить машиночитаемые средства выбора и контроля веб-издателей для новых вариантов использования ИИ и исследований. Узнайте больше об этом усилии, в том числе о том, как присоединиться к обсуждению, зарегистрировавшись: https://t.co/iF9WNyhN3O
— Google SearchLiaison (@searchliaison) 6 июля 2023 г.
Если вы хотите принять участие, заполните эта форма.
У кого-нибудь из вас есть идеи?
Обсуждение форума на Твиттер.