Microsoft опубликовала новую патентную заявку под названием Классификация надежности веб-контента (США 20230350956 А1). Кажется, этот патент описывает, как определить оценку надежности веб-сайта или части контента на веб-сайте для использования в поиске Bing.
Конечно, вам нужно иметь в виду, что тот факт, что у поисковой компании есть патент, не означает, что патент используется сегодня или когда-либо.
Я не писатель-патентовед, как покойный великий Билл Славски, поэтому не буду притворяться, что делаю это. Но вот аннотация:
Описанная здесь технология присваивает оценку надежности веб-контенту, например веб-сайту или его части. В одном аспекте результатом технологии является высокая оценка надежности и низкая оценка надежности веб-контента. Высокая оценка надежности означает соответствие сайтам с высокой надежностью, а низкая оценка надежности означает соответствие сайтам с низкой надежностью. Оценка высокой надежности может быть получена путем первой идентификации онлайн-контента высокой надежности в сжатом веб-графе. На первой итерации высокая оценка надежности исходных сайтов используется для оценки онлайн-контента, связанного с исходными сайтами. На высоком уровне, чем больше ссылок происходит из источников с высокой надежностью, тем выше оценка надежности связанного контента. Оценка низкой надежности аналогична, но вместо входящих ссылок с сайтов с высокой надежностью используются исходящие ссылки на сайты с низкой надежностью.
Гленн Гейб заметил это и разместил на своем сайте. Икс:
Интересный патент -> Microsoft хочет подтвердить ваши источники
«Microsoft хочет запатентовать систему «классификации надежности веб-контента», которая «присваивает оценку надежности» определенным веб-сайтам (или разделам веб-сайта)». pic.twitter.com/sWLZxNAaz0
— Гленн Гейб (@glenngabe) 6 ноября 2023 г.
Что может сделать этот показатель надежности? «Показатель надежности можно использовать для блокировки контента, ранжирования контента, предоставления предупреждений о контенте и выбора источника для ответа на вопрос, а также для других целей».
Как он определяет, является ли что-то надежным? Вот несколько цитат:
- «Данные о трафике могут указывать на то, популярен ли источник, но популярность — это не то же самое, что надежность.
- Обработку естественного языка можно использовать для определения того, является ли онлайн-контент грамматическим, но грамматика — это не то же самое, что надежность.
- Настоящая технология определяет надежный контент, используя экспертную оценку небольшого объема веб-контента путем итеративного распространения этих оценок на другой контент на основе того, как веб-контент связан.
- Взаимодействие с пользователем также может быть использовано.
В этом патенте также говорится о «исходных сайтах», используемых для определения того, что является надежным. «Показатель высокой надежности генерируется путем первого выявления высоконадежного онлайн-контента в веб-графе. Эти первоначально оцененные сайты можно назвать исходными сайтами. Рейтинги исходных сайтов могут быть взяты из авторитетных списков известных надежных поставщиков контента», — говорится в нем. .
Это лишь часть этого патента, надеюсь, вам понравится его читать.
Обсуждение на форуме Икс.