пятница, 3 июня 2022 г.

На этой неделе мы представили алгоритмическое усовершенствование, которое идентифицирует документы, в которых элемент заголовка написан на языке или графике, отличном от их содержимого, и выбирает заголовок, похожий на язык и графику документа. Это основано на общем принципе, согласно которому заголовок документа должен быть написан на языке или графике его основного содержания. Это одна из причин, по которой мы можем выйти за рамки элементов заголовка для заголовков веб-результатов.

Многоязычные названия

Многоязычные заголовки повторяют одну и ту же фразу на двух разных языках или сценариях. Самый популярный шаблон — добавление английской версии к исходному тексту заголовка.

Биография Гитанджали — Биография Гитанджали на хинди

В этом примере заголовок состоит из двух частей (разделенных дефисом), и они выражают одно и то же содержание на разных языках (хинди и английском). Хотя название на обоих языках, сам документ написан только на хинди. Наша система обнаруживает такое несоответствие и может использовать только текст заголовка на хинди, например:

Биография Гитанджали

Заголовки на латинице

Транслитерация — это когда контент записывается с одного языка на другой язык, использующий другую письменность или алфавит. Например, рассмотрим название страницы для песни, написанной на хинди, но транслитерированной для использования латинских символов, а не родного письма деванагари для хинди:

jis desh me холи кхели джати хай

В таком случае наша система пытается найти альтернативный заголовок, используя скрипт, преобладающий на странице, который в данном случае может быть:

Страна, где играют Холи

Резюме

Как правило, наши системы используют элемент заголовка страницы. В случае многоязычных или транслитерированных заголовков наши системы могут искать альтернативы, соответствующие преобладающему языку страницы. Вот почему рекомендуется предоставлять заголовок, соответствующий языку и/или сценарию основного содержимого страницы.

ЧИТАТЬ  Как начать бизнес по дизайну веб-сайтов

Мы приветствуем дальнейшие отзывы в нашем Форумвключая существующие темы по этой теме в
Английский
а также
Японский.



Source link