Октябрьские рабочие часы Google по поисковой оптимизации ответили, можно ли использовать автоматически переведенный контент, который был проверен человеком и подвергнут лишь незначительным изменениям редактирования.

Эпизод Google SEO-Office Hours

В этом выпуске видеовстречи в рабочее время используется новый формат, в котором вопросы задаются в письменном виде, а затем даются ответы.

На вопросы отвечают гуглеры Лиззи Сассман и Джон Мюллер.

Лиззи Сассман (англ.@окайлиззи) — технический писатель, который «заботится» о документации Google Site Central.

В отличие от предыдущего живого формата, когда зрители задавали вопросы в режиме реального времени, этот новый формат исключает возможность задавать дополнительные вопросы.

Это приводит к ответам, которые полностью повторяют документацию Google, без возможности попросить разъяснений.

Человек, задавший вопрос, был обеспокоен тем, что их контент был машинным переводом с другого языка.

Они наняли редакторов-людей для проверки контента, который регулярно считался приемлемым и требовал лишь незначительных изменений.

Естественно, человек, задающий вопрос, обеспокоен тем, достаточно ли «незначительных правок», чтобы сделать контент приемлемым для Google.

Лиззи Сассман ответила на вопрос, внимательно изучив документацию Google.

Возможно, ответ можно было бы уточнить с помощью дополнительного вопроса, чтобы определить, достаточно ли хороши «незначительные изменения».

В конце концов, вопрос прямо спрашивает, достаточно ли незначительных изменений для Google.

Возможно, подразумеваемый ответ заключается в том, чтобы использовать ваше суждение о качестве переведенного контента.

Судите сами.

Приемлем ли умеренно отредактированный контент с машинным переводом?

Они спросили:

«Сайт использует машинный перевод, чтобы публиковать сообщения на других языках.

Контент проверяется переводчиками-людьми, и они часто остаются довольны качеством после незначительных изменений.

Это нормально для Google?»

Лиззи Сассман из Google ответила:

«Что ж, приятно слышать, что переводчики-люди довольны, и это совершенно нормально для Google, если в процессе рецензирования участвует человек. Это ключ.

На что вы должны обращать внимание, так это на то, чтобы качество оставалось хорошим и хорошо работало для людей, которые читают контент».

В ответе конкретно не говорится, допустимы ли незначительные правки, а только то, что если «человеки-переводчики» хорошо с этим справляются, то это должно быть хорошо для Google.

ЧИТАТЬ  Новое исправление и часто задаваемые вопросы для видеообзоров для профилей компаний в Google.

Может ли быть так, что Google не проверяет, переведен ли контент автоматически, а полагается на стандартные сигналы качества контента?

Мы не знаем.

Новый формат рабочих часов не дает лицу, задающему вопрос, возможность задать дополнительный вопрос.

Политика Google в отношении спама

В документации для разработчиков Google о спам-контенте упоминаются инструменты автоматического перевода текста и прямо говорится, что это спам, за исключением случаев, когда в нем участвует человеческий фактор.

Это то, что В документации Google указано:

«Примеры спам-контента, сгенерированного автоматически, включают:

Текст, переведенный с помощью автоматизированного инструмента, без проверки или проверки человеком перед публикацией».

Таким образом, из опубликованных рекомендаций Google ясно, что до тех пор, пока человек редактирует машинно-переведенный контент, Google будет с этим согласен.

Кроме того, в видеоролике Google Office-Hours от апреля 2022 года Джон Мюллер упомянул, что контент, созданный ИИ, считается спамом, а затем упомянул контент с автоматическим переводом.

Мюллер рассказал об инструментах для создания контента с помощью ИИ и сравнил их с инструментами автоматического перевода.

В 24:55 минутная отметка в видеоролике Office-Hours от апреля 2022 года Мюллер сказал:

«Я думаю, я не знаю, со временем, может быть, это что-то, что будет развиваться, в том смысле, что это станет больше инструментом для людей.

Это похоже на то, как если бы вы использовали машинный перевод в качестве основы для создания переведенной версии веб-сайта.

Но вы все равно… в основном работаете с этим вручную».

Почему человек должен проверять автоматически переведенный контент?

Как упоминалось выше, Google заботится о том, чтобы контент, на который ссылаются страницы результатов поисковой системы (SERP), был высокого качества и чтобы пользователи были им довольны.

ЧИТАТЬ  Результаты поиска Google могут быть вредными и опасными в некоторых случаях

Что-то, что не обсуждалось, это то, что переведенный контент содержит подписи, которые может идентифицировать алгоритм обнаружения перевода.

Обнаружение контента с машинным переводом исследуется уже много лет.

Исследовательская работа от 2021 года (Обнаружение машинного перевода текста по сходству текста с двусторонним переводомскачать PDF) утверждает, что контент, переведенный с одного языка на другой, может быть сложным для обнаружения людьми.

Например, используя 100 переведенных текстов, оценщики-люди смогли идентифицировать только чуть более половины переведенных текстов.

Исследователи отметили:

«Средняя точность составила 53,3% (55,0% для носителей языка и 52,0% для не носителей языка), что было близко к случайному».

Когда статья была опубликована в 2021 году, подход, названный «Сходство текста с двусторонним переводом» (TSRT), превзошел оценщиков-людей и получил более высокие оценки, чем современные детекторы перевода.

Примечательно, что этот метод может определить исходный язык переведенных текстов.

Он также может определить, какой алгоритм перевода выполнил перевод.

Они сообщили:

«Результаты оценки показывают, что TSRT превосходит другие методы с точностью до 90,2%.

Более того, TSRT также может определить переводчика оригинала и язык перевода с точностью 93,3% и 85,6% соответственно».

Неясно, может ли Google обнаруживать переведенный контент и пытается ли Google вообще обнаруживать переведенный контент.

Но мы знаем, что технология для его обнаружения существует. Технология может обнаруживать переведенный контент лучше, чем люди, и определять, какой алгоритм перевода выполнил перевод.

Если того факта, что это противоречит Руководству для веб-мастеров и может иметь негативные последствия для пользователей, недостаточно, чтобы мотивировать редактирование контента с машинным переводом, то, возможно, возможность то, что Google анализирует качество контента для машинного перевода, может быть причиной для всесторонней проверки такого контента.

ЧИТАТЬ  Прямая трансляция «Биллс против Джетс»: смотрите футбол в понедельник вечером бесплатно | Цифровые тенденции

Цитата

Послушайте видеовстречу Google Office Hours на отметке 17:50.

Избранное изображение Shutterstock/g_tech





Source link