«Яндекс Переводчик» признали лучшим в мире по качеству перевода с английского на русский
Лента новостей
Российский сервис также занял третье место по качеству перевода с английского на китайский, немецкий, итальянский и испанский. Насколько оправданны такие оценки?
«Яндекс Переводчик» лучше других языковых моделей определяет значение конкретных английских слов в предложениях и допускает меньшее число семантических ошибок, когда речь идет о переводе на русский. Рейтинг опубликовали итальянские институты Sapienza и SSML Carlo Bo — ведущие мировые центры изучения языка в машинном обучении.
Когда-то транслейтеры выдавали ляпы, которые потом становились мемами. Многие помнят перевод текста о том, как «кошка родила троих котят — двух белых и одного афроамериканца». Или фразу из фильма «Форрест Гамп» — «Беги, Форрест, беги» машина переводила как «Беги, лес, беги».
Но сейчас онлайн-сервисы могут вполне качественно перевести английский текст. Например, заголовок в топе NBC News вечером 27 февраля: Biden says he hopes to see a cease-fire by next week in the Israel-Hamas war. Google переводит так: «Байден говорит, что надеется увидеть прекращение огня к следующей неделе в войне между Израилем и ХАМАС». «Яндекс» лаконичнее и точнее: «Байден надеется на прекращение огня между Израилем и ХАМАС к следующей неделе».
Какие-то фразы переводятся одинаково. Неудивительно: у моделей похожий принцип обучения. Сначала нужно освоить много текстов. Дальше приходят дата-сайентисты: модель дает им несколько вариантов перевода, они проверяют их качество. У «Яндекса» есть специалисты, «железо», массивы данных — спасибо поисковику. Продолжает гендиректор Dbrain, автор телеграм-канала AI Happens Алексей Хахунов:
Алексей Хахунов гендиректор Dbrain, автор телеграм-канала AI Happens «Действительно, «Яндекс Переводчик» великолепно справляется с парой «русский — английский». То, что он находится на третьем месте в паре «английский — китайский», тоже вполне может быть. Если бы он лидировал, это было бы уже меньше похоже на правду. Если сравнивать «Яндекс Переводчик» и «Google Переводчик», это практически идентичные системы. Очень сильно извернуться в подходе к решению задач практически невозможно. Основное, что будет отличать «Google Переводчик» от «Яндекс Переводчика», — это сколько у вас было данных и как долго вы могли учить модель».
Несколько лет назад в браузере «Яндекса» появилась функция закадрового перевода видео. Затем добавили закадровый перевод прямых трансляций на YouTube. Все это подавалось как сенсация. В Google такой опции нет до сих пор.
Но те, кто работает с видеоконтентом профессионально, в том числе с озвучиванием кино, чаще всего имеют дело с переводами, которые делают специально обученные люди. Конечно, бывает, что нерадивые переводчики, желая побольше заработать, позволяют себе использовать Google. Получается смешно, рассказывает актриса дубляжа, член Союза дикторов Ольга Зубкова:
Ольга Зубкова актриса дубляжа, член Союза дикторов «До сих пор помню одного переводчика, который воспользовался «Google Переводчиком» и написал нам в одном документальном фильме: «В этих горах Грузии и расположилась авиационная база США». Мы все остановились и говорим: «Какая база? Какая Грузия?» Georgia — это штат Джорджия, и Georgia — это Грузия, человек не подумал об этом. В работе часто появляются моменты, когда нужно услышать носителя языка. К Google мы не обращаемся, почему-то «Яндекс» кажется роднее, ближе, может быть, правильнее. Не подводил еще ни разу. Но нужно заметить, что люди, которые вселяют в эту нейросеть наши мысли, наши слова, тоже должны быть как минимум высокоинтеллектуальными людьми, чтобы не было казусов с произношением».
О том, что без человека нейросетям пока нелегко, свидетельствует и то, что в «Яндексе» прошлой весной искали профессиональных редакторов, журналистов и филологов на должности тренеров искусственного интеллекта. До «человеческого» языка ему еще расти и расти.