О трендах лингвистических технологий 2021/22
24.01.2022
CAT-СИСТЕМЫ
В прошедшем году производители CAT-систем много работали над совершенствованием облачных технологий. Это относится даже к Trados, который исторически был исключительно локальной системой, однако сейчас активно развивает платформу облачной работы Trados Live Team. Много новых функций появилось в SmartCAT, одна из самых значимых – полностью одновременная работа переводчиков, которую разработчик вывел на достаточно высокий уровень. Memsource выпустил более стабильную версию мобильного приложения, которое позволяет работать с мобильного устройства как менеджерам проектов, так и переводчикам.
Продолжили развиваться коннекторы и другие инструменты непрерывной локализации в облачных CAT, особенно для сайтов e-commerce и платформ онлайн-курсов.
И, конечно, стал еще доступнее машинный перевод в CAT-системах: расширился ассортимент СМП, были доработаны интеллектуальные технологии выбора машинного перевода для конкретного типа текста (например, Memsource Translate).
МАШИННЫЙ ПЕРЕВОД
В 2021 стали очень востребованы автоматические метрики качества МП: все стремятся измерить качество машинного перевода, и многие уже научились делать это профессионально. Популярная ранее метрика BLEU уже не считается достаточно функциональной, ей на смену пришел ряд других. Продолжается совершенствование МП для редких языков и языковых пар. Также очень продвинулись технологии кастомизации. Например, разработчики систем машинного перевода, от Google до PROMT, активно внедряются функцию кастомизации машинного перевода на глоссариях как дополнение или замену обучения движка на текстовых корпусах.
Один из новых мировых трендов машинного перевода – привлечение пользователей к постредактированию МП, или crowd-editing. Веб-сайты, посты на форумах, каталоги товаров и т.п. все чаще переводятся «машинкой» для сокращения затрат. Однако ошибки остаются, и компании привлекают пользователей к постредактированию машинного перевода. В отличие от полноценного «крауд-перевода», которые в последние годы отошел на второй план, постредакция силами волонтеров выполняется быстрее и проще.
Как во всем мире, так и в России растет «корпоративное» использование кастомизированного МП: не-переводческие компании, имеющие потребность в переводах, все чаще развертывают и обучают системы машинного перевода. Например, интересным опытом на эту тему в 2021 году поделился Центробанк. Нам кажется, что очевидный вектор развития в данной сфере – возможность для любой компании натренировать систему машинного перевода на собственных материалах и использовать ее для своих нужд, будь то в CAT-инструменте или вне его. И именно на это будут направлены усилия разработчиков в 2022 и последующих годах.
Сегодня речь пойдет об ещё одной важной тенденции рынка перевода
«БУМ» РЕЧЕВЫХ ТЕХНОЛОГИЙ
Самой интересной тенденцией ушедшего года стало стремительное развитие речевых технологий, получившее в отрасли неофициальное название the Voice Tech Tsunami. Основные тренды 2021 в этой сфере:
- синтез речи («нейронные голоса») для автоматического перевода видео
- различные варианты устного машинного перевода
- computer assisted interpreting tools, CAI (аналог CAT-систем для устных переводчиков)
- совершенствование инструментов автоматического (машинного) субтитрирования
- прорыв в технологии speech-to-speech, который вскоре предвещает ее массовое коммерческое использование вместо уже привычной speech-to-text.
В проекты, связанные с Voice Tech, вложились Facebook, Zoom, TikTok, Netflix. Новые разработки представили Google, Яндекс и крупнейшие мировые научные центры. О новых тенденциях в сфере распознавания речи, ее перевода и синтеза мы более подробно расскажем в следующей публикации.