Машинный перевод
23.08.2019
История развития машинного перевода
Что такое машинный перевод?
Машинный перевод (МП) – это преобразование текста на одном естественном языке в эквивалентный по содержанию текст на другом языке с помощью технических средств, а также результат такого действия.
Многие специалисты ставят в один ряд такие понятия, как «машинный перевод + постредакция» и абсурдные по качеству тексты, прогнанные через бесплатный онлайн-переводчик. Но уравнивание этих двух понятий безосновательно. В случае с машинным переводом с постредакцией мы говорим о технологии, которая автоматически переводит текст, используя память переводов, подгружаемую человеком, и методы системного анализа. Онлайн-переводчики предоставляют переводы, созданные с помощью программных технологий, математических алгоритмов и баз данных, где конечный результат, никем не редактируется.
Как развивался машинный перевод?
Более 60 лет совместной работы лингвистов, математиков, специалистов во многих научных областях, включающих интеллектуальные системы и прикладную лингвистику, способствовали развитию машинного перевода.
В 1933 году наш соотечественник, советский изобретатель, Петр Смирнов-Троянский получил патент на «машину для подбора и печатания слов при переводе с одного языка на другой». Однако, к сожалению, данная информация если и известна, то, как правило, не берется в расчет.
Первым же прорывом в области автоматизированного перевода принято считать случай 1949 года. Уоррен Уивер, руководивший отделением естественных наук Рокфеллеровского фонда, в письмах Норберту Винеру впервые сформулировал концепцию машинного перевода. Была разработана система, которая переводила порядка 60 предложений с русского на английский. В нее было вложено 6 грамматических правил, 250 слов словаря.
Однако появление машинного перевода как такового относят к Джорджтаунскому эксперименту (1954 год). В этом же году был проведен первый эксперимент, связанный с машинным переводом, в СССР ( И.К. Бельская и Д.Ю. Панов). Все исследования, направленные на развитие машинного перевода в СССР и Европе, никак не были связаны между собой, то есть функционировал независимо и каждый для своих целей.
Низкое качество первых результатов машинного перевода привело к торможению процесса его развития, однако прогресс вычислительной техники способствовал последующему улучшению результатов работы машинного перевода.
В 1966 году согласно данным ALPAC, машинный перевод был признан нерентабельным!
В начале 80-х годов актуальность машинного перевода вновь возросла, чему способствовали разработки в области искусственного интеллекта.
В 1968 году появился русско-английский переводчик Systran, работавший по технологии грамматических правил, для ВМФ США. А позже, в 1984 году, TRADOS разработали технологию Translation Memory. Translation Memory. ТМ – база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. Это был прорыв в сфере компьютеризированного перевода, ведь данная технология используется нами и по сей день!
В России первой коммерческой компанией, плотно занявшейся вопросом машинного перевода, была PROMT (1991). 6 марта 1998 года PROMT запускает первый российский сервис бесплатного онлайн-перевода Translate.ru.
Как менялись технологии машинного перевода?
· 40-е годы – пословный перевод;
· 50 — 60-е и 70-80-е – МП, основанные на грамматических правилах;
· 90-е – статистический и гибридный МП;
· 2010 — 2016 – нейронный МП (на сегодняшний день – самый востребованный).
Мы видим, что машинный перевод интегрируется во все сферы бизнеса. Мы приходим к тому, что услугами машинного перевода и постредакции пользуются не только в лингвистической отрасли, но и в медицине, политике, иными словами, везде!