Автоматическая проверка терминологии – важный этап перевода
23.08.2019
Один из важнейших критериев оценки качества перевода — корректно подобранная терминология.
Помимо этого, для достижения безупречного качества необходимы такие вещи, как одинаковый перевод терминов по всему корпусу текстов (в соответствии с глоссарием, утвержденным заказчиком), единообразное написание слов в тех случаях, когда существует несколько допустимых вариантов, написание чисел в соответствии с правилами конкретного языка и многое другое.
Однако даже после того, как все требования к переводу утверждены, а участвующие в проекте переводчики получили глоссарий и выполнили перевод при помощи одной из современных CAT-программ, в готовых документах все равно могут встретиться термины, перевод которых не соответствует глоссарию.
Правильность терминологии в переведенных документах нужно проверять всегда до сдачи работы заказчику. Для того чтобы облегчить и ускорить работу, а также уменьшить число погрешностей при проверке, была придумана автоматическая проверка терминологии.
Когда дело доходит до проверки терминологии, практически невозможно найти удобное решение, которое правильно и точно «понимает» флективные языки, такие как русский, украинский, казахский и т.п. Обычно разные формы одного и того же слова воспринимаются программами как разные слова, из-за чего возникает огромное количество «шума» (ложных ошибок), среди которого в отчете можно пропустить реальные ошибки.
Поэтому нами было разработано собственное программное решение – QaTerm. Эта программа разработана для проверки билингвальных текстов, в паре с русским языком, с учетом словоизменения, в том числе, в рамках составной терминологии. Основные возможности QaTerm:
· Проверка правильности терминологии в двуязычных документах в формате TMX.
· Поддержка глоссариев в виде таблиц Excel.
· Применение глоссариев как с учетом регистра, так и без учета регистра.
· Распознавание множественного числа слов в исходном тексте.
· Понятный отчет о проверке терминологии, включающий также сегменты, в которых встречаются ошибки. В программу загружается билингвальный документ в формате .tmx и глоссарий, утвержденный клиентом, в формат .xlsx. В течение нескольких секунд программа анализирует весь текст на соответствие терминологии, содержащейся в тексте, глоссарию и выдает отчет с указанием всех актуальных для данного текста ошибок. Этот отчет отправляется в работу либо переводчикам, либо редакторам, которые вносят все правки в текст перевода. Таким образом, на выходе мы получаем перевод с выверенной терминологией. Как можно видеть из вышесказанного, благодаря развитию лингвистических технологий процесс проверки правильности терминологии, используемой при переводе, получает поддержку в виде частичной автоматизации.