Новости лингвистического рынка и сферы обработки данных и ИИ
14.02.2020
14.02.2020
M&A, СОТРУДНИЧЕСТВО, КОНТРАКТЫ
07.01.2020 multilingual
TransPerfect, поставщик глобальных бизнес-услуг, приобрел Chulengo, поставщика озвучивания, дубляжа, пост-продакшн и других аудиовизуальных услуг. Chulengo станет подразделением семейства компаний TransPerfect и будет по-прежнему возглавляться основателем Хавьером Гором.
07.01.2020 multilingual
Компания Xillio, занимающаяся миграцией и интеграцией контента, объявила, что World Translation, поставщик услуг датского языка, интегрирует LocHub в процесс перевода.
16.01.2020 Slator
Российский провайдер языковых услуг (LSP) AWATERA объединился с ирландской компанией SPEAKUS, поставщиком облачного удаленного синхронного перевода (RSI), 25 декабря 2019 года. Главный управляющий и соучредитель SPEAKUS Игорь Гусев станет главным владельцем продукта AWATERA и сосредоточится на развитии существующего технологического стека компании, включая Perevedem.ru и рынок устных переводчиков Interpret.me.
ПРОДУКТЫ И ТЕХНОЛОГИИ
08.01.20 multilingual
Компания-разработчик программного обеспечения для переводов Pairaphrase разработала надстройку Microsoft Excel под названием TBX Exporter для преобразования файлов .xls, .csv или .xslx в файл TermBase eXchange (.tbx).
08.01.20 NLP
iFLYTEK, одна из ведущих мировых компаний в области искусственного интеллекта (ИИ) и речевых технологий, впервые в США представила ряд потребительских и бизнес-продуктов.
Jarvisen – Переводчик нового поколения, который позволяет легко общаться между 60 языками.
iFLYREC App – мобильное приложение записывает и преобразует речь в текст, а затем отображает текст на экране? может переводить между английским и китайским в режиме реального времени.
iFLYREC Smart Conference System (Video Conference Edition) L1 – интеллектуальная система для облегчения видеоконференции с переводом и транскрипцией в реальном времени.
iFLYTEK AI Mouse – записывает, транскрибирует, переводит и отвечает на голосовые команды. Он может обрабатывать 400 слов в минуту текста с высокой точностью и поддерживает перевод между китайским и 28 другими языками.
Alpha Egg Pro (new generation) – Умный компаньон для всей семьи, включающий образование, супер ТВ, видеозвонки, умных носителей и понимание на естественном языке для облегчения взаимодействия человека и робота.
Global Chinese Learning Platform – Первый интеллектуальный портал для изучения китайского языка.
14.01.20 NLP
Coral - инициатива Google по включению искусственного интеллекта без облака.
Coral - это платформа аппаратных и программных компонентов от Google, которые помогают вам создавать устройства с локальным ИИ - обеспечивая аппаратное ускорение для нейронных сетей ... прямо на периферийном устройстве.
Для удовлетворения потребностей клиентов Coral предлагает два основных типа продуктов: ускорители и платы разработки, предназначенные для создания прототипов новых идей, и модули, предназначенные для питания интеллектуальных мозгов производственных устройств, таких как интеллектуальные камеры и датчики. В обоих случаях сердце аппаратного обеспечения - это Edge TPU от Google, чип ASIC, оптимизированный для работы с легкими алгоритмами машинного обучения - (очень) младший брат по сравнению с водоохлаждаемым TPU, используемым в облачных серверах Google.
Учитывая большое количество конкурентов, команда Coral заявляет, что она дифференцируется, тесно интегрируя свое оборудование с экосистемой сервисов искусственного интеллекта Google. В случае Coral имеется библиотека моделей искусственного интеллекта, специально скомпилированных для его аппаратного обеспечения, а также службы искусственного интеллекта в Google Cloud, которые напрямую интегрируются с отдельными модулями Coral, такими как датчики среды.
Фактически, Coral настолько тесно интегрирован с экосистемой искусственного интеллекта Google, что его аппаратное обеспечение на базе Edge TPU работает только с платформой машинного обучения Google TensorFlow, факт, который, по словам Verge, является ограничивающим фактором.
24.01.20 NLP
Firefox Voice теперь доступен в бета-версии, где можно осуществлять голосовой поиск, а также использовать свой голос для управления различными функциями браузера, щелкнув значок микрофона в адресной строке.
28.01.20 NLP
Google представила функцию, которая позволит людям использовать свои телефоны для расшифровки и перевода разговора в режиме реального времени на язык, на котором они не говорят. Инструмент будет доступен для приложения Google Translate в ближайшие месяцы.
Сейчас эта функция тестируется на нескольких языках, включая испанский, немецкий и французский. Перевод будет происходить на серверах Google, а не на устройствах людей.
31.01.20 NLP
На этой неделе Google представила Meena, разговорный агент на основе нейронной сети, который, по ее утверждению, является лучшим в мире. Сеть имеет 2,6 миллиарда параметров и обучена на 341 ГБ данных. Google также выпустил показатель чувствительности и специфичности (SSA), метрику для измерения способности разговорного агента поддерживать ответы в разговоре, которые имеют смысл и являются конкретными. Люди занимают около 86% в SSA; Мина набирает 79%. Mitsuku Pandora Bots, который выиграл приз Лебнера в течение последних четырех лет, набрал 56%, а говорящий по-мандарински Microsoft XiaoIce - 31%.
31.01.20 NLP
Канадская платформа мониторинга состояния здоровья BlueDot использует NLP и ML для поиска новостей на иностранных языках, сетей по болезням животных и растений, а также официальных объявлений для выявления опасных зон. Он предупредил своих клиентов о вспышке коронавируса 31 декабря, более чем за неделю до публичных уведомлений от ВОЗ и Центров США по контролю и профилактике заболеваний.
СТАТЬИ, АНАЛИТИКА, ПРОЧЕЕ
23.01.20 multilingual
Allcorrect Group, поставщик языковых услуг и локализации видеоигр, выпустила The World: Your Oyster. Руководство по подготовке вашей игры для международного распространения. В руководстве рассказывается, как выбрать рынки локализации ПК, консолей и мобильных игр; почему особое внимание уделяется шрифтам; затраты на получение возрастного рейтинга для игр в Японии, Корее и Новой Зеландии; и различные культурные ошибки и табу.
24.01.20 NLP
Получение основанных на глубоком обучении моделей NLG для создания текста, который соответствует фактам, является нерешенной проблемой, но Uber AI продвинулся в этом направлении, добавив модель оценки в GPT-2, которая направляет сгенерированный текст к указанным темам или настроениям.
24.01.20 Slator
Исследователи машинного перевода изучают новый рубеж в обработке естественного языка, машинном дублировании. В исследовательской работе, опубликованной в январе 2020 года группой Amazon AI, подразделением Amazon Web Services (AWS), были исследованы новые методы, позволяющие сделать автоматическое дублирование более естественным.
Автоматический дубляж, который можно рассматривать как расширение преобразования речи в речь (STST), направлен на замену всей речи в видео речью на другом языке, сохраняя при этом как можно более естественный вид и звук. STST стал новостью в сообществе исследователей машинного перевода, когда Google запустил систему под названием Translatotron и Microsoft, демонстрируя то, что, как они утверждали, было прямым STST на конференции Microsoft Inspire 2019.
Исследователи отобрали 24 видеоклипа из шести выступлений TED на английском языке. Каждый клип длился от 10 до 15 секунд, включал только одного говорящего, произносящего как минимум два предложения, и лицо говорящего было в основном видно во время клипа.
Команда использовала свою моделью MT, чтобы генерировать итальянские предложения желаемой длины, основываясь на временных ограничениях. (Конечно, команда использовала Amazon Translate в качестве базовой системы MT).
Высказывание за высказыванием, команда следила за тем, чтобы длительность итальянского выхода TTS соответствовала длительности исходного английского аудио. Они также выполнили «аудио рендеринг», извлекая фоновое аудио (все, кроме речи) из оригинального видео, а затем добавляя его обратно в дублированные версии, чтобы они звучали более естественно.
Согласно оценкам трех версий видеоклипов 14 добровольцев (пять говорящих на итальянском и девять не говорящих по-итальянски), понимание содержания влияет на восприятие слушателем качества автоматического дублирования. Говорящие на итальянском языке имели тенденцию оценивать систему A (которая показала только STST) как лучшую версию, тогда как не говорящие по-итальянски считали систему A худшей.