Исследовательское подразделение Meta работает над универсальным переводчиком, который упростит взаимодействие пользователей в цифровой вселенной компании. «Это будет особенно важно, когда люди начнут путешествовать по виртуальным мирам и общаться с людьми из разных мест», — указывает глава компании Марк Цукерберг. План Meta состоит из двух частей. Во-первых, по словам Цукерберга, компания разрабатывает No Language Left Behind, систему перевода, способную изучить «любой язык, даже если материала для изучения не так много». Система будет знать сотни языков: от астурийского до языка луганда и урду. Второй проект называется Universal Speech Translator; в его рамках компания разрабатывает новые подходы к переводу речи с одного языка на другой в режиме реального времени. Модель мгновенного перевода «даст возможность общаться с кем угодно на любом языке». «Это сверхспособность, о которой люди всегда мечтали, и ИИ обеспечит ее еще при нашей жизни» , — пообещал Цукерберг. Основное препятствие в разработке системы — нехватка данных. «Системы машинного перевода обычно полагаются на миллионы аннотированных данных, — пишет Facebook AI Research в своем блоге. — По этой причине системы, способные выполнять высококачественные переводы, разработаны только для нескольких языков, доминирующих в интернете». По словам команды Facebook AI Research, для прямого преобразования речи в речь дополнительные данные еще важнее. Большинство систем речевого машинного перевода используют текст в качестве промежуточного шага, то есть речь на одном языке сначала преобразуется в текст, затем переводится в текст на целевом языке, а затем, наконец, вводится в систему преобразования текста в речь. Из-за этого системы перевода речи в речь очень зависимы от текста, что ограничивает их эффективность и затрудняет их применение с языками, которые мало используют письменность. Переводчик в реальном времени, над которым работает Meta, сможет переводить даже те языки, в которых нет стандартизированных систем письма. Этот речевой подход также сделает перевод быстрее и эффективнее, так как он не потребует дополнительных шагов по преобразованию речи в текст.)