Благодаря эксперту Акмуллинского университета и его команде башкирский язык появился в Google Translate

28 июня 2024

Башкирский язык появился в фирменных переводческих сервисах компании Google. Как сообщает ИА «Башинформ», теперь можно переводить с любого языка на башкирский и наоборот, в том числе и офлайн.

Появление башкирского языка в переводческих сервисах Google стало возможно благодаря языковым активистам и волонтёрам, в течение многих лет кропотливо собиравшим параллельный корпус башкирского языка. Сейчас его размер составляет более 1 млн пар словоупотреблений.

Создателями корпуса являются главный специалист информационно-консультационного центра им. Р.Г. Кузеева Акмуллинского университета Искандер Шакиров и Айгиз Кунафин, автор умной колонки «Һомай». Они разработали электронный словарь башкирского языка на основе платформы Glosbe.

Перевести на требующийся язык можно книги любого объёма, а в связке с умной колонкой можно автоматически создавать аудиокниги на башкирском языке классиков мировой литературы. Возможен перевод любых сайтов с сохранением всей разметки, в том числе и одним нажатием в браузере, любых документов с сохранением структуры и форматирования, а также также перевод сообщений в любых мессенджерах, писем в почтовых ящиках, автоперевод субтитров в YouTube и мгновенный перевод через камеру смартфона. В будущем возможен также синхронный голосовой перевод живых разговоров «на лету», видеолекций с непрерывной подачей текста и многое другое.

Google Translate – это самая крупная в мире бесплатная система для работы с языками, использующая собственный самообучаемый нейросетевой алгоритм машинного перевода (PaLM 2). «Google Переводчик» является одним из самых скачиваемых кроссплатформенных приложений в мире. Попадание в этот сервис очень престижно и свидетельствует о цифровой развитости языка. Тем самым вместе с новыми возможностями открывается и новая значимая страница в истории башкирского языка.

 На этих данных башкирскому языку обучались и другие языковые модели, в том числе Яндекс.Переводчик и ChatGPT4.

«Работа проделана огромная, но одного лишь появления языка в списке поддерживаемых языков недостаточно, важно качество самого перевода. Для ещё большего улучшения точности и художественности перевода мы просим носителей башкирского языка присоединиться к нашему общему проекту по дальнейшему сбору корпуса параллельных текстов, подписавшись на наш чат-бот в Telegram. Там работа идёт в игровой увлекательной форме. Время от времени со спонсорами проводятся конкурсы с призами, чтобы поощрить активных знатоков башкирского языка», – пишут авторы проекта в социальных сетях и призывают присоединиться к их сообществу.

Фотографии