AI вместо курсов иностранных языков: как технологии упрощают жизнь путешественникам

23.03.2024 12:00
Дмитрий Гопалов,
эксперт по AI и нейросетям
Наверняка вам знакома ситуация, когда люди без знания иностранных языков отказывают себе в путешествиях. Или, на худой конец, осваивают одно направление (желательно с «безопасной языковой средой») и каждый год путешествуют только туда.


Фото: Envato Elements

Оказаться в ситуации, когда ты не можешь изъясниться или понять собеседника в другой стране, действительно, неприятно, а порой и очень страшно. Но хорошая новость в том, что технологии благодаря ИИ помогут справиться с проблемой, даже если вы пока еще не записались на курсы иностранных языков.

Существуют различные приложения и сервисы, помогающие путешественникам справиться с языковым барьером. Самый распространенный из них — Google Translate, который основан на нейронной сети Google Neural Machine Translation (GNMT). Он способен быстро перевести нужную фразу как с помощью текстового, так и голосового ввода. Более того, человек может тут же прослушать, как ее правильно произнести. Прелесть еще и в том, что подобными сервисами можно пользоваться и без подключения к интернету.

— А как быть с переписками и общением в чате с условным итальянским арендодателем или мексиканским таксистом? — спросите вы. Но и тут есть решение. Многие популярные мессенджеры, такие как Viber, уже имеют встроенную возможность перевода сообщений. Эти сервисы используют AI и нейронные сети. Они позволяют корректно распознавать фразу при голосовом вводе и переводить целые предложения с правильным контекстом.

Но и это не предел! Учитывая скорость развития искусственного интеллекта, в ближайшем будущем мы увидим куда более значительные изменения. Вот только некоторые новшества, которые сильно упростят нашу жизнь уже совсем скоро.

Apple Vision Pro. Фото: Unspash / shavnya.com
  • Начнем с автоматического перевода SMS, email и сообщений в мессенджерах на родной язык. Развитие нейронных сетей для перевода текста позволяет предположить, что скоро можно будет встроить эту технологию в любимый мессенджер или почтовый клиент, чтобы отправлять и получать качественно переведенный текст без дополнительных действий. Как будто вы общаетесь не с латиноамериканским доставщиком еды, а со своим соотечественником. Удобно, правда? Кстати, нейронная сеть OpenAI GPT-4 уже справляется с продвинутым переводом больших текстов. Осталось только встроить эту технологию в сервис для отправки электронной почты и в мессенджеры — и вуаля!

  • Идем дальше. Как насчет использования AR-устройства для отображения перевода разговора в реальном времени в виде субтитров? Сегодня уже доступны такие устройства, как Apple Vision Pro, которые могут быть использованы для этой цели. Но в ближайшие 3–5 лет должны выйти более бюджетные и компактные аналоги в виде простых очков.

    AR-устройство способно также помочь и в переводе текстов вокруг нас. Что я имею в виду? Встроенные в устройство камеры сканируют окружающее нас пространство и в реальном времени переводят тексты всех вывесок и плакатов на родной язык. Удобно? И вполне реально. При желании можно будет легко прочитать новую книгу в максимально привычных условиях. Ведь перевод в реальном времени дополняется тем, что устройство будет накладывать перевод на объект, например на страницу вашей книги, поэтому и весь процесс будет выглядеть максимально естественно.

  • Более того, путешественник сможет не только уверенно переписываться с собеседником, но и вступать с ним в дискуссии. Тут на помощь придут AI голосовой переводчик и беспроводные наушники. Активация голосового помощника позволит получить голосовой перевод в реальном времени, чтобы любой смайлик от собеседника смог перерасти в полноценную беседу.

  • Если в будущем вам захочется поддерживать общение с кем-то из иностранных друзей в видеоформате, то и тут на подхвате суперинструменты. HeyGen, Verbalate и Zeebra уже привлекли миллионы долларов инвестиций на сервисы, которые позволяют не только добавлять подписи к видео, но и переводить, синхронизировать звук с движениями губ и добавлять субтитры.

  • Ну и для совсем ленивых (или просто интровертов) есть прекрасная опция в виде AI-ассистента. При желании можно будет не участвовать в переписке или вербальной дискуссии. Вместо этого — просто сформулировать голосовому ассистенту в вашем смартфоне задание заказать такси или столик в ресторане. Он выполнит все необходимые действия и пришлет инструкции с результатом.

  • ИИ сильно улучшит работу с популярными Google-картами. Обновления на базе AI помогут пользователям планировать поездки, ориентироваться в незнакомых местах и находить зарядные станции для электромобилей. Только представьте, благодаря функции Immersive View вы получите подробный предварительный просмотр своего путешествия от начала до конца в Google Maps. То есть фактически симуляцию собственного маршрута, как будто вы уже там побывали.

И хотя все перечисленные новшества могут звучать немного фантастично, но на самом деле все они основываются на уже имеющихся технологиях.

Фото: Envato Elements

При этом важно отметить, что абсолютное большинство инструментов ИИ доступны людям, владеющим английским, испанским, русским и другими популярными языками. Многие языки, среди которых, например, белорусский или казахский, остаются в этом смысле «малоресурсными», что значит недостаточно представленными и исследованными в области искусственного интеллекта из-за ограниченного количества лингвистических ресурсов в Сети.

Согласно данным Statista, рейтинг наиболее часто используемых для веб-контента языков по состоянию на январь 2023 года выглядит так: 1) английский (58,8%); 2) русский (5,3%); 3) испанский (4,3%); 4) французский (3,7%); 5) немецкий (3,7%); 6) японский (3%); 7) турецкий (2,8%); 8) персидский (2,3%); 9) китайский (1,7%); 10) итальянский (1,6%). Причем представленность языка в виртуальном мире не всегда связана с количеством говорящих на нем в реальности. Глобализация и социально-экономические изменения приводят к доминированию определенных языков в цифровом пространстве. Например, хинди, на котором говорят более 500 млн человек, тоже является «низкоресурсным» языком, в то время как западноевропейские языки, например голландский, на котором говорят почти в 20 раз меньше, технически являются языками с более высоким ресурсом.

По данным крупнейшего мирового справочника по языкам Ethnologue, в мире насчитывается 7168 языков. Лишь около 20 из них имеют достаточно обучающих данных в Сети, чтобы создавать системы обработки естественного языка (NLP).

Поэтому очевидно, что перед технологическим миром стоит большая задача по развитию технологий ИИ и для «малоресурсных» языков, чтобы как можно большему количеству людей можно было сказать Bon voyage! на разных языках.