AI вместо курсов иностранных языков: как технологии упрощают жизнь путешественникам
Оказаться в ситуации, когда ты не можешь изъясниться или понять собеседника в другой стране, действительно, неприятно, а порой и очень страшно. Но хорошая новость в том, что технологии благодаря ИИ помогут справиться с проблемой, даже если вы пока еще не записались на курсы иностранных языков.
Существуют различные приложения и сервисы, помогающие путешественникам справиться с языковым барьером. Самый распространенный из них — Google Translate, который основан на нейронной сети Google Neural Machine Translation (GNMT). Он способен быстро перевести нужную фразу как с помощью текстового, так и голосового ввода. Более того, человек может тут же прослушать, как ее правильно произнести. Прелесть еще и в том, что подобными сервисами можно пользоваться и без подключения к интернету.
— А как быть с переписками и общением в чате с условным итальянским арендодателем или мексиканским таксистом? — спросите вы. Но и тут есть решение. Многие популярные мессенджеры, такие как Viber, уже имеют встроенную возможность перевода сообщений. Эти сервисы используют AI и нейронные сети. Они позволяют корректно распознавать фразу при голосовом вводе и переводить целые предложения с правильным контекстом.
Но и это не предел! Учитывая скорость развития искусственного интеллекта, в ближайшем будущем мы увидим куда более значительные изменения. Вот только некоторые новшества, которые сильно упростят нашу жизнь уже совсем скоро.
Начнем с автоматического перевода SMS, email и сообщений в мессенджерах на родной язык. Развитие нейронных сетей для перевода текста позволяет предположить, что скоро можно будет встроить эту технологию в любимый мессенджер или почтовый клиент, чтобы отправлять и получать качественно переведенный текст без дополнительных действий. Как будто вы общаетесь не с латиноамериканским доставщиком еды, а со своим соотечественником. Удобно, правда? Кстати, нейронная сеть OpenAI GPT-4 уже справляется с продвинутым переводом больших текстов. Осталось только встроить эту технологию в сервис для отправки электронной почты и в мессенджеры — и вуаля!
Идем дальше. Как насчет использования AR-устройства для отображения перевода разговора в реальном времени в виде субтитров? Сегодня уже доступны такие устройства, как Apple Vision Pro, которые могут быть использованы для этой цели. Но в ближайшие 3–5 лет должны выйти более бюджетные и компактные аналоги в виде простых очков.
AR-устройство способно также помочь и в переводе текстов вокруг нас. Что я имею в виду? Встроенные в устройство камеры сканируют окружающее нас пространство и в реальном времени переводят тексты всех вывесок и плакатов на родной язык. Удобно? И вполне реально. При желании можно будет легко прочитать новую книгу в максимально привычных условиях. Ведь перевод в реальном времени дополняется тем, что устройство будет накладывать перевод на объект, например на страницу вашей книги, поэтому и весь процесс будет выглядеть максимально естественно.
Более того, путешественник сможет не только уверенно переписываться с собеседником, но и вступать с ним в дискуссии. Тут на помощь придут AI голосовой переводчик и беспроводные наушники. Активация голосового помощника позволит получить голосовой перевод в реальном времени, чтобы любой смайлик от собеседника смог перерасти в полноценную беседу.
Если в будущем вам захочется поддерживать общение с кем-то из иностранных друзей в видеоформате, то и тут на подхвате суперинструменты. HeyGen, Verbalate и Zeebra уже привлекли миллионы долларов инвестиций на сервисы, которые позволяют не только добавлять подписи к видео, но и переводить, синхронизировать звук с движениями губ и добавлять субтитры.
Ну и для совсем ленивых (или просто интровертов) есть прекрасная опция в виде AI-ассистента. При желании можно будет не участвовать в переписке или вербальной дискуссии. Вместо этого — просто сформулировать голосовому ассистенту в вашем смартфоне задание заказать такси или столик в ресторане. Он выполнит все необходимые действия и пришлет инструкции с результатом.
ИИ сильно улучшит работу с популярными Google-картами. Обновления на базе AI помогут пользователям планировать поездки, ориентироваться в незнакомых местах и находить зарядные станции для электромобилей. Только представьте, благодаря функции Immersive View вы получите подробный предварительный просмотр своего путешествия от начала до конца в Google Maps. То есть фактически симуляцию собственного маршрута, как будто вы уже там побывали.
И хотя все перечисленные новшества могут звучать немного фантастично, но на самом деле все они основываются на уже имеющихся технологиях.
При этом важно отметить, что абсолютное большинство инструментов ИИ доступны людям, владеющим английским, испанским, русским и другими популярными языками. Многие языки, среди которых, например, белорусский или казахский, остаются в этом смысле «малоресурсными», что значит недостаточно представленными и исследованными в области искусственного интеллекта из-за ограниченного количества лингвистических ресурсов в Сети.
Согласно данным Statista, рейтинг наиболее часто используемых для веб-контента языков по состоянию на январь 2023 года выглядит так: 1) английский (58,8%); 2) русский (5,3%); 3) испанский (4,3%); 4) французский (3,7%); 5) немецкий (3,7%); 6) японский (3%); 7) турецкий (2,8%); 8) персидский (2,3%); 9) китайский (1,7%); 10) итальянский (1,6%). Причем представленность языка в виртуальном мире не всегда связана с количеством говорящих на нем в реальности. Глобализация и социально-экономические изменения приводят к доминированию определенных языков в цифровом пространстве. Например, хинди, на котором говорят более 500 млн человек, тоже является «низкоресурсным» языком, в то время как западноевропейские языки, например голландский, на котором говорят почти в 20 раз меньше, технически являются языками с более высоким ресурсом.
По данным крупнейшего мирового справочника по языкам Ethnologue, в мире насчитывается 7168 языков. Лишь около 20 из них имеют достаточно обучающих данных в Сети, чтобы создавать системы обработки естественного языка (NLP).
Поэтому очевидно, что перед технологическим миром стоит большая задача по развитию технологий ИИ и для «малоресурсных» языков, чтобы как можно большему количеству людей можно было сказать Bon voyage! на разных языках.