Весь мир уже неделю обсуждает DeepSeek: что нужно знать о нашумевшем ИИ-стартапе

Юрий Грибовский
Появление на рынке ИИ-разработок китайского чат-бота DeepSeek произвело эффект разорвавшейся бомбы: малоизвестный стартап стал конкурировать с OpenAI, Google и Meta. Пользователи утверждают, что по производительности он не уступает гигантам ИИ-индустрии, при этом на его разработку потратили несопоставимо меньший бюджет. Office Life объясняет, почему вокруг столько разговоров о DeepSeek.
Весь мир уже неделю обсуждает DeepSeek: что нужно знать о нашумевшем ИИ-стартапе
Фото: Shutterstock

Что такое DeepSeek?

DeepSeek — это китайская компания, разрабатывающая большие языковые модели с открытым исходным кодом. Она представила чат-бот DeepSeek-R1 на базе ИИ. Внешне и по функционалу он мало чем отличается от ChatGPT или Copilot, при этом есть и новые функции. Скажем, у нейросети предусмотрен режим рассуждения, когда она сначала анализирует запрос, оценивает различные подходы к решению и лишь затем выдает ответ.

Особенность этой модели строится на обучении с использованием менее продвинутых и более дешевых чипов по сравнению с решениями лидеров рынка, в том числе OpenAI и Anthropic. Кроме того, DeepSeek предоставляет модель в формате открытого кода, то есть любая компания может получить к нему доступ и использовать его на своих собственных мощностях. Для сравнения: OpenAI, выпустила модель o1 с закрытым кодом и продает ее исключительно пользователям и отдельно — владельцам пакетов стоимостью от $20 до $200 в месяц.

Кто за этим стоит?

Китайский стартап DeepSeek был основан в июле 2023 года в Ханчжоу выпускником Чжэцзянского университета инженером-электронщиком Ляном Вэнфэнем. Компанию финансирует китайский хедж-фонд High-Flyer, который сам Лян и основал в 2015 году. В High-Flyer он заработал состояние, используя искусственный интеллект для выявления закономерностей, влияющих на цены акций, а позже заявил о намерении разработать ИИ уровня человеческого интеллекта, запустив уже известный нам DeepSeek. В команду стартапа входят молодые выпускники ведущих китайских университетов. При наборе персонала отдают предпочтение не опыту работы, а техническим навыкам.

Стартап громко заявил о себе в ноябре 2023-го. Компания представила модель DeepSeek Coder, которая была заточена под задачи программирования. Затем последовали DeepSeek LLM и DeepSeek-V2. Из-за высокой производительности и низкой стоимости последней крупные китайские компании, в том числе ByteDance (владелец TikTok), Tencent и Baidu, вынуждены были уменьшить цены на свои модели ИИ.

Весь мир уже неделю обсуждает DeepSeek: что нужно знать о нашумевшем ИИ-стартапе
Фото: france24.com

Последние разработки DeepSeek-V3 и DeepSeek-R1 только усилили позиции компании на рынке. По предварительным оценкам, по эффективности эта модель не уступает продуктам лидеров рынка. При этом на обучение своей нейросети компания потратила лишь $6 млн, что в разы меньше затрат OpenAI на ChatGPT.

Почему все это обсуждают?

Чат-бот доступен для пользователей бесплатно. И это — одна из главных причин ажиотажа вокруг него и основное преимущество на рынке.

В начале недели мировой рынок в сфере ИИ отреагировал на новинку резким падением акций почти всех техгигантов, в том числе ASML, Nvidia, Meta, Advantest. Западные инвесторы встревожены, что успех DeepSeek может пошатнуть доминирование США в области искусственного интеллекта и сократить спрос на чипы американских компаний. Кроме того, применение менее дорогих ресурсов для обучения ИИ снижает порог для входа на рынок. А это усиливает конкуренцию в индустрии искусственного интеллекта. Эксперты подсчитали, что в результате обвала на рынке капитализация всего IT-сектора просела на $1 трлн. Больше всего потеряла Nvidia — минус $590 млрд, пишет Forbes.

Успех китайского стартапа стал настолько быстрым и неожиданным, что ведущие компании в области разработки ИИ Microsoft и OpenAI заподозрили его в краже данных для обучения собственной модели. И даже начали внутреннее расследование по этому поводу. Сообщалось, что осенью прошлого года специалисты в сфере безопасности Microsoft заметили, как люди, которые могут быть связаны с DeepSeek, с помощью интерфейса прикладного программирования OpenAI извлекали большой объем данных, полученных в ходе работы ChatGPT.

К слову, к приложению уже возникли вопросы и у европейских регуляторов из-за обработки персональных данных. Например, 29 января, оно пропало из официальных магазинов Apple и Google в Италии, сообщает Reuters.

Весь мир уже неделю обсуждает DeepSeek: что нужно знать о нашумевшем ИИ-стартапе
Фото: france24.com

Что говорят аналитики?

Многие аналитики говорят, что появление моделей вроде DeepSeek-R1 поможет в дальнейшем развивать инновации, ускорить развитие и доступность ИИ. В результате это будет выгодно для всей отрасли.

Основатель Telegram Павел Дуров считает, что китайский прогресс в эффективности алгоритмов не возник на пустом месте, ведь местные студенты «уже давно опережают других в математике и программировании на международных олимпиадах».

Любопытно, что и глава OpenAI Сэм Альтман назвал нашумевшую ИИ-модель DeepSeek-R1 «впечатляющей», учитывая ее возможности за свою цену. При этом он анонсировал, что его компания представит лучшие модели, так как «здорово иметь нового конкурента».

По мнению основателя Meta Марка Цукерберга, рано делать какие-либо выводы о том, как успех DeepSeek повлияет на развитие инфраструктуры искусственного интеллекта и капитальные расходы. Но он отметил, что Meta анализирует достижения стартапа и надеется внедрить некоторые из них в свои проекты.

Николай Давыдов, инвестор в стартап с белорусскими корнями Perplexity, отметил, что это очень хорошо для стартапов, которые занимаются созданием application layers — агентов, использующих API-запросы к фундаментальным моделям. Расходы снижаются, а качество растет.

Весь мир уже неделю обсуждает DeepSeek: что нужно знать о нашумевшем ИИ-стартапе
Фото: Pexels

Аналитики Morgan Stanley отмечают, что «подход DeepSeek может вдохновить бигтехи на инновации». По их мнению, это хорошая новость для рынка, так как прогнозы окупаемости инвестиций в ИИ могут значительно улучшиться, а сам ИИ станет более доступным.

В то же время, по мнению экспертов Jefferies, дешевая модель ИИ — вынужденный шаг на фоне ограничений поставок чипов и новый драйвер гонки между США и Китаем. В свою очередь аналитики Bernstein сомневаются, что на разработку хватило всего $6 млн.

А что с этого белорусам?

Белорусские компании присматриваются к новинке и, как оказалось, уже внедряют в свою работу. Открытость китайской модели дает возможность разработчикам дообучать ее под локальные нужды, улучшая сервисы и снижая издержки.

К примеру, в «БелПроектКонсалтинг» заявили, что уже развернули большую языковую модель DeepSeek-R1 на своих серверах и начали использовать некоторые функции. В компании также подчеркнули, что «лицензия MIT, под которой распространяется языковая модель DeepSeek, действительна на территории Беларуси и не накладывает искусственных ограничений на пользователя».

Три техгиганта объединятся и инвестируют в технологии ИИ до $500 млрд