КИТАЙСКАЯ КОМПАНИЯ DEEPSEEK СОСТАВЛЯЕТ СЕРЬЕЗНУЮ КОНКУРЕНЦИЮ OPENAI И ДРУГИМ ВЕДУЩИМ РАЗРАБОТЧИКАМ В ОБЛАСТИ ИИ
Китайский стартап в области искусственного интеллекта DeepSeek, которому чуть больше года, вызвал фурор в Кремниевой долине, продемонстрировав модели ИИ, которые по производительности не уступают лучшим в мире чат-ботам, но при этом стоят в разы дешевле.
Появление стартапа
DeepSeek ломает широко распространенный стереотип, что развитие искусственного интеллекта в будущем неизбежно потребует всё больше и больше вычислительной мощности и энергии.
Шумиха вокруг инновационности
DeepSeek, нарастающая как снежный ком, в итоге привела к тому, что 27 января акции мировых технологических компаний обвалились. Инвесторы просто испугались, что китайский стартап «утопит» своих американских конкурентов и поставщиков оборудования для ИИ, таких как
Nvidia Corp.
ЧТО ЖЕ ТАКОЕ DEEPSEEK?
DeepSeek была основана в 2023 году
Лян Вэньфэном, руководителем хедж-фонда
High-
Flyer, специализирующегося на развитии искусственного интеллекта. Компания занимается разработкой моделей ИИ с открытым исходным кодом, что позволяет сообществу разработчиков тестировать и улучшать программное обеспечение. Уже в начале января, после запуска мобильного приложения, оно моментально заняло первое место в рейтинге загрузок на
iPhone в
США.
Приложение отличается от других чат-ботов, таких как
OpenAI ChatGPT, тем, что формулирует свои собственные аргументы, прежде чем выдать ответ на запрос. Компания утверждает, что ее версия чат-бота R1 не уступает по производительности последней версии модели ИИ от
OpenAI.
DeepSeek также предлагает лицензии частным разработчикам, желающим создавать чат-боты на основе своей технологии. При этом стоимость таких лицензий значительно ниже, чем та, которую взимает
OpenAI за аналогичный доступ.
ЧЕМ ОТЛИЧАЕТСЯ DEEPSEEK R1 ОТ OPENAI ИЛИ META AI*?
DeepSeek заявляет, что производительность их модели R1 сопоставима или даже превосходит показатели ведущих конкурентов в нескольких ключевых тестах. Например, модель продемонстрировала выдающиеся результаты в тесте
AIME 2024 для математических задач,
MMLU для проверки общих знаний и
AlpacaEval 2.0 для обработки вопросов и ответов.
Кроме того, R1 уверенно занимает высокие позиции на платформе Chatbot Arena, которая связана с Калифорнийским университетом в Беркли и служит площадкой для сравнения различных технологий чат-ботов.
Хотя компания
DeepSeek не разглашает всех подробностей о своей работе, можно предположить, что ее затраты на разработку и обучение моделей
DeepSeek значительно ниже расходов на топовые продукты
OpenAI или
Meta Platforms Inc*. А более высокая эффективность моделей
DeepSeek ставит под сомнение необходимость значительных инвестиций в самые современные и мощные ускорители ИИ от таких компаний, как
Nvidia Corp.
Внедрение моделей от компании
DeepSeek также делает бесполезными ограничения
США на экспорт передовых полупроводников в
Китай. Их вводили, чтобы предотвратить технологические прорывы, подобные тем, которых достигла компания
DeepSeek.
КОГДА DEEPSEEK ЗАИНТЕРЕСОВАЛ ВЕСЬ МИР?
За разработками компании
DeepSeek пристально следили с того момента, как в 2023 году она выпустила свою первую модель ИИ. Затем, в ноябре, компания представила миру
DeepSeek R1 — версию, созданную для имитации человеческого мышления.
На базе этой модели было разработано мобильное приложение для чат-ботов, моментально ставшее популярным во всем мире как более дешевая альтернатива
OpenAI. Инвестор
Марк Андреессен назвал выпуск этого приложения
«событием в области развития ИИ, сопоставимым с запуском Спутника-1 Советским Союзом».
По данным аналитической платформы
App Figures, к 25 января мобильное приложение
DeepSeek заняло первое место в магазинах приложений для
iPhone в
Австралии,
Канаде,
Китае,
Сингапуре,
США и
Великобритании: его скачали 1,6 миллиона раз.
КАК ОТРЕАГИРОВАЛ ФОНДОВЫЙ РЫНОК?
Последние два года, с тех пор как
ChatGPT положил начало глобальному ажиотажу вокруг ИИ, инвесторы считали, что для развития технологии потребуются всё более совершенные чипы от таких компаний, как
Nvidia.
Но
DeepSeek перевернул это представление с ног на голову, представив модель с сопоставимой производительностью, но требующую куда менее сложных чипов и относительно небольших затрат.
Как итог - инвесторы поспешили избавиться от акций
Nvidia, в результате чего 27 января они упали на 17 %, а стоимость крупнейшей в мире компании сократилась на 589 миллиардов долларов — это рекорд фондового рынка. Производитель станков для производства полупроводников
ASML Holding NV и другие компании, которые ранее получили хорошую прибыль за счет высокого спроса на современное оборудование для ИИ, также понесли убытки.
Успех DeepSeek заставляет задуматься: а насколько обоснованны огромные расходы таких компаний, как Meta и Microsoft Corp.? Каждая из них только в этом году выделила на инфраструктуру ИИ более $65 миллиардов долларов.
Акции
Meta* и
Microsoft тоже открылись небольшим снижением, хотя оно было менее значительным по сравнению с
Nvidia. Это произошло из-за того, что инвесторы начали пересматривать свои ожидания относительно объёмов инвестиций этих технологических гигантов в инфраструктуру искусственного интеллекта. Акции
Meta* даже восстановились к концу торговой сессии и закрылись ростом. Выросли и акции китайских компаний, связанных с
DeepSeek, таких как
Iflytek Co.
Несмотря на то что фондовый рынок лихорадило, отраслевые эксперты видят в прорыве
DeepSeek скорее благо: ведь это может подтолкнуть
OpenAI и другие американские компании к снижению цен и придать ускорение внедрению ИИ.
КАК DEEPSEEK МОЖЕТ ПОВЛИЯТЬ НА ГЛОБАЛЬНУЮ КОНКУРЕНЦИЮ ЗА ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ?
Искусственный интеллект является ключевым фактором в борьбе
США и
Китая за технологическое превосходство.
Вашингтон запретил продавать
Китаю высокопроизводительные графические процессоры, чтобы замедлить развитие страны в этой отрасли.
Но судя по успеху
DeepSeek, китайские инженеры в области ИИ нашли способ обойти торговые барьеры, сосредоточившись на повышении эффективности при ограниченных ресурсах. Хотя до сих пор неизвестно, на каком оборудовании была создана китайская модель ИИ.
Разработчики по всему миру уже экспериментируют с программным обеспечением DeepSeek, создавая собственные инструменты на его основе. Открытый доступ к открытому коду должен помочь американским компаниям повысить эффективность своих моделей и в принципе ускорить внедрение передовых методов ИИ.
Но это, в свою очередь, может вынудить регулирующие органы принять новые правила по использованию китайской модели. Ведь всякий раз, когда китайская компания выходит на зарубежные рынки, возникает закономерный вопрос: могут ли массивы данных, которые мобильное приложение собирает и хранит на китайских серверах, представлять угрозу конфиденциальности или безопасности для граждан
США?
С другой стороны, модели
DeepSeek имеют открытый исходный код, а значит пользователи в
США могут его просто взять и запустить свои модели так, чтобы они не использовали серверы в
Китае.
КТО ЯВЛЯЕТСЯ ОСНОВАТЕЛЕМ DEEPSEEK?
Лян Вэньфэн родился в 1985 году в провинции
Гуандун. Он получил степени бакалавра и магистра в области электронной и информационной инженерии в
Чжэцзянском университете и никогда не работал за пределами
Китая. Согласно базе данных компании
Tianyancha, он основал компанию
DeepSeek с уставным капиталом в 10 миллионов юаней (1,4 миллиона долларов).
В интервью китайскому изданию
36kr Лян заявил, что главным препятствием для дальнейшего роста компании являются не проблемы с финансированием, а ограничения
США на доступ к самым современным чипам. Он подчеркнул, что многие ведущие исследователи
DeepSeek — выпускники престижных китайских вузов, и они вполне могут создать в
Китае собственную экосистему ИИ, аналогичную той, что выстроена вокруг компании
Nvidia и ее чипов.
«Рост инвестиций не всегда означает рост инноваций. Иначе все новаторские идеи принадлежали бы крупнейшим корпорациям», — отметил
Лян.
Ляна, кстати, часто сравнивают с основателем
OpenAI Сэмом Альтманом, но гражданин
Китая ведёт себя гораздо скромнее и редко выступает публично.
КАКОЕ МЕСТО ЗАНИМАЕТ DEEPSEEK В СФЕРЕ ИИ КИТАЯ?
Технологические лидеры
Китая, такие как
Alibaba Group Holding Ltd.,
Baidu Inc. и Tencent Holdings Ltd., вложили много денег и ресурсов, чтобы заполучить оборудование и клиентов для своих проектов в области искусственного интеллекта.
Но DeepSeek, как и стартап 01.AI бывшего руководителя Microsoft и Google Кай-Фу Ли, использует открытый исходный код, чтобы сначала быстро привлечь как можно больше пользователей, а уже потом думать, как монетизировать проект.
Доступность модели
DeepSeek спровоцировала в
Китае технологическую войну — многие компании вступили в борьбу за привлечение пользователей, что в итоге привело к значительному за последние полтора года снижению цен.
В ЧЕМ НЕДОСТАТКИ DEEPSEEK?
Как и все другие китайские модели искусственного интеллекта,
DeepSeek подвергает самоцензуре темы, считающиеся в
Китае деликатными. Например, он не отвечает на вопросы о протестах на площади
Тяньаньмэнь в 1989 году или избегает темы возможного вторжения
Китая в
Тайвань. Бот
DeepSeek дает подробные ответы о политических деятелях, таких как премьер-министр
Индии Нарендра Моди, но отказывается рассказывать о председателе
Китайской Народной Республики (КНР)
Си Цзиньпине.
Из-за своей внезапной популярности облачная инфраструктура
DeepSeek, скорее всего, будет испытывать серьезную нагрузку. Так, 27 января, когда все СМИ написали о прорыве китайского стартапа, в работе бота начались серьезные сбои. Теперь трафик увеличится еще больше, ведь теперь запросы будут отправлять как старые, так и новые пользователи.
Bloomberg
Перевод Антона Дубровского
* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ
Иллюстрация: использованы изображения endang firmansyah , freepik