Чат-бот китайского стартапа DeepSeek приостановил регистрацию из-за масштабных кибератак
В настоящее время его успех обсуждают все мировые СМИ, и приложение занимает лидирующие позиции по количеству скачиваний в различных странах, включая Россию.
Эксперт по искусственному интеллекту специально для «Осторожно, новости» раскрывает все, что необходимо знать о продукте, который повлиял на американские рынки:
— По словам руководителя лаборатории суперкомпьютеров в ИИ Центра ИИ Сколтеха Сергея Рыкованова, Deepseek обучали преимущественно на китайских источниках данных (форумы, соцсети, статьи). Отсюда лучшее понимание внутренних культурных контекстов: китайской речи, сленга и национальных реалий. Организационные отличия – в том, что Deepseek подчиняется китайскому законодательству и правилам цензуры. У него более жёсткая модерация контента, чем в США или Европе. (например, там нельзя узнать, что случилось на площади Тяньаньмэнь в 1989 году — прим. ред.) В темах мировой повестки Deepseek может быть менее точен, чем ChatGPT. С ним можно случайно узнать о тайнах Великой китайской стены, даже если спрашивали про другие вещи.
— Чат-бот от Deepseek смог так быстро завоевать популярность благодаря обширной пользовательской базе в Китае: внутренний рынок колоссален, а наличие мощной поддержки местных техногигантов ускоряет распространение. Также тут важна господдержка: ИИ-технологии в КНР — приоритетное направление развития. Это открывает разработчикам доступ к грантам, партнёрствам и инфраструктуре.
— Разговоры о том, что «в Китае сделали аналог ChatGPT за копейки», — отчасти преувеличение. Китайские проекты действительно дешевле и быстрее запускают AI-продукты на локальном рынке. Но чаще всего это «микс» из уже известных исследовательских решений и локальных оптимизаций. Они используют имеющиеся открытые модели и накопленные наработки, применяя к ним технологии оптимизации (сокращение параметров, выборочную активацию слоёв). На бумаге затраты могут выглядеть ниже, потому что часть их «спрятана» в госпрограммах, субсидиях, дешёвой электроэнергии, налоговых льготах и т.д.
— Когда речь идет о цене важно учитывать, что западные гиганты инвестируют в фундаментальные исследования. Эти расходы тяжело быстро окупить, но они дают долгосрочный научный задел.
— Скорее всего, эта модель (и другие китайские решения) максимально используют существующие языковые модели, «докрученные» под местные задачи и языковые нюансы. Фактически Deepseek — эволюционное продолжение предыдущих проектов. Что, впрочем, нормально. Реальность такова, что современные ИИ-разработки часто строятся на открытых фреймворках (PyTorch, TensorFlow) и используют уже опубликованные статьи, исходные коды и модели. «Слепить» из существующих наработок — нормальная практика в AI-сфере, это ускоряет прогресс.
— Сейчас все обсуждают сбои в работе Deepseek. По мнению Рыкованова, за ними стоит перегрузка серверов при обновлении модели и последующем устранении технических ошибок. “Я бы сильно не верил в проявление конкурентных войн и кибератаки — на деле все заняты тем, что пытаются научить ИИ распознавать мемы и заказывать себе кофе, и реальной «войной» там и не пахнет – скорее, братское соперничество в стиле «чья модель выучит больше языков за неделю». На практике речь идёт о здоровой (хотя и жёсткой) конкуренции, где каждая страна и компания стремится захватить больший сегмент рынка”, — отмечает он.
Распечатать