© Getty Images Китайський стартап зіткнувся з технічними обмеженнями вітчизняних процесорів.
Китайська компанія зі штучного інтелекту DeepSeek відклала запуск своєї нової моделі R2 після того, як не змогла успішно провести навчання на процесорах Ascend від Huawei. За словами трьох джерел Financial Times, знайомих із ситуацією, влада Китаю наполегливо рекомендувала стартапу перейти на вітчизняні чіпи замість продукції Nvidia, але технічні труднощі змусили повернутися до використання американського обладнання для ключового етапу.
R2 планували представити у травні 2025 року, однак невдачі під час навчання моделі на Ascend і триваліший, ніж очікувалося, процес маркування даних призвели до затримки. У результаті компанія втратила позиції на користь конкурентів.
Після випуску своєї попередньої моделі R1 у січні, яка викликала найбільше падіння акцій за один день в історії, DeepSeek отримала від уряду сигнал переходити на локальні технології – чіпи Huawei Ascend та розробки компанії Cambricon. Проте під час спроби навчити R2 на Ascend інженери стикнулися з низкою проблем: нестабільна робота, повільне з’єднання та менш ефективне програмне забезпечення у порівнянні з Nvidia.
Зрештою компанія вирішила використовувати чіпи Nvidia для навчання, а Huawei Ascend – лише для етапу інференсу, тобто логічного висновку, коли вже готова модель генерує відповіді чи прогнози. Щоб допомогти розв’язати проблеми, Huawei направила команду інженерів до офісу DeepSeek. Однак навіть за їхньої присутності навчання R2 на Ascend завершити не вдалося.
Засновник DeepSeek Лян Веньфенг, за словами співробітників компанії, висловив незадоволення прогресом. Він наполягає на додатковому часі для створення вдосконаленої моделі, здатної утримати лідерство на ринку ШІ.
Експерти вказують, що китайські виробники чіпів значно поступаються американським у складних завданнях. Але дослідник Каліфорнійського університету в Берклі Рітвік Гупта зазначає, що “моделі – це товари, які можна легко замінити”. За його словами, чимало розробників вже використовують Qwen3 від Alibaba, яка запозичує ключові ідеї DeepSeek, зокрема алгоритм навчання, але реалізує їх ефективніше. Гупта також зауважив, що Huawei наразі проходить “проблеми зростання” з використанням Ascend для навчання, однак очікує, що компанія з часом адаптує свої чіпи до потреб провідних моделей.
Паралельно влада Китаю запровадила нові обмеження на замовлення американських чіпів Nvidia H20. Технологічним компаніям тепер необхідно обґрунтовувати закупівлі, щоб стимулювати розвиток внутрішніх альтернатив.
Сама Nvidia, яка опинилася в центрі геополітичного протистояння між Пекіном і Вашингтоном, нещодавно погодилася віддавати частину доходів від продажів у Китаї уряду США, щоб відновити постачання H20 на китайський ринок. У компанії наголошують, що відмова від доступу до ринків та спільноти розробників негативно вплине на економічну та національну безпеку США.
DeepSeek продовжує роботу з Huawei, щоб зробити R2 сумісною з Ascend для етапу інференсу. Китайські ЗМІ не виключають, що реліз може відбутися в найближчі тижні, хоча точна дата залежить від завершення оптимізації та тестування.
DeepSeek та Alibaba випускають моделі штучного інтелекту з відкритим вихідним кодом, що дозволяє вільно їх завантажувати та змінювати. Цей підхід забезпечує швидке поширення китайських технологій і створює конкуренцію для американських розробників, таких як OpenAI, які традиційно тримали свої моделі закритими. Подібна “гонка” за стандартизацію може мати значні геополітичні наслідки, адже відкриті моделі ШІ стають новим важелем впливу, що змушує Вашингтон переглядати свою стратегію.