Разработка модели R2 застопорилась из-за ограничений на поставку чипов H20. Популярный китайский ИИ-разработчик DeepSeek столкнулся с серьёзными трудностями по запуску следующей версии модели. Причиной стало ограничение поставок видеокарт Nvidia со стороны США.
Компания DeepSeek выпустила обновлённую версию рассуждающей модели R1, которая показала хорошие результаты в решении математических задач и написании кода. Однако источник данных для её обучения остаётся неизвестным.
DeepSeek обновила ИИ-модель Prover, специализирующуюся на доказательстве теорем и решении сложных математических задач. Модель построена на базе MoE-архитектуры с 671 миллиардами параметров и имеет облегчённый вариант, доступный на Hugging Face
На фоне обсуждения прибыльности компаний искусственного интеллекта DeepSeek раскрыла детали своей модели бизнеса и сообщила, что в теории маржа может составляет не менее 545%.
Не обращая внимания на временные колебания рынка из-за появления DeepSeek R1, Nvidia продолжает успешно работать, удваивая выручку от центров обработки данных и презентуя новые мощные чипы.
Производитель чипов Zhaoxin объявил о поддержке DeepSeek-R1 на всех своих процессорах, включая потребительские и серверные модели.
Китайская компания DeepSeek снова открыла доступ к своему API после временного прекращения работы из-за нехватки ресурсов.
Дженсен Хуанг объяснил, почему выпуск модели R1 от DeepSeek — это возможность для роста, а не угроза для бизнеса Nvidia.