DeepSeek обновила ИИ-модель Prover, специализирующуюся на доказательстве теорем и решении сложных математических задач. Модель построена на базе MoE-архитектуры с 671 миллиардами параметров и имеет облегчённый вариант, доступный на Hugging Face
Источник изображения: Solen Feyissa / Unsplash
Как сообщает TechCrunch со ссылкой на South China Morning Post, новая версия Prover V2 и её облегчённый вариант уже доступны на платформе для разработчиков Hugging Face. Модель основана на архитектуре DeepSeek-V3, которая использует 671 миллиард параметров и технологию Mixture of Experts (MoE), позволяющую эффективно распределять задачи между узкоспециализированными модулями.
Технология MoE разбивает сложные вычисления на подзадачи, передавая их отдельным «экспертам», что повышает точность и скорость работы модели. Количество параметров напрямую влияет на способность ИИ решать нетривиальные математические проблемы. Отмечается, что это не первое обновление. Так, в августе DeepSeek уже обновляла Prover, позиционируя его как «открытую модель для формального доказательства теорем и математических рассуждений».
Новый релиз совпадает с активным прогрессом компании. Недавно стартап также представил обновлённую V3 — универсальную ИИ-модель, а в ближайшее время анонсирует улучшенную версию R1, ориентированную на логические рассуждения. Интересно, что в феврале Reuters сообщила, что DeepSeek может впервые привлечь внешние инвестиции.
Аналитики отмечают, что в целом компания делает ставку на научно-ориентированный ИИ, который может применяться в академических исследованиях и инженерных расчётах и, в отличие от чисто разговорных моделей, таких как ChatGPT, Prover V2 фокусируется на строгих математических выкладках, что делает его потенциально полезным инструментом для учёных и программистов.
Пока компания не раскрывает детали тестирования новой версии, но её публикация в открытом доступе говорит о готовности к сотрудничеству с разработчиками. Ожидается, что в ближайшие месяцы DeepSeek представит ещё несколько технологических новинок, укрепляя свои позиции на рынке искусственного интеллекта.
Мнение hdhAI
Обновление DeepSeek Prover V2 подтверждает тренд на специализированные ИИ-модели, способные не просто генерировать текст, а решать сложные научные задачи. Если Prover V2 подтвердит свою эффективность, это может ускорить внедрение ИИ в фундаментальную науку и автоматизацию сложных вычислений. Однако пока неясно, насколько модель превосходит существующие аналоги и сможет ли она действительно заменить экспертов-математиков. Если DeepSeek удастся совместить мощь MoE-архитектуры с точностью формальной логики, это может стать прорывом — но для этого нужны независимые тесты и реальные кейсы применения.
Google анонсировала планы по внедрению своей ИИ-модели Gemini в автомобили и на умные часы Wear OS. Обновление также коснётся планшетов и наушников.
Источник изображения: Solen Feyissa / Unsplash
Генеральный директор Google Сундар Пичаи (Sundar Pichai) объявил о намерении компании интегрировать Gemini в автомобили и умные часы. Технология появится в машинах благодаря платформе Android Auto, а на устройствах Wear OS заменит текущую версию Google Assistant. По словам главы, обновление также затронет планшеты и наушники, подключаемые к смартфону.
На конференции Alphabet (материнской компании Google), посвящённой итогам первого квартала Пичаи сказал: «Мы обновляем Google Assistant на мобильных устройствах до Gemini, а позже в этом году мы обновим планшеты, автомобили и устройства, которые подключаются к вашему телефону, такие как наушники и часы».
Дополнительных подробностей пока не раскрывается, но это и не удивительно. Google вложила значительные ресурсы в разработку Gemini, и было лишь вопросом времени, когда технология появится на всех устройствах и платформах, на которых компания отвечает за программное обеспечение. Именно это сейчас и происходит.
К сожалению, в привычной для Google манере, точные сроки остаются туманными. Фраза «позже в этом году» явно является любимым выражением компании. Сайт hdhAI сообщит вам, как только появится больше информации.
Тайваньская компания TSMC объявила о запуске производства самых передовых в мире 2-нм чипов. Новые процессоры обещают резкий рост производительности и энергоэффективности, что ускорит развитие ИИ, гаджетов и автономных систем. Однако за прорывом стоят сложности и риски.
Источник изображения: TSMC
Микрочипы являются основой современных технологий и встречаются практически во всех электронных устройствах, начиная от электрических зубных щеток и смартфонов и заканчивая ноутбуками и бытовой техникой. Они создаются путем нанесения и травления материалов, таких как кремний, для формирования микроскопических схем, содержащих миллиарды транзисторов.
Транзисторы — это, по сути, крошечные переключатели, управляющие потоком электричества и позволяющие компьютерам работать. Как правило, чем больше транзисторов содержит чип, тем он быстрее и мощнее.
По сравнению с предыдущим поколением микрочипов (3 нм), новая разработка TSMC обещает значительные преимущества. «Наша технология 2 нм обеспечит увеличение скорости вычислений на 10–15% при том же уровне энергопотребления или снижение потребления энергии на 20–30% при той же скорости», — заявляют в компании. Плотность транзисторов в новых чипах увеличится примерно на 15%, что сделает устройства быстрее, экономичнее и способными справляться с более сложными задачами.
Кремниевый щит Тайваня: как микрочипы влияют на глобальную безопасность
Источник изображения: TSMC
Микрочиповая индустрия Тайваня тесно связана с безопасностью острова. Ее часто называют «кремниевым щитом», так как ее глобальная экономическая значимость побуждает США и их союзников защищать Тайвань от возможного вторжения Китая. TSMC недавно заключила сделку на $100 млрд для строительства пяти новых заводов в США. Однако остаются сомнения относительно того, можно ли производить 2-нанометровые чипы за пределами Тайваня, поскольку некоторые официальные лица опасаются, что это может подорвать безопасность острова.
Компания TSMC, основанная в 1987 году, производит чипы для других компаний. Так, на долю Тайваня приходится 60% мирового рынка аутсорсинга производства полупроводников, и большая часть этого объёма приходится именно на TSMC. Сверхсовременные микрочипы TSMC используются в широком спектре устройств, например, компания производит процессоры Apple A-серии, применяемые в iPhone, iPad и Mac, графические процессоры NVidia, которые используются в машинном обучении и приложениях ИИ, процессоры AMD Ryzen и EPYC, применяемые в суперкомпьютерах по всему миру, а также процессоры Qualcomm Snapdragon, используемые в телефонах Samsung, Xiaomi, OnePlus и Google.
В 2020 году TSMC запустила специальный процесс миниатюризации микрочипов, известный как 5-нм технология FinFET, который сыграл ключевую роль в развитии смартфонов и высокопроизводительных вычислений (HPC). HPC — это практика одновременной работы нескольких процессоров над сложными вычислительными задачами.
Два года спустя TSMC представила 3-нм процесс миниатюризации, основанный на ещё более маленьких микрочипах. Это дальнейшее улучшило производительность и энергоэффективность. Например, процессоры Apple A-серии основаны на этой технологии.
2-нм чипы как новые горизонты технологий и вызовы будущего
Источник изображения: TSMC
Смартфоны, ноутбуки и планшеты с 2-нм чипами могут получить лучшую производительность и более длительное время автономной работы, что приведет к созданию меньших и легких устройств без потери мощности. Эффективность и скорость новых чипов имеют потенциал улучшить ИИ-приложения, такие как голосовые помощники, мгновенный перевод и автономные компьютерные системы (те, что работают с минимальным или нулевым участием человека).
Центры обработки данных смогут снизить энергопотребление и улучшить вычислительные возможности, что будет способствовать достижению экологических целей. Секторы, такие как автономные автомобили и робототехника, получат выгоду от увеличения скорости обработки и надежности новых чипов, делая эти технологии безопаснее и практичнее для массового внедрения.
Однако, несмотря на все многообещающие перспективы, 2-нм чипы также представляют собой вызовы. Первый из них связан со сложностью производства, при котором требуется использование передовых методов, таких как литография с использованием экстремального ультрафиолета (EUV), что является сложным и дорогим процессом, требующим исключительной точности.
Ещё одна серьёзная проблема — это перегрев. Даже при относительно низком энергопотреблении, по мере уменьшения транзисторов и увеличения их плотности, управление рассеиванием тепла становится критически важной задачей. Перегрев может повлиять на производительность и долговечность чипа. Кроме того, на таком малом масштабе традиционные материалы, такие как кремний, могут достигнуть своих пределов производительности, что потребует исследования новых материалов.
Тем не менее, повышенная вычислительная мощность, энергоэффективность и миниатюризация, обеспечиваемые этими чипами, могут стать воротами в новую эру потребительских и промышленных вычислений. Меньшие чипы могут привести к прорывам в технологиях будущего, создавая устройства, которые будут не только мощными, но и более экологичными и минимального размера.