Google объявила о скором выходе своего ИИ-ассистента Gemini для Android Auto. Уже через несколько месяцев водители смогут управлять автомобилем с помощью голоса, не нажимая никаких кнопок. Система будет понимать естественную речь и выполнять команды, позволяя полностью сосредоточиться на дороге.
Источник изображения: Google
По словам компании, Gemini в автомобиле — это не просто голосовой поиск, а полноценный помощник с автомобильными функциями. Например, можно попросить проложить маршрут до почты, а затем уточнить: «Найди зарядную станцию рядом с парком». Кроме того, как уточняет ArenaEV, ассистент поддерживает Gemini Live — режим живого диалога и можно обсудить любые вопросы.
Интеграция начнётся с Android Auto, а затем дойдёт до машин с Google Built-in, где система встроена прямо в автомобиль, без использования смартфона. В настоящий моммент более 250 миллионов автомобилей поддерживают Android Auto, а около 50 моделей имеют встроенный Google-интерфейс. Компания обещает, что Gemini сделает поездки не только удобнее, но и безопаснее, ведь водителю больше не придётся отвлекаться на физические кнопки.
Apple расширяет своё присутствие на рынке искусственного интеллекта, разрабатывая специализированные процессоры для дата-центров под кодовым названием Baltra, которые будут обрабатывать запросы Apple Intelligence. В этом ей помогает Broadcom, но детали проекта намекают на более амбициозные планы.
Как сообщает Tom's Hardware, Baltra создаётся в сотрудничестве с Broadcom и должен быть готов к 2027 году. Обычно ИИ-чипы Broadcom используют систолические массивы тензорных или матричных блоков, а также память HBM. Однако Apple рассматривает нестандартные конфигурации, включая варианты с удвоенным, учетверённым или даже восьмикратным количеством основных и графических ядер по сравнению с M3 Ultra.
M3 Ultra является одним из самых мощных процессоров Apple с 24 высокопроизводительных и 8 энергоэффективных ядер. Однако серверные чипы редко используют гибридные архитектуры, поэтому остаётся загадкой, идёт ли речь об 256 CPU-ядрах общего назначения или 192 высокопроизводительных. Если графические кластеры M3 Ultra действительно увеличат вчетверо, это может превзойти даже будущую видеокарту Nvidia GeForce RTX 5090.
Однако есть нюанс. Современные ИИ-алгоритмы полагаются не на CPU или GPU, а на тензорные и матричные ускорители. Например, нейропроцессор (NPU) Apple оптимизирован для локальных ИИ-задач. Если Baltra предназначен для ИИ-инференса, компании важнее масштабировать NPU, а не CPU. Тем не менее, серверы всё равно требуют CPU для управления потоками данных, так что, вероятно, Apple разрабатывает и то, и другое.
Параллельно компания продолжает развивать линейку чипов для своих устройств. Сообщается, что M5 появится в iPad Pro и MacBook Pro уже к концу 2025 года. Далее последуют M6 (Komodo) и M7 (Borneo) для новых поколений iPad и Mac. Также в разработке находится высокопроизводительный чип Sotra, но его назначение пока неизвестно. Кроме того, Apple работает над процессорами для носимых устройств, включая очки дополненной реальности.
Исследователи из Carnegie Mellon University представили ИИ-модель LegoGPT, способную создавать уникальные проекты из конструктора Lego на основе текстовых описаний. Система уже доступна бесплатно на платформе GitHub и может использоваться как для личных проектов, так и в образовательных целях.
Для обучения искусственного интеллекта (ИИ) исследователи использовали набор данных, содержащий более 47 000 Lego-структур, собранных из 28 000 уникальных трёхмерных объектов. Среди них — книжные полки, стулья, автомобили, корабли, гитары и другие предметы. На основе этого массива данных модель научилась понимать, как соединять отдельные элементы, чтобы получались устойчивые и функциональные конструкции.
Инструмент можно комбинировать с компьютерным зрением или моделями обработки изображений. Например, сделав фото имеющихся Lego-кирпичей, можно загрузить снимок в систему, которая предложит множество вариантов сборки, используя только те детали, которые имеются в наличии, что делает LegoGPT не просто творческой игрушкой, но и практическим помощником в обучении основам проектирования и инженерии.
Чтобы обеспечить работоспособность и устойчивость создаваемых конструкций, в процесс генерации были внедрены проверка на корректность и механизм отката при выявлении ошибок. Модель на каждом этапе проверяет, правильно ли форматирован кирпич, существует ли он в библиотеке и не пересекается ли с уже установленными элементами. Если система определяет, что конструкция теряет устойчивость, она возвращается к последнему стабильному состоянию и продолжает сборку с этого места.
В основе работы LegoGPT лежит специально подготовленный датасет StableText2Lego. В нём текстовые запросы преобразуются в трехмерные модели (ShapeNetCore mesh), которые затем переводятся в воксельную сетку размером 20x20x20. На основе этой сетки определяется начальное расположение элементов Lego. После этого алгоритм вносит вариации, сохраняя общую форму объекта, а затем отсеивает нестабильные конструкции. Оставшиеся рендерятся с 24 ракурсов, а GPT-4o генерирует к ним описания.
Полученные таким образом данные позволяют LegoGPT устанавливать связь между текстовым описанием и физической конструкцией. Модель разбивает проект на слои, конвертируя их в текстовые токены, и строит пошаговые инструкции. Это помогает пользователю понять, как именно собирается объект и какие элементы используются в каждой его части.
Мнение HDHai
Честно говоря, LegoGPT — это как мечта детства, ставшая реальностью. Наконец-то можно просто сказать «собери мне крутой космический корабль» и получить не абстрактную 3D-модель, а реальную схему из Lego. Правда, есть нюанс: нейросеть пока требует технической подкованности (GitHub всё-таки), но сам факт, что ИИ научился учитывать законы физики и откатывать неудачные конструкции, впечатляет. Интересно, как скоро энтузиасты прикрутят к этому красивый интерфейс? Тогда LegoGPT может стать Must Have для родителей, которым надоело придумывать новые домики из кубиков после работы. Главное, чтобы ИИ не начал выдавать слишком сложные схемы, иначе придётся объяснять ребёнку, почему его «простой дракон» состоит из 2000 деталей и требует инженерного образования.