Новости IT, Tech-лайфхаки & Кодинг

Исследователи выяснили, что при прохождении игр ИИ может терять над собой контроль

Google и Anthropic, тестируя свои модели, также изучают, как они справляются с играми. Компания Google сообщила, что её модель Gemini 2.5 Pro начинает «паниковать» в критических ситуациях во время игры в Pokémon Red. Согласно отчёту DeepMind, приближение к поражению приводит к ухудшению логики модели, которое исследователи описывают как снижение качества рассуждений.

Исследователи выяснили, что при прохождении игр ИИ может терять над собой контроль
Источник изображения: hdhai.com

Компании, разрабатывающие искусственный интеллект (ИИ), продолжают искать новые способы оценки возможностей своих моделей. Один из необычных подходов — тестирование ИИ в классических видеоиграх, например, в Pokémon Red. В ходе экспериментов специалисты Google DeepMind заметили у модели Gemini 2.5 Pro интересную особенность: приближение к поражению в игре вызывало у неё состояние, похожее на панику. Это приводило к ухудшению логики принятия решений, что обычно происходит у людей в стрессовых ситуациях.

Два независимых разработчика также запустили стримы на Twitch под названиями Gemini Plays Pokémon и Claude Plays Pokémon, где можно было наблюдать, как искусственный интеллект проходит игру 1996 года. Каждый ход сопровождался текстовым пояснением, которое показывало, как модель анализирует ситуацию.

Выяснилось, что несмотря на впечатляющий потенциал, ИИ пока не слишком хорош в прохождении игр. То, что ребёнок освоит за вечер, модели требуются дни. Например, Gemini тратит сотни часов на выполнение задач, которые человек решает интуитивно. Вместе с тем, интерес представляла не скорость, а характер поведения ИИ. Как отметили авторы исследования, в сложных ситуациях Gemini начинает действовать хаотично. В частности, перестаёт использовать доступные инструменты и принимает неэффективные решения.

Модель Claude от Anthropic тоже продемонстрировала любопытные особенности. Однажды, застряв в пещере Маунт-Мун, она пришла к ошибочному выводу, что если намеренно уничтожить всех своих покемонов, игра телепортирует её в следующий город. Поэтому модель стала методично отправлять игроков в заведомо проигрышные бои, где им грозила гибель.

Несмотря на подобные «неувязки», Gemini 2.5 Pro демонстрирует впечатляющие результаты в решении сложных головоломок и задач, а Google не исключает, что в будущем модель сможет самостоятельно создавать инструменты для оптимизации игрового процесса, включая модуль для подавления «панических» состояний.

Добавьте Hdhai в избранное и вы будете чаще видеть наши последние новости на главной Дзена и в разделе «Новости партнёров» или читайте нас в Telegram в привычном для вас формате.