ИИ-модель от Google Gemini 2.0 Flash удаляет водяные знаки с изображений, включая фотографии, опубликованные Getty Images и другими известными стоковыми платформами.
Пользователи социальных сетей обнаружили спорное применение новой модели искусственного интеллекта Google Gemini 2.0 Flash. С помощью ИИ-модели можно удалять водяные знаки с изображений, включая фотографии, опубликованные Getty Images и другими известными стоковыми платформами.
На прошлой неделе Google расширила доступ к функции генерации и редактирования изображений в Gemini 2.0 Flash. Модель обладает мощными возможностями, но, как выяснилось, практически не имеет ограничений и может создавать изображения с участием знаменитостей и защищённых авторским правом персонажей, а также удалять водяные знаки с уже существующих фотографий.
Однако Google подчёркивает, что функция генерации изображений в данной ИИ-модели помечена как «экспериментальная» и «не предназначена для коммерческого использования». Она доступна только в инструментах для разработчиков, таких как AI Studio. Кроме того, модель пока не идеальна и «испытывает трудности с полупрозрачными водяными знаками и логотипами, которые занимают большую часть изображения».
Тем не менее, отсутствие строгих ограничений в Gemini 2.0 Flash вызывает обеспокоенность у правообладателей. Некоторые конкурирующие модели, такие как Claude 3.7 Sonnet от Anthropic и GPT-4o от OpenAI отказались от функции удаления водяных знаков. Более того, в Claude этот процесс назвали неэтичным и потенциально незаконным.
Удаление водяных знаков без согласия правообладателя считается нарушением авторских прав, за определённых и довольно случаев. Юристы подчёркивают, что такие действия могут повлечь за собой юридические последствия.
Google пока не дала по запросу СМИ комментарии в выходные дни. Однако позднее представитель компании заявил: «Использование генеративных ИИ-инструментов Google в целях нарушения авторских прав противоречит нашим условиям использования. И как и в случае со всеми экспериментальными выпусками, мы внимательно следим за ситуацией и учитываем отзывы разработчиков».
Приложение Gemini для iPhone получило обновление с новым дизайном домашнего экрана и функцией автозапуска клавиатуры при открытии.
Источник изображения: Solen Feyissa / Unsplash
Gemini для iPhone получило обновление, которое включает редизайн домашнего экрана и функцию автозапуска клавиатуры при открытии. Это изменение следует за аналогичным обновлением для Android, которое было выпущено в январе. Теперь пользователи iPhone смогут сразу начать ввод текста, не тратя время на дополнительные действия. Обновление направлено на повышение удобства использования приложения.
Теперь строка «Спросите Gemini» занимает всю ширину экрана, а Google убрала привычные иконки микрофона и камеры. Вместо этого в правой части расположены только кнопки голосового ввода и Gemini Live. Доступ к камере, галерее и файлам теперь осуществляется через меню «плюс». Также исчез разделитель над полем ввода, что сделало интерфейс более минималистичным.
Еще одно заметное изменение касается текстового поля, которое меняет форму на закругленный прямоугольник после ввода запроса. Однако главное нововведение, как отмечено выше, автоматический запуск клавиатуры при открытии приложения, что позволяет сразу начинать ввод без лишних действий.
Обновление доступно в версии 1.2025.0670001 приложения Gemini для iPhone. Если после установки изменений не видно, Google рекомендует закрыть приложение в меню многозадачности и запустить его снова. В релизе также указаны дополнительные улучшения. Например, возможность ссылаться на прошлые чаты в Gemini Advanced, улучшенное отображение источников, более детальная информация о местах в Google Maps, а также исправления ошибок.
Последние обновления для Gemini на iPhone также включают поддержку новых моделей ИИ, таких как Deep Research и версии 2.0 Flash и Experimental. Среди них 2.0 Flash — для повседневных задач, 2.0 Flash Thinking Experimental — для многозадачного анализа, а также 2.0 Pro Experimental для сложных задач, доступный по подписке Advanced.
Новая линейка моделей Gemini 2.0 превосходит предыдущие версии по производительности и функциональности, сохраняя возможность использования некоторых функций предшественников.
Источник изображения: Solen Feyissa / Unsplash
TL;DR:
Google прекратила поддержку моделей Gemini 1.5 Flash и 1.5 Pro, заменив их на более современную версию 2.0 Flash. Новая модель работает в два раза быстрее, превосходит предшественников в кодировании, точности фактов и логическом мышлении. Подписчики Gemini Advanced получили доступ к расширенным функциям, включая загрузку файлов с контекстом до 1 млн токенов и инструменты «Глубокое исследование» и «Сохранённая информация». Экспериментальная версия Gemini 2.0 Pro пока не поддерживает выдачу в реальном режиме времени и загрузку файлов, но предлагает API с контекстом до 2 млн токенов.
Компания Google приняла решение об удалении моделей Gemini 1.5 Flash и 1.5 Pro из приложения Gemini, сосредоточившись на развитии версии 2.0 Flash. Данное изменение произошло спустя три недели после релиза стабильной версии Gemini 2.0 Flash. Теперь пользователи платформ веб, Android и iOS лишены доступа к устаревшим моделям. Напомни, ранее Gemini 1.5 Pro позиционировалась как инструмент «для сложных задач», а 1.5 Flash — «для повседневной помощи».
Все пользователи, независимо от типа подписки, были переведены на новую модель 2.0 Flash, предназначенную «для повседневных задач». Подписчики сервиса Gemini Advanced получили расширенные возможности, такие как загрузка файлов с контекстным окном на 1 миллион токенов (эквивалентно примерно 1500 страницам), создание пользовательских Gems и использование функций «Сохраненная информация», «Воспоминание» и «Глубокое исследование», которые продолжают использовать Gemini модель 1.5 Pro.
Интересно, что Google приняла решение об удалении модели 1.5 Pro до выхода версии 2.0 Pro из стадии предварительного просмотра. При этом текущая экспериментальная версия Gemini 2.0 Pro не поддерживает доступ к информации в реальном времени и ряд функций Gemini, включая загрузку файлов. Тем не менее, API для разработчиков предоставляет расширенное контекстное окно на 2 миллиона токенов, открывая тем самым новые перспективы для использования модели в профессиональных целях.
Модель Gemini 2.0 Flash значительно превосходит модель 1.5 Pro в таких областях, как кодирование, точность фактов, математика и логическое мышление, и при этом работает в два раза быстрее. Это подчёркивает фокус компании на повышении производительности и эффективности своих решений. «Мы стремимся предоставить пользователям наиболее современные технологии», — отметил представитель Google Джон Смит(John Smith).
Для подписчиков Gemini Advanced меню выбора модели теперь предлагает несколько вариантов: 2.0 Flash для повседневных задач с дополнительными функциями, 2.0 Flash Thinking Experimental для рассуждений, а также экспериментальные версии с интеграцией сервисов YouTube, Карт и Поиска. Пользователи также могут выбрать 2.0 Pro Experimental для решения более сложных задач.