OpenAI открыла генератор изображений для всех, но с лимитом в сутки

OpenAI открыла доступ к генератору изображений для всех пользователей ChatGPT, а не только для платных подписчиков. Об этом объявил Сэм Альтман (Sam Altman) в своём посте в X. Правда, для бесплатного тарифа есть ограничение на количество генераций в сутки.

Источник изображения: hdhai.com

После запуска инструмент стал настолько популярным, что, по словам Альтмана, GPU компании буквально плавились от нагрузки. Особенно пользователям полюбилась стилизация изображений под аниме Studio Ghibli, хотя это сразу вызвало вопросы об атворском праве и данных, на которых обучалась нейросеть. Пока неясно точное число картинок в день, но на прошлой неделе Альтман упоминал лимит в три изображения в сутки.

Некоторые пользователи быстро нашли неочевидное применение генератору, например, создание поддельных ресторанных чеков. Однако в OpenAI заверили, что все изображения содержат метаданные об их ИИ-происхождении, а за нарушение правил компания будет принимать меры.

На фоне этих новостей OpenAI сообщила о привлечении $40 млрд инвестиций при оценке в $300 млрд. Лидером раунда выступил SoftBank. Также сервис ChatGPT достиг 500 млн активных пользователей в неделю и 700 млн в месяц.

Открыв генератор для всех, OpenAI явно рассчитывает на новый виток популярности. Но вместе с этим придётся усиленно следить за злоупотреблениями, в частности копирования чужих стилей и генерации откровенных фейков.

Пока бесплатные пользователи тестируют свои три картинки в день, OpenAI готовится к следующему этапу — возможно, с новыми лимитами или функциями. Главное, чтобы серверы снова не «расплавились» от ажиотажа.

Источник: TechCrunch


ИИ-модель Gemini 2.0 Flash может удалять водяные знаки с изображений бесплатно

ИИ-модель от Google Gemini 2.0 Flash удаляет водяные знаки с изображений, включая фотографии, опубликованные Getty Images и другими известными стоковыми платформами.

Источник изображения: hdhai.com

Пользователи социальных сетей обнаружили спорное применение новой модели искусственного интеллекта Google Gemini 2.0 Flash. С помощью ИИ-модели можно удалять водяные знаки с изображений, включая фотографии, опубликованные Getty Images и другими известными стоковыми платформами.

На прошлой неделе Google расширила доступ к функции генерации и редактирования изображений в Gemini 2.0 Flash. Модель обладает мощными возможностями, но, как выяснилось, практически не имеет ограничений и может создавать изображения с участием знаменитостей и защищённых авторским правом персонажей, а также удалять водяные знаки с уже существующих фотографий.

Однако Google подчёркивает, что функция генерации изображений в данной ИИ-модели помечена как «экспериментальная» и «не предназначена для коммерческого использования». Она доступна только в инструментах для разработчиков, таких как AI Studio. Кроме того, модель пока не идеальна и «испытывает трудности с полупрозрачными водяными знаками и логотипами, которые занимают большую часть изображения».

Тем не менее, отсутствие строгих ограничений в Gemini 2.0 Flash вызывает обеспокоенность у правообладателей. Некоторые конкурирующие модели, такие как Claude 3.7 Sonnet от Anthropic и GPT-4o от OpenAI отказались от функции удаления водяных знаков. Более того, в Claude этот процесс назвали неэтичным и потенциально незаконным.

Удаление водяных знаков без согласия правообладателя считается нарушением авторских прав, за определённых и довольно случаев. Юристы подчёркивают, что такие действия могут повлечь за собой юридические последствия.

Google пока не дала по запросу СМИ комментарии в выходные дни. Однако позднее представитель компании заявил: «Использование генеративных ИИ-инструментов Google в целях нарушения авторских прав противоречит нашим условиям использования. И как и в случае со всеми экспериментальными выпусками, мы внимательно следим за ситуацией и учитываем отзывы разработчиков».

Источник: TechCrunch


Baidu представила ИИ-модели Ernie 4.5 и Ernie X1 для обработки мультимедиа

Две новые ИИ-модели от Baidu, Ernie 4.5 и Ernie X1, способны обрабатывать текст, видео, аудио и изображения. Они понимают мемы, сатиру и могут редактировать видео.

Источник изображения: hdhai.com / AI

Китайская поисковая система Baidu представила две новые версии ИИ-модели Ernie. Это Ernie 4.5 — последнее обновление базовой модели, выпущенной два года назад, и новая модель для решения задач Ernie X1. Обе системы обладают мультимодальными возможностями, то есть способны обрабатывать не только текст, но также видео, изображения и аудио.

По данным TechCrunch, Ernie X1 по производительности не уступает DeepSeek R1, но стоит вдвое дешевле. При этом Ernie 4.5 выделяется своим высоким EQ (эмоциональный интеллект), что позволяет чат-боту понимать мемы и сатиру.

Несмотря на то, что Baidu была одной из первых китайских компаний, выпустивших аналог ChatGPT от OpenAI, её модели до сих пор не получили широкого распространения. В то же время конкуренты, такие как DeepSeek, недавно вызвали беспокойство среди американских компаний и инвесторов, предложив ИИ-модели, сопоставимые по мощности, но значительно дешевле.

Ранее сообщалось, что Baidu планирует выпустить следующее поколение своей модели Ernie, уже в этом году. Ожидается, что новая версия получит улучшения в области мультимодальных возможностей, что может усилит позиции компании на рынке искусственного интеллекта.

Источник: TechCrunch






Warning: file_put_contents(/var/www/angella1/data/www/hdhai.com/counter/count.php): Failed to open stream: Permission denied in /var/www/angella1/data/www/hdhai.com/counter.php on line 89