Компания OpenAI выпустила долгожданное улучшение возможностей ИИ для генерации изображений. Вместо использования отдельной модели, такой как DALL-E, новый продвинутый генератор изображений теперь встроен в GPT-4o.
Существует множество моделей генерации изображений, способных создавать фантастические сцены Однако все они сталкиваются с трудностями при создании изображений с текстом, логотипами и другими распространенными элементами повседневной жизни.
OpenAI заявляет, что новый генератор изображений GPT-4o решает эти проблемы: он способен точно воспроизводить текст и точно следовать инструкциям, используя свою базу знаний и контекст чата. Новый инструмент также позволяет редактировать загруженные изображения или создавать новые, используя загруженную графику в качестве визуального вдохновения.
Новая модель генерации изображений GPT-4o уже доступна всем пользователям ChatGPT Plus, Pro, Team и Free. Поскольку эта модель теперь является генератором изображений по умолчанию в ChatGPT, пользователи смогут пользоваться ею без необходимости выбирать ее отдельно перед запросом. Также можно настраивать изображения, указывая соотношение сторон, точные цвета в виде HEX-кодов или делать фон прозрачным. В ближайшие недели OpenAI также представит этот инструмент пользователям ChatGPT Enterprise и Edu.
Эту модель можно будет использовать в Sora для создания изображений, а также через отдельный DALL-E GPT. Для разработчиков генерация изображений с помощью GPT-4o API станет доступной в ближайшие недели.
Тем не менее, у модели есть некоторые ограничения. Поскольку она создает более детализированные изображения, время генерации может достигать одной минуты. Также на момент запуска у модели наблюдаются следующие недостатки, которые OpenAI планирует исправить в ближайшие недели и месяцы:
- Может слишком сильно обрезать длинные изображения, например постеры, особенно в нижней части.
- Генерация изображений может включать выдуманные детали, особенно при недостаточно подробных запросах.
- При создании изображений на основе своей базы знаний модель может испытывать трудности с точным воспроизведением более 10–20 различных объектов одновременно, например, полной периодической таблицы.
- Иногда модель некорректно отображает символы нелатинских языков или «галлюцинирует» их, особенно при высокой сложности текста.
- Редактирование отдельных частей изображения, например исправление опечаток, может быть неэффективным и иногда изменяет другие части изображения неожиданным образом или добавляет новые ошибки.
- Модель испытывает сложности при рендеринге мелких и детализированных элементов.
Все изображения, созданные с помощью новой модели, будут содержать метаданные C2PA, а внутренний инструмент OpenAI сможет подтверждать, было ли изображение сгенерировано этой моделью.
Несмотря на существующие ограничения, новый GPT-4o предлагает пользователям более точные и настраиваемые возможности создания изображений. По мере дальнейшего улучшения модели можно ожидать повышения ее производительности и надежности.
Как получить доступ к ChatGPT в России
OpenAI ограничивает доступ к ChatGPT в России. Однако вы можете использовать возможности чат-бота, настроив Comss.one DNS на вашем устройстве по следующим инструкциям:
Настройка Comss.one DNS
- Настройка Comss.one DNS (DNS-over-HTTPS) в браузерах
- Настройка Comss.one DNS в Windows
- Настройка Comss.one DNS на Android
- Настройка Comss.one DNS на iPhone, iPad и Mac
- Как настроить Comss.one DNS в Linux
- Роутеры Keenetic (инструкция)
- Роутеры MikroTik (инструкция)
Проверка работы Comss.one DNS:
- Для проверки корректности настройки DNS перейдите на страницу Comss.one DNS. Вы должны увидеть сообщение, что Comss.one DNS настроен.
- Если проверка не пройдена, убедитесь, что в вашей ОС или браузере не настроен другой DNS-over-HTTPS.
- После проверки перезагрузите устройство, чтобы изменения вступили в силу.
Использование ChatGPT
- Откройте веб-версию ChatGPT или используйте мобильные и настольные приложениях ChatGPT:
- Используйте чат-бота без регистрации, или создайте бесплатную учетную запись и войдите в свой аккаунт для получения расширенных возможностей.
Обновления программ, что нового
• Релиз Firefox 137. Что нового
• Яндекс выложил в открытый доступ YandexGPT 5 Lite Instruct — компактную, но мощную ИИ-модель
• Нейросеть Яндекса ускоряет уборку мусора в заповедниках с помощью аэрофотоанализа
• Apple готовит «ИИ-тренера» в обновлённом приложении «Здоровье» — запуск ожидается в 2026 году
• Сервисы «Яндекса» столкнулись с крупным сбоем из-за аварии в дата-центре
• Обновление Comss.one DNS: Доступ к T3 Chat, Guilded, MongoDB и другим популярным сервисам