Компания Яндекс анонсировала обновлённую версию своей визуальной нейросети — YandexART 2.0. Новая модель умеет создавать надписи непосредственно на изображениях, комбинировать различные стили на одной картинке и точнее размещать объекты в пространстве. Благодаря расширенным возможностям, пользователи смогут создавать логотипы для брендов, иллюстрации для постов в социальных сетях или веб-сайтов, а также оформлять рекламные баннеры.
Всё это делает YandexART 2.0 идеальным инструментом для предпринимателей и компаний, желающих повысить эффективность маркетинговых кампаний.
Технологии YandexART 2.0
Основой для YandexART 2.0 стала новая гибридная архитектура, которая объединяет преимущества свёрточных и трансформерных нейросетей. Свёрточная модель, подобно человеческому глазу, выявляет ключевые элементы на изображении, такие как текстуры и формы, но ей трудно работать с длинным контекстом. Трансформеры, наоборот, отлично справляются с задачей генерации сложных изображений с учётом множества деталей. Это объединение позволило YandexART 2.0 не только создавать более сложные и реалистичные изображения, но и учитывать больше деталей из пользовательского запроса.
Новая версия обучалась на огромном массиве данных — сотнях миллионов изображений и их описаний. Особая роль в этом процессе была отведена собственным разработкам Яндекса, включая модель VLM, которая анализировала изображения и формировала точные текстовые описания. Это помогло нейросети повысить точность и качество генерации.
Теперь YandexART 2.0 также умеет создавать надписи латинскими буквами, благодаря обучению на специальном наборе изображений с текстом. Это открывает новые возможности для дизайнеров и маркетологов, которые хотят интегрировать текстовые элементы в свои визуальные проекты.
Для оценки качества работы нейросети Яндекс разработал специальную систему, которая учитывает такие параметры, как релевантность, эстетичность, дефектность и комплексность изображений. В сравнении с конкурентом Midjourney v6.1, YandexART 2.0 показала лучшие результаты по таким критериям, как комплексность и эстетичность изображений.
YandexART для бизнеса
YandexART 2.0 уже доступна на платформе Yandex Cloud. Компании могут использовать её через API для интеграции в собственные приложения, либо протестировать генерацию изображений в демо-режиме, чтобы подобрать оптимальные промты. Нейросеть помогает быстрее и качественнее создавать реалистичные визуальные материалы для рекламных кампаний и маркетинговых проектов. Например, сервис Text.ru использует YandexART для создания иллюстраций, а с помощью YandexGPT создаёт текстовое сопровождение.
Нейросеть также помогает создавать рекламные объявления в Яндекс Директе. По данным экспериментов, использование сгенерированных нейрообъявлений в сочетании с собственными креативами может повысить эффективность кампаний на 10-15%.
YandexART для пользователей
Обычные пользователи могут воспользоваться возможностями YandexART 2.0 через виртуального ассистента Алису в новом приложении для iPhone и Android, подключив опцию «Алиса Про». Это позволит им создавать изображения по текстовым запросам и модифицировать их в реальном времени. Нейросеть подойдёт как для создания аватарок и иконок, так и для более сложных творческих задач, таких как разработка логотипов или открыток.
Генерация картинок занимает всего несколько секунд, а пользователи могут использовать её безлимитно в мобильной и десктопной версиях.
О YandexART
Yandex AI Rendering Technology (YandexART) — диффузионная нейросеть, которая создаёт изображения по текстовым запросам, улучшает анимацию и обрабатывает загруженные фотографии. Она обучалась на 850 миллионах изображений и их описаний, учитывает российский культурный контекст и обладает уникальными алгоритмами распознавания текстов. YandexART уже интегрирована в сервисы Яндекса, такие как приложения Алиса для Android и iPhone, Шедеврум для Android и iPhone, Директ и Яндекс.Браузер.
Обновления программ, что нового
• Обновление Intel ARC Game On Driver 32.0.101.6253 Non-WHQL: Исправления для Intel Arc B-серии «Battlemage»
• OpenAI представила новые ИИ-модели o3 и o3-mini с возможностью «рассуждения»
• Samsung Display Assistant: Расширенное управление экраном Galaxy S24
• Обновление Intel Graphics Drivers (legacy) 31.0.101.2134 WHQL для процессоров Intel 7-10 поколения
• OpenAI анонсировала возможность позвонить ChatGPT
• Google выпускает Gemini 2.0 Flash Thinking Experimental — свою первую ИИ-модель с возможностью «рассуждения»