Одной из самых ярких инноваций в области генерации контента является нейросеть YandexART от Яндекса. Это максимально простое в использовании приложение, позволяющее преобразовывать текстовые запросы в потрясающие изображения и анимации.
Что такое YandexART?
YandexART представляет собой генеративную модель, способную воплощать идеи в жизнь, создавая реалистичные и детализированные изображения и анимацию по текстовому запросу. Пользователи могут задавать команды обычным текстом (легче, чем промты в Midjourney), а нейросеть берет на себя задачу создания красивого изображения, соответствующего запросу.
Нам нужно было сгенерировать симпатичных приемщиц автосервиса. Чтобы была понятна принадлежность, мы задали цвет и тип одежды.
Как и другие подобные нейросети, YandexART пока с трудом рисует кисти рук, а также часто ошибается в небольших деталях. Например, сделать похожий на автосервис фон она может, но если разглядывать картинки внимательно, то машины часто имеют неровные края, неправильный масштаб, поэтому придется перебрать множество изображений прежде чем найдется нужное.
Из нескольких попыток смогли выбрать такое изображение (слева). За счет ракурса кистей рук не видно, на фоне машина не видна, поэтому и марка не имеет значения. Накладываем необходимый логотип сервиса в любом графическом редакторе, получается вполне пригодная для сториз картинка (справа). Насколько такая генерация изображений экономически оправдана зависит от конкретных задач. Чтобы получить подобные фото можно обратиться к фотографу, который за пару часов сделает пару десятков фото с сотрудниками в процессе работы. Это точно будет намного быстрее, чем пытаться сгенерировать идеально подходящее изображение. Другое дело, что подчас условия на производстве не позволяют провести фотосессию.
Нейросеть позволяет создавать изображения и простые клипы из них (называется “видео”, но на самом деле это лишь анимированные статические изображения с добавлением эффектов) на основе текстовых описаний, а также при загрузке своего изображения.
Еще один пример. Заметно, что девушка стоит на фоне какой-то очень странной машины, будто слепленной из двух. Да и с руками что-то “не то”.
Но если кадрировать изображение и использовать портрет, то вполне себе сойдет для использования в контекстной рекламе или для соцсетей. Главное, что не нужно нанимать моделей или покупать стоки, а за 1 минут можно получить безопасное с точки зрения охраны авторских прав изображение.
Портреты с более абстрактными и менее детализированными фонами, как правило, получаются лучше.
Модель YandexART использует метод каскадной диффузии для создания изображений. При обучении модели изображения «портятся», добавляя к ним случайный шум, а затем модель постепенно «восстанавливает» изображение, преобразуя шум в реалистичное изображение с мельчайшими деталями.
При загрузке своего исходника, модель в основном берет палитру цветов и общие контуры. Немногие наши попытки “доработать” свое изображение показали, что генерация с нуля из текстового запроса позволяет добиться лучших результатов.
Пример создания изображения на основе исходника (слева). Результат (справа):
Также у нейросети (в бесплатной версии) не возможно использовать логотипы брендов и накладывать шрифты. Если дать команду “содержит текст” и далее описать, что должно быть написано, сетка сгенерирует что-то неразборчивое.
Особенности YandexART:
- Очень реалистичные изображения с детализацией мелких элементов,
- В обучающих данных учитывается много локальных реалий, чтобы модель понимала культурный контекст,
- Создание иллюстраций в разной стилистике: трехмерная акварель, мультипликация и прочее.
- Разные форматы изображений: от квадратных для ленты до вытянутых для сториз.
- Возможность создания анимации с различными эффектами.
Зачем нужна YandexART?
YandexART помогает превращать идеи в образы и делиться ими. С ее помощью можно создавать художественные работы, рекламные изображения или просто красивые картинки. Да, скорее всего вы не получите идеальное изображение, но можете использовать его в качестве демонстрации и объяснения коллегам (дизайнерам, контент-мейкерам, аниматорам), как вы представляете себе образы персонажей или концепцию.
Несколько абстрактных картинок, которые сгенерированы за полминуты, и могут быть использованы для принтов, творческих презентаций, разработки концепций фотосессий или контент-мейкерства.
Недавно Яндекс обновил YandexART, сделав ее еще более эффективной и адаптивной к запросам пользователей.
Обновленная версия нейросети, YandexART 1.3, перешла на новую технологию для генерации изображений — латентную диффузию. Это позволяет создавать более реалистичные изображения в разных форматах и снижает нагрузку на вычислительные ресурсы.
Благодаря новым алгоритмам и увеличению датасета в 2,5 раза, YandexART теперь лучше понимает запросы пользователей и создает более качественные изображения. По результатам замеров асессорами Яндекса, нейросеть YandexART 1.3 выигрывает в 57 процентах случаев в сравнении с Midjourney V5.2 и в 63 процентах случаев в сравнении с предыдущей версией YandexART 1.2.
YandexART — это не просто приложение, а настоящий прорыв в мире творчества. Ее возможности вдохновляют на создание удивительных работ и делают искусство доступным для всех. Благодаря постоянному развитию и улучшениям, YandexART становится незаменимым инструментом для творческих идей и воплощения фантазий в жизнь, а также доступным инструментов для генерации контента.