РассылкиИдеи для бизнесаБизнес с нуляМаркетплейсыВопросы–ответыЖизнь вне работыСправочник
РассылкиИдеи для бизнесаБизнес с нуляМаркетплейсыВопросы–ответыЖизнь вне работыСправочник

Эксперимент: мы взяли оригинальное фото и искали промпты, чтобы нейросеть повторила его


Больше 50% компаний на рынке уже используют нейросети для генерации изображений. Наиболее популярные задачи — визуализация идеи проекта, раскадровка видеоролика, ретушь отснятого материала, создание контента для продажи на стоковых сайтах. В статье покажем результаты эксперимента с промтингом — написанием команд для нейросети. Цель эксперимента — создание максимально похожего на оригинал изображения. В качестве оригинала было выбрано изображение природы из Adobe Stock.

ИИ и визуальный контент: 4 типовых задачи

Нейросети часто используют для генерации изображений, в том числе просто для развлечения. Но как применять ИИ в работе? Приведем несколько примеров.

Визуализировать идею. Нейросети позволяют показать заказчику идею, которая пока существует только в голове дизайнера или креатора. ИИ оперативно создаст изображение на основе текстовой «подсказки», так что заказчик сразу видит концепт и может принять решение, соглашаться или нет на его доработку.

Проекты могут быть разнообразными. Нейросеть может создать персонажа для продвижения брендов, нарисовать фон и цветовую палитру, которые будут использоваться в будущей кампании.

Чтобы нарисовать этот визуал в специальной программе, дизайнеру потребовалось 45 минут
Нейросеть справилась с задачей за пять минут, то есть в 9 раз быстрее, а результат оказался сопоставимым по качеству и даже эффектнее
Пример визуала рекламы, который агентство Ingate Communications нарисовало с помощью ИИ
А это уже итоговый результат с тем же сюжетом. Его и взяли в ротацию

С помощью ИИ можно также показать, как примерно будет выглядеть в будущем административное здание, ресторан или электрическая заправка. Все то, для чего раньше приходилось создавать макеты, 3D-модели или искать более-менее подходящие изображения в стоках.

Сделать раскадровку. При создании сценария видео нейросеть позволяют быстро сгенерировать раскадровку. Это не означает, что будущий ролик будет именно таким, как его показала ИИ, но позволяет заказчику оценить идею.

Технические моменты. ИИ существенно облегчает работу по улучшению изображений. К примеру, нейросеть Upscale автоматически устраняет шумы, размытия и другие дефекты, повышает качество картинок. Для соцсетей можно автоматически изменять размер изображений и создавать композицию из нескольких картинок. Еще одна сложная задача в дизайне, выполнение которой облегчает ИИ, — подбор шрифтов и цветов, сочетающихся с изображением.

Генерация изображений для продажи на стоках. Этот «стартап» еще до конца не изучен. Но определенные успехи есть. Мы сгенерировали изображение в нейросети, а потом продали через сток.

Еще один момент с продажей изображений: законодательно не урегулирован вопрос авторских прав. Есть две точки зрения, кому они принадлежат — разработчику ИИ или пользователю. Остается только посоветовать внимательно читать пользовательское соглашение.

Доходы от такой деятельности пока минимальны. В данный момент не ясна тематика изображений, которые будут выкупать. Необходимо дальше тестировать эту возможность в поиска подходящей ниши

Эксперимент: поиск идеального промпта

Для генерации подходящих под ваши потребности изображений недостаточно просто знать о существовании нейросетей. Требуется знание ИИ, иностранных языков, практические навыки в дизайне. В противном случае результат не будет соответствовать задачам.

Возьмем пример.

Это изображение, взятое из Adobe Stock, мы пытались повторить с помощью промптов

Промтинг — процесс ввода исходных данных или подсказок для генерации контента с помощью ИИ — эффективнее делать на «официальном» языке нейросетей — английском. Для эксперимента мы попросили описать изображение преподавателя, хорошо знающего английский язык. Вот его запрос:

The picture of the lake surrounded by the mountains clustered with the trees. In the background of the picture there is a mountain covered with ice and snow. The left side of the picture is full of golden sunlight. Mountains reflect in the lake. In the foreground of the picture there is a small pier with two wooden boats. Each boat has oars and red lifelines.

А вот результат. У изображения сразу несколько недостатков: нет причала, в лодках отсутствуют спасательные круги, а горы не отображаются в воде

Проблемы возникли и при использовании онлайн-переводчиков. Вот как запрос был введен:

The picture shows a lake surrounded by mountains surrounded by trees. A mountain covered with ice and snow is depicted in the background. The left side of the image is flooded with golden sunlight. The mountains are reflected in the lake. In the foreground of the photo there is a small pier with two wooden boats. Each boat has oars and red lifebuoys.

Получилось совершенно нереалистичное изображение с двумя рядами гор, одни из которых находятся в озере
Нужного результата удалось добиться только при написании запроса от специалиста, знающего язык и активно практикующего промтинг. А small wooden pier on center with two wooden boats on each side in water with has paddles and lifelines, front view, lake in the heart of the mountains, autumn trees, background a mountain covered with ice and snow, left side of the picture is full of golden sunlight

Эксперимент демонстрирует, что у генерации контента с помощью ИИ высокий порог входа. Неподготовленный человек, без опыта работы с нейросетями, не даст нужного результата. Требуется постоянно практиковаться, и на генерацию одной картинки иногда часто приходится не одна и не две попытки.

Сложности возникают и с архетипами, встроенными в ИИ. Если поставить неподготовленному человеку задачу сгенерировать картину, где один персонаж улыбается, а другой злится (вполне жизненная ситуация), то большинство нейросетей не смогут ее выполнить — будет одна эмоция.

Причина в том, что в обучающей выборке большинства нейросетей просто нет подобных фотографий, на основе которых она может создать требуемую картинку
Но есть решение: в Stable diffusion есть функция Inpaint, которая позволяет обойти ограничение и получить, к примеру, следующее изображение

Что мы поняли по результатам экспериментов

Важно помнить: искусственный интеллект подходит для создания референсов, но не полноценных проектов. Всегда требуется доработка. Например, при создании персонажа для продвижения или маскота. Их необходимо продемонстрировать в нескольких позах, в различных ситуациях и с разных ракурсов. Но с помощью ИИ это сделать не получается, потому что изображения не будут полностью идентичными — меняется мимика, одежда, рост и вес. Аналогичная ситуация с видео — нейросеть может создать один кадр, но второй будет немного, но отличаться.

Нейросети также не позволяют генерировать брендированные изображения. Так что с их помощью нельзя показать, как будет выглядеть тот или иной бренд на транспорте или на одежде.

Нейросети позволяют сэкономить время и деньги на генерации изображений. Но отказаться от фотографов и дизайнеров не получится. Изображения в любом случае придется дорабатывать, а человек видит мир иначе, чем нейросеть. Так что искусственный интеллект должен выступать помощником в руках опытных специалистов. Такой симбиоз позволит повысить эффективность отделов креатива и дизайна.

Расчетный счет для бизнеса

Предложение от Т-Банка

Расчетный счет для бизнеса

  • Бесплатное открытие, онлайн. Реквизиты — в день заявки
  • Первые два месяца — бесплатное обслуживание
  • Любые платежи ИП и юрлицам внутри банка — 0 ₽
Узнать больше

АО «ТБанк», лицензия №2673

Юлия Калинина
Юлия Калинина

Довольны ли вы качеством изображений, созданных нейросетями?


Больше по теме

Новости