Больше 50% компаний на рынке уже используют нейросети для генерации изображений. Наиболее популярные задачи — визуализация идеи проекта, раскадровка видеоролика, ретушь отснятого материала, создание контента для продажи на стоковых сайтах. В статье покажем результаты эксперимента с промтингом — написанием команд для нейросети. Цель эксперимента — создание максимально похожего на оригинал изображения. В качестве оригинала было выбрано изображение природы из Adobe Stock.
ИИ и визуальный контент: 4 типовых задачи
Нейросети часто используют для генерации изображений, в том числе просто для развлечения. Но как применять ИИ в работе? Приведем несколько примеров.
Визуализировать идею. Нейросети позволяют показать заказчику идею, которая пока существует только в голове дизайнера или креатора. ИИ оперативно создаст изображение на основе текстовой «подсказки», так что заказчик сразу видит концепт и может принять решение, соглашаться или нет на его доработку.
Проекты могут быть разнообразными. Нейросеть может создать персонажа для продвижения брендов, нарисовать фон и цветовую палитру, которые будут использоваться в будущей кампании.
С помощью ИИ можно также показать, как примерно будет выглядеть в будущем административное здание, ресторан или электрическая заправка. Все то, для чего раньше приходилось создавать макеты, 3D-модели или искать более-менее подходящие изображения в стоках.
Сделать раскадровку. При создании сценария видео нейросеть позволяют быстро сгенерировать раскадровку. Это не означает, что будущий ролик будет именно таким, как его показала ИИ, но позволяет заказчику оценить идею.
Технические моменты. ИИ существенно облегчает работу по улучшению изображений. К примеру, нейросеть Upscale автоматически устраняет шумы, размытия и другие дефекты, повышает качество картинок. Для соцсетей можно автоматически изменять размер изображений и создавать композицию из нескольких картинок. Еще одна сложная задача в дизайне, выполнение которой облегчает ИИ, — подбор шрифтов и цветов, сочетающихся с изображением.
Генерация изображений для продажи на стоках. Этот «стартап» еще до конца не изучен. Но определенные успехи есть. Мы сгенерировали изображение в нейросети, а потом продали через сток.
Еще один момент с продажей изображений: законодательно не урегулирован вопрос авторских прав. Есть две точки зрения, кому они принадлежат — разработчику ИИ или пользователю. Остается только посоветовать внимательно читать пользовательское соглашение.
Эксперимент: поиск идеального промпта
Для генерации подходящих под ваши потребности изображений недостаточно просто знать о существовании нейросетей. Требуется знание ИИ, иностранных языков, практические навыки в дизайне. В противном случае результат не будет соответствовать задачам.
Возьмем пример.
Промтинг — процесс ввода исходных данных или подсказок для генерации контента с помощью ИИ — эффективнее делать на «официальном» языке нейросетей — английском. Для эксперимента мы попросили описать изображение преподавателя, хорошо знающего английский язык. Вот его запрос:
The picture of the lake surrounded by the mountains clustered with the trees. In the background of the picture there is a mountain covered with ice and snow. The left side of the picture is full of golden sunlight. Mountains reflect in the lake. In the foreground of the picture there is a small pier with two wooden boats. Each boat has oars and red lifelines.
Проблемы возникли и при использовании онлайн-переводчиков. Вот как запрос был введен:
The picture shows a lake surrounded by mountains surrounded by trees. A mountain covered with ice and snow is depicted in the background. The left side of the image is flooded with golden sunlight. The mountains are reflected in the lake. In the foreground of the photo there is a small pier with two wooden boats. Each boat has oars and red lifebuoys.
Эксперимент демонстрирует, что у генерации контента с помощью ИИ высокий порог входа. Неподготовленный человек, без опыта работы с нейросетями, не даст нужного результата. Требуется постоянно практиковаться, и на генерацию одной картинки иногда часто приходится не одна и не две попытки.
Сложности возникают и с архетипами, встроенными в ИИ. Если поставить неподготовленному человеку задачу сгенерировать картину, где один персонаж улыбается, а другой злится (вполне жизненная ситуация), то большинство нейросетей не смогут ее выполнить — будет одна эмоция.
Что мы поняли по результатам экспериментов
Важно помнить: искусственный интеллект подходит для создания референсов, но не полноценных проектов. Всегда требуется доработка. Например, при создании персонажа для продвижения или маскота. Их необходимо продемонстрировать в нескольких позах, в различных ситуациях и с разных ракурсов. Но с помощью ИИ это сделать не получается, потому что изображения не будут полностью идентичными — меняется мимика, одежда, рост и вес. Аналогичная ситуация с видео — нейросеть может создать один кадр, но второй будет немного, но отличаться.
Нейросети также не позволяют генерировать брендированные изображения. Так что с их помощью нельзя показать, как будет выглядеть тот или иной бренд на транспорте или на одежде.
Нейросети позволяют сэкономить время и деньги на генерации изображений. Но отказаться от фотографов и дизайнеров не получится. Изображения в любом случае придется дорабатывать, а человек видит мир иначе, чем нейросеть. Так что искусственный интеллект должен выступать помощником в руках опытных специалистов. Такой симбиоз позволит повысить эффективность отделов креатива и дизайна.
Довольны ли вы качеством изображений, созданных нейросетями?