Каким компаниям выгоднее использовать в работе искусственный интеллект, как натренировать нейросеть на нужный результат и какой переворот произойдет на медиарынке через 10 лет, рассказывает Михаил Иванин, владелец и арт-директор продакшен-студии полного цикла «Мандарин Медиа».
Диффузионные нейросети: зачем использовать, как тренировать и устанавливать
В последние годы искусственный интеллект развивается стремительными темпами. Одни из самых популярных и востребованных его инструментов — генераторы изображений. Они преобразуют входящее утверждение, или свойство, промпт, в картинку. Известные нейросети в этом сегменте: Midjourney, Stable Diffusion, DALL-E. Изображения, которые создает DALL-E, уступают по качеству первым двум нейросетям, поэтому я бы хотел подробно остановиться на том, как работать с Midjourney и Stable Diffusion.
Есть нейросети, которые генерируют картинки закрытого типа в закрытом API. Например, нейросеть Midjourney. Чтобы с помощью нее создать изображение, пользователь заходит в Discord-канал или в каналы в Телеграме и генерирует разнообразные визуальные образы: от логотипов до персонажей. Это платный ресурс, он создает более качественные и достоверные изображения при простых настройках. Например, хочу нарисовать анимированную лису в лесу. Задаю нейросети запрос «лиса в лесу мультяшно» и получаю изображение.
Нейросеть Stable Diffusion — открытого типа, поэтому ее можно бесплатно установить на компьютер. Чтобы получить результат, важно создать запрос посложнее. Например, «лиса в лесу рыжая с черными пятнами, с пушистым хвостом» и добавить, в какой стилистике хочу получить изображение, например художника Ван Гога или определенного арт-направления.
Нейросети Stable Diffusion и Midjourney работают по принципу гигантской паутины. Они поглощают в себя миллионы изображений, собирают в архивах, а потом работают с запросом пользователя. Разберем на примере той же мультяшной лисы. Чем больше в запросе указано свойств, или промптов, тем больше нейросеть формирует картинок из хранилища, как будто паук забирает в паутину, а на выходе выдает необходимое изображение.
Как обучаются нейросети
Нейросеть Stable Diffusion — это самообучающаяся система, при помощи которой можно создавать интересные аватарки. Как это делать? Например, загрузить 10 и более своих фотографий с разных ракурсов, а затем с помощью нейросетей и видеокарты обучать модель, как бойца в спортзале. Через час тренировки Stable Diffusion создаст изображения, похожие на оригинал, через три часа — еще более достоверные, а спустя 8—12 часов можно уже получить хорошую модель в зависимости от изначальной фотографии.
Если изображения будут плохого качества, то вы получите такой же результат на выходе. Но важно помнить, что на обучение нейросети уходит довольно много времени: от 8 часов до нескольких недель.
Для каких задач мы используем нейросети
Перечислю задачи, для которых мы используем нейросети.
Быстрая генерация рекламных креативов. Нейросети могут по запросу за несколько часов предложить десятки изображений. Например, к нам однажды обратился клиент, которому нужен был персонаж. Дизайнеры написали нейросети запрос и через несколько минут получили 50 готовых вариантов. С нуля работали бы над ними месяц или даже два. Клиент выбрал из предложенных образов: «Вот такого примерно хочу». А потом мы отдали эскиз разрабатывать дизайнерам.
Нейросеть — это помощник дизайнера, инструмент, с помощью которого работа идет в разы быстрее, но он не способен на сегодняшнем этапе полностью заменить специалиста.
Создание фонов и пейзажей. Во время разработки рекламных креативов для разных компаний с помощью искусственного интеллекта мы рисуем пейзажи. Затем в созданную картину органично добавляем фотографии. У Photoshop появилась собственная ИИ-модель Firefly. При помощи функции Generative Fill — генеративной заливки — можно дорисовать объекты. На фоне леса взять «Лассо», вырезать маской и написать «птица». И появится возможность выбрать один из трех вариантов картинки.
Генерация аватарок. Например, нейросети могут создавать интересные аватарки. Для этого нужно загрузить фотографии, натренировать модель и получить аватарку в выбранном стиле.
Как установить и использовать нейросети
Midjourney — нейросеть с закрытым исходным кодом и ограниченным количеством моделей. При минимальном количестве промптов (до четырех) она генерирует качественные изображения. Ее не надо устанавливать на компьютер, а проблемы с оплатой для русскоязычных пользователей помогают решить телеграм-каналы.
При помощи обучающих видеороликов на YouTube можно за 10 минут разобраться, как правильно писать промпты. Общий принцип простой: запросы создаются на английском и описывают объект, действие и стиль.
Stable Diffusion — нейросеть с открытым исходным кодом, поэтому она устроена сложнее. Чтобы получить точный результат, нужно быть погруженным в тему и писать подробные промпты от 10 до 30 слов. Для сравнения: в Midjourney можно получить качественный результат, используя от одного до четырех промптов.
Чтобы установить на компьютер Stable Diffusion, нужно зайти на сайт и разобраться, как это корректно сделать. Рядовой пользователь не будет этим заморачиваться.
Поэтому я рекомендую использовать для создания медиаконтента Midjourney.
Как навести порядок в деньгах бизнеса и личных сбережениях
- Как свести доходы с расходами: 4 совета из книги консультанта по финграмотности «Девушка с деньгами»
- Как инвестировать время и деньги, чтобы обрести финансовую свободу: 5 принципов из книги «Капитал»
- 9 способов получать пассивный доход
- 10 фильмов про деньги
- 3 проверенных десятилетиями совета по управлению финансами из книги «Самый богатый человек в Вавилоне»
Мультимодальные нейросети: что есть сейчас и будет завтра
Все нейросети работают по единому принципу и различаются по виду контента, который создают. Генерацию видео нейросети делают некачественно, поэтому изображение нужно улучшать с помощью дополнительных программ, например использовать After Effects. По моему мнению, сейчас видеопроизводство может просто поразвлекаться с нейросетями, чтобы генерировать разные видео. Но это не имеет под собой коммерческой основы.
При создании рекламных роликов необходимы высокобюджетные съемки, а не нейросети. Например, Sostav опубликовал рейтинг 100 лучших рекламных клипов 2023 года, но в нем нет ни одной рекламы, которую бы сняли нейросети.
Наши зарубежные коллеги создали рекламу Coca-Cola и использовали маркетинговый ход, заявив, что клип сделан при помощи нейросети. А на самом деле съемки проходили в штатном режиме: был построен огромный павильон, вручную в 3D созданы декорации. На финальном этапе на видео стилистически наложили нейросеть, чтобы углубить фактуру, сделать ее объемнее и выразительнее. Таким образом, при создании этого видео нейросети использовались на 10—15%.
За два последних месяца технологии серьезно продвинулись вперед. Сейчас с помощью нейросетей можно снять дипфейки — изображения, где лицо или голос человека не настоящие, а созданы или изменены искусственным интеллектом. Раньше дипфейк выдавали руки, количество пальцев или взгляд, а сейчас определить подделку почти невозможно. И это немного пугает: представьте, какое количество фейков может появиться.
Умение нейросетей создавать двойников продемонстрировали президенту России Владимиру Путину на конференции по итогам года в декабре 2023. С помощью искусственного интеллекта в СПбГУ создали очень качественный дипфейк, который выглядел как Владимир Владимирович и говорил его голосом. Так что теперь на самом высоком уровне знают, на что способны нейросети, но будем надеяться, что эта технология послужит в первую очередь для развития медиапространства, а не для противозаконных целей.
Как будут развиваться мультимодальные нейросети
Мультимодальные нейросети растут поразительно быстро. Два года назад еще не было нейросети ChatGPT. А сегодня ей активно пользуются больше 160 млн людей на планете. Я думаю, что скоро наступит переломный момент, когда можно будет по запросам писать любые тексты и снимать любой видеоконтент. В ближайшем будущем нейросети будут играть ключевую роль при создании фильмов. Это позволит кинокомпаниям сократить штат специалистов и удешевить производство.
Скоро не нужно будет платить 3D-специалистам и художникам, чтобы, например, на зеленом фоне отрисовать город. Это вполне реальная и выполнимая задача для искусственного интеллекта. Нейросети легко создадут эффектные футажи — анимированные фоны, шаблоны с текстами, спецэффекты. Все это придаст видео яркость и зрелищность. Всего через пару десятков лет в каждом фильме или клипе будет использована та или иная нейросеть.
Мы неминуемо движемся к эре нейросетей. На смену специалистам придут нейросети. Сейчас же они отличные помощники, например, дизайнерам, но не в состоянии полностью их заменить. Пока видео, созданное нейросетями, выглядит сыро. Технологии по типу дипфейка смотрятся сейчас достаточно впечатляюще, но они по-прежнему без человека не существуют. А через 10—20 лет ситуация изменится кардинально и нейросети заменят многие профессии — произойдет технологический коллапс.
Сегодня использование нейросетей — оптимальное решение для компаний с небольшим бюджетом, а для бюджетных и масштабных проектов — предпочтительнее съемки. Нейросети в медиапространстве предлагают много возможностей для создания контента. Но пока искусственный интеллект может генерить контент только под присмотром человека.
Хотите рассказать о своем бизнесе или поделиться экспертизой?
В рубрике «Блоги компаний» вы можете бесплатно публиковать статьи о своем бизнесе. Публикации помогут укрепить ваш личный бренд или привлечь внимание партнеров, клиентов, инвесторов.
О чем можно рассказать?
- Обо всем, с чем вы столкнулись лично, например, вышли на новый рынок, нашли неочевидный канал сбыта или придумали, как увеличить продажи в несезон.
- О работе с инструментами, сервисами или технологиями для бизнеса.
Для помощи в подготовке статьи мы сделали телеграм-бот. В нем — рекомендации по содержанию статьи и инструкции по ее оформлению. Следуйте инструкциям, пишите статьи и отправляйте готовые тексты так же в чат-бот.
После короткой проверки ваш материал выходит на сайте Бизнес-секретов, а лучшие статьи мы отправляем на главную страницу медиа.
Ждем ваших историй!
А как вы используете нейросети? Расскажите в комментариях.