Фоновое изображение
Как нейросети делают дизайнера мультитулом

Привет! Меня зовут Сергей, я графический дизайнер в продуктовой лаборатории Mish. Так уж получилось, что меня заменили нейросети. Ну, или я просто научился с ними работать. В этой статье я расскажу, как приручил искусственный интеллект, удесятерил собственный и перестал бояться, что когда-нибудь стану жертвой этой бездушной машины как профессионал.

Дисклеймер: все упомянутые в статье инструменты актуальны на момент написания. Новые сервисы и модели появляются каждый день, какие-то становятся платными, меняют свой функционал, качество генераций улучшается и т.д.

Поэтому, как говорится, stay tuned.

Работаем с тестовыми стендами

Я занимаюсь дизайном около 7 лет, в основном графикой. Логотипы, фирменные стили, иллюстрации— это все мое-родное. Я всегда стремился расширить свою область компетенций во все стороны. И не просто так. Во-первых, из желания делать все самому, быть эдаким мультитулом от мира дизайна. А может, и от неумения нормально делегировать, но это детали.

Во-вторых, из любопытства и скуки. У нас с дизайном все, конечно, по любви, но когда ты какое-то долгое время делаешь одно и то же, превращаешься из бодрого художника в тоскливый конвейер. А для творческой натуры это самая прямая и короткая дорога к выгоранию. Поэтому всегда, как только слышал про новый для себя инструмент, не жалея времени, бросался в изучение. Иллюстрации, 3D, анимация, типографика, каллиграфия, леттеринг, лепка, живопись, 3D печать, фото и видеосъемки — хоть титрами пускай все, чем я пытался заниматься. И мне это нравится.

Плюсы у моей скуки очевидные: можно самому закрыть много задач, взяться за разные проекты и профессионально не уставать. Даже если не занимаешься задачей сам, знание специфических терминов и софта сильно облегчает коммуникацию со специалистами разных профилей. Больше знаешь — увереннее себя чувствуешь. Да и денег на таких специалистов обычно не жалеют.

О рабочем процессе до нейропанка

Как выглядел мой воркфлоу пару лет назад?

Нужна тебе иллюстрация — практикуешься в рисовании, делаешь скетчи на бумаге, юзаешь планшет в связке с фотошопом и иллюстратором, неплохо и кисточками по холсту повозить.

Хочешь сделать 3D — разбирайся в Blender, Cinema, ZBrush. За анимацией идешь в Adobe After Effects или Adobe Premier. Тратишь время на поиски моделей, фотографий на стоке, кистей для иллюстратора. Пока разбираешься с одним инструментом — забываешь, как работать с другим. Пока разбираешься с 3D — забываешь, как рисовать руками. Ни времени, ни оперативной памяти в голове не хватает на поддержание хорошего уровня во всех областях.

Но пару лет назад все изменилось.

О рабочем процессе после нейропанка

Как выглядел мой воркфлоу пару лет назад?

Примерно с 2022 года, когда стабильная диффузия обрела какую-то ощутимую известность в кругах не ИИ-разработчиков, я установил на свой ноутбук оболочку automatic1111 со Stable Diffusion на борту. Увы, это не был действительно рабочий инструмент. Первые генерации получились откровенным месивом из пикселей, что при желании, конечно, можно принять за арт, но для каких-то обыденных дизайнерских задач штука была не применима. В общем, ничего непонятно, но очень интересно.

Очень быстро прогресс в нейросфере зашагал в геометрической прогрессии. Каждый день новости об обновлении моделей или выходе новых инструментов. Картинки, музыка, видео, 3D, языковые модели. И, что было тревожным звоночком для дизайнеров, с каждым разом все работало лучше и лучше. Сначала можно было думать, что это просто очередная хайповая фишка. Но со временем нейросети стали все ближе к реальным рабочим инструментам.

И вот вы находитесь в точке, где сложно представить ежедневный рабочий процесс без кучи нейросетей, которые, как нейроимпланты стали моими дополнительными руками и глазами.

Сказать, что все теперь работает без моего участия, я не могу. Нейросети — такие же инструменты, как и любые другие. Они требуют изучения, погружения в тему, отслеживания новостей. Кто-то скажет, что нарисовать котика теперь может каждый — и это факт, но за котиков, увы, не платят.

Об инструментарии

Ядром моей деятельности был и продолжает оставаться графический дизайн, поэтому и инструментарием я пользуюсь соответствующим. В контексте графики нейросети помогают с фотографиями, иллюстрациями, созданием концептов. 3D и видео пока чуть меньше развиты, но уверен, что в ближайшее время и эти инструменты будут на уровне.

Сейчас короткий дисклеймер, чтобы было понятно, о чем говорим дальше.

У нейросети есть оболочка — это графический интерфейс, с помощью которого пользователь взаимодействует с моделью. Модель — это массив данных, на которых та или иная нейросеть обучена. Например, если мы говорим про инструменты, которые генерируют изображения — это пара миллиардов картинок, которые модель соотносит с промптом. А промпт — это текстовый запрос, которым вы описываете, что хотите увидеть в результате. Еще есть токены — это внутренняя валюта, которой оплачивается генерация.

Теперь по коням.

Для фотографий и иллюстраций, где не нужны тонкие настройки, использую онлайн-решения вроде Ideogram, Recraft, Leonardo. У них отличные, постоянно развивающиеся модели, простой интуитивно понятный интерфейс, возможность автоматически улучшать промпт. Есть небольшое количество бесплатных токенов, но они обновляются каждый день, что удобно. Этого достаточно для ознакомления и решения простых задач. Еще одна нейросеть, которая и без моей статьи прекрасно справляется — Midjourney. Это самый популярный генератор картинок и отраслевой стандарт качества. Картинки говорят лучше слов.

Если у дизайнера есть конкретные требования к изображению (определенная поза модели, цвет и фасон платья, аксессуары в цвет глаз, сложная композиция сцены), я советую локальные решения в оболочках Forge и ComfyUI. Существует куча моделей для генерации, которые можно скачать с сайтов нейросообществ Civitai или Hugging Face. Есть универсальные модели и специфические, для решения конкретных задач, например для фотореализма или аниме. В локальных оболочках есть возможность тонкой настройки генерации. И огромный функционал для контроля результата: можно заменить, перерисовать или перекрасить хоть один элемент изображения, хоть всю картинку. Генерации бесплатные и безлимитные.

Стоит учесть, что для запуска нейросетей на своем железе потребуется мощная видеокарта, внушительный объем места на жестком диске и ощутимое количество времени на изучение.

Если есть желание войти в нейросферу основательно, проходить мимо этих нейросетей точно не стоит. Чтобы понять устройство, стоит заглянуть под капот, разобраться, в чем принцип их обучения, что такое модели и какие они бывают, что такое Lora, узнать другие специфические термины.

Совет: если хочется разобраться в подобных инструментах, а ваше железо их не тянет, есть облачные сервисы, вроде immers.cloud или cloud4y.ru где по почасовой оплате можно арендовать мощные видеокарты.

Примеры воркфлоу

Несколько полезных приемов, которые я периодически использую в своей работе.

Пример №1

Сделаем пресет для генерации иллюстраций в определенном стиле в сервисе Recraft. Для начала соберем референсы по стилю. Я собираюсь сделать иллюстрации в стиле Кита Харинга. Открываем вкладку со стилями на панели изображения. Нажимаем на большой плюс в окне с моделями, чтобы создать кастомный стиль. Загружаем несколько изображений-образцов и тестируем прямо в этом же окне. Стиль сохранится в наборе и будет доступен в любой момент.

Пример №2

Не будем ограничиваться картинкой и сделаем еще и 3D-модельку. 
Сперва генерируем персонажа в том же Recraft на пресете 3D render. В качестве промтпа возьмем нечто абстрактное, отлично подойдет что-то из названий IKEA — например, подушка Fjädrar. Добавляем в промтп character и получаем такого забавного персонажа.

Далее закинем получившуюся картинку в сервис Tripo3D. Давать подсказки можно с помощью промпта или по картинке (наш вариант). На данный момент Tripo3D, пожалуй, лучшее решение в области генерации 3D, поэтому на выходе получаем вполне сносную модель. В сервисе можно сохранить модель в разных форматах, в том числе obj и stl, можно использовать свою модель в цифровой среде или отправить в слайсер и напечатать на 3D-принтере.

Пример №3

Вариант работы с локальным инструментом. Если вы умеете рисовать, но делаете это на среднем уровне, вот интересный способ улучшить свое творчество.

Берем листок и рисуем что-то посильное. Фотографируем и закидываем в ComfyUI. На первом этапе по сути заменяем фотошоп, делаем скетч поярче, добавляем четкости.

Закидываем результат во второй процесс, и просим его нарисовать то же самое — только чтобы красиво было. Уже получается годно, 
но можно еще раскрасить все это дело в полноцветную иллюстрацию.

Закидываем в третий процесс и описываем стиль. Называется этот механизм СontrolNet: нейросеть сканирует исходное изображение и на основе этой композиции генерирует новое, добавив к этому описание из промпта.

Теперь вы рисуете как про. Только не говорите никому.

О замене дизайнеров

Кого нейросети действительно могут заменить? Рабочие руки — то есть специалиста, который умеет только копировать, делать ресайзы и выполнять стандартные задачи строго по ТЗ. Пока и для таких форматов нужен естественный, а не искусственный интеллект, но через время верстку простенькой презентации легко можно будет переложить на плечи нейронок.

Всем остальным бояться нечего. Если вы готовы принять ИИ в коллеги как мощный инструмент, который возьмет на себя рутинные задачи и освободит время для творчества и креатива, — можете быть спокойны.

У нейронок есть массивы данных с миллиардами картинок, но какие из них и для чего сгодятся, решать только дизайнеру. Волшебной кнопки «сделать хорошо» ни в одной модели пока что не появилось и скорее всего не появится. Задача нейросети — изобразить то, что от нее просят. Задача специалиста — поставить задачу, наделить это смыслом и увидеть эстетику в пикселях.

Поэтому осваивайте новые инструменты, упрощайте рутинные процессы и развивайтесь. И помните: если какой-то процесс можно упростить или автоматизировать, то так и надо сделать.

Загружаем ещё...