В 2023 году каждый, у кого есть руки, глаза и доступ в интернет, может воспользоваться нейросетью для создания обложки альбома, книги или личной страницы в соцсетях. Мы собрали популярные сервисы для новичков без навыков дизайна и программирования, а также примеры нейронных сетей, которые помогут лучше разобраться в тонкостях машинного обучения для создания креатива.
Нейросети для создания обложек для книг, журналов, альбомов, треков и персональных профилей онлайн
Большинство сервисов, которые используют нейронные сети для рисования, находятся в открытом бесплатном доступе. Некоторые предлагают приобрести подписку или купить пакет. Иногда результат работы художника с искусственным интеллектом ничуть не уступает творчеству дизайнера, который потратит на прорисовку куда больше времени.
Панч
Панч — русскоязычный сайт, где нейросеть генерирует изображения, которые выглядят как готовая обложка для трека или музыкального альбома. Подойдёт начинающим композиторам и битмейкерам.
Для создания обложки нужно ввести название трека, имя исполнителя, указать жанр, настроение и нажать кнопку «Сгенерировать». Доступно 5 вариантов стиля. Картинки получаются яркими и креативными.
Результат сохраняется в трёх форматах: квадратах 512 px и 3000 px, вертикального фото для сторис в социальных сетях.
Сервис работает бесплатно. Он не вставляет водяные знаки и не предлагает купить пакеты загрузок.
Плюсы:
- Бесплатный сервис.
- Существует в виде мобильного приложения для устройств Android и iOS.
- Нет лимитов.
- Интересные цветовые решения и сочетания.
- 3 формата обложки для скачивания.
Минусы:
- Один запрос — одна загрузка. Можно повторять операцию, редактируя черновик предыдущего запроса.
- Иногда получаются обложки с плохой детализацией. Это касается случаев, когда задано больше одного персонажа. Решить проблему поможет дополнительная обработка.
Midjourney
Midjourney возглавляет все рейтинги сервисов для создания изображений при помощи искусственного интеллекта. Нейросеть генерирует варианты одной картинки по запросу в текстовой форме.
Картинки получаются с детализированной прорисовкой. В последней версии даже улучшилось изображение рук, а раньше встречались артефакты в виде шестипалых людей.
Любой желающий может присоединиться к каналу команды разработчиков в Discord и бесплатно опробовать нейросеть в чате. Текстовой запрос доступен только на английском языке. В результате получается 4 варианта изображения. Midjourney способна нарисовать всё что угодно в любом стиле. Благодаря ей персонажи Гарри Поттера успели побывать в романах Достоевского, сняться в советских фильмах и переродиться в виде щенят.
В Midjourney есть лимит на 25 бесплатных попыток. После исчерпания пользователю предложат приобрести ежемесячную подписку за 30$ месяц или 200 попыток за 10$.
Плюсы:
- Бесплатный доступ.
- Один запрос — 4 картинки.
- Удобный вид бота в Discord.
- Рисунки доступны для редактирования в промежуточном результате.
Минусы:
- Программа распознаёт только английский язык.
- Продукт на стадии бета-тестирования.
- Качественная картинка получится не с первой попытки.
Stability Ai
https://replicate.com/stability-ai/stable-diffusion
Изображения, созданные в Stability Ai, подойдут для самых разных творческих целей. Главное — внимательно отнестись к описанию запроса на английском языке. Тогда получится качественная обложка для книги, альбома или соцсетей. В сервисе есть полезная строка описания для исключения нежелательных деталей.
Программа бесплатная, работает в браузере. Она генерирует изображения в форматах 512×512 и 768×768. Это высокотехнологичная нейросеть выдает обложки альбомов в формате квадрата.
За один запрос можно создать до 4 картинок.
Плюсы:
- Бесплатный доступ ко всем функциям.
- Большой функционал.
- Один запрос — 4 картинки.
- Хорошее шумоподавление.
- Можно выставить планировщик и случайное зерно.
Минусы:
- Для лучшей работы нужны навыки программирования.
Dall-e Mini
https://huggingface.co/spaces/dalle-mini/dalle-mini
Dall-e Mini — технология генерирования изображений по англоязычному запросу. Результат получается креативный, хоть и не всегда реалистичный. Нейронная сеть является мини-версией Dall-e и повторяет его функционал.
Для работы понадобится браузер, ничего дополнительно скачивать не нужно.
Плюсы:
- Сервис работает бесплатно.
- Генерирует мемы.
- Существует в виде онлайн-сервиса и Telegram-бота.
- Один запрос — 9 рисунков или фото.
Минусы:
- Изображения требуют доработки.
- Работы выглядят нереалистичными и даже безумными.
Dezgo
Простой и бесплатный сервис генерации картинок. Он входит в ТОП лучших сервисов для новичков. Однако запрос нужно вводить на английском языке.
Генерация занимает несколько минут. В дополнительных опциях доступны другие форматы для портретов и пейзажей. По сути, нейросеть рисует обложки разной ориентации, которые подойдут для музыкального альбома, книги или постера.
Плюсы:
- Работает бесплатно.
- Много опций и инструментов.
- Нет принудительной регистрации.
Минусы:
- Один запрос — 1 картинка.
- Распознаёт только англоязычный запрос.
- Не всегда удобно работать без личного кабинета.
Dream ai от WOMBO
Dream ai считается самым удобным сервисом для начинающих.
Изображения получаются красочными, оригинальными и сюжетными. Они идеально подходят для иллюстраций, обложек журналов и художественных книг.
Существует реальная обложка журнала, которую создала нейросеть Dream ai. Это летний номер 2022 года научного журнала университета Эмори в США.
Программа адаптирована под русскоязычных пользователей. Сервис бесплатный, но есть ограничения на определённые стили и количество картинок на выходе. Ежемесячная премиум-подписка стоит 10$, ежегодная — 90$, пожизненная — 170$.
Сервис выдаёт только вертикальный формат. Для лучшего результата можно загружать свои фото, картинки или скетчи, которые станут референсом для нейронной сети. Работает быстро и при каждом запуске запроса выдаёт результат лучше предыдущего.
Понравившийся арт пользователь может выложить в виде NFT или купить в виде постера за 20-45$.
Плюсы:
- Можно использовать свой контент для загрузки.
- Отличное качество.
- Удобные форматы для сохранения.
Минусы:
- В бесплатной версии есть только одна генерация за раз. В платной — до 4.
- Ограничение многих функций в бесплатной версии.
- Часть опций на бета-тестировании.
Генератор персональных обложек для профиля во «Вконтакте»
В 2022 году пользователи VK получили возможность сгенерировать обложку на личной странице с помощью нейронной сети. Внутреннее приложение анализирует аккаунт с учётом интересов, подписок, указанных увлечений, и предлагает 5 изображений в разных стилях.
Пользователи соцсети надеются, что нейросеть для обложки ВК продолжит развиваться и генерировать таким же образом обложки сообществ и групп.
Плюсы:
- Получаются оригинальные и неповторимые фоновые картины в хорошем качестве.
- Обложка подчёркивает индивидуальность пользователя.
Минусы:
- Единоразовая генерация 5 фонов. Нет функции запустить процесс заново и обновить результат.
- Картинки не всегда соответствуют ожиданиям. Больше похоже на рандомную подборку.
- Перед генерацией обложек лучше актуализировать информацию в профиле.
Ridero
https://ridero.ru/l/cover-design-with-neural-net/
Издательский сервис для независимых авторов Ridero подключил нейросеть для создания иллюстраций и обложек книг.
Она не понимает запросы буквально, как в предыдущих сервисах. Для работы с ней нужен профессиональный дизайнер, который правильно поставит задачу. Он может задать необходимую детализацию, степень освещённости и стиль определённого художника.
Заказ уникальной обложки на Ridero стоит 3900 руб. Автор оставляет запрос на сайте, менеджер предлагает референсы будущей обложки. Через 3 дня автору предлагают на выбор 10 вариантов обложек, созданных нейросетью. Выбранную иллюстрацию дорабатывает дизайнер.
Плюсы:
- Итоговая иллюстрация получается качественной и оригинальной.
- Автору будут принадлежать права на изображение.
Минусы:
- Нет гарантий, что обложку нарисовала именно нейросеть.
- Высокая стоимость сервиса. Столько же стоит работа дизайнера. Есть другие сервисы для создания обложки бесплатно.
Нейросети для рисования обложек, рекомендуемые ChatGPT-4
В конце 2022 года сервис Midjourney оказался в центре скандала: профессиональные художники угадывали в создаваемом ИИ контенте свои работы, которые являются интеллектуальной собственностью. Это может стать проблемой для тех, кто хочет использовать ИИ для оформления обложки своего бизнес-продукта.
Поэтому разработчики стремятся обучить нейросети создавать уникальные креативы, которые обычно придумывает человек.
Нашумевший Chat GPT-4 пока ограничивается распознаванием и генерированием текста. Для создания креативных и неповторимых рисунков он советует начать с основ — изучить свёрточные нейронные сети.
СПРАВКА. Свёрточная нейронная сеть — алгоритм обучения машины, который получает входное изображение, изучает его и присваивает важность его разным аспектам и объектам. Самообучается распознавать лица, животных, лишний шум и т. п.
Ими могут пользоваться только те, кто уже знаком с базовыми концепциями машинного обучения.
GAN (Generative Adversarial Networks)
https://github.com/tensorflow/gan
Generative adversarial network, сокращённо GAN — дуэт двух нейронных сетей, которые настроены на работу друг против друга. Поэтому сеть получила название «генеративно-состязательная».
Первые разновидности сети GAN были представлены на практике в 2014 году. Один из «крёстных отцов нейронных сетей» Ян ЛеКун назвал состязание двух сетей самой интересной идеей за последние 10 лет в истории машинного обучения.
GAN — это роботы-художники, которые самообучаются создавать изображения, музыку и прозу. Получаются несуществующие образы, которые выглядят максимально реалистично. Результат можно назвать идеальной подделкой. Пример художественной работы GAN — реалистичные фотоснимки несуществующих знаменитых людей.
Нейросеть GAN подойдёт тем, кто делает портретную фотографию для задней обложки книги. Автор создаёт собственное альтер эго и работает под псевдонимом. Мошенникам в соцсетях тоже понравится такая идея.
Работа сетей выглядит так. Одна нейросеть, обозначаемая как «генератор», создаёт экземпляры заданных данных. Другая — «дискриминатор» — оценивает подлинность работы первой. Их работу можно сравнить с продавцом подделок и покупателем брендовых вещей. Продавец старательно копирует подлинный товар, а покупатель оттачивает свои навыки распознавания подделки. Обе стороны изучают методы друг друга и постоянно эскалируют в борьбе.
Плюсы:
- Сети обучаются на примерах. Они самостоятельно меняют внутренние настройки для улучшения результата и экземпляров данных.
- Не нужен контроль. После первого ввода данных сети тренируются и создают свои собственные обучающие данные.
- Создают специфические наборы данных, которые заменят часы труда человека.
Минусы:
- GAN часто нестабильны и сложны в обучении.
- Требуют большого объема данных для эффективного обучения.
- Процесс занимает много времени.
СПРАВКА. Чтобы создать собственную модель GAN на Python, потребуется следующее:
- Обучающий набор данных.
- Сценарий генератора.
- Сценарий дискриминатора.
Можно использовать TF-GAN — популярную легковесную программную библиотеку для обучения генеративно-состязательных сетей, или Keras в TensorFlow. Также обучить модель ИИ можно с помощью Jupyter Notebook в Google Collab.
VAE (Variational Autoencoder)
https://keras.io/examples/generative/vae/
Вариационный автоэнкодер (Variational Autoencoder, VAE) — ещё одна генеративная модель. Иногда работу VAE сочетают вместе с GAN.
Автоэнкодер также состоит из двух нейронных сетей: энкодера и декодера. Энкодер кодирует данные изображения в сжатую форму, а декодер восстанавливает как можно ближе к входной версии. Сеть обучается сохранять как можно больше полезной информации в сжатом виде (скрытом пространстве) и не добавляет второстепенные детали. А декодер учится принимать зашифрованные данные и восстанавливать их.
Вариационные автоэнкодеры не восстанавливают условно сжатое изображение, они учитывают дополнительную информацию, вроде метаданных изображения (улыбка, наличие очков, цвет кожи и т. п.)
Если GAN обучается самостоятельно, без учителя, VAE обучаются с частичным привлечением учителя, т. к. их главная задача — минимизировать потери при воспроизведении конкретного заданного изображения.
Плюсы:
- VAE легко внедрить и обучить.
- Вариационные автоэнкодеры способны работать с удивительно разнообразными типами данных.
Минусы:
- Картинки получаются размытыми и нереалистичными.
СПРАВКА. Реализовать простой вариационный автоэнкодер можно с помощью пакета Keras в TensorFlow, а также фреймворка PyTorch.
DeepDream от Google
https://github.com/google/deepdream
DeepDream представляет собой свёрточную нейронную сеть для поиска и улучшения паттернов в изображениях с помощью алгоритмической парейдолии.
СПРАВКА. Парейдолия — формирование иллюзорных образов на основе реальных объектов.
DeepDream был разработан в 2014 году. Его кодовое название — Inception — стало отсылкой к фильму «Начало» Кристофера Нолана. Большая часть повествования проходит во снах, где не работают законы физики.
В 2021 году исследование журнала Entropy нашло сходство между работами DeepDream и реальным психоделическим опытом по данным нейробиологии.
Когда Google сделал код открытым, на рынке появилось множество инструментов в виде веб-сервисов, мобильных приложений и ПО, позволяющих пользователям преобразовывать и «искажать» свои собственные фотографии.
Нейросеть DeepDream обеспечит создание самой необычной и будоражащей обложки, которая подойдет для экспериментальной и футуристичной музыки.
Плюсы:
- Есть исходники для самостоятельной обработки.
- Сервис стал доступным для всех в различных редакторах фотографий.
Минусы:
- Работы DeepDream понравятся только ценителям психоделического стиля.
- Нужно отслеживать, чтобы обработка DeepDream не выглядела как пропаганда наркотиков. Особенно это касается коммерческих работ.
Neural Style Transfer
Нейронная передача стиля (Neural Style Transfer) — алгоритм, который смешивает картинку с контентом и картинку стиля определённого художника. В итоге получается изображение с определённой композицией в образе копируемого стиля.
За механизм переноса также отвечает свёрточная нейронная сеть.
Плюсы:
- Картинки выглядят очень художественно. Такой же метод используется в приложениях, подобных Prisma. Его контент широко популярен в социальных сетях.
Минусы:
- Для каждого нового стиля приходится обучать новую нейросеть, что замедляет процесс.
- Часто сеть не полностью стилизует работу: пропускает участки, которые не научилась обобщать.
СПРАВКА. Neural Style Transfer можно реализовать на основе открытой платформы глубокого обучения PyTorch.
PIX2PIX
https://zaidalyafeai.github.io/pix2pix/cats.html
PIX2PIX использует модель разновидности GAN-нейросетей — условную порождающую соперничающую сеть CGAN. Она сконструирована при помощи передачи дополнительных условий для генератора и дискриминатора. Нейронная сеть называется прямым переводом изображений (Image-to-image translation).
Вместо создания с нуля система сопоставляет имеющиеся в ней данные с наброском пользователя. Этими данными может быть некоторое абстрактное представление о том, как выглядят и где находятся глаза, нос, рот.
Разработчик OpenAI Кристофер Хессе создал сайт, где все, кто хочет, может попробовать PIX2PIX. Она делает рисунки котов, обуви, сумок и зданий по наброскам от руки. Сеть понимает, как выглядят кошачьи глаза, нос, и помещает их туда, где обозначил пользователь, даже если это выглядит неестественно.
Пока нейросеть PIX2PIX далека от версии, которая делает высокохудожественные обложки для книг или альбомов. Но подойдёт для сюрреалистичных экспериментов с большой долей юмора.
Плюсы:
- Пользователи экспериментируют и находят новые формы.
- Проста в использовании.
Минусы:
- Работа алгоритма далека от идеала. Иногда плохо распознаёт волосы или линию рта.
- Для получения лучшего результата нужно больше обучающих данных.
Теперь каждый желающий может получить красивое и уникальное оформление для своего творчества при помощи нейросети. Есть разные варианты: использовать простой и доступный сервис, научиться программировать или обратиться к людям, которые умеют и то, и другое.