ТОП 5 нейросетей для создания изображений

Создание изображений – одно из перспективных направлений использования нейросетей. На данный момент на базе искусственного интеллекта разработано уже несколько десятков сервисов и программ, способных генерировать картинки по текстовым описаниям.

В статье рассмотрим 5 бесплатных нейросетей для генерации изображений. Также протестируем их на практике и проверим, как с одним и тем же заданием, справятся разные нейронки.

Разберемся с интерфейсом и возможностями выбранных генераторов изображений. Узнаем их особенности использования и дополнительные опции.

1. Шедеврум

Приложение для смартфонов, разработанное в апреле 2023 года российской компанией Яндекс. Доступно на Android и iOS. Веб-версии и десктопного варианта программы пока нет.

В Шедеврум заложен функционал соцсети: пользователь может публиковать созданные изображения, подписываться на обновления других авторов, лайкать и репостить их картинки.

Кнопка «+» служит для перехода к генератору изображений. Клик по аватару открывает стену, разделенную на собственные публикации и понравившиеся картинки.

Приложение полностью бесплатное, не имеет лимитов и может использоваться для генерации любых изображений, за исключением некоторых тематик. Под запретом религия, политика, категория 18+, сцены насилия и жестокости. Во избежание генерирования фейков, Шедеврум не работает с изображениями реальных людей.

2. Kandinsky

Нейросеть от Сбера, первая версия которой была представлена в 2022 году. 4 апреля 2023 года появилась обновленная версия Kandinsky 2.1 с улучшенным и расширенным функционалом.

Перейти в генератор изображений можно с официального сайта Сбера, нажав на кнопку «Начать творить». Пользователь будет автоматически перенесен на сайт FUSION BRAIN, позволяющий получать изображения по текстовому описанию.

Kandinsky 2.1 доступен также на сайте ruDALL-E:

Есть программы (в десктопной и мобильной версиях) и Телеграм-бот.

Kandinsky 2.1 умеет создавать уникальные изображения как с нуля, так и на основе загруженных картинок. Может смешивать несколько картинок, добавлять в рисунки дополнительные детали, выдавать различные вариации заданного изображения, работать в режиме inpainting/outpainting (бесконечного полотна). Распознает различные стили рисования, понимает более 100 естественных языков, включая русский и английский.

Это также бесплатная нейросеть для использования в любой сфере – от дизайна соцсетей до бизнеса и финансов.

3. Canva

Сервис для работы с изображениями, в функционал которого теперь входит возможность генерировать картинки по текстовому описанию. Инструмент Text to Image, созданный на базе искусственного интеллекта, был добавлен в редактор в октябре 2022 года.

После нажатия на кнопку «Generate Al Images» система спрашивает, куда пользователь собирается добавлять картинку – в новый проект или в один из существующих, затем переносит в окно редактирования с уже включенным инструментом.

Та же самая опция есть и в программных версиях (для Windows, Mac OS, Android и iOS):

Важный момент: Из-за санкций российские пользователи могут работать с Канвой только через VPN.

Чтобы сгенерировать картинку, нужно ввести текстовый запрос, при необходимости выбрать стиль и размер, затем нажать на кнопку «Создать изображение». Доступные стили: рисунки, живопись, узоры, фотографии и изображения с элементами современного искусства.

Генерация производится в облаке в течение 10-20 секунд, ее результатом становятся 4 уникальные картинки. Текстовые запросы проверяются при помощи встроенного фильтра: если система сочтет описание небезопасным, то попросит пользователя сформулировать его по-другому.

Лимиты на бесплатное использования – 100 картинок в сутки. После оформления подписки Pro ограничения снимаются.

4. Lexica

Сервис на базе нейросети, способный генерировать картинки по текстовому описанию или на основе исходного изображения. Включает в себя поисковую систему по готовым артам, созданную с использованием модели Stable Diffusion. База сервиса содержит свыше млн. изображений с подсказками о способе их генерации.

Чтобы сгенерировать картинку, перейдите на страницу Generaty, введите текстовое описание и нажмите на кнопку ниже для запуска процесса. При необходимости можно изменить разрешение (по умолчанию стоит максимальное значение – 768 х 1152) и воспользоваться расширенными настройками. Присутствует также еще одно поле, под запросом, где вы можете отметить нежелательные детали, которые хотите исключить из будущего изображения.

По запросу сервис генерирует 4 картинки, которые можно скачивать на устройство, и лайкать, а также включать режим Outpain для получения полотна, заполненного выбранным изображением.

Новый пользователь бесплатно может сгенерировать 100 картинок, для дальнейшего использования сервиса потребуется оформление подписки (от 8 долларов в месяц).

5. Midjourney

Нейросеть Midjourney, способна создавать изображения в различных жанрах. Умеет также обрабатывать и модифицировать исходные картинки. Кроме веб-версии, есть приложения, Discord-сервер и Телеграм-боты.

Для начала работы потребуется авторизация в Discord и присоединение к сообществу.

Сгенерированные нейросетью бесплатные изображения можно использовать только в некоммерческих целях. Чтобы получить на них авторские права, необходимо оформить платную подписку (от 10 долларов в месяц).

Тест-драйв нейросетей для создания картинок

Давайте протестируем нейросети и проверим на практике их функционал, посмотрим, как они умеют генерировать картинки по текстовым запросам и обрабатывать уже готовые изображения.

Создание картинки по тексту

В качестве примера возьмем Шедеврум, Kandinsky 2.1 и Canva и посмотрим, как они справляются с генерацией изображений животных, людей, растительности и архитектуры, поэтапно используя текстовые запросы:

Красивый кот сидит на цветочной поляне.
Девочка с яблоками.
Современный мегаполис.

Шедеврум

Запрос: Красивый кот сидит на цветочной поляне.

Запрос: Девочка с яблоками.

Запрос: Современный мегаполис.

Canva

Текстовый запрос: Красивый кот сидит на цветочной поляне.

Текстовый запрос: Девочка с яблоками.

Текстовый запрос: Современный мегаполис.

Kandinsky 2.1. Поскольку выдает только одну картинку, будем генерировать по каждому запросу дважды.

Описание: Красивый кот сидит на цветочной поляне.

Описание: Девочка с яблоками.

Описание: Современный мегаполис.

Видим, что с изображениями животных и растительности все рассмотренные нейросети справились неплохо.

Рисование людей нейросетям пока дается значительно хуже – могут нарушаться пропорции лица, вместо пяти пальцев на руках отображаться 4 и т.д. Самые реалистичные картинки по данному запросу выдал Шедеврум, хуже всех справился Кандинский.

Архитектура также вызвала сложности, и если в вариантах, предложенных Шедеврум и Канвой, попадаются реалистичные изображения, то Кандинский выдает что-то футуристическое, причем явно с постапокалиптическим уклоном.

На практике видим, что искусственный интеллект способен качественно генерировать картинки не на любую тематику. Но нужно понимать, что нейросети пока еще находятся на стадии тестирования и со временем их возможности будут совершенствоваться.

Обработка фотографий

Воспользуемся для этой цели Телеграм-ботами Kandinsky 2.1 и Midjourney.

Запускаем Kandinsky 2.1, выбираем вариант «Вариации картинки», загружаем картинку и ждем около минуты.

Получаем вот такой вариант. Если он не устроил, можно перезапустить процесс для получения другого результата.

Открываем Телеграм-бот, выбираем нейросеть Midjourney, затем пункт «Перерисовать картинку».

Загружаем картинку. Нейросеть запрашивает, в каком направлении нужно ее изменить и показывает в качестве примера несколько запросов. Давайте добавим нашему коту наглости и введем текст «Наглый кот».

Получаем 4 варианта на выбор:

Вывод: Нейросети уже умеют обрабатывать фотографии, но пока их возможности ограничены и не всегда полученный результат соответствует ожиданиям.

Инструменты, созданные с использованием искусственного интеллекта, по сравнению с классическими, имеют свои плюсы и минусы.

Преимущества нейросетей:

Высокая скорость генерации, многократно превышающая человеческие возможности.
Универсальность, создание любых изображений – от природных пейзажей до интерьеров помещений.
Распознавание техник рисования (углем, карандашом, акварелью и пр.) и стилей (от реализма до футуризма).
Нестандартное «мышление» и отсутствие шаблонов, что позволяет создавать креативные композиции и интересные визуальные эффекты.
Пригодность для всех сфер человеческой деятельности – дизайн, бизнес, реклама, маркетинг, книжное издательство и пр.

Нейросети создают уникальные изображения, на которые не распространяются авторские права других пользователей. Этот момент по умолчанию избавляет от проблем с указанием авторства.

Недостатки:

Возможно получение некорректного результата, не соответствующего запросу.
Огрехи при прорисовке отдельных деталей.
Сложности при рисовании человеческих лиц и пальцев.
Отстраненность, отсутствие эмоциональности в картинах.
Невозможность контроля за процессом – генерация производится автоматически, опираясь только на результаты обучения искусственного интеллекта.

К недостаткам можно отнести также возможность использования нейросетей мошенниками. Несмотря на то, что разработчики минимизируют этот риск путем установки некоторых ограничений, полностью его устранить они не смогут.

Заключение

Использование нейросетей для создания картинок – бесплатный и быстрый способ получить уникальные изображения, не нарушающие ничьих авторских прав. Сгенерированные картинки можно использовать для оформления публикаций на сайтах и в соцсетях, создания карточек товара, рекламы и других целей.

Многие нейросети позволяют не только генерировать новые картинки по текстовым описаниям, но и обрабатывать уже существующие, видоизменять их, объединять несколько изображений в одно, создавая усредненный вариант.

Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Digital marketing для всех!