Как пользоваться Midjourney или как не потратить впустую 25 круток

Все вокруг говорят о волшебном ИИ, который способен создать шедевры из текстовых запросов пользователей интернета. Это первый пост в недавно созданном сообществе Midjourney, который является полной инструкцией к применению.

Изображение

01. Вводная

Midjourney (в народе «пол пути») — это ИИ, которое преобразует текст в изображения. На данный момент запущен бета-тест с помощью бота Discord. Благодаря ему можно создать что вашему и его воображению угодно. До недавнего времени бот был доступен только в Discord сообществе Midjourney, но теперь его можно добавить к себе на сервер с количеством участников менее 5,000.

Всего для нового пользователя Discord бесплатно доступно 25 GPU-минут или как я называю круток, которые тратятся на примерно 25 действий(в том числе альтернативные варианты, улучшение разрешения и собственно создание новой серии картинок). Команда Midjourney объясняет это тем, что их детище популярно и эта популярность выходит боком для веб-серверов. Очевидный обход ограничений и цены на полноценной использование ниже.

02. Работа с Discord

Для использования нужна регистрация на сайте Discord. Если не зарегистрированы, то это можно сделать по ссылке.

Далее мы заходим на сервер Midjourney. У нас есть два варианта работы с ботом.

Вариант а. Через Discord сервер Midjourney. При попадании на сервер вам присваивается рандомная группа с определенными открытыми каналами для новичков. Не волнуйтесь, если они не отображаются. Подождите немного. Тыкаем на каналы для новичков.

Изображение

Их название начинается с newbies

+ можно вдохновиться и попытать удачу с другими работами; чуть проще.
— вам мешают сосредоточиться другие новички; вы стесняетесь показывать что получилось; ваши картинки могут затеряться в море сообщений (когда это случится, то нужно заглянуть в почту>упоминания).

Изображение

Вариант б. Добавить на собственный сервер. В таком случае нам не нужны публичные каналы для новичков (но даже так всё равно результаты публичны на сайте-галерее, о том как сделать, чтобы они такими не были всё также ниже). Чтобы добавить на свой сервер нужно нажать на бота в списке пользователей справа и нажать на большую кнопку «добавить на сервер». Затем выбираем сервер и у нас на сервере теперь есть бот Midjourney.

+ всё, что в минусах у варианта а.
— всё, что в плюсах у варианта б.

03. Базовые команды

Команды вводятся в сообщениях. Начинайте писать / и увидите список команд. Ниже все важные команды, которые нужно узнать прежде, чем о команде генерации.

Команда /info показывает информацию. Для неподписанных количество оставшихся круток, для подписанных примерно то же что и на картинке. Можно узнать сколько осталось GPU-минут.

Команда/settings показывает параметры, которые можно отрегулировать. Некоторые параметры недоступны тем у кого бесплатная версия.

  1. Версия движка. Можно выбрать старые если вам нужно.
  2. Насыщенность стилизации. По моим наблюдениям чем выше тем дальше от запроса и больше похоже на красивый пейзаж. Технически добавляется в конце запроса.
  3. Качество изображения. Влияет на длительность генерации, стоимость в GPU-минутах и результат генерации. Технически добавляется в конце запроса.
  4. Приоритетность генерации. Быстрый режим тратит драгоценные GPU-минуты, но зато ты быстрее получаешь результат, т. к. первее в очереди. Медленный режим же наоборот не тратит быстрые GPU-минуты. Настройка доступна только тем у кого подписка за 30$ рекомендую медленный режим, чтобы не тратить 15 GPU-часов попусту на все ваши генерации. Команды /fast и /relax переключают режимы через команды.
  5. Степень увеличения разрешения.
  6. Режим приватности. Приватность доступна за отдельный прайс. Команды /private и /public переключают режимы через команды.

Команда /show при вводе id работы показывает её. ID работы можно найти на сайте Midjourney при входе через Discord.

Эти команды позволяют задавать и смотреть кастомные параметры генерации. Например вы можете ввести --ar.

Например, я обновил уже существующий кастомный параметр. Чтобы удалить какой-то параметр, нужно оставить второй аргумент пустым. Максимально собственных параметров можно задать 20.

04. Команда «сделать шедевр»

Теперь самая используемая команда /imagine. Prompt является необходимой частью команды. Если вы стерли его, то введите команду заново. В prompt вписываем что угодно (кроме запрещенных слов).

Через какое-то время вы получите результат. Процесс генерации будет отображаться в том же канале, в иных случаях бот оповестит, что не может показать процесс. Получаем серию картинок из 4. Под картинками находятся кнопки. Напомню все кнопки кроме web будут стоить как минимум 1 крутку.

Меню после генерации
  • U — апскейлинг или увеличение разрешения. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
  • Кнопка на уровне с апскейлингом генерация новых изображений по тому же запросу.
  • V — вариации или сделать ещё 4 похожие. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
Меню после апскейлинга
  • Make Variations создает новые 4 изображения похожие на апскейлнутое
  • Upscale to Max и Light Upscale Redo — вариации апскейла. Исходя из названия один сильный, другой послабее.
  • Web открывает ссылку на изображение на сайте-галерее
  • Эмодзи позволяют оценить работу, свою или чужую. Ведь никто не оценит лучше чем ты сам.

05. Параметры

Казалось бы всё, можно начинать, но у всего есть нюансы. Самое главное, что вы должны понимать, так это то, что Midjourney — это ИИ и ему непонятны некоторые фразы или слова, он может неправильно понять. Он не сгенерирует «Агент взял свой любимый коктейль и поднял свои брови думая отравлен ли он» как вы бы хотели, он поймёт запрос по-своему. Чтобы запрос получится больше похож на ваши ожидания нужно написать «мужчина, смокинг, в руке бокал с коктейлем, задумчивое лицо». Однако вы всегда можете экспериментировать, разнообразные результаты того как понимает ИИ эфемерные фразы и слова интригуют.

Лучше всего бот работает с командами на английском, но вы можете ввести команду и на другом языке. Результаты конечно же будут расплывчатые, но зато непредсказуемые. Например, я сгенерировал 5 запросов на разных языках «Девушка смотрит на закат».

Якутский показал только пейзаж с закатом. Русский показал только девушек с закатными цветами. Корейский и китайский показали одну девушку смотрящую на закат. И только английский запрос полностью удовлетворил запрос.

Для разграничения запроса используются " :: " (с пробелами), то есть допустим «girls on beach :: steven universe style, hd, octane render --ar 16:9 --no rocks». Сначала текстовой запрос, потом технические параметры, например соотношение сторон и то, что должно отсутствовать. Стиль можно в обоих вариантах, я предпочитаю после разделения. Можно и через ",", как делают все новички, но мы профи, поэтому через " :: "

Дальше мы сосредоточимся на параметрах после "::". Сюда включаются в основном технические параметры.

Вес (::x, где x число). Также используются для регулирования соотношения каких-либо элементов на изображении, но использовать их нужно без пробелов, то есть «car::80, road::20». Минимальное число — -10000, максимальное — 10000. Ниже примеры.

Стилизация (--s x, где x число). Один из параметров, который в настройках можно поставить по умолчанию на каком-то значении. Не путать со стилями художника, фильма и сериала, это другое. Чем больше число, тем абстрактнее и похоже на красивый пейзаж. Советую ставить в настройках (/settings) либо по умолчанию (2000) или чуть выше (5000) значение. Минимальное число — 625, максимальное — 60000. Ниже примеры.

Качество (--q x, где x число). Второй из параметров, который в настройках можно поставить по умолчанию на каком-то значении. Чем больше, тем больше деталей и красивее в целом, но также больше тратится GPU-минут и времени на создание. По умолчанию — 1, минимальное число — 0.25, максимальное — 2 (некогда было 5). Ниже примеры.

Высокое разрешение (--hd ). Потенциально лучше для больших изображений, т.к. использует другую композицию, но меньше деталей. К тому же разрешение сгенерированных изображений будет больше. Неплохой вариант не тратя действие на апскейлинг получить картинку побольше. По тестам, просто делает уже апскейлнутую серию из 4 картинок. Ниже примеры.

Соотношение сторон можно задать двумя путями: первый через (--ar x:y, где x ширина, y высота). К сожалению при сильной разнице высоты и ширины соотношение «сглаживается», лучше использовать второй вариант. Ниже примеры.

Также соотношение сторон можно задать (--w x, где x ширина) и/или(--h y, где y это высота). Лучше сработает, если число кратно 64 (или 128 в случае с --hd). Ниже пример с соотношением 1:10, которое я не смог сделать с помощью --ar.

Landscape, Clouds, River, Mountain, Ocean :: Wakfu style --h 2560 --w 256

Без (--no x, где x слово). Если ИИ внезапно добавляет на изображение какой-то элемент, то его можно убрать с помощью этого параметра. Я уже добавлял изображение с таким параметром, оно находится после объяснения про " :: ", а вот так выглядело бы изображение без «без». Это происходит т.к. стиль Steven Universe связан с камнями, поэтому на пляже их огромное количество.

Сид (--seed x, где x цифра). Каждому изображению присваивается своё семя, поэтому изображение можно повторить, хотя и только в начальных этапах генерации. Чтобы узнать его нужно будет поставить эмодзи письма или :envelope: на сгенерированное изображение

Например у всех этих изображений один сид, только у 2 картинки тот же запрос что у 1, а 3 картинка с запросом «пустыня».

Референс-изображение (через ссылку на изображение). Изображения берутся как стили, а не как содержание, поэтому так вы не сможете обойти запретные слова. Можно добавить несколько иллюстраций, но отрегулировать вес каждого нельзя.

Регуляция веса (--iw x, где х это число) позволяет усилить влияние на конечное изображение референса. По-умолчанию 0.25, максимально — 5.

Видео (--video). Вам будет отправлен процесс генерации в виде видео через сообщение лс, но нужно будет поставить эмодзи письма или :envelope: на сгенерированное изображение. Подробнее об эмодзи ниже (08).

06. Прочие параметры

В эту категорию я отмел рендеры, камеры, сами стили и прочее. Чтобы узнать о них вы можете посмотреть на вот этот гитхаб, где собрано множество изображений, которые помогут выбрать какой-то стиль. В остальном я помочь не смогу.

Использовал автопереводчик Яндекса

07. Помощник для составления запросов

Также может помочь выбрать стиль, камеры, рендеры помощник. Есть несколько разных веб-сервисов, которые помогают с составлением запросов. Вот некоторые.

Использовал автопереводчик Яндекса

08. Эмодзи

Также на сообщения бота со сгенерированными изображениями можно добавлять эмодзи. Они функциональные. Удобно писать название эмодзи, и уже при частом использование оно будет на заметном месте.

✉:envelope: Бот отправляет вам в личные сообщения сгенерированное изображение вместе с сидом и ссылкой на изображение. Если вы прописали "--video", будет видео генерации. Если сообщение с сеткой изображений, то они отправятся по отдельности.

⭐:star: Добавляет в избранную категорию изображений в галерее веб-сайта.

❌:x: Удаляет полностью, что сообщение, что из веб-сайта.

09. Веб-сайт

Веб-сайт является галереей с работами других пользователей и вашими. Можно скачать ваши изображения. Можно вдохновиться или попытать удачу с тем же запросом.

10. Что запрещено генерировать

По правилам ИИ все запросы должны быть PG13, поэтому расписную обнаженную тяночку-вайфочку-сосочку сделать нельзя, как и какое-нибудь кровь-кишки-располовинило. Есть гугл таблица, где каждый может добавить забаненное слово. Ваш слуга даже добавил категории и отсортировал по синонимам, поэтому дерзайте. Однако скажу, что излишнее использование запрещенных слов по сообщению может привести вашему бану.

11. Подписки и цена

Вот и закончились 25 круток, теперь пришло время платить (или нет). У нас есть три пути:

Триальный. Вы можете создать новый аккаунт, хотя это карается администрацией. 0 долларов в месяц, много забот и возможность быть забаненным;

Базовый. Вы можете подписаться на 10 долларов в месяц, так сказать на полшишечки влиться в ИИ генерирование изображений, т.к. у вас ограниченные 200 GPU-минут, за остальные платить по ужасному коэффициенту;

Стандартный. Вы можете подписаться на 30 долларов в месяц, получите 15 GPU-часов и возможность поставить релакс режим, что рекомендую, иначе ресурс быстро истощится и бот самостоятельно поставит релакс режим.

Способ работы напрямую взаимодействуя с ботом открывается за подписку. Удобно, даже не нужен собственный сервер.

Отмеряемый режим. За каждый GPU-час вы тратите 4 доллара. Весьма дорого, лучше выбрать стандартный режим, и установить режим relax в настройках. Но вы сами решаете что вам и как.

Приватный режим. Ваши изображения не будут показываться на веб-сайте, однако они всё также модерируются администрацией. Весьма дорого для мнимой приватности (+20 долларов сверху). Повторюсь, возможно вам это подходит.

Оплатить из РФии можно с помощью купленной на площадке plati карточке visa. Не реклама, выбирайте тщательно, чтобы и возвратов не было и отзывы все были положительные.

13. Ну и всё

29
Нет комментариев. Ваш будет первым!
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.