MidJourney vs DALL·E 3
Сравнивать в лоб результаты одинаковых запросов интересно, но не так полезно. Упускаются особенности каждого из инструментов.
Сначала выводы: MidJourney по-прежнему легче остальных выдает классны результат. Но DALL·E 3 за счёт работы в режиме чата с GPT-4 дает возможности получить некоторые результаты, невозможные в MJ. А Stable Diffusion остается самой гибкой по настройке параметров визуального результата, при этом по обработке запросов, оно воспринимает только такое же облако тегов, как MJ. Так что у каждой сети есть свои преимущества, и кейсы, когда они справляются лучше всего.
Реальная задача — нарисовать сердце
Недавно мы сгенерили для клиента в качестве референса куб в MidJourney. Куб понравился, на основе референса сделали финальную тридешку, анинимаровали и разместили на сайте. Теперь клиент хочет для поста в соцсетях в таком же стиле сердце.
a transparent cube of glass and spectrum decomposition of light, high detailed, a lot of particles and digital glitches, red and azure colors, on black background, digital lines and particles inside and outside

Просто взять промпт и заменить "cube" на "heart" результата не дает. Да и куб такой прикольный одним этим промптом не получишь. Помимо текста в запросе к кубу было 5 референсных картинок, часть ранее сгенерированные удачные кубы, часть картинки из фирстиля клиента, часть референсы из сети.
a transparent heart made of glass and spectrum decomposition of light, high detailed, a lot of particles and digital glitches, red and azure colors, on black background, digital lines and particles inside and outside
Поэтому ищем в сети картинку Ruby Heart, чтобы дать понять какая нам нужна форма, и закидываем её и наш референс в MJ с командой /description, чтобы получить понимание как MJ видит эти картинки.
Из описаний MJ собираем свой промпт-франкенштей, который как обычно, продолжает выглядеть как облако тегов, а не как описание человеческим языком. Обязательно добавляем два референса, сердце и куб.
a glass floating heart glowing ruby 3d model on black background with blue and azure reflect lights, dynamic linear composition, neon, transparent medium, crystalcore, luminiscent lightscapes, partly matte, chromatic abberation prism
Результат красивый, но не то. Нужна более диджитальная картинка, со всякими линиями и частицами, похожими на цифровые глитчи немного.

Тут три наборы, хотя всего итераций было 6. Каждый раз немного менял промпт, добавлял, менял убирал не больше пары слов за раз. На результате это почти никак не сказывалось. Что именно и как влияет на картинку в MJ сложно предугадать и понять. В идеале, нужен чистый эксперимент, взять только базовый промпт, а потом к нему добавлять отдельные куски и с сохранением seed смотреть, что меняется.

Но на это не было времени. А отдельно этим заниматься лень, да и не понятно зачем.
Идем экспериментировать в DALL-E 3.
Трехмерное стеклянное сердце с внутренними светящимися линиями и геометрическими структурами, в стиле кристального куба на черном фоне.
Совсем мимо по цветам, потому что я просто их не указал в запросе. И вообще логика была скорее попробовать, как он отнесется к геометричности, кристальности и светящести. Он учел всё в своих вариантах. Дальше я ему указываю на классные варианты и даю промпт, который использовал для MJ.
Первый и третий вариант хорошие. Попробуй сделать их ближе к этому описанию: floating heart made of matte glowing glass with violet highlites, 3d model on black background with blue and azure reflect lights, digital world with a lot of digital lines and particles, dynamic linear composition, neon, transparent medium, crystalcore, luminiscent lightscapes, partly matte, chromatic abberation prism
Всё, в стиль попали. И вот тут начинается основное отличии DALL-E от MJ. Я больше не экспериментирую с промптом, дальше я просто указываю на конкретные доработки. Чтобы не перегружать его, я стараюсь дествовать поэтапно, чтобы не сломать то, что уже получилось. Первый этап — попасть в цвета. Синий нам не очень нужен. Нам нужно красное сердце с фиолетовыми отблесками. Так и пишем.
Близко! Давай внесем небольшие правки не меняя стиль. Мне нужно, чтобы само сердце было красного цвета, и на нем были фиолетовые отблески. Других цветов на сердце быть не должно.
Ну не чудо ли? Особенно после MJ, степень взаимопонимания поражает. Теперь второй этап — нам это сердце надо будет встроить в композицию, поэтому всякие сторонние штуки вокруг сильно мешают. Прошу убрать. А ещё я внезапно понял, что я всё это время говорю с нейронкой по-русски, а надо бы по-английски наверное. Хотя так всё хорошо, что не уверен. Но на всякий случай перехожу на en.
Remove all details from background, i need lights, particles and lines only inside heart
Снова чудеса взаимопонимания. Он реально убрал почти все детали с фона и поместил больше деталей внутрь сердца.
Собственно на этом всё. Кроме левого нижнего, остальные три вполне себе рабочие вариант, особенно правые, потому что в левом верхнем надо будет в фотошопе рудиментарное сердце внутри сердца почистить.
Итог. В DALL-E 3 получается получить сильно больше контроля над результатом, за счёт понимания человеческого языка. Такой же результат можно получить и от MJ, только для этого придется проделать большую работу, по изучению того, как нейронка реагирует на разные слова и их сочетания, а тут всё на человеческом.