В эпоху искусственного интеллекта кажется, что все, о чем мы когда-либо слышим, это ChatGPT, и иногда Gemini или Apple Intelligence привлекают всеобщее внимание.
Под заголовками скрываются сотни других, менее известных инструментов искусственного интеллекта, которые могут помочь в решении самых разных задач. Flux и Midjourney — два сильных выбора в мире создания изображений с помощью ИИ, но что лучше?
Тесты
Мы организовали тест из пяти раундов, чтобы сравнить возможности этих систем по созданию изображений и продемонстрировать, что они умеют делать хорошо, а что нет.
Подсказки включают в себя знакомого вымышленного персонажа, совершающего ожидаемое действие; еще одно ожидаемое действие, на этот раз выполняемое реальными людьми; немного более непонятная подсказка с выдающимся прилагательным для управления ИИ: животное, совершающее маловероятное действие; и более широкая подсказка, которая дает ИИ больше свободы.
«Создай образ Джека Фроста, идущего по снегу»
Никто не знает, как выглядит Джек Фрост, но о нем говорят каждый год, когда ночи становятся короче. Мы попросили ИИ создать изображение этого вымышленного персонажа, подходящее для зимы, и результаты впечатляют.
Хотя все пять созданных изображений соответствуют всем требованиям, мы предпочитаем результаты Midjourney, поскольку они включают снег и ветер, добавляя глубины безмятежному изображению.
Поток 9,21 с
Середина пути 20.35 с.
Поток 0 – Середина пути 1
«Изобрази на поле команду футболистов»
Flux создал самый знакомый образ — команда футболистов, сгрудившаяся на поле, а за ней наблюдающая публика. Однако есть что-то не совсем правильное в этом изображении – неправильно расставленные ноги и близость игроков портят изображение.
Midjourney создала четыре изображения немного лучше, но все они выполнены в одинаковом стиле и лишены какой-либо четкой четкости.
Поток 10,61 с
Середина путешествия 20.02с.
Поток 0 – Середина пути 1
«Создайте хаотичную иллюстрацию детского сада для собак»
Содержимое Flux на первый взгляд кажется неплохим, но присмотритесь немного поближе, и вы заметите безголовую собаку в луже или трехногую собаку со скрещенным телом, похожую на льва, справа от нее. Другие аномалии делают результат разочаровывающим, но видимый кот слева от лужи, безусловно, усилит ощущение хаоса.
Возможно, иллюстрация хаоса в Midjourney лучше — на четырех изображениях повсюду изображены собаки, и они намного ближе к тому, что мы представляли, когда создавали подсказку.
Поток 10,96 с
Середина пути, 19.50
Поток 0 – Середина пути 1
«Сделай реалистичное изображение гепарда, играющего в хоккей»
Попытка Флюкса заставить гепарда играть в хоккей, хотя и в хоккей с шайбой, достойна восхищения, а тот факт, что он стоит на задних лапах, как человек, добавляет веселья.
Однако гепарды, произведенные Midjourney, гораздо более точны, что приводит к лучшим общим результатам. Четвертый гепард, кажется, держит клюшку не совсем в том месте, но мы можем упустить это из виду из-за качества первых трех результатов.
Поток 11,05 с
Середина пути 20.27с.
Поток 0 – Середина пути 1
«Покажи мне, каково жить с динозаврами»
Мы уже пробовали этот тест в другом сравнении двух генераторов изображений AI, но результаты нас не слишком впечатлили, поэтому мы надеялись, что на этот раз результат будет лучше.
Детализация изображений Flux исключительна, однако они не попали в цель, показывая нам, каково было бы человеку жить с рассматриваемым динозавром.
Midjourney справилась с этой задачей, показав взаимодействие людей и динозавров в самых разных условиях. Получение результата также не заняло много времени. Мы считаем, что 20 секунд — разумное время, чтобы дождаться такого серьезного усилия.
Поток 13.00с
Середина пути 20.23
Поток 0 – Середина пути 1
Midjourney против Flux: что лучше?
Поток 0 – Середина пути 5
К сожалению, Flux завершил состязание с нулевым количеством очков, но это не исключает его возможности как достойного генератора изображений ИИ. Правда в том, что Midjourney только что превзошел Flux во всех пяти раундах, но Flux все равно смог создать хорошие изображения. Некоторые просто промахнулись и не совсем ответили на наши подсказки.
С другой стороны, Midjourney неизменно впечатлял и предлагал хороший выбор изображений. Генерация четырех совершенно отдельных изображений добавляет ему привлекательности, но это исключительно генератор изображений, тогда как Flux предлагает и некоторые другие инструменты искусственного интеллекта, такие как генератор видео и многое другое, что делает его хорошим выбором для маркетологов в социальных сетях.