Фотореализм без Midjourney: тестируем новую нейросеть
Бесплатных генераций в Midjourney больше нет и пришлось искать альтернативы.
Нейросеть Midjourney покорила сотни тысяч пользователей по всему миру качеством генерации картинок. Изображения, созданные там, многие путают с реальными рисунками или фотографиями. Лично для меня в Midjourney нашлись недостатки — необходимость работать в Discord (редко пользуюсь в повседневной жизни) и стоимость попыток генерации (200 попыток стоят $10, а подписка $30), а еще писать запросы можно только на английском.
Можно попробовать запустить Automatic111 или Dreambooth для генерации, но взять именно эту нейросеть не получится, а с CivitAI или Huggingface не каждый умеет работать. Преимуществом работы в Telegram-боте является отсутствие необходимости в своём «железе», ведь для запуска подобной нейросети потребуется минимум 12 Гб видеопамяти, а ещё это всё настроить самому надо. В общем, когда за тебя уже всё сделали и бесплатно дают воспользоваться, то это круто. Да, есть и сайты, на которых можно генерировать изображения, но мессенджер всегда под рукой и это стало ещё одним плюсом для меня.
Авторы указывают, что нейросеть обучалась на базе архитектуры Stable Diffusion. Сравнивая с моделями из CivitAI и HuggingFace, убедился, что синтаксис запросов у данной модели намного проще, хоть и не без грехов.
Учитывая минусы Midjourney, решил попробовать другую нейросеть для генерации изображений от российских разработчиков — TurboText. Первое, что меня интересовало, смогу ли я получать реалистичные картинки, не хуже чем в MJ. Также обращал внимание на скорость работы, стоимость тарифов и удобство использования. Сначала покажу свои примеры, которые удалось сгенерировать по простым запросам, а после озвучу собственные выводы.
женщина 35 лет с ребенком, RAW фото, крупным планом, высокая детализация
Грязная худая девочка с сажей на лице в старых ободранных вещах сидит на берегу горной реки
старик с морщинами, загорелое лицо, платок на голове
RAW фото, европейская лань бежит по лесу, крупным планом, снято на Fujifilm XT3, dslr
кот нежится на солнышке, лежит на зеленой лужайке, весна, фотосъемка, профессиональный кадр
ворона сидит на ветке дерева
горячий прожаренный стейк из говядины, сочное мясо, лежит на деревянной тарелке, веточка розмарина
Горячие спагетти с насыщенным томатным соусом, нежными фрикадельками, ароматными травами, естественное теплое освещение
сочный гамбургер с говяжьей котлетой сыром и зеленью, румяные булочки с кунжутом, расплавленный сыр стекает на тарелку
чашка чая на столе, рядом лежат аппетитные бублики и стоит ваза с цветами, атмосфера деревни
Выводы
Нейросеть TurboText приятно удивила своими возможностями генерации фотореализма. С ее помощью можно создавать качественные изображения для любых целей.
Хотелось бы выделить главные плюсы на данный момент:
удобство использования (Telegram всегда под рукой);
низкая стоимость тарифов: 100, 150 рублей, $2 или $3;
можно давать запросы на русском и английском;
картинки получаются реалистичными и «сочными»;
есть 10 бесплатных попыток для теста.
есть возможность увеличить до 4096×4096 и изменить стиль
если нет идей, то дополнительная нейросеть в боте поможет составить запрос бесплатно
В Midjourney больше нет 25 бесплатных попыток как раньше, минимум придётся отдать 10$ (790 руб.). В Telegram-боте TurboText я получил 10. Но все же выделил это как плюс. Почему? В боте каждый день я могу возобновлять до 30 бесплатных попыток командой get_bonus. Да и в целом тарифы в российском сервисе гораздо ниже, не так бьет по карману. Поэтому выделил бесплатные попытки как плюс для TurboText.
Что касается качества картинок, Telegram-бот порадовал. Да, бывает 6 пальцев на руке, кривые части тела, но это всё решается с помощью параметра negative_prompt. Если наловчиться правильно давать запросы, использовать параметры (указывать стиль, силу фантазии нейросети и тд), можно с первого раза получать хорошие изображения без необходимости доработки деталей.