🔥
Журнал Gerwin
Читать
Журнал Gerwin
Журнал Gerwin

11 ошибок при генерации изображений

При генерации картинок многие пользователи допускают элементарные ошибки, которых можно избежать, если понимать базовые возможности
11 ошибок при генерации изображений11 ошибок при генерации изображений

Когда пользователь обращается к нейросети, он не всегда понимает возможности системы и ждет полного соответствия его призрачным представлениям. В итоге можно получить несколько неудачных генераций после неверных запросов и сделать поспешные выводы. В статье мы назовем основные 11 ошибок, которые допускают пользователи при создании картинок на основе искусственного интеллекта.

1. Непонимание четкой цели и отсутствие технического задания.

Многие начинают вводить запрос, толком не понимая, чего они ждут, какой результат бы их устроил. Они просто хотят, чтобы было красиво и уникально. Это заведомо провальная генерация, так как если вы ищете «что-то симпатичное для обложки» можно генерировать до бесконечности, и не факт, что нейросеть вас поймет. Она, конечно, умна и талантлива, но мысли ваши прочитать не в силах. Поэтому заранее пропишите или просто сформулируйте определенную цель, которую вы преследуете при создании изображений.

2. Привычка придерживаться одного и того же запроса.

Если вас не устроил результат запроса больше двух раз, лучше поменять его и попытаться ввести более подробный или сделать акцент на другие элементы. Возможно, нейросеть видит ваш вариант запроса по-своему. Сместив ракурс внимания, больше шансов получить нужный результат.

3. Слишком короткое описание запроса.

Например, вы ищете конкретную картинку, где собака играет во дворе дома, но вводите «собака». Наверняка нейросеть предложит вам изображения собаки в других местах или просто портрет песика, поэтому при наличии в голове полного запроса вводите целиком. В противном случае вам долго придется доказывать нейросети, что это не тот результат, но напоминаем, читать ваши мысли искусственный интеллект не может.

Image

4. Излишне подробный запрос.

Это тоже не приведет к нужному результату, так как просто запутает нейросеть и вас самих. Наличие множества деталей и элементов сделает изображение не таким ярким и сочным, более общим. В то время как лаконичный в меру запрос дает детальные и красивые картинки.

5. Несохраненные шаблоны запросов.

Самые удачные шаблоны запросов, сохраненные вами, можно будет в будущем использовать для других генераций. Таким образом, вы точно будете уверены, что итог будет вас устраивать.

6. Генерация сцен с руками.

Одна из немногих проблем нейросети на данный момент это сложность генерации изображений с руками: часто это наличие у людей 4 или 6 пальцев на одной руке. На данный момент достигнут хороший результат при создании такого плана фотографий, но до 100-процентного нейросеть ещё не дошла. Если вы цените свое время и не хотите получать случайные снимки мутаций, то лучше избегать по возможности присутствия рук в кадре.

Image

7. Генерация конкретного слова или букв.

Искусственный интеллект на данный момент не может исполнить данный запрос должным образом: скорее всего, он создаст какой-то свой, выдуманный логотип или слово. Может, вам и понравится итог, но соответствовать изначальной цели он не будет. Поэтому тратить время и вдохновение на пустые генерации не рекомендуем.

8. Генерация неизвестного здания.

Вы получите при создании такого запроса красивую картинку здания или учреждения, которая, правда, будет мало соответствовать тому строению, которое вы ожидали увидеть. Если вы будете использовать в запросе самые популярные здания, то сгенерированные изображения будут максимально близки к реальным фотографиям. Например, Эйфелева башня или Биг-Бэн, Московский Кремль, Дом Зингера на Невском проспекте в Санкт-Петербурге, Эрмитаж.

Еще нет аккаунта в Gerwin AI?

Пора исправлять ситуацию

9. Генерация объятий.

Подобные запросы лучше обходить стороной, потому что нейросети довольно сложно различить две переплетающиеся фигуры: кто кого обнимает. К тому же, в таких сценах всегда задействованы руки, которые, как упоминалось выше, искусственному интеллекту прорисовать трудно.

10. Много разноплановых персонажей в кадре.

Если вы будете вводить в запросе однотипных «героев» изображения, например, «стадо овец», то у нейросети не возникнет проблем сгенерировать вам картинку. Но наличие в фокусе, например, быка, жирафа, утки и пуделя поставит ее в тупик: скорее всего, она просто создаст вам команду животных на свое усмотрение.

11. Завышенные ожидания от нейросети.

Многие пользователи, особенно в начале знакомства с нейросетью, надеются, сразу получить максимальные результаты. Им кажется, что фотореализм искусственного интеллекта сможет заменить профессионального фотографа. На самом деле, это не так. Искусственный интеллект достиг высокого уровня развития, картинки после генерации можно и нужно использовать в коммерческих целях: для развития бренда, меню ресторанов, рекламы магазинов, товарных обзоров. Но все это не заменяет реальных фотографий.

Попробуем совершить парочку ошибок, которые допускают пользователи-новички, и тут же исправим их. Давайте запросим у Gerwin малоизвестное здание, например, «Музей-усадьба Чайковского в Воткинске», выберем стиль на свой вкус — Small Town (подходит для генерации сооружений).

Image

Модель здания получилась масштабная и величественная, даже похожая на музей-усадьбу. Но совершенно не похожа на оригинал, который неопытный пользователь хотел получить от нейросети. Теперь немного исправим ситуацию и поищем «Эйфелеву башню» в стиле History.

Image

Сооружение более чем популярно во всем мире — соответственно нейросеть смогла создать изображение максимально приближенное к оригиналу. Ретро-стиль добавляет еще более историчности и величественности строению, а также еще больше романтичности самой Франции.

Далее разберем ошибку наличия в кадре разноплановых персонажей. Так и введем запрос: «Бык, олень, утка и кошка на прогулке»:

Image

Ну, нейросеть очень попыталась, но нет. Тут есть подобия уток и даже деловой олень, и не один. Но остальные участники прогулки, видимо, остались за кадром. Ожидаемо.

Исправлять ситуацию будем следующим образом: введем запрос «Толпа кошек»:

Image

Другое дело! Целая милашная стая пушистых мяукающих мордочек сгенерирована. Как видите, однотипных персонажей нейросети генерировать гораздо проще — она не путается в действующих лицах.

Генерация картинок — удивительный творческий процесс, к тому же полезный и увлекательный. Приняв во внимание все вышеперечисленные ошибки других пользователей и ваши прошлые в том числе, вы непременно покорите мир генерации и пойдете с нейросетью рука об руку, как союзники.