Блог


Вы здесь: Авторские колонки FantLab > Авторская колонка «Юлия Белова» облако тэгов
Поиск статьи:
   расширенный поиск »


Статья написана 6 мая 2023 г. 12:16

Красивая мраморная розетка в шапке статьи, правда? Конечно, можно заметить некоторые странности с лепестками розы, но в целом-то смотрится эффектно. Проблема одна — нейросеть уверяет, что это, якобы, хохлома.

Что, не похоже?

Вот и мне кажется, что не похоже.

Уже не первый месяц интернет-сообщество радуется или страдает (кто как), что вскоре компьютерные технологии смогут заменить художников. Те, кто радуются, уверяют, будто теперь легко смогут иллюстрировать любимые книжки, в том числе свои. Те, кто печалятся, говорят: "А как же душа?!"

Кто прав?

Никто. Пока что нет оснований ни для радости, ни для печали.

Почему?

Сначала давайте ответим на простой вопрос — может ли нейросеть (любая) творить?

Нет. Она может лишь по вашему запросу в разных пропорциях монтировать то, что уже существует. Собственно, именно поэтому в портретах, созданных нейросетями, вы так часто видите одни и те же лица.

Между прочим, ниже роза, которая, как уверяет нейросеть, выполнена в стиле иконописи.

Что — опять не похоже? Вот и я думаю, что это называется "резьбой по дереву".

Что нужно, чтобы нейросеть (любая) могла хотя бы адекватно монтировать изображение по вашим запросам?

Прежде всего, требуется загрузить в программу обширный толковый словарь — как специальные термины, так и обычные слова. Дальше необходима огромная база изображений: данные по анатомии (не только человека) и вообще по естествознанию, данные по истории (в том числе науки и искусства), данные практически по всем сферам жизни человека, в том числе образцы эмоций.

Возможно?

Теоретически.

Но что говорят два изображения розы, приведенные мною выше?

Что по крайней мере два понятия — хохлома и иконопись — даны в программе неверно.

На днях я протестировала крайне популярную сейчас нейросеть Кандинский 2.1, разработанную Сбером. На чем экспериментировала? Да на своих произведениях. Это называлось: "Создай иллюстрацию к собственной книжке".

Между прочим, нейросеть Кандинский предлагает множество стилей изображений:

-без стиля

-аниме

-детальное фото

-киберпанк

-Кандинский

-Айвазовский

-Малевич

-Пикассо

-Гончарова

-Классицизм

-Ренессанс

-Картина маслом

-Рисунок карандашом

-Цифровая живопись

-Средневековый стиль

-Советский мультфильм

-3D рендер

-Мультфильм

-Студийное фото

-Портретное фото

-Мозаика

-Иконопись

-Хохлома

-Новый год

Скажете: "Есть где разгуляться!".

Не обольщайтесь. Во-первых, не все стили соответствуют заявленному. Про хохлому я уже говорила. А во-вторых, далеко не всегда можно сделать серию изображений в одном стиле. Не все стили в равной степени понимают ваши запросы. Оказалось, что у нейросети крайне бедный словарный запас и очень низкий культурный уровень. Да-да, нейросеть не опознает то, что знает любой человек с 3 классами образования. С базами изображений тоже беда. Попробуйте сделать запросы на темы "Три мушкетера", "Одиссея капитана Блада", да хотя бы просто Московский Кремль... Результаты вас удивят.

А еще у Кандинского есть "стоп-слова", при использовании которых вы никогда не получите ничего похожего на свой запрос. Кстати, если вы используете в запросе слово "граф", то обязательно получите Дракулу, а не что-то иное.

Легче всего с помощью нейросети сделать портрет персонажа, хотя и тут возникают проблемы. Вот пожалуйста, сенатор Данкан, к которому угодил главный герой моего романа "Этот прекрасный свободный мир...".

Не правда ли, вы его уже видели?

И его внучка — замечательная Элизабет, она же Бетси — получилась очень и очень милой. Вот только с ее портретом возникли первые проблемы — оказалось, нейросеть очень плохо представляет, как выглядят женские шляпки. Да и нитка жемчуга на шее стала для Кандинского 2.1 очень сложным запросом. Видимо, данные по одежде и украшениям в программу тоже не загрузили.

Но представьте, какие проблемы возникают, если вы решите не ограничиться портретом, а показать персонажа в действии?

К примеру, сенатор Ричард Томпсон, родной племянник главного героя Роберта Шеннона, произносит речь с трибуны сената. Тут пришлось менять стиль изображения — потому что большинство стилей просто не понимало запроса, даже если я принималась писать объяснения в стиле общения с трехлетним ребенком. И вообще — не надейтесь, что вы можете получить одно и то же изображение в разных стилях. При абсолютно одинаковом запросе в разных стилях получаются разные картинки.

Труднее всего оказалось с главным героем — Робертом.

Мало того, что я решила сделать не просто портрет, программу вывело из равновесия пожелание, чтобы у персонажа была выбрита голова (такое требование в романе было в отношении питомцев).

Отсутствие волос программа принялась компенсировать деформацией черепа персонажа. К тому же по ходу дела у него периодически появлялись дополнительные пальцы и руки — да-да, в какой-то миг у него стало четыре руки. Что делать — данных по анатомии у Кандинского явно не хватает. Я стирала лишние руки и пальцы пять раз, пока программа не смирилась с нормальным количеством конечностей у Роберта Шеннона.

Точно так же для программы очень сложно было изобразить мольберт — это слово пришлось разъяснять, как разъясняют маленькому ребенку. Но программа все равно напортачила.

А вот изображение одной из картин персонажа, как ни странно, получилось почти сразу. Конечно, не совсем так, но близко:

цитата
Художник решительно вытащил недавно купленный картон, поставил на стол — устанавливать мольберт не было времени — разложил кисти и краски, вытащил пару тряпок. Как там говорил дед? «Забудь эти безумные цвета»?

Сейчас он знал, что именно цвета и были его спасением — чистые, без полутонов, как ему хотелось писать еще в школе. Почему бы не попробовать прямо сейчас?

Роберт хотел сделать предварительный набросок углем, но вместо этого взялся за кисть. Он и так видел всю картину, словно бы стоял посреди главной улицы столицы Свободного мира: великолепие города, когда закатное солнце расцвечивает его самыми безумными красками, а в витрине магазина отражение родного лица в ореоле светлых волос…

Спросите: "И какой же вывод?!"

А вывод такой, что художником опасаться нечего. Тем же, кто хочет лично иллюстрировать любимые книжки, могу сказать, что им проще пойти и нарисовать все самостоятельно. По крайней мере, они не будут путаться с количеством пальцев, рук, ног, а временами и голов у персонажей.

Да, бывает, программа рисует по две головы на одном теле, а бывает и ни одной. И как-то ходят эти несчастные.

А еще программа не опознает известных людей. Если вы напишите в запросе "Президент Джон Кеннеди", вы не получите его изображение. Вы получите монтаж из всех изображений различных Кеннеди, а также актеров, которые их играли. Чуть ли не единственная знаменитость, которую Кандинский 2.1 опознал — это Наполеон, но и он получился карикатурным.

Зато как игрушка нейросеть Кандинский вполне себе на высоте.

Наслаждайтесь!

PS А вот так Кандинский ответил на запрос изобразить обычный огурец в средневековом стиле.


Файлы: розетка.png (731 Кб)



  Подписка

Количество подписчиков: 5

⇑ Наверх