Если название DragGAN все еще не кажется вам знакомым, приготовьтесь к радикальным изменениям в мире редактирования фотографий. Старый способ редактирования изображений со сложными инструментами и бесконечными слоями Photoshop вот-вот уступит место чему-то совершенно новому. Буквально увлекательно, если вы выдержите срок.
Новая «потрясающая игрушка» для креативщиков
Идея DragGAN была выражена в статье (Я связываю это здесь) смешанной командой исследователей из Массачусетского технологического института, Google и Пенсильванского университета. Цель — вывести простоту редактирования изображений на новый уровень. Это решение, которое обходится без всех классических инструментов редактирования фотографий: кистей, слоев и всего остального, на которых прижились такие программы, как Photoshop.
Пользователь может просто щелкнуть стратегические точки на фотографии, создав точки «намерения», а затем перетащить эти точки, чтобы изменить изображение. Это почти волшебство.
Редактирование фотографий переходит в четвертое измерение
Что означает возможность редактировать элемент на фото с точки зрения непрофессионала (в мире, где фото это уже будет само по себе «вычислительным») простым перетаскиванием мыши? Например, вы можете открыть закрытые глаза человека, удлинить юбку, приблизить или отдалить автомобиль, сохраняя при этом реалистичный вид и без необходимости вносить какие-либо дополнения в изображение вручную.
Энтузиазм, вызванный этим нововведением, ощутим. После анонса его разработки пользователи забеспокоились веб-сайт ДрагГАН: явный сигнал об интересе, который он вызывает в мире редактирования фотографий и, в более общем смысле, к редактированию изображений.
DragGAN — это полный разрыв с прошлым
Самые преданные читатели Futuro Prossimo, возможно, помнят, как мы говорили друг другу: le. GAN (генеративно-состязательные сети) смогут «воображать», например они сделают хаос. Теперь это произошло, и вы снова можете спросить себя: а чем DragGAN отличается от других инструментов для редактирования фотографий или от генеративных ИИ, таких как Midjourney или StableDiffusion (которые также можно использовать в комбинации)?
Ответ прост: DragGAN не генерирует изображения. Он их модифицирует. Буквально. И делает это удивительно эффективно: если вы посмотрите на две фотографии, одну до и одну после редактирования с помощью DragGAN, вы не сможете сказать, какая из двух является оригиналом.
DragGAN способен делать то, что пока не может сделать ни одно программное обеспечение для редактирования фотографий в мире, например, изменять угол объекта, а не только его перспективу, или «изобретать» детали, необходимые для того, чтобы сделать все более реалистичным.
Трансформатор. И это всего лишь инструмент, который все еще находится в стадии исследования. Я не смею думать, что он сможет сделать, когда будет готов к мессе.
Будущее редактирования фотографий
Представьте себе мир, в котором для редактирования изображения достаточно дать голосовую команду, не требуя каких-либо особых навыков. DragGAN — это первая часть головоломки, которая приведет к такому будущему.
Подумайте об этом: «Эй, Google, преврати эту рубашку в красное платье и заставь модель надеть шляпу». В будущем это может стать нормой: ни мыши, ни клавиатуры больше не будет. Делаю гораздо меньше фотографий.
Иногда нет.