Дослідники з Інституту інформатики імені Макса Планка, Сарбрюккенського дослідницького центру, Массачусетського технологічного інституту, Університету Пенсільванії та Google розробили метод редагування зображень з використанням GAN (генеративно-змагальні мережі), який дозволяє контролювати практично все на зображенні. Ставиш дві точки та рухаєш об'єкти на фото у тривимірному просторі.
"У цій роботі ми вивчаємо потужний, але маловивчений спосіб управління GAN, а саме, "перетягування" будь-яких точок зображення, щоб точно досягти цільових точок в інтерактивному режимі з користувачем, як показано на малюнку 1. Для досягнення цієї мети ми пропонуємо DragGAN, який складається з двох основних компонентів: 1) спостереження за рухом на основі особливостей, що приводить точку управління до цільового положення, і 2) новий підхід до відстеження точок, який використовує дискримінативні особливості GAN для локалізації положення точок управління За допомогою DragGAN будь-який може змінювати зображення з точним контролем над переміщенням пікселів, тим самим змінюючи позу, форму, вираз та композицію різних категорій, таких як тварини, автомобілі, люди, пейзажі і т.д.