DragGAN : Nouvelle Révolution dans la manipulation d’images

Rédigé par Emile Dev

20 mai 2023

Qu'est-ce que DragGAN ?

DragGAN est un outil d'édition d'images basé sur l'IA qui permet à quiconque de manipuler une image avec un contrôle précis sur l'endroit où vont les pixels. Que vous vouliez changer la pose, la forme, l'expression d’un visage, la forme d’une voiture, ou même les paysages, tout devient possible avec DragGAN.

Comment fonctionne DragGAN ?

DragGAN repose sur une interface très simple d'utilisation, rendant cette technologie accessible à tous. Contrairement à des outils plus traditionnels comme Photoshop qui se contentent de manipuler les pixels existants, DragGAN génère de nouveaux pixels qui s'harmonisent avec le reste de l'image. Cela rappelle le fonctionnement de l'IA derrière des projets comme StableDiffusion et MidJourney.

L'utilisation de DragGAN se fait grâce à un système de start and stop. Vous sélectionnez un élément de l'image, vous indiquez où il doit aller et vous appuyez sur start. DragGAN se charge alors de modéliser en direct les modifications. C'est simple, intuitif, et extrêmement efficace.

DragGAN face à la concurrence

Cette nouvelle approche fait de DragGAN un outil plus puissant que l'ensemble de ses concurrents. Il a été conçu avec une vision différente, orientée vers l'accessibilité et la facilité d'utilisation. Grâce à ces avantages, il est en train de changer la donne dans le monde de l'édition d'images.

Est-ce la fin des photographes et des retoucheurs ?

Une question se pose alors : est-ce la fin des photographes et des personnes qui retouchent les photos ? La réponse est non. Même si DragGAN est un outil fantastique, il a ses limites. Les 10 à 20% de détails les plus importants viennent souvent à manquer, comme on peut le voir dans certains exemples et les clients lambda n’utiliseront pas ce genre d’outils non plus.

De plus, les images créées par IA finiront par être flaguées, c’est-à-dire marquées comme étant créées par une IA. On accordera donc automatiquement un peu moins d’attention à ces images. D'ailleurs, Google envisage de séparer Google Images IA et Google Images traditionnels.

Conclusion

En somme, DragGAN représente une nouvelle étape dans la manipulation d'images. Il est puissant, intuitif et accessible à tous. Cependant, il ne sonne pas le glas des photographes et des retoucheurs. Ces derniers ont encore de beaux jours devant eux. L'arrivée de DragGAN dans le paysage technologique enrichit simplement les possibilités et les outils à notre disposition pour manipuler les images.

FAQ

Qu'est-ce que DragGAN ? DragGAN est un outil d'édition d'images basé sur l'IA qui permet de manipuler une image avec un contrôle précis sur l'endroit où vont les pixels.

Comment fonctionne DragGAN ? DragGAN utilise un système de start and stop. Vous sélectionnez un élément, indiquez où il doit aller, appuyez sur start, et DragGAN modélise en direct les modifications.

DragGAN est-il plus puissant que ses concurrents ? Oui, grâce à une approche novatrice et à une interface utilisateur simple, DragGAN est considéré comme plus puissant que ses concurrents.

DragGAN signifie-t-il la fin des photographes et des retoucheurs ? Non, malgré les avancées de DragGAN, les photographes et retoucheurs ont encore une place importante dans le domaine de l'édition d'images.

Est-ce que les images créées par IA seront distinguées des images traditionnelles ? Oui, Google envisage par exemple de séparer Google Images IA de Google Images traditionnels. Les images créées par IA seront donc identifiées comme telles.

DragGAN souhaite permettre à quiconque de déformer une image avec un contrôle précis sur l'endroit où vont les pixels, rendant ainsi la manipulation de la pose, la forme, l'expression d’un visage, la forme d’une voiture, les humains, les paysages, accessible à tout le monde.

Notes de l’article :

Approche très novatrice

Interface très simple d’utilisation
Technologie plus puissante que l’ensemble des concurrents car l’outil a clairement était build avec une approche différente

Système de start and stop, vous sélectionnez un élément, vous indiquez sur la photo ou l’élément doit aller, vous appuyez sur start, et DragGAN va modéliser en live les modifications

Au lieu de manipuler simplement les pixels (comme peut le faire par exemple l’outil correction de Photoshop), l’IA derrière DragGAN va chercher à en générer de nouveaux qui sont cohérents, ça fait penser à l’IA derrière StableDiffusion et MidJourney

Code disponible en Juin sur le Github du créateur : https://github.com/XingangPan/DragGAN

Site du projet : https://vcai.mpi-inf.mpg.de/projects/DragGAN/

Détails techniques : https://arxiv.org/pdf/2305.10973.pdf

draggan process creation

Est-ce que c’est la fin des photographes ? Des personnes qui retouchent les photos ?

Comme avec l’ensemble des outils de générations vidéos, ce sont les 10 à 20% de détails les plus importants qui viennent à manquer, voir les exemples suivants :
- https://twitter.com/rpnickson/status/1659556293181423616?s=20
Les clients lambda n’utiliseront pas ce genre d’outils
Les images IA finiront par se faire flag (c’est à dire noter comme IA) et on apportera donc automatiquement un peu moins d’attention aux images IA
- Google veut séparer Google Images IA et Google Images traditionnels