Rédigé par Emile Dev
20 mai 2023
La technologie progresse à une vitesse inouïe, ouvrant des portes et créant des possibilités autrefois inimaginables. L'un des domaines où cette évolution est la plus évidente est celui de l'édition d'images. DragGAN est une innovation dans ce domaine, et nous allons vous montrer comment il fonctionne et pourquoi il représente une véritable révolution.
DragGAN est un outil d'édition d'images basé sur l'IA qui permet à quiconque de manipuler une image avec un contrôle précis sur l'endroit où vont les pixels. Que vous vouliez changer la pose, la forme, l'expression d’un visage, la forme d’une voiture, ou même les paysages, tout devient possible avec DragGAN.
DragGAN repose sur une interface très simple d'utilisation, rendant cette technologie accessible à tous. Contrairement à des outils plus traditionnels comme Photoshop qui se contentent de manipuler les pixels existants, DragGAN génère de nouveaux pixels qui s'harmonisent avec le reste de l'image. Cela rappelle le fonctionnement de l'IA derrière des projets comme StableDiffusion et MidJourney.
L'utilisation de DragGAN se fait grâce à un système de start and stop. Vous sélectionnez un élément de l'image, vous indiquez où il doit aller et vous appuyez sur start. DragGAN se charge alors de modéliser en direct les modifications. C'est simple, intuitif, et extrêmement efficace.
Cette nouvelle approche fait de DragGAN un outil plus puissant que l'ensemble de ses concurrents. Il a été conçu avec une vision différente, orientée vers l'accessibilité et la facilité d'utilisation. Grâce à ces avantages, il est en train de changer la donne dans le monde de l'édition d'images.
Une question se pose alors : est-ce la fin des photographes et des personnes qui retouchent les photos ? La réponse est non. Même si DragGAN est un outil fantastique, il a ses limites. Les 10 à 20% de détails les plus importants viennent souvent à manquer, comme on peut le voir dans certains exemples et les clients lambda n’utiliseront pas ce genre d’outils non plus.
De plus, les images créées par IA finiront par être flaguées, c’est-à-dire marquées comme étant créées par une IA. On accordera donc automatiquement un peu moins d’attention à ces images. D'ailleurs, Google envisage de séparer Google Images IA et Google Images traditionnels.
En somme, DragGAN représente une nouvelle étape dans la manipulation d'images. Il est puissant, intuitif et accessible à tous. Cependant, il ne sonne pas le glas des photographes et des retoucheurs. Ces derniers ont encore de beaux jours devant eux. L'arrivée de DragGAN dans le paysage technologique enrichit simplement les possibilités et les outils à notre disposition pour manipuler les images.
Approche très novatrice
Système de start and stop, vous sélectionnez un élément, vous indiquez sur la photo ou l’élément doit aller, vous appuyez sur start, et DragGAN va modéliser en live les modifications
Au lieu de manipuler simplement les pixels (comme peut le faire par exemple l’outil correction de Photoshop), l’IA derrière DragGAN va chercher à en générer de nouveaux qui sont cohérents, ça fait penser à l’IA derrière StableDiffusion et MidJourney
Code disponible en Juin sur le Github du créateur : https://github.com/XingangPan/DragGAN
Site du projet : https://vcai.mpi-inf.mpg.de/projects/DragGAN/
Détails techniques : https://arxiv.org/pdf/2305.10973.pdf