Quel modèle d’édition d’images choisir ?

Comparaison de 6 modèles d’IA pour la modification d’images

Quel modèle d’édition d’images choisir ?
Do not index
Do not index
feather:link
mydate
Flag
Publish
Publish
L'édition d'images par IA a connu une accélération fulgurante cette année. En quelques mois, tous les géants du secteur ont sorti leur solution. Black Forest Labs a ouvert le bal en mai avec FLUX.1 Kontext, remarqué pour sa capacité à transformer les styles visuels et effectuer des retouches ciblées. Depuis, la vague ne s'est pas arrêtée. Et elle ne semble pas prête à le faire avec les dernières rumeurs d’un prochain Nano Banana 2.
On se retrouve donc aujourd’hui avec une ribambelle d'options pour modifier des images avec l’IA, chacune promettant monts et merveilles. Pour vous aider à démêler tout ça, nous avons mis différents modèles à l'épreuve sur des cas d'usage concrets dans le but d’identifier clairement celui qui répondra le mieux à vos attentes.

Tarifs et rapidité

Avant de plonger dans les tests, regardons ce que chaque solution coûte et combien de temps elle prend pour générer des images.
Modéles
Editeurs
Prix par image
Temps de génération
FLUX.1 Kontext [dev]
Black Forest Labs
$0.025
1.7 seconds
FLUX.1 Kontext [pro]
Black Forest Labs
$0.04
4.4 seconds
FLUX.1 Kontext [max]
Black Forest Labs
$0.08
4.9 seconds
GPT Image 1
OpenAI
$0.01-$0.25
40 seconds
Nano Banana
Google
$0.039
10 seconds
Qwen Image Edit
Alibaba
$0.03
2.9 seconds
Qwen Image Edit Plus
Alibaba
$0.03
16 seconds
SeedEdit 3.0
ByteDance
$0.03
13 seconds
Seedream 4
ByteDance
$0.03
14 seconds
Au niveau du prix, GPT-image-1 est clairement le plus abordable avec un prix qui peut descendre à 0,01 $ l'image. Mais c'est aussi le plus lent, avec une quarantaine de secondes par génération. De son côté, FLUX.1 Kontext [dev] peut êtrte optimisé pour atteindre un vitesse impressionnante de 1,9 seconde chrono tout en restant très abordable. Mais évidemment, quand on pousse l'optimisation à ce point, il faut s’attendre à ce que la qualité finale en prenne parfois un petit coup.
De l’autre côté du spectre, FLUX.1 Kontext [max] est le plus cher des modèles. Il est presque deux fois plus cher que Nano Banana (mais aussi deux fois plus rapide). Les autres modèles ont tous des budgets assez proches des 3 cents par image.
Pour la suite, nous allons tester et comparer les modèles en évaluant les modèles de base de chaque éditeur afin d’éviter de multiplier les génération. Concrètement, pour FLUX.1 Kontext et Qwen, nous ne présenterons que les résultats de FLUX.1 Kontext [pro] et Qwen Image Edit.

Comparaison des modèles

1. Faire disparaître des éléments

Commençons par un classique : effacer un objet d'une photo.
Sur papier, ca n’a rien de bien sorcier et c'est même une fonction de base dans Photoshop. Mais les choses se corsent quand l’élèment à supprimer cache d'autres parties de l'image. Le vrai test consiste à voir comment l'IA va deviner et reconstruire ce qui se trouve derrière.
Pour cette évaluation, prenons cette vue de Londres avec Big Ben et le pont de Westminster que nous allons faire disparaitre.
notion image
 
Prompt d’édition : Remove the bridge
FLUX.1 Kontext [pro]
FLUX.1 Kontext [pro]
Nano Banana
Nano Banana
SeedEdit 3.0
SeedEdit 3.0
GPT-Image-1
GPT-Image-1
Qwen Image Edit
Qwen Image Edit
Seedream 4
Seedream 4
Les meilleurs : Qwen Image Edit et Seedream 4
Le moins convaincant : FLUX.1 Kontext [pro]
FLUX.1 Kontext [pro] a clairement raté le coche en laissant de gros morceaux du pont en place. Nano Banana fait a peine mieux en imaginant un second pont au loin. GPT-image-1 s'autorise quelques libertés en supprimant des bâtiment au bout du pont. Qwen Image Edit et Seedream 4 sont ceux qui nous semble créer le paysage le plus cohérent derrière le pont.

2. Changer le fond

Encore un grand classique de l’édition d’images qu’on fait souvent avec Photoshop. Changer l'arrière-plan d'une image demande de bien comprendre où s'arrête le sujet et où commence le décor, de générer un nouvel environnement qui reste crédible et d’adapter éventuellement la luminosité au nouvel environnement. Voyons comment nos modèles gèrent ce défi.
notion image
 
Prompt d’édition : Change the background to a tropical jungle
FLUX.1 Kontext [pro]
FLUX.1 Kontext [pro]
Nano Banana
Nano Banana
SeedEdit 3.0
SeedEdit 3.0
GPT-Image-1
GPT-Image-1
Qwen Image Edit
Qwen Image Edit
Seedream 4
Seedream 4
 
Les gagnants : SeedEdit 3.0 et Seedream 4
Les plus mauvais : GPT-Image-1 et Qwen Image Edit
GPT-Image et Qwen Image Edit sont assez décevant : en changeant le fond, ils redessinent le personnage qui n’a plus tout à fait le même visage ni la même chemise À l'inverse, les deux modèles brillent : le personnage reste fidèle à lui-même, l'éclairage semble naturel et l'intégration dans la jungle paraît authentique. FLUX.1 Kontext [pro] s'en rapproche sans totalement y arriver alors que Nano Banana crée un fond qui ressemblent plus à un décor dessiné.

3. Changer d’angle de vue

Modifier l'angle de vue d'une image est nettement moins évident avec Photoshop et les logiciels d’édition classique. Mais c’est un cas d’usage fréquent pour l’IA. Par exemple pour obtenir une vue frontale à partir d’une partir d’une photo de profil ou de trois-quarts.
notion image
Le but est donc d’obtenir une image qui nous montre le personnage de face, sans perdre leurs caractéristiques distinctives au passage.
Prompt d’édition : Show a front view of the woman, keeping her face features
FLUX.1 Kontext [pro]
FLUX.1 Kontext [pro]
Nano Banana
Nano Banana
SeedEdit 3.0
SeedEdit 3.0
GPT-Image-1
GPT-Image-1
Qwen Image Edit
Qwen Image Edit
Seedream 4
Seedream 4
Les meilleurs : Qwen Image Edit et FLUX.1 Kontext [pro]
Le plus décevant : GPT-Image-1
La plupart des modèles s’en sortent raisonnablement bien sur cet exercice. FLUX.1 Kontext [pro] et Qwen Image Edit s’en sortent le mieux à mon goût, en partie parcequ’ils ne changent pas le fond en même temps que la position du personnage. Du côté de ByteDance, c'est moins glorieux. SeedEdit change très fortement les traits et la coiffures et Seedream change aussi complètement le visage. Enfin, GPT-Image-1 change le fond et l’ambiance, sans être convainquant sur la cohérence du visage non plus.

4. Transformer le style artistique

Le transfert de style révèle comment chaque modèle interprète et applique une esthétique artistique. Certains se focalisent sur la reproduction fidèle des techniques picturales, d'autres privilégient le maintien de la structure et de la composition originales.
Pour ce test, nous demanderons aux modèles de transformer une photo en une peinture.
notion image
Prompt d’édition : Transform this photo into an gouache painting with matte, textured color blocks, soft edges, and visible brush strokes
FLUX.1 Kontext [pro]
FLUX.1 Kontext [pro]
Nano Banana
Nano Banana
SeedEdit 3.0
SeedEdit 3.0
GPT-Image-1
GPT-Image-1
Qwen Image Edit
Qwen Image Edit
Seedream 4
Seedream 4
Le meilleur : Nano Banana
Le moins convaincant : SeedEdit 3.0
Cet exercice donne des résultats intriguants parce que chaque modèle a sa propre vision de ce qu'est une peinture à la gouache (et certains semblent un peu à côté de la plaque). Nano Banana reste le plus proches de l'image source tout en appliquant les consignes de style (effet gouache, avec des coups de pinceaux). GPT-image s’en sort aussi assez bien, mais ajoute systématiquement cette dominante jaune qui le caractérise. Les autres modèles respectent moins le style demandé, parant plutôt vers d’autres styles de peinture. SeedEdit 3.0 déçoit largement en changeant très fort les traits du personnage en plus de simplifier le décor.

5. Modifier du texte

Modifier du texte dans une image est l'une des prouesses les plus bluffantes de ces nouvelles IA. Réussir à comprendre, remplacer et générer du texte en respectant la typographie, la perspective et l'éclairage relève de l'exploit technique. Il y a à peine un an, ce genre de manipulation étaient encore du domaine de la science-fiction.
Ce qu'on cherche ici, c'est à voir quels modèles maintiennent le mieux la police de caractères d'origine et respectent tous les détails physiques du support : sa texture, sa couleur, l'emplacement des autres éléments textuels, etc. Tout en respectant l’orthographe française (ce qui n’est pas toujours simple).
notion image
 
Prompt d’édition : Change the word ‘lundi’ to ‘vendredi’
Flux Kontext [pro]
Flux Kontext [pro]
Nano Banana
Nano Banana
SeedEdit 3.0
SeedEdit 3.0
GPT-Image-1
GPT-Image-1
Qwen-Image-Edit
Qwen-Image-Edit
Seedream 4
Seedream 4
Les champions : GPT-Image-1
Les pires de tous : Qwen-Image-Edit et SeedEdit 3.0
Ce test est un véritable aveux d’échec pour l’ensemble des modèles. Seuls GPT-Image-1 parvient à sortir un texte correct, sans supprimer de mot ni se tromper dans l’orthographe. Mais c’est au prix d’une régénération complète du texte qui change la police. Tous les autres s’en sortent mieux sur le respect de l’image d’origine, mais en faisant des fautes dans le textes. Sauf Qwen Image Edit qui ne change rien et ressort l’image sans modification. Mention spéciale pour SeedEdit 3.0 qui a manifestement essaye rde traduire le mot en anglais avant de mal l’écrire…

Verdict final

Après avoir soumis ces six modèles à des tests variés, il est difficile de désigner en grand gagnant qui l’emporte dans tous les cas.
Seedream 4 et dans une moindre mesure Qwen Image Edit semblent les plus polyvalents. Seedream 4 excelle dans la suppression d'objets et le changement de fond sans jamais être parmi les plus mauvais pour les autres modifications.
GPT-Image-1 et Nano Banana s’en sortent en général assez bien, mais peuvent parfois êtte complètement à côté de la demande.
FLUX.1 Kontext [pro] et SeedEdit 3.0 sont les plus décevant - même si ils montrent des capacités intéressante pour certains usages.
Ces tests et leurs résultats donnent une première indication pour choisir un modèle, mais ils ne constituent qu’un survol. Vos besoins spécifiques peuvent différer selon vos cas d’usages - et la pratique et l’experience dans l’utilisation d’un modèle peuvent le rendre bien plus efficace.
Le meilleur conseil reste d'essayer ces outils vous-même sur vos propres images pour identifier celui qui s'intègre vraiment dans votre façon de travailler et correspond le plus à vos préfèrences.

Stop aux heures perdues et aux crédits gaspillés sur des prompts inefficaces. Accédez à plus de 150 prompts éprouvés et opérationnels, pensés pour générer des visuels remarquables en un clin d'œil - sans galère, sans approximation, juste des résultats constants et exploitables.

Marre de tourner en rond ?

Découvrir l'Atelier du Prompt