Edition d’images IA : Quel modèle choisir ?

Do not index

Flag

Publish

feather:link

mydate

Tarifs et rapidité

Avant de plonger dans les tests, regardons ce que chaque solution coûte et combien de temps elle prend pour générer des images.

Modéles	Editeurs	Prix par image	Temps de génération
FLUX.1 Kontext [dev]	Black Forest Labs	$0.025	1.7 seconds
FLUX.1 Kontext [pro]	Black Forest Labs	$0.04	4.4 seconds
FLUX.1 Kontext [max]	Black Forest Labs	$0.08	4.9 seconds
GPT Image 1	OpenAI	$0.01-$0.25	40 seconds
Nano Banana	Google	$0.039	10 seconds
Qwen Image Edit	Alibaba	$0.03	2.9 seconds
Qwen Image Edit Plus	Alibaba	$0.03	16 seconds
SeedEdit 3.0	ByteDance	$0.03	13 seconds
Seedream 4	ByteDance	$0.03	14 seconds

Au niveau du prix, GPT-image-1 est clairement le plus abordable avec un prix qui peut descendre à 0,01 $ l'image. Mais c'est aussi le plus lent, avec une quarantaine de secondes par génération. De son côté, FLUX.1 Kontext [dev] peut êtrte optimisé pour atteindre un vitesse impressionnante de 1,9 seconde chrono tout en restant très abordable. Mais évidemment, quand on pousse l'optimisation à ce point, il faut s’attendre à ce que la qualité finale en prenne parfois un petit coup.

De l’autre côté du spectre, FLUX.1 Kontext [max] est le plus cher des modèles. Il est presque deux fois plus cher que Nano Banana (mais aussi deux fois plus rapide). Les autres modèles ont tous des budgets assez proches des 3 cents par image.

Pour la suite, nous allons tester et comparer les modèles en évaluant les modèles de base de chaque éditeur afin d’éviter de multiplier les génération. Concrètement, pour FLUX.1 Kontext et Qwen, nous ne présenterons que les résultats de FLUX.1 Kontext [pro] et Qwen Image Edit.

Comparaison des modèles

1. Faire disparaître des éléments

Commençons par un classique : effacer un objet d'une photo.

Sur papier, ca n’a rien de bien sorcier et c'est même une fonction de base dans Photoshop. Mais les choses se corsent quand l’élèment à supprimer cache d'autres parties de l'image. Le vrai test consiste à voir comment l'IA va deviner et reconstruire ce qui se trouve derrière.

Pour cette évaluation, prenons cette vue de Londres avec Big Ben et le pont de Westminster que nous allons faire disparaitre.

Prompt d’édition : Remove the bridge

Les meilleurs : Qwen Image Edit et Seedream 4

Le moins convaincant : FLUX.1 Kontext [pro]

FLUX.1 Kontext [pro] a clairement raté le coche en laissant de gros morceaux du pont en place. Nano Banana fait a peine mieux en imaginant un second pont au loin. GPT-image-1 s'autorise quelques libertés en supprimant des bâtiment au bout du pont. Qwen Image Edit et Seedream 4 sont ceux qui nous semble créer le paysage le plus cohérent derrière le pont.

2. Changer le fond

Encore un grand classique de l’édition d’images qu’on fait souvent avec Photoshop. Changer l'arrière-plan d'une image demande de bien comprendre où s'arrête le sujet et où commence le décor, de générer un nouvel environnement qui reste crédible et d’adapter éventuellement la luminosité au nouvel environnement. Voyons comment nos modèles gèrent ce défi.

Prompt d’édition : Change the background to a tropical jungle

Les gagnants : SeedEdit 3.0 et Seedream 4

Les plus mauvais : GPT-Image-1 et Qwen Image Edit

GPT-Image et Qwen Image Edit sont assez décevant : en changeant le fond, ils redessinent le personnage qui n’a plus tout à fait le même visage ni la même chemise À l'inverse, les deux modèles brillent : le personnage reste fidèle à lui-même, l'éclairage semble naturel et l'intégration dans la jungle paraît authentique. FLUX.1 Kontext [pro] s'en rapproche sans totalement y arriver alors que Nano Banana crée un fond qui ressemblent plus à un décor dessiné.

3. Changer d’angle de vue

Modifier l'angle de vue d'une image est nettement moins évident avec Photoshop et les logiciels d’édition classique. Mais c’est un cas d’usage fréquent pour l’IA. Par exemple pour obtenir une vue frontale à partir d’une partir d’une photo de profil ou de trois-quarts.

Le but est donc d’obtenir une image qui nous montre le personnage de face, sans perdre leurs caractéristiques distinctives au passage.

Prompt d’édition : Show a front view of the woman, keeping her face features

Les meilleurs : Qwen Image Edit et FLUX.1 Kontext [pro]

Le plus décevant : GPT-Image-1

La plupart des modèles s’en sortent raisonnablement bien sur cet exercice. FLUX.1 Kontext [pro] et Qwen Image Edit s’en sortent le mieux à mon goût, en partie parcequ’ils ne changent pas le fond en même temps que la position du personnage. Du côté de ByteDance, c'est moins glorieux. SeedEdit change très fortement les traits et la coiffures et Seedream change aussi complètement le visage. Enfin, GPT-Image-1 change le fond et l’ambiance, sans être convainquant sur la cohérence du visage non plus.

4. Transformer le style artistique

Le transfert de style révèle comment chaque modèle interprète et applique une esthétique artistique. Certains se focalisent sur la reproduction fidèle des techniques picturales, d'autres privilégient le maintien de la structure et de la composition originales.

Pour ce test, nous demanderons aux modèles de transformer une photo en une peinture.

Prompt d’édition : Transform this photo into an gouache painting with matte, textured color blocks, soft edges, and visible brush strokes

Le meilleur : Nano Banana

Le moins convaincant : SeedEdit 3.0

Cet exercice donne des résultats intriguants parce que chaque modèle a sa propre vision de ce qu'est une peinture à la gouache (et certains semblent un peu à côté de la plaque). Nano Banana reste le plus proches de l'image source tout en appliquant les consignes de style (effet gouache, avec des coups de pinceaux). GPT-image s’en sort aussi assez bien, mais ajoute systématiquement cette dominante jaune qui le caractérise. Les autres modèles respectent moins le style demandé, parant plutôt vers d’autres styles de peinture. SeedEdit 3.0 déçoit largement en changeant très fort les traits du personnage en plus de simplifier le décor.

5. Modifier du texte

Modifier du texte dans une image est l'une des prouesses les plus bluffantes de ces nouvelles IA. Réussir à comprendre, remplacer et générer du texte en respectant la typographie, la perspective et l'éclairage relève de l'exploit technique. Il y a à peine un an, ce genre de manipulation étaient encore du domaine de la science-fiction.

Ce qu'on cherche ici, c'est à voir quels modèles maintiennent le mieux la police de caractères d'origine et respectent tous les détails physiques du support : sa texture, sa couleur, l'emplacement des autres éléments textuels, etc. Tout en respectant l’orthographe française (ce qui n’est pas toujours simple).

Prompt d’édition : Change the word ‘lundi’ to ‘vendredi’

Les champions : GPT-Image-1

Les pires de tous : Qwen-Image-Edit et SeedEdit 3.0

Ce test est un véritable aveux d’échec pour l’ensemble des modèles. Seuls GPT-Image-1 parvient à sortir un texte correct, sans supprimer de mot ni se tromper dans l’orthographe. Mais c’est au prix d’une régénération complète du texte qui change la police. Tous les autres s’en sortent mieux sur le respect de l’image d’origine, mais en faisant des fautes dans le textes. Sauf Qwen Image Edit qui ne change rien et ressort l’image sans modification. Mention spéciale pour SeedEdit 3.0 qui a manifestement essaye rde traduire le mot en anglais avant de mal l’écrire…

Verdict final

Après avoir soumis ces six modèles à des tests variés, il est difficile de désigner en grand gagnant qui l’emporte dans tous les cas.

Seedream 4 et dans une moindre mesure Qwen Image Edit semblent les plus polyvalents. Seedream 4 excelle dans la suppression d'objets et le changement de fond sans jamais être parmi les plus mauvais pour les autres modifications.

GPT-Image-1 et Nano Banana s’en sortent en général assez bien, mais peuvent parfois êtte complètement à côté de la demande.

FLUX.1 Kontext [pro] et SeedEdit 3.0 sont les plus décevant - même si ils montrent des capacités intéressante pour certains usages.

Ces tests et leurs résultats donnent une première indication pour choisir un modèle, mais ils ne constituent qu’un survol. Vos besoins spécifiques peuvent différer selon vos cas d’usages - et la pratique et l’experience dans l’utilisation d’un modèle peuvent le rendre bien plus efficace.

Le meilleur conseil reste d'essayer ces outils vous-même sur vos propres images pour identifier celui qui s'intègre vraiment dans votre façon de travailler et correspond le plus à vos préfèrences.

Quel modèle d’édition d’images choisir ?

Tarifs et rapidité