
L'écosystème ComfyUI continue de s'agrandir à une vitesse phénoménale. La semaine dernière, il intégrait ainsi le support natif pour Z-Image, le nouveau modèle de base d'Alibaba Tongyi Lab est donc désormais disponible dans ComfyUI.
Si vous avez aimé la vitesse de Z-Image-Turbo sortie en novembre dernier, vous allez adorer la flexibilité et la qualité supérieure de cette version Base (non-distillée).
Support de Z-Image
Qu'est-ce que Z-Image-Base ?
Contrairement à la version Turbo qui privilégie la rapidité via la distillation, Z-Image-Base est le "checkpoint brut". Il préserve l'intégralité du potentiel génératif de l'architecture originale. C'est une base fondamentale pour la famille Z-Image, offrant un contrôle créatif accru et un plafond artistique bien plus élevé.
Pourquoi choisir la version Base plutôt que la Turbo ?
- Détails visuels plus riches : Bien que plus lent (30 à 50 étapes recommandées contre 8 pour le Turbo), le modèle produit des textures plus fines et des compositions plus complexes.
- Liberté créative : Étant non-distillé, il réagit beaucoup mieux aux invites (prompts) complexes et nuancés.
- Idéal pour le Fine-Tuning : C'est la base parfaite pour la communauté afin de créer des LoRA, faire du transfert de style ou développer des modèles spécialisés.
- Prompts Négatifs efficaces : Le modèle est extrêmement sensible aux invites négatives, permettant un contrôle précis pour éliminer les éléments indésirables.
Les points forts du modèle
- Esthétique diversifiée : Une gamme de styles artistiques plus large, tout en conservant une qualité photoréaliste exceptionnelle (notamment sur les portraits et les textures de peau).
- Rendu de texte bilingue : Comme son prédécesseur, il excelle dans l'affichage de texte clair en anglais et en chinois.
- Architecture S3-DiT : Il utilise une architecture Scalable Single-Stream Diffusion Transformer (S3-DiT) qui unifie le texte et l'image dans un seul flux, maximisant l'efficacité des 6 milliards de paramètres.
Utiliser Z-Image dans ComfyUI
L'intégration est directe et ne nécessite pas de scripts complexes. Voici la marche à suivre :
- Mettez à jour ComfyUI : Assurez-vous d'avoir la dernière version (via
git pullou votre gestionnaire habituel).
- Accédez aux Modèles (Templates) : Dans la barre latérale de ComfyUI, cliquez sur Templates -> Library.
- Recherchez "Z-image" : Sélectionnez le workflow Z-Image : Texte vers Image.

- Téléchargez les poids (Weights) : Vous aurez besoin du modèle principal, de l'encodeur de texte (
qwen_3_4b.safetensors) et du vae. Les liens sont directement indiqué dans les notes du workflow mais nous le reprenons aussi ci-dessous. Placez-les fichiers dans les repertoires correspondants dans comme indiqué dans la notes - Encodeur texte : qwen_3_4b.safetensors
- Modèle : z_image_bf16.safetensors
- vae : ae.safetensors
Voilà, vous êtes prêts à générer vos images avec Z-Image. Cliquez sur Executer pour lancer une première génération de test. Avec le prompt pas défaut, vous devriez obtenir une image comme sur cette capture.

En plus du prompt principal vous pouvez également indiquez un prompt négatif pour préciser ce qui ne doit pas être dans l’image.
Le Node LatentImage vous permet de changer les dimensions et KSampler les paramètres d’inférence comme le nombre d’étapes, le CFG ou même le sampler à utiliser.
Paramètres recommandés
- Étapes (Steps) : 30 à 50.
- CFG : 3.0 à 5.0.
- Résolution : Optimisé pour le 1024x1024.
Performances et Matériel
Z-Image est remarquablement léger pour sa qualité. Avec ses 6B de paramètres, il tourne confortablement sur des GPU grand public :
- VRAM : Moins de 16 Go requis.
- Vitesse : Environ 13 secondes pour une image 1024x1024 (30 étapes) sur une RTX 6000 Blackwell (comptez un peu plus sur une série 30 ou 40 standard).
Prêt à tester ?
Disponible gratuitement en Open Source et légéer à utiliser, Z-Image-Base est un ajout indispensable à votre arsenal de création. Lancez donc votre ComfyUI et explorez les nouveaux templates Z-Image !
Exemples de prompts




Ecrit par

