Utiliser Z-Image Base avec ComfyUI

Do not index

Flag

ComfyUI

Publish

feather:link

mydate

Support de Z-Image

Qu'est-ce que Z-Image-Base ?

Contrairement à la version Turbo qui privilégie la rapidité via la distillation, Z-Image-Base est le "checkpoint brut". Il préserve l'intégralité du potentiel génératif de l'architecture originale. C'est une base fondamentale pour la famille Z-Image, offrant un contrôle créatif accru et un plafond artistique bien plus élevé.

→ En savoir plus sur les modèles Z-Image

Pourquoi choisir la version Base plutôt que la Turbo ?

Détails visuels plus riches : Bien que plus lent (30 à 50 étapes recommandées contre 8 pour le Turbo), le modèle produit des textures plus fines et des compositions plus complexes.

Liberté créative : Étant non-distillé, il réagit beaucoup mieux aux invites (prompts) complexes et nuancés.

Idéal pour le Fine-Tuning : C'est la base parfaite pour la communauté afin de créer des LoRA, faire du transfert de style ou développer des modèles spécialisés.

Prompts Négatifs efficaces : Le modèle est extrêmement sensible aux invites négatives, permettant un contrôle précis pour éliminer les éléments indésirables.

Les points forts du modèle

Esthétique diversifiée : Une gamme de styles artistiques plus large, tout en conservant une qualité photoréaliste exceptionnelle (notamment sur les portraits et les textures de peau).

Rendu de texte bilingue : Comme son prédécesseur, il excelle dans l'affichage de texte clair en anglais et en chinois.

Architecture S3-DiT : Il utilise une architecture Scalable Single-Stream Diffusion Transformer (S3-DiT) qui unifie le texte et l'image dans un seul flux, maximisant l'efficacité des 6 milliards de paramètres.

Utiliser Z-Image dans ComfyUI

L'intégration est directe et ne nécessite pas de scripts complexes. Voici la marche à suivre :

Mettez à jour ComfyUI : Assurez-vous d'avoir la dernière version (via git pull ou votre gestionnaire habituel).

Accédez aux Modèles (Templates) : Dans la barre latérale de ComfyUI, cliquez sur Templates -> Library.

Recherchez "Z-image" : Sélectionnez le workflow Z-Image : Texte vers Image.

Téléchargez les poids (Weights) : Vous aurez besoin du modèle principal, de l'encodeur de texte (qwen_3_4b.safetensors) et du vae. Les liens sont directement indiqué dans les notes du workflow mais nous le reprenons aussi ci-dessous. Placez-les fichiers dans les repertoires correspondants dans comme indiqué dans la notes

Encodeur texte : qwen_3_4b.safetensors

Modèle : z_image_bf16.safetensors

vae : ae.safetensors

Voilà, vous êtes prêts à générer vos images avec Z-Image. Cliquez sur Executer pour lancer une première génération de test. Avec le prompt pas défaut, vous devriez obtenir une image comme sur cette capture.

Essais d’une génération en text-to-image avec Z-Image Base sur ComfyUI

En plus du prompt principal vous pouvez également indiquez un prompt négatif pour préciser ce qui ne doit pas être dans l’image.

Le Node LatentImage vous permet de changer les dimensions et KSampler les paramètres d’inférence comme le nombre d’étapes, le CFG ou même le sampler à utiliser.

👉

Paramètres recommandés

Étapes (Steps) : 30 à 50.

CFG : 3.0 à 5.0.

Résolution : Optimisé pour le 1024x1024.

Performances et Matériel

Z-Image est remarquablement léger pour sa qualité. Avec ses 6B de paramètres, il tourne confortablement sur des GPU grand public :

VRAM : Moins de 16 Go requis.

Vitesse : Environ 13 secondes pour une image 1024x1024 (30 étapes) sur une RTX 6000 Blackwell (comptez un peu plus sur une série 30 ou 40 standard).

Prêt à tester ?

Disponible gratuitement en Open Source et légéer à utiliser, Z-Image-Base est un ajout indispensable à votre arsenal de création. Lancez donc votre ComfyUI et explorez les nouveaux templates Z-Image !

Exemples de prompts

A high-quality retro analog film photograph of a superhero performing a powerful landing on a cracked urban street. The hero is captured in a classic three-point landing pose—one knee bent, one fist pressed into the asphalt—sending small stones and dust into the air. Low-angle perspective to emphasize impact and strength, with the figure centered and dominant in the frame.
Authentic 1970s–1980s film aesthetics: visible film grain, muted and slightly desaturated color palette, warm shadows, mild vignetting, subtle light leaks, slight halation around highlights. Photographic realism, cinematic composition, analog texture. — A high-quality retro analog film photograph of a superhero performing a powerful landing on a cracked urban street. The hero is captured in a classic three-point landing pose—one knee bent, one fist pressed into the asphalt—sending small stones and dust into the air. Low-angle perspective to emphasize impact and strength, with the figure centered and dominant in the frame. Authentic 1970s–1980s film aesthetics: visible film grain, muted and slightly desaturated color palette, warm shadows, mild vignetting, subtle light leaks, slight halation around highlights. Photographic realism, cinematic composition, analog texture.

A vivid, high-quality photographic portrait of a romantic young couple, captured in a wholesome and natural way. The two lovers stand close together in a medium close-up frame, gently leaning toward one another, sharing soft smiles and sincere eye contact that conveys youthful affection and emotional connection. Their expressions are relaxed and genuine, with subtle warmth rather than posed intensity. Color grading is vivid yet realistic, with warm, balanced saturation that enhances the romantic mood without appearing artificial. Photographic realism, professional portrait photography, cinematic softness, high detail, natural textures, emotionally intimate but PG-rated, timeless and authentic.

A poetic still life of everyday objects arranged naturally on a simple tabletop, photographed in an editorial art photography style. The composition features ordinary items : a handmade ceramic cup with subtle glaze imperfections, a folded linen cloth with soft creases, an aged book or loose paper, and a small glass vessel placed asymmetrically as if casually left behind after use.

A bold pop art comic portrait of Dick Tracy, depicted in a classic mid-20th-century newspaper comic style. Head-and-shoulders framing shows his iconic square jaw, sharp nose, and stern detective expression, wearing a bright yellow fedora and matching trench coat. The pose is confident and upright, with a slight three-quarter angle that enhances his noir attitude. Rendered with thick black outlines, exaggerated graphic features, and minimal shading using solid shadow blocks. The color palette is limited and high-contrast—yellow, red, cyan, black, and off-white—applied as flat ink fields with no gradients. Visible halftone dot patterns appear in skin tones and shadows, evoking vintage print reproduction. Background is a simple pop-art field with halftone texture or abstract comic shapes, keeping focus on the character. Screen-print aesthetic, retro comic pop art, bold graphic design, high visual impact, clean edges, intentional ink imperfections, iconic and striking illustration.

Z-Image sur ComfyUI

Support de Z-Image

Qu'est-ce que Z-Image-Base ?

Pourquoi choisir la version Base plutôt que la Turbo ?

Les points forts du modèle

Utiliser Z-Image dans ComfyUI

Performances et Matériel

Prêt à tester ?

Exemples de prompts

Marre de tourner en rond ?

Articles liés

Z-Image base en Open-Source

Z-Image sur ComfyUI

Support de Z-Image

Qu'est-ce que Z-Image-Base ?

Pourquoi choisir la version Base plutôt que la Turbo ?

Les points forts du modèle

Utiliser Z-Image dans ComfyUI

Performances et Matériel

Prêt à tester ?

Exemples de prompts

Marre de tourner en rond ?

Articles liés

Z-Image base en Open-Source

✉️ Creative Diffusion