
Flux Nunchaku est un moteur d'inférence révolutionnaire développé par le MIT HAN Lab, spécialement conçu pour accélérer drastiquement la génération d'images avec les modèles Flux.
Cette solution d'optimisation utilise la quantification SVDQuant 4-bit pour transformer complètement l'expérience utilisateur, rendant la génération d'images haute qualité accessible même sur du matériel grand public.
Pourquoi Nunchaku ?
Le nom Nunchaku évoque la rapidité et l'efficacité de cette technologie d'accélération. Tout comme l'arme traditionnelle permet des mouvements fluides et rapides, Flux Nunchaku rend la génération d'images jusqu'à 10 fois plus rapide tout en réduisant drastiquement l'utilisation de la mémoire GPU.
Face aux limitations des modèles de diffusion traditionnels Nunchaku apporte une solution élégante qui démocratise l'accès à la génération d'images haute qualité.
Qu'est-ce que la méthode SVDQuant 4-bit ?
La technologie SVDQuant (Singular Value Decomposition Quantization) est au cœur de l'optimisation Nunchaku. Cette méthode avancée de quantification permet de réduire la précision des poids du modèle de 16 bits à 4 bits sans compromettre significativement la qualité des résultats.
Caractéristiques de SVDQuant
- Compression intelligente : SVDQuant utilise une décomposition en valeurs singulières pour identifier et préserver les informations les plus importantes du modèle
- Quantification adaptative : Contrairement aux méthodes de quantification uniformes, SVDQuant s'adapte à la distribution des données pour optimiser la représentation 4-bit
- Préservation de la qualité : La méthode maintient environ 98% de la qualité d'image originale malgré la réduction drastique de précision
- Optimisation mémoire : Réduction de 3,6× de l'utilisation VRAM par rapport aux modèles 16-bit
- Accélération matérielle : Les calculs 4-bit sont nativement plus rapides sur les GPU modernes
Les avantages de Nunchaku
- Vitesse exceptionnelle : Génération d'images 1024×1024 en seulement 5-6 secondes (contre 45-60 secondes en temps normal)
- Efficacité mémoire : Réduction de 3,6× de l'utilisation VRAM, permettant de faire tourner FLUX sur des GPU 8GB
- Qualité préservée : Maintien de ~98% de la qualité d'image par rapport au modèle 16-bit original
- Accessibilité : Fonctionne sur du matériel grand public sans nécessiter de configurations haut de gamme
- Intégration native : Plugin ComfyUI officiel avec support multi-LoRA et ControlNet

Performances comparatives
Voici un aperçu des gains de performance typiques avec Nunchaku :
Configuration | Temps (FP16) | Temps (Nunchaku) | Gain |
RTX 4090 | 45s | 5s | 9× |
RTX 3090 | 60s | 6s | 10× |
RTX 4070 | 90s | 12s | 7.5× |
Flux + Nunchaku = 💥
La communauté Flux a rapidement adopté Nunchaku pour tous les modèles de la gamme FLUX.1, offrant des performances extraordinaires même sur des systèmes aux ressources limitées.
Télécharger Flux Nunchaku
Vous pouvez télécharger les versions Nunchaku des modèles FLUX.1 à partir des dépôts Hugging Face suivants :
nunchaku-flux.1-dev
Version optimisée du modèle FLUX.1-dev avec quantification SVDQuant 4-bit.
nunchaku-flux.1-schnell
Version accélérée du modèle FLUX.1-schnell pour prototypage rapide.
nunchaku-flux.1-kontext-dev
Version optimisée du modèle contextuel FLUX.1-Kontext capable de comprendre et modifier les images existantes.
sqdv-int4_r32-flux.1-krea-dev
Version optimisée du modèle FLUX.1 Krea Dev, un modèle spécialement entrainé pour le photoréalisme et la qualité ésthétique.
Ces modèles peuvent être utilisés avec le plugin ComfyUI-Nunchaku (voir ci-dessous) ou d'autres interfaces compatibles. Placez les fichiers du modèle dans le répertoire approprié comme avec tout autre checkpoint.
Configuration GPU : Nunchaku fonctionne de manière optimale sur les GPU NVIDIA avec CUDA. Pour des performances maximales, assurez-vous d'avoir les derniers pilotes installés et suffisamment de VRAM disponible (8GB minimum recommandé).
En utilisant les versions Nunchaku des modèles Flux, vous pouvez obtenir des performances exceptionnelles même sur des GPU avec seulement 8GB de VRAM, révolutionnant votre workflow créatif.
Nunchaku sur ComfyUI
Pour utiliser les modèles Flux Nunchaku avec ComfyUI, vous devrez installer le plugin officiel ComfyUI-nunchaku. Ce plugin ajoute le support complet de la technologie Nunchaku avec des nœuds spécialisés pour une intégration parfaite.
Installation du plugin
- Cliquez sur le bouton Manager dans le menu principal
- Sélectionnez le bouton Custom Nodes Manager
- Cherchez ComfyUI-nunchaku via la barre de recherche
- Cliquez sur Install
Après l'installation, relancez ComfyUI.
Chargez alors le workflow install_wheel.json et executez-le pour installer le Nunchaku Wheel, un fichier nécessaire à l'intégration du backend Nunchaku dans ComfyUI qui contient tous les modules Python, couches natives et dépendances requis.
Utilisation
Le plugin ComfyUI-nunchaku fournit des nœuds spécialisés pour tirer parti de l'optimisation Nunchaku :
- Nunchaku Flux DiT Loader : Charge les modèles Flux optimisés avec quantification SVDQuant
- Nunchaku Text Encoder Loader : Gère l'encodage de texte optimisé
- Support multi-LoRA : Permet l'utilisation simultanée de plusieurs LoRA
- Intégration ControlNet : Compatible avec tous les types de ControlNet existants

Nunchaku représente une avancée majeure dans l'optimisation des modèles Flux, rendant la génération d'images haute qualité accessible à tous. Pour les créateurs cherchant à accélérer leur workflow créatif sans compromettre la qualité, Nunchaku se révèle être une solution incontournable qui transforme littéralement l'expérience de création avec l'IA.
Ecrit par