FLUX.2 : La riposte de Black Forest Labs

BFL fait face au buzz des nouveaux modèles Google

FLUX.2 : La riposte de Black Forest Labs
Do not index
Do not index
Flag
Publish
Publish
feather:link
mydate
Tags
Alors que Google et son Nano Banana Pro monopolisaient l'attention depuis une semaine, Black Forest Labs arrive avec du lourd. FLUX.2 ne se contente pas de s'aligner : il propose une alternative crédible, ouverte et professionnelle à l'hégémonie du géant de Mountain View.
On les sentait venir depuis quelques semaines, entre rumeurs sur X et bruits de couloir sur Reddit. Cette fois, le doute n'est plus permis : FLUX.2 est disponible et il ne s'agit pas d'une simple mise à jour de courtoisie. Black Forest Labs (BFL) semble bien décidé à prouver que le modèle "Open Core" proposant à la fois des outils propriétaires de pointe et des versions accessibles aux chercheurs est tout aussi viable pour l'avenir de la création visuelle.

Un véritable outil de production

Si FLUX.1 avait marqué les esprits par son réalisme, FLUX.2 change de paradigme. L'ambition affichée est claire : passer du "jouet technologique" à l'outil "Production-Ready".
La fonctionnalité qui risque de faire le plus de bruit est sans doute le support natif multi-référence qui met le modèle de Black Forest Labs a niveau avec celui de Google. Concrètement, vous ne dépendez plus uniquement de votre capacité à rédiger un prompt parfait. Le modèle peut désormais ingérer jusqu'à 10 images de référence simultanément. Pour un créatif, c'est une petite révolution : cela permet de conserver la cohérence d'un personnage, d'un produit ou d'un style graphique spécifique à travers toute une série d'images.
notion image

Sous le capot : un monstre

Techniquement, BFL n'a pas fait les choses à moitié. Le modèle repose sur une architecture de 32 milliards de paramètres (pour la version [dev]). Pour donner un ordre d'idée, c'est massif.
Le moteur intègre un encodeur de texte basé sur Mistral-3, ce qui explique les progrès fulgurants annoncés en compréhension du langage naturel. Fini les mots-clés cryptiques ; le modèle comprend les instructions complexes, les relations spatiales et, cerise sur le gâteau, gère la typographie avec une fiabilité déconcertante. Les designers apprécieront également la prise en charge des codes couleurs HEX pour un respect strict des chartes graphiques.
Bien sûr, une telle puissance a un coût. Nativement, la bête demande près de 110 Go de VRAM. Heureusement, BFL a collaboré étroitement avec VIDIA pour proposer dès le lancement une optimisation en FP8. Résultat : une réduction de 40% des besoins en mémoire, rendant l'exécution du modèle [dev] possible sur une "simple" RTX 4090. Pour ceux qui n'ont pas une telle carte graphique sous la main, pas de panique, le cloud est là pour ça.
notion image
notion image

À chacun son Flux.2

Comme pour la version précédente, la gamme est segmentée pour répondre à tous les besoins :
  • FLUX.2 [pro] : C'est la version "bête de course", accessible via API. Elle offre la meilleure qualité visuelle et une fidélité aux prompts sans compromis.
  • FLUX.2 [dev] : C'est le cadeau à la communauté. Disponible en poids ouverts sur Hugging Face, cette version permet aux passionnés et aux chercheurs d'utiliser un modèle de classe mondiale (sous licence non-commerciale) directement chez eux.
  • FLUX.2 [flex] : Une nouvelle variante pensée pour l'efficacité, permettant de moduler la vitesse et la qualité, idéale pour les développeurs d'applications.
Une version [klein], plus légère et totalement open-source (Apache 2.0), est également dans les tuyaux pour une sortie prochaine.
notion image

Comment tester dès maintenant ?

Pas besoin d'attendre ou d'installer des bibliothèques Python complexes pour se faire un avis. Le modèle est déjà disponible sur le BFL Playground avec un système de crédits gratuits à l'inscription. Les plateformes partenaires habituelles comme Replicate ou fal.ai ont également mis à jour leurs endpoints dès ce matin.
Avec cette sortie, Black Forest Labs confirme qu'il ne faut pas nécessairement être un géant de la Tech pour rivaliser avec GPT ou Nano Banana. FLUX.2 place la barre très haut en termes de photoréalisme et de contrôle, tout en gardant une porte ouverte vers la communauté. Reste à voir comment les créateurs vont s'emparer de ces nouveaux outils, notamment pour la vidéo, domaine où les rumeurs vont encore bon train.

Stop aux heures perdues et aux crédits gaspillés sur des prompts inefficaces. Accédez à plus de 150 prompts éprouvés et opérationnels, pensés pour générer des visuels remarquables en un clin d'œil - sans galère, sans approximation, juste des résultats constants et exploitables.

Marre de tourner en rond ?

Découvrir l'Atelier du Prompt