SD 3.5 - La surprise de Stability AI

Stability AI sort la nouvelle version 3.5 de Stable Diffusion

SD 3.5 - La surprise de Stability AI
Tags
Do not index
Do not index
mydate
Flag
Stability AI vient d’annoncer Stable Diffusion 3.5, une nouvelle gĂ©nĂ©ration de modĂšles de crĂ©ation d'images qui marque une Ă©volution significative par rapport Ă  la version 3.0 sortie en juin dernier.

Un retour inattendu

Le lancement de Stable Diffusion 3.5 par Stability est une vraie surprise.
Dans un paysage dominé par l'ascension fulgurante de Flux et aprÚs la déception de Stable Diffusion 3, peu anticipaient une telle annonce.
En effet, la version 3.0, sortie en juin dernier, n'avait pas convaincu. Sa qualitĂ© en deçà des attentes et ses licences d’utilisations restrictive avaient poussĂ© de nombreux crĂ©ateurs vers d'autres solutions.
Cette situation, combinée aux rumeurs sur les difficultés financiÚres de Stability AI, laissait présager un déclin progressif de la série Stable Diffusion, tandis que Flux s'imposait comme l'héritier spirituel de SDXL auprÚs de la communauté.
Mais Stability AI tente un véritable retour, avec une proposition qui semble avoir tiré les leçons du passé : des modÚles plus performants et une licence plus permissive.
notion image
notion image
notion image

Stable Diffusion 3.5

Les trois variantes du modĂšle

Comme Flux et la plupart des modÚles modernes, Stable Diffusion 3.5 est publié en plusieurs variantes, adaptées à différents usages.
  • Stable Diffusion 3.5 Large (disponible immĂ©diatement) : Un modĂšle de 8 milliards de paramĂštres capable de gĂ©nĂ©rer des images en rĂ©solution 1 mĂ©gapixel. Cette version phare se distingue par sa qualitĂ© et sa fidĂ©litĂ© aux prompts.
  • Stable Diffusion 3.5 Large Turbo (disponible immĂ©diatement) : Une version optimisĂ©e du modĂšle Large qui gĂ©nĂšre des images en seulement 4 Ă©tapes, privilĂ©giant la vitesse sans compromettre la qualitĂ©.
  • Stable Diffusion 3.5 Medium (disponible le 29 octobre) : Une version plus lĂ©gĂšre avec 2,5 milliards de paramĂštres qui sera plus adaptĂ©e aux configurations grand public. Il supportera des rĂ©solutions de 0,25 Ă  2 mĂ©gapixels.

Points forts de SD 3.5

Cette version apporte des améliorations significatives sur plusieurs aspects clés :
  • La fidĂ©litĂ© aux prompts :
    • Un meilleur respect des descriptions textuelles
    • De nouvelles capacitĂ©s de contrĂŽle via le "highlighting" dans les prompts pour orienter prĂ©cisĂ©ment les gĂ©nĂ©rations
    • La prise en charge de hashtags thĂ©matiques (#boho, #fashion...) pour spĂ©cifier des styles prĂ©cis
  • La qualitĂ© des gĂ©nĂ©rations :
    • Un rĂ©alisme accru des images gĂ©nĂ©rĂ©es
    • Une amĂ©lioration notable du rendu des textes dans les images
    • Une gĂ©nĂ©ration multi-styles couvrant la 3D, la photographie, la peinture et le dessin au trait
  • AccessibilitĂ© et performances :
    • Des performances optimisĂ©es sur du matĂ©riel grand public, particuliĂšrement pour les versions Medium et Large Turbo
    • Une reprĂ©sentation inclusive et diversifiĂ©e sans nĂ©cessitĂ© de prompts complexes
    • Une compatibilitĂ© avec les principaux outils du marchĂ©

Une personnalisation renforcée

La personnalisation constitue l'axe central du développement de cette nouvelle version. L'intégration de la Query-Key Normalization dans les blocs transformers améliore la stabilité du processus d'entraßnement et simplifie les opérations de fine-tuning. Cette approche technique ouvre la voie à de multiples adaptations et développements futurs.
Ce choix architectural s'accompagne toutefois de certains compromis. Le modĂšle produit dĂ©libĂ©rĂ©ment une plus grande variĂ©tĂ© de rĂ©sultats pour un mĂȘme prompt selon le seed utilisĂ©. Cette caractĂ©ristique, loin d'ĂȘtre un dĂ©faut, prĂ©serve une base de connaissances plus large et une plus grande diversitĂ© stylistique dans les modĂšles de base.
Les utilisateurs doivent néanmoins tenir compte de deux particularités :
  • Les prompts imprĂ©cis peuvent gĂ©nĂ©rer des rĂ©sultats plus incertains
  • La qualitĂ© esthĂ©tique peut varier selon les gĂ©nĂ©rations
notion image
notion image
notion image

Accessibilité et licence

L’ensemble des modĂšles, y compris la version Large, sont partagĂ©s sous la licence communautaire Stability AI qui autorise :
  • Un usage gratuit pour les particuliers et la recherche
  • Un usage commercial gratuit pour les entreprises gĂ©nĂ©rant moins d'1M$ de revenus annuels
  • La propriĂ©tĂ© totale des images gĂ©nĂ©rĂ©es
Les deux premiers modĂšles peuvent ainsi ĂȘtre tĂ©lĂ©chargĂ©s sur Hugging Face :

Utiliser Stable Diffusion 3.5

DÚs sa sortie, Stable Diffusion 3.5 a été rendu disponibles sur diverses plateformes :
notion image
Cette version 3.5 marque un tournant stratégique pour Stability AI. L'entreprise, aprÚs l'échec relatif de SD3, revient avec une approche qui privilégie l'accessibilité et la personnalisation.
L'impact réel de ces nouveaux modÚles dépendra largement de leur adoption par la communauté.
La licence plus permissive et l'architecture modulaire pourraient séduire les développeurs, tandis que les artistes et créatifs attendront de voir la qualité effective des générations au quotidien.
Dans un Ă©cosystĂšme oĂč Flux domine actuellement les discussions, Stable Diffusion 3.5 devra dĂ©montrer sa pertinence au-delĂ  des promesses techniques.
Le secteur de l'IA générative continue ainsi sa mutation rapide.
Chaque sortie majeure redéfinit les standards et les attentes, obligeant les créateurs à constamment réévaluer leurs outils. Cette dynamique, si elle peut paraßtre éprouvante pour les utilisateurs, stimule l'innovation et la diversité des approches dans le domaine.

Découvre, apprends et maßtrise la génération d'images

La 1Úre Newsletter SD & Flux en Français

Inscription Gratuite

Ecrit par

Stable Tom

Créateur de Creative Diffusion