Sommaire
- Playground AI
- Le modèle Playground 2.5
- Exemple de résultats
- Disponibilité du modèle
- Télécharger Playground 2.5
- Utiliser Playground 2.5 en ligne
- Utiliser Playground 2.5 avec Fooocus
- Utiliser Playground 2.5 avec ComfyUI
- Détails du modèle
- Amélioration des couleurs et du contraste
- Amélioration de la génération en diffèrent format
- Amélioration des humains
- Evaluation du modèle
- Un modèle Open Source de qualité
Do not index
Do not index
Publish
Publish
L’une des force de Stable Diffusion XL est sa nature libre. Le modèle a en effet été partagé par ses créateur, Stability AI, sous licence Open Source. Cela permet notamment à d’autres créateurs de reprendre, modifier et améliorer SDXL - à conditions de le partager de manière libre également.
C’est ce qu’a fait récemment ByteDance avec SDXL Lightning et c’est ce que fait également Playground IA. Ces derniers viennent justement d’annoncer une nouvelle version de leur modèle de génération d’image : Playground 2.5.
Playground AI
Playground AI est une plateforme en ligne qui intègre des outils de création et modification d’image basés sur Stable Diffusion et d’autres technologies IA. Avec son offre gratuite et diverses options d'abonnement, Playground AI s'adresse aussi bien aux utilisateurs occasionnels qu'aux professionnels à la recherche d'un outil complet et puissant.
Le modèle Playground 2.5
Playground v2.5 est un modèle open-source de pointe en termes de qualité esthétique, avec un accent particulier mis sur l'amélioration des couleurs et du contraste et le raffinement des détails des figures et personnages humains.
Avec cette sortie, l’équipe de Playground AI a intentionnellement choisi de repousser les limites de l’architecture SDXL actuelle - L’explorations des nouvelles architectures comme Stable Cascade ou le prochain Stable Diffusion 3 a volontairement été mise de coté pour pouvoir proposer rapidement des améliorations aux utilisateurs de Playground et à la communauté Stable Diffusion.
Même en conservant l’architecture actuelle, leurs méthodes permettent une augmentation significative et surprenante de la qualité esthétique des images générées - au point de surpasser la plupart des autres modèles Open Source ou propriétaire comme DALL·E 3 et Midjourney.
Exemple de résultats
Le modèle ayant été partagé en beta privée avec quelques utilisateurs de Playground AI qui ont déjà pu créer ces images époustouflantes :
Disponibilité du modèle
Télécharger Playground 2.5
Comme sa version précédente, Playground 2.5 est partagé en open source et peut donc être télécharger et utiliser librement avec la plupart une interface conçues pour Stable Diffusion XL.
Il requiert néanmoins une adaptation technique qui n’est actuellement disponible que dans ComfyUI - gageons que d’autres interfaces seront prochainement compatibles.
→ Vous pouvez télécharger Playground 2.5 depuis sa page HuggingFace ou sur Civitai.
Utiliser Playground 2.5 en ligne
Le modèle est évidemment directement utilisable sur le plateforme de Playground.com qui permet de générer jusqu’à 500 images gratuites par jour.
Le modèle a également été intégré à la plateforme Poe qui propose diffèrent chatbots, dont un tout nouveau Playground-v2.5 à qui vous pouvez demander de générer des images.
Enfin, le modèle peut évidemment être utiliser en ligne sur des plateformes cloud comme Diffus qui permettent d’uploader et utiliser les modèles, checkpoints et LoRAs de votre choix.
Utiliser Playground 2.5 avec Fooocus
Fooocus, une interface Stable Diffusion simple à installer et utiliser permet d’utiliser Playground 2.5 à l’aide d’un preset de configuration dédiée.
Pour l’utiliser, vous pouvez sélectionnez playground_v2.5 dans la liste des preset qui apparait en haut de la colonne de droite quand vous coché advanced sous le champs du prompt. Vous pouvez également appliquer directement le preset au démarrage en ajoutant l’argument —preset playground_v2.5 à la commande démarrage comme expliqué dans notre article sur les presets.
Utiliser Playground 2.5 avec ComfyUI
Vous trouverez plusieurs workflow permettant d’utiliser Playground 2.5 sur Openart.ai - ils permettent de prendre en main le modèle et de voir quels réglages utilisé pour l’incorporer à vos flux de travail et l’utiliser pour vos génération.
Détails du modèle
Playground 2.5 a été construit et entrainé sur base de contributions de la communauté open source, en particulier la famille de modèles d'images basés sur Stable Diffusion. C’est la suite logique des modèle précèdent (Playground 1 et Playground 2) qui profitent des recherches et apprentissages de l’équipe de recherche de Playground.
Cette nouvelle version cherche notamment à corriger ou combler les failles identifié après la sortir de la version 2.0. Trois problèmes critiques on été adressés : améliorer les couleurs et le contraste, améliorer la génération de diffèrent formats, et améliorer les détails fins de représentation humaines.
Plus généralement, l’équipe a cherché à affiner les capacités du modèle pour produire des sorties plus réalistes et visuellement convaincantes.
Amélioration des couleurs et du contraste
Les modèles de diffusion latente ont généralement du mal à générer des images avec des couleurs vives et un contraste élevé. C’est une une limitation connue depuis SD1.5 et même SDXL, malgrè une nette amélioration, a encore du mal à générer une image avec des couleurs pures et n’est pas toujours bon pour créer des des sujets sur des arrière-plans d’une couleur unique.
Ce problème provient du noise scheduling dans le processus de diffusion. SDXL et Playground v2 utilisent une méthode appelée Offset Noise pour limiter le problème. Playground v2.5 utilise une solution plus radicale avec un entrainement repris à 0 en utilisant le framework EDM.
Amélioration de la génération en diffèrent format
Les procédures de pré-entraînement habituellement utilisée pour les modèles de Diffusion commencent par des images carrées (format 1:1) dans les premiers stades, avec un recadrage aléatoire ou central par la suite. En théorie, cela ne devrait pas poser de problème. Malheureusement, en pratique, les modèles de diffusion entrainée de cette façon ne se généralisent pas bien à d'autres formats et dimensions.
Playground 2.5 a donc été entrainé avec un soin particulier apporté à la selection des données pour assurer une grande variétés de format d’images et en utilisant une méthode de regroupement des formats similaire à celle de SDXL. En appliquant une stratégie plus fines et équilibrée que celle de SDXL, Playground 2.5 ne rencontre pratiquement aucune difficulté à créer des images de qualités dans n’importe quel format.
Amélioration des humains
Les humains sont particulièrement sensibles aux erreurs visuelles sur les caractéristiques humaines comme les mains, les visages et les corps. Une image avec un éclairage parfait, une composition et un style excellents seront considérés comme de faible qualité si le visage est mal formé ou la structure du corps contorsionnée.
Pour éviter ce type de distortion, Playground 2.5 utilise une méthode d’alignement particulier inspirée de l’alignement EMU proche des stratégie anti-hallucination utilisée pour améliorer les modèles de language comme ChatGPT ou Mistral.
Cette stratégie donne des résultats grandement améliorer pour les composition et expression faciale, le yeux et le regard et la texture des cheveux.
Evaluation du modèle
Des études ont été menées pour évaluer le modèle sur la qualité esthétique globale et sur des domaines spécifiques d'amélioration de Playground v2.5, notamment les ratios d'aspect multiples et l’amiloration des représentations humaines.
Playground v2.5 a surpassé les modèles open source actuels SDXL et PixArt-α, ainsi que la version précédente Playground v2, et même des modèles propriétaire de pointe comme DALL·E 3 et Midjourney v5.2 en termes de qualité esthétique.
En ce qui concerne les format d’images, Playground v2.5 a également démontré une performance supérieure par rapport à SDXL.
Pour les images liées aux personnes, visant à tester le rendu des caractéristiques humaines, Playground v2.5 a largement surpassé les modèles de base couramment utilisés comme SDXL et RealStock v2.
Un modèle Open Source de qualité
Avec son travail de recherche et le partage de Playground v2.5, Playground AI contribue activement au développement des solutions libres pour la génération d’images à l’aide de l’intelligence artificielle.
Leurs modèles démontrent à la fois la validité et l’efficacité des techniques d’entraînement et de génération d’images mises au point avec Stable Diffusion, ainsi que l’importance de la communauté Open Source et des avantages que ce type de distribution et de partage peut offrir.
Nous n’en sommes encore qu’au début des améliorations possibles et des opportunités qu’ouvrent les modèles de diffusion Open Source. Le travail de Playground AI, comme celui des autres contributeurs, est essentiel pour continuer à avancer et explorer tous ces potentiels.
Ecrit par