Playground v2.5 - le nouveau modèle de PlayGround AI

Playground AI

Playground AI est une plateforme en ligne qui intègre des outils de création et modification d’image basés sur Stable Diffusion et d’autres technologies IA. Avec son offre gratuite et diverses options d'abonnement, Playground AI s'adresse aussi bien aux utilisateurs occasionnels qu'aux professionnels à la recherche d'un outil complet et puissant.

Le modèle Playground 2.5

Playground v2.5 est un modèle open-source de pointe en termes de qualité esthétique, avec un accent particulier mis sur l'amélioration des couleurs et du contraste et le raffinement des détails des figures et personnages humains.

Avec cette sortie, l’équipe de Playground AI a intentionnellement choisi de repousser les limites de l’architecture SDXL actuelle - L’explorations des nouvelles architectures comme Stable Cascade ou le prochain Stable Diffusion 3 a volontairement été mise de coté pour pouvoir proposer rapidement des améliorations aux utilisateurs de Playground et à la communauté Stable Diffusion.

Même en conservant l’architecture actuelle, leurs méthodes permettent une augmentation significative et surprenante de la qualité esthétique des images générées - au point de surpasser la plupart des autres modèles Open Source ou propriétaire comme DALL·E 3 et Midjourney.

Exemple de résultats

Le modèle ayant été partagé en beta privée avec quelques utilisateurs de Playground AI qui ont déjà pu créer ces images époustouflantes :

Image créée par PolyCrumbs avec Playground v2.5

Image créée par Shaddy et Bella avec Playground v2.5

Image créée par Playground avec Playground v2.5

Disponibilité du modèle

Télécharger Playground 2.5

Comme sa version précédente, Playground 2.5 est partagé en open source et peut donc être télécharger et utiliser librement avec la plupart une interface conçues pour Stable Diffusion XL.

Il requiert néanmoins une adaptation technique qui n’est actuellement disponible que dans ComfyUI - gageons que d’autres interfaces seront prochainement compatibles.

→ Vous pouvez télécharger Playground 2.5 depuis sa page HuggingFace ou sur Civitai.

Utiliser Playground 2.5 en ligne

Le modèle est évidemment directement utilisable sur le plateforme de Playground.com qui permet de générer jusqu’à 500 images gratuites par jour.

Le modèle a également été intégré à la plateforme Poe qui propose diffèrent chatbots, dont un tout nouveau Playground-v2.5 à qui vous pouvez demander de générer des images.

Enfin, le modèle peut évidemment être utiliser en ligne sur des plateformes cloud comme Diffus qui permettent d’uploader et utiliser les modèles, checkpoints et LoRAs de votre choix.

Utiliser Playground 2.5 avec Fooocus

Fooocus, une interface Stable Diffusion simple à installer et utiliser permet d’utiliser Playground 2.5 à l’aide d’un preset de configuration dédiée.

Pour l’utiliser, vous pouvez sélectionnez playground_v2.5 dans la liste des preset qui apparait en haut de la colonne de droite quand vous coché advanced sous le champs du prompt. Vous pouvez également appliquer directement le preset au démarrage en ajoutant l’argument —preset playground_v2.5 à la commande démarrage comme expliqué dans notre article sur les presets.

Utiliser Playground 2.5 avec ComfyUI

Vous trouverez plusieurs workflow permettant d’utiliser Playground 2.5 sur Openart.ai - ils permettent de prendre en main le modèle et de voir quels réglages utilisé pour l’incorporer à vos flux de travail et l’utiliser pour vos génération.

https://openart.ai/workflows/datou/playground-v25/Rj7haGmd0ZPtFZmtj74K

Détails du modèle

Playground 2.5 a été construit et entrainé sur base de contributions de la communauté open source, en particulier la famille de modèles d'images basés sur Stable Diffusion. C’est la suite logique des modèle précèdent (Playground 1 et Playground 2) qui profitent des recherches et apprentissages de l’équipe de recherche de Playground.

Cette nouvelle version cherche notamment à corriger ou combler les failles identifié après la sortir de la version 2.0. Trois problèmes critiques on été adressés : améliorer les couleurs et le contraste, améliorer la génération de diffèrent formats, et améliorer les détails fins de représentation humaines.

Plus généralement, l’équipe a cherché à affiner les capacités du modèle pour produire des sorties plus réalistes et visuellement convaincantes.

Amélioration des couleurs et du contraste

Les modèles de diffusion latente ont généralement du mal à générer des images avec des couleurs vives et un contraste élevé. C’est une une limitation connue depuis SD1.5 et même SDXL, malgrè une nette amélioration, a encore du mal à générer une image avec des couleurs pures et n’est pas toujours bon pour créer des des sujets sur des arrière-plans d’une couleur unique.

Ce problème provient du noise scheduling dans le processus de diffusion. SDXL et Playground v2 utilisent une méthode appelée Offset Noise pour limiter le problème. Playground v2.5 utilise une solution plus radicale avec un entrainement repris à 0 en utilisant le framework EDM.

Comparaison des contrastes entre la v2 (en haut) et la v2.5 (en bas)

Amélioration de la génération en diffèrent format

Les procédures de pré-entraînement habituellement utilisée pour les modèles de Diffusion commencent par des images carrées (format 1:1) dans les premiers stades, avec un recadrage aléatoire ou central par la suite. En théorie, cela ne devrait pas poser de problème. Malheureusement, en pratique, les modèles de diffusion entrainée de cette façon ne se généralisent pas bien à d'autres formats et dimensions.

Playground 2.5 a donc été entrainé avec un soin particulier apporté à la selection des données pour assurer une grande variétés de format d’images et en utilisant une méthode de regroupement des formats similaire à celle de SDXL. En appliquant une stratégie plus fines et équilibrée que celle de SDXL, Playground 2.5 ne rencontre pratiquement aucune difficulté à créer des images de qualités dans n’importe quel format.

Amélioration des humains

Les humains sont particulièrement sensibles aux erreurs visuelles sur les caractéristiques humaines comme les mains, les visages et les corps. Une image avec un éclairage parfait, une composition et un style excellents seront considérés comme de faible qualité si le visage est mal formé ou la structure du corps contorsionnée.

Pour éviter ce type de distortion, Playground 2.5 utilise une méthode d’alignement particulier inspirée de l’alignement EMU proche des stratégie anti-hallucination utilisée pour améliorer les modèles de language comme ChatGPT ou Mistral.

Cette stratégie donne des résultats grandement améliorer pour les composition et expression faciale, le yeux et le regard et la texture des cheveux.

Image créée pat voisard avec Playground v2.5

Evaluation du modèle

Des études ont été menées pour évaluer le modèle sur la qualité esthétique globale et sur des domaines spécifiques d'amélioration de Playground v2.5, notamment les ratios d'aspect multiples et l’amiloration des représentations humaines.

Playground v2.5 a surpassé les modèles open source actuels SDXL et PixArt-α, ainsi que la version précédente Playground v2, et même des modèles propriétaire de pointe comme DALL·E 3 et Midjourney v5.2 en termes de qualité esthétique.

En ce qui concerne les format d’images, Playground v2.5 a également démontré une performance supérieure par rapport à SDXL.

Pour les images liées aux personnes, visant à tester le rendu des caractéristiques humaines, Playground v2.5 a largement surpassé les modèles de base couramment utilisés comme SDXL et RealStock v2.

Un modèle Open Source de qualité

Avec son travail de recherche et le partage de Playground v2.5, Playground AI contribue activement au développement des solutions libres pour la génération d’images à l’aide de l’intelligence artificielle.

Leurs modèles démontrent à la fois la validité et l’efficacité des techniques d’entraînement et de génération d’images mises au point avec Stable Diffusion, ainsi que l’importance de la communauté Open Source et des avantages que ce type de distribution et de partage peut offrir.

Nous n’en sommes encore qu’au début des améliorations possibles et des opportunités qu’ouvrent les modèles de diffusion Open Source. Le travail de Playground AI, comme celui des autres contributeurs, est essentiel pour continuer à avancer et explorer tous ces potentiels.

Sortie de Playground v2.5

Playground AI