
Quelques semaines après la sortie de la version 2.1 de son modèle d’image, Tencent frappe à nouveau et annonce Hunyuan-Image 3.0, un modèle d'IA générative d'images open source qui promet quelques bouleversement.
Annoncé le 28 septembre 2025, ce modèle open-source se distingue par sa taille impressionnante et ses capacités avancées. Plongeons dans les détails de cette innovation majeure.
Un géant aux capacités impressionnantes
Hunyuan-Image 3.0 est un véritable colosse dans le monde de l'IA générative. Avec pas moins de 80 milliards de paramètres et une architecture Mixture of Experts (MoE) à 64 experts, ce modèle se positionne comme le plus grand modèle open-source de génération d'images disponible à ce jour.
Mais ce n'est pas tout. Hunyuan-Image 3.0 utilise un cadre autorégressif unifié pour la compréhension et la génération multimodales, ce qui améliore significativement la précision sémantique et la qualité esthétique des images générées.
Le modèle a été entraîné sur un corpus massif de 5 milliards de paires texte-image et 6 téraoctets de données textuelles, avec une stratégie d'entraînement progressif et une curation minutieuse des datasets. Cette curation vise à améliorer la qualité des images générées et à réduire les biais et artefacts.
Concrètement, cela signifie que le modèle est capable de comprendre et de générer des images à partir de textes longs et complexes, une fonctionnalité rare dans les modèles open-source.

Exigences matérielles élevées
Cependant, cette taille impressionnante signifie malheureusement que Hunyuan-Image 3.0 nécessite une infrastructure matérielle conséquente pour fonctionner de manière optimale. Le modèle requiert en effet un système Linux, des GPU NVIDIA avec CUDA, 170 Go d'espace disque, et au moins 3 x 80 Go de mémoire GPU (4 x 80 Go recommandés).
Cette exigence matérielle élevée peut rendre le modèle inaccessible aux amateurs ou aux petites structures sans ressources matérielles importantes. Toutefois, pour les professionnels et les grandes organisations, Hunyuan-Image 3.0 représente une opportunité majeure d'améliorer leurs workflows de création visuelle.

Pour les professionnels de la création visuelle, Hunyuan-Image 3.0 offre une opportunité unique d'améliorer leurs workflows et de produire des contenus de haute qualité. Pour les amateurs et les petites structures, le modèle peut être un outil puissant, à condition de disposer des ressources matérielles nécessaires.
Ecrit par