Models

Select the model you want to generate your video with.

Image

Click to upload or drag and drop

Supported formats: JPG, JPEG, PNG; each file max 10MB.

Prompt

Duration

Quality

Aspect Ratio

No Watermark

Private

Auto Sound

Auto Speech

Wan 2.2 : Comment accéder en ligne et exécuter Wan 2.2 localement

L’open source s’associe à la précision cinématographique grâce à Wan 2.2.

Qu’est-ce que Wan 2.2 ?

Ce qui rend Wan 2.2 différent de Wan 2.1

Wan 2.2 est un générateur vidéo par IA de nouvelle génération développé par Wan AI, une équipe de recherche affiliée à Alibaba. Conçu pour les tâches de génération vidéo à partir de texte et d’image, il produit des vidéos cinématographiques de haute qualité, rapides et avec des mouvements réalistes. Par rapport à Wan 2.1, cette version présente une architecture puissante de type Mixture of Experts (MoE), permettant une génération plus fluide, une meilleure adhérence aux prompts et un contrôle visuel renforcé.

Générateur vidéo open source Wan 2.2

Wan 2.2 d'Alibaba est entièrement open source sous licence Apache 2.0. Les développeurs peuvent télécharger, utiliser et modifier le générateur vidéo par IA Wan 2.2 sans restriction, à la fois pour des projets de recherche et commerciaux. Cette approche ouverte offre aux créateurs et ingénieurs une flexibilité totale pour construire des pipelines vidéo personnalisés et intégrer le modèle dans leurs propres outils.

Voir les exemples de Wan 2.2

Les modèles vidéo IA Wan 2.2

Wan2.2-T2V-A14B : Modèle de génération vidéo à partir de texte

Ce modèle transforme les descriptions textuelles en vidéos de 5 secondes à une résolution de 480P et 720P. Grâce à une compréhension précise des descriptions textuelles et un contrôle précis du mouvement, il produit des résultats plus précis et expressifs que les versions précédentes de Wan ou d'autres outils d'IA concurrents.

Wan2.2-I2V-A14B : Modèle de génération de vidéo à partir d’image

Conçu pour transformer des images statiques en séquences dynamiques, ce modèle prend en charge les sorties 480P et 720P. Il réduit le tremblement de caméra et permet d'appliquer divers styles, ce qui en fait un outil idéal pour des applications artistiques ou basées sur des storyboards.

Wan2.2-TI2V-5B : Générateur vidéo hybride

Le modèle TI2V-5B permet à la fois la génération vidéo à partir de texte et d’image dans un seul pipeline. Il utilise un VAE à haute compression pour générer rapidement des vidéos 720P@24fps, et fonctionne efficacement sur une seule carte graphique grand public comme l’RTX 4090 — idéal pour la recherche ou la production.

Principales fonctionnalités de Wan 2.2

Architecture Mixture-of-Experts (MoE)

Wan 2.2 intègre une architecture puissante de type Mixture-of-Experts (MoE) qui renforce la capacité du modèle sans augmenter la charge de calcul. Cela permet une génération vidéo plus rapide et de meilleure qualité à travers les étapes temporelles, établissant Wan 2.2 comme référence technique dans les modèles de diffusion open source.

Données d'entraînement étendues

Wan 2.2 a été entraîné avec 65,6 % plus d'images et 83,2 % plus de vidéos que son prédécesseur, Wan 2.1. Cette augmentation significative des données d'entraînement garantit une meilleure gestion du mouvement, une cohérence sémantique et une consistance esthétique dans les vidéos générées.

Esthétique cinématographique améliorée

Avec des jeux de données soigneusement étiquetés en ce qui concerne l'éclairage, la composition et la coloration, Wan 2.2 excelle dans la production de vidéos cinématographiques visuellement impressionnantes, offrant aux créateurs un contrôle précis sur leurs préférences artistiques.

Hybride TI2V haute définition efficace

Le modèle Wan 2.2 TI2V-5B permet de générer des vidéos en 720p à 24fps, en utilisant une compression VAE avancée (16×16×4). Conçu pour l'efficacité, il fonctionne sur des cartes graphiques destinées aux utilisateurs ordinaires comme la 4090, rendant la génération de haute qualité accessible à un plus large public.

Comment accéder à Wan 2.2 en ligne ?

Essayez Wan 2.2 TI2V-5B via le Hugging Face Space

Vous pouvez explorer directement le générateur vidéo AI Wan 2.2 sur Hugging Face Space. Le modèle TI2V-5B prend en charge à la fois la génération texte vers vidéo et image vers vidéo à une résolution de 720p et 24fps.

Accédez à Wan 2.2 Plus sur le site officiel

Rendez-vous sur le site officiel Wan AI pour accéder à Wan 2.2 Plus, une version avancée offrant des outils améliorés et des workflows prédéfinis. Il est conçu pour les utilisateurs souhaitant davantage de contrôle et des résultats plus rapides. Notez que Wan 2.2 Plus est actuellement un service payant.

Comment installer et exécuter Wan 2.2 localement

Étape 1 : Cloner le dépôt

Commencez par cloner le dépôt Wan 2.2 sur GitHub. Il contient tout ce dont vous avez besoin pour exécuter le modèle localement.

Étape 2 : Installer les dépendances

Assurez-vous que votre environnement répond aux exigences. Installez les paquets Python listés dans le dépôt, et vérifiez que PyTorch est à la version 2.4.0 ou supérieure pour garantir la compatibilité avec Wan 2.2.

Étape 3 : Télécharger le modèle

Sélectionnez le bon modèle selon votre cas d’usage : T2V-A14B pour texte vers vidéo I2V-A14B pour image vers vidéo TI2V-5B pour une entrée hybride texte+image, prenant en charge une résolution 720p à 24fps Vous pouvez télécharger et en savoir plus sur chaque modèle sur Hugging Face et ModelScope.

Étape 4 : Générer une vidéo

Après l’installation, vous pouvez commencer à générer des vidéos à partir d’un prompt textuel ou d’une image. Le modèle traitera votre entrée et générera une vidéo en 720p, entièrement sur votre machine locale — avec un contrôle total sur le style visuel, les mouvements et le timing.

Accéder au workflow ComfyUI pour Wan 2.2

Workflow Wan 2.2 TI2V-5B pour ComfyUI

Vous pouvez explorer un flux de travail visuel pour générer des vidéos avec Wan 2.2 TI2V-5B directement dans ComfyUI. Cette configuration prend en charge à la fois la génération texte vers vidéo et image vers vidéo. Pour commencer, consultez le guide Wan 2.2 ComfyUI, qui explique comment charger les modèles et exécuter le flux de travail de manière fluide.

Configuration requise et installation

Pour exécuter Wan 2.2 dans ComfyUI, vous devez installer manuellement les fichiers de modèle spécifiques : le modèle de diffusion, le VAE et l’encodeur de texte. Il est recommandé d’utiliser un GPU doté d’au moins 8 Go de VRAM pour une génération fluide.

Choisissez parmi trois types de flux de travail

ComfyUI prend actuellement en charge trois workflows Wan 2.2 : T2V (texte-vers-vidéo) pour la génération texte-vers-vidéo I2V (image-vers-vidéo) pour la génération image-vers-vidéo TI2V (hybride) pour une entrée hybride Chacune de ces versions peut être ajustée selon vos préférences en matière de prompt, de résolution et de durée en images par seconde — ce qui en fait un outil flexible pour créateurs, chercheurs et développeurs.

Comment Wan 2.2 fonctionne-t-il ?

Architecture MoE (Mixture of Experts) efficace

Wan 2.2 utilise une architecture de type Mixture of Experts (MoE) pour équilibrer qualité de génération et efficacité computationnelle. Pendant le processus de débruitage, il commute dynamiquement entre deux modèles experts : l’un spécialisé dans les étapes à fort bruit, l’autre pour le raffinement à faible bruit. Cette structure en couches permet à Wan 2.2 de produire des résultats plus détaillés et stables sans augmenter l’utilisation de mémoire par rapport à Wan 2.1.

Modèle léger TI2V-5B pour une génération rapide

Pour les utilisateurs souhaitant une performance rapide sur du matériel grand public, Wan 2.2 inclut le modèle TI2V-5B. Il compresse les représentations vidéo à l’aide d’un VAE hautement efficace, permettant une génération en 720p à 24fps en moins de 9 minutes sur un seul GPU. Le modèle supporte à la fois les tâches texte-vers-vidéo et image-vers-vidéo dans une configuration unifiée.

Performance par rapport aux autres modèles d’IA vidéo

Dans les tests de benchmark, Wan 2.2 offre une précision nettement améliorée en matière de mouvement, de structure et d’alignement avec le prompt. Il dépasse régulièrement les modèles commerciaux leaders sur les principales métriques d’évaluation, offrant ainsi des résultats plus réalistes et cohérents.

Bientôt disponible : Intégration du générateur vidéo AI de Wan

Vous pouvez dès maintenant essayer gratuitement notre générateur de vidéos IA en ligne sur Vidful.ai — pas besoin de s'inscrire. Une intégration complète avec le générateur vidéo AI Wan 2.2 arrive bientôt, vous donnant accès aux modèles avancés de Wan AI pour créer des vidéos cinématographiques de haute qualité, rapides et efficaces.

Questions fréquentes sur Wan 2.2

Qu’est-ce que Wan 2.2 ?

Wan 2.2 est un modèle open-source de génération vidéo, doté de capacités améliorées telles qu'une architecture Mixture-of-Experts et un style cinématographique.

Est-ce que Wan 2.2 est vraiment open-source ?

Oui, Wan 2.2 est open-source, incluant le modèle TI2V-5B ainsi que les composants nécessaires à la génération de vidéos à partir de textes ou d’images.

Quel matériel est nécessaire pour faire tourner Wan 2.2 ?

Wan 2.2 est optimisé pour fonctionner sur des cartes graphiques consommateurs comme l’NVIDIA RTX 4090, permettant une génération de vidéos de haute qualité en 720P@24fps.

Quelle est la différence entre ces trois types de génération dans Wan 2.2 ?

T2V génère des vidéos à partir de textes, I2V à partir d’images statiques, et TI2V permet une entrée hybride pour plus de flexibilité.

Puis-je utiliser Wan 2.2 pour des projets professionnels ?

Oui. La licence open-source autorise son utilisation à la fois en recherche et en industrie. Veuillez toujours consulter le fichier de licence pour connaître les permissions spécifiques.

Comment Wan 2.2 se compare-t-il aux modèles commerciaux existants ?

Wan 2.2 dépasse les modèles commerciaux leaders dans les benchmarks clés comme Wan-Bench 2.0, offrant une qualité professionnelle avec une transparence totale.

Quelles résolutions sont prises en charge par Wan 2.2 ?

Actuellement, Wan 2.2 permet de générer des vidéos en 480P et 720P, avec des mises à jour prévues vers des résolutions plus élevées à l’avenir.