videoEffect.duration
videoEffect.resolution
videoEffect.ratio
Wan 2.2: Cómo usarlo en línea y ejecutarlo localmente
La potencia de Wan 2.2 combina código abierto con precisión cinematográfica.
¿Qué es Wan 2.2?
¿Qué diferencia a Wan 2.2 de Wan 2.1?
Wan 2.2 es un modelo de generación de videos con IA de última generación desarrollado por Wan AI, un equipo de investigación afiliado a Alibaba. Diseñado para generar videos a partir de texto e imágenes, produce videos de alta calidad, con estética cinematográfica, mayor velocidad y movimientos más realistas. En comparación con Wan 2.1, esta versión presenta una avanzada arquitectura Mixture of Experts (MoE), que permite una generación más fluida, mejor alineación con las indicaciones y mayor control visual.
Generador de Video de Código Abierto Wan 2.2
Alibaba Wan 2.2 es completamente de código abierto bajo la licencia Apache 2.0, lo que permite su libre uso, descarga y modificación. Los desarrolladores pueden descargar, usar y modificar libremente el generador de video de IA Wan 2.2 para proyectos de investigación y comerciales. Este enfoque abierto brinda a los creadores e ingenieros total flexibilidad para construir flujos de trabajo personalizados para videos con Wan e integrar el modelo en sus propias herramientas.
Explora ejemplos de Wan 2.2
Ejemplo de Fuente de Luz
Ejemplo de Emoción del Personaje
Ejemplo de Estilización
Ejemplo de Control de Movimiento
Modelos de Video Wan 2.2 con IA
Wan2.2-T2V-A14B: Modelo de Texto a Video
Este modelo convierte las indicaciones de texto en videos de 5 segundos a 480P y 720P. Con una gran comprensión de las indicaciones y control del movimiento, ofrece resultados más precisos y expresivos que las versiones anteriores de Wan o de otras herramientas de IA competidoras.
Reedición de traducciónWan2.2-I2V-A14B: Modelo de Imagen a Video
Diseñado para convertir imágenes estáticas en videos dinámicos, este modelo admite salida en 480P y 720P. Reduce la inestabilidad de la cámara y es compatible con diversos estilos, lo que lo hace ideal para aplicaciones artísticas y orientadas al diseño de historias visuales.
Wan2.2-TI2V-5B: Generador de Video Híbrido
El modelo TI2V-5B admite tanto la generación de video a partir de texto como de imagen en un único flujo de trabajo. Utiliza un VAE de alta compresión para generar videos rápidamente a 720P a 24fps y funciona eficientemente en una GPU de consumo como una RTX 4090, lo que lo hace ideal para investigaciones o producción.
Características Clave de Wan 2.2
Arquitectura Mixture-of-Experts (MoE)
Wan 2.2 integra una avanzada arquitectura Mixture-of-Experts (MoE) que mejora la capacidad del modelo sin aumentar el costo computacional. Esto permite una generación de video más rápida y de mayor calidad a lo largo del tiempo, estableciendo a Wan 2.2 como un referente técnico en los modelos de difusión de código abierto.
Datos de Entrenamiento a Gran Escala
Wan 2.2 ha sido entrenado con un 65.6% más de imágenes y un 83.2% más de videos que su predecesor, Wan 2.1. Este aumento sustancial en los datos de entrenamiento asegura una mejor gestión del movimiento, coherencia semántica y consistencia estética en los videos generados.
Estética Cinemática Avanzada
Con conjuntos de datos curados etiquetados para iluminación, composición y corrección de color, Wan 2.2 sobresale en la creación de videos visualmente impresionantes con estilo cinematográfico, ofreciendo a los creadores un control preciso sobre sus preferencias artísticas.
Generación Híbrida de Alta Definición TI2V de Alta Eficiencia
El modelo Wan 2.2 TI2V-5B admite la generación de video a 720P y 24fps, aprovechando la avanzada compresión VAE (16×16×4). Diseñado para ser eficiente, funciona en GPUs de consumo como la RTX 4090, haciendo accesible la generación de videos de alta calidad a más usuarios.
Usa Wan 2.2 Plus en el Sitio Web Oficial
_blank
Prueba el generador de videos IA Wan 2.2 a través de Hugging Face Space
_blank
_blank
Cómo Configurar y Ejecutar Wan 2.2 Localmente
Step 1: Clone the Repository
Begin by cloning the official Wan 2.2 GitHub repository. It contains everything you need to run the model locally.
Unsupported media type: .2 desde la web?Paso 2: Instalar Dependencias
Verifica que tu entorno cumpla con los requisitos. Instala los paquetes de Python listados en el repositorio y asegúrate de que PyTorch sea versión 2.4.0 o superior para usar Wan 2.2 correctamente.
Paso 3: Descargar el Modelo
Elige el modelo adecuado para tu caso de uso: T2V-A14B para generación de video desde texto I2V-A14B para generación de video desde imagen TI2V-5B para entrada híbrida de texto+imagen, que permite 720p a 24fps Puedes descargar y aprender más sobre cada modelo en Hugging Face y ModelScope.
Paso 4: Generar Video
Después de configurar todo, puedes comenzar a generar videos usando un texto o una imagen. El modelo procesará tu entrada y creará un video de alta calidad en resolución 720p, todo directamente en tu máquina local, con control total sobre el estilo visual, el movimiento y el tiempo.
Accede al flujo de trabajo de Wan 2.2 con ComfyUI
Flujo de trabajo Wan 2.2 TI2V-5B para ComfyUI
Puedes probar un flujo de trabajo visual para generar videos usando Wan 2.2 TI2V-5B directamente dentro de ComfyUI. Esta configuración admite tanto la generación de video desde texto como de imagen. Para comenzar, consulta la guía de Wan 2.2 ComfyUI, que explica los pasos para cargar los modelos y ejecutar el flujo de trabajo sin problemas.
Requisitos del Sistema y Configuración
Ejecutar Wan 2.2 en ComfyUI requiere instalar manualmente archivos específicos del modelo: el modelo de difusión, VAE y el codificador de texto. Se recomienda una GPU con al menos 8GB de VRAM para un rendimiento óptimo.
Selecciona entre tres tipos de flujo de trabajo
ComfyUI actualmente ofrece tres flujos de trabajo de Wan 2.2: T2V para generación de video desde texto I2V para generación de video desde imagen TI2V para entrada híbrida Cada versión puede ajustarse a tus preferencias de entrada, resolución y duración de fotogramas, lo que la hace flexible para creadores, investigadores y desarrolladores.
¿Cómo funciona Wan 2.2?
1
Arquitectura MoE para una generación eficiente
Wan 2.2 adopta un diseño de Mezcla de Expertos (MoE) que optimiza la generación de alta calidad y la eficiencia computacional. Durante el proceso de reducción de ruido, cambia dinámicamente entre dos modelos expertos: uno especializado en las etapas de alto ruido y otro para el refinamiento en etapas de bajo ruido. Esta estructura en capas permite a Wan 2.2 generar resultados más detallados y estables, sin aumentar el uso de memoria frente a Wan 2.1.
2
TI2V-5B Ligero para Generación Ágil
Para quienes buscan un rendimiento más rápido en equipos personales, Wan 2.2 incluye el modelo TI2V-5B. Este modelo comprime las representaciones de video con un VAE de alta eficiencia, permitiendo generar videos en 720p a 24 fps en menos de 9 minutos con una sola GPU. Es compatible con tareas de texto a video e imagen a video en una configuración unificada.
3
Comparativa de rendimiento con otros modelos de video con IA
En pruebas comparativas, Wan 2.2 ofrece una mejora notable en precisión de movimiento, estructura y coherencia con los prompts. Supera constantemente a los modelos comerciales líderes, brindando resultados más realistas y coherentes.
Próximamente: integración con el generador de videos con IA de Wan
Ya puedes probar gratis nuestro generador de video con inteligencia artificial en Vidful.ai, sin necesidad de registrarte. Muy pronto estará disponible la integración completa con Wan 2.2, lo que te permitirá acceder a modelos avanzados de Wan AI para crear videos cinematográficos de alta calidad y con un rendimiento ágil.
Preguntas frecuentes sobre el generador de videos Wan 2.2
¿Qué es Wan 2.2?
Wan 2.2 es un modelo de generación de video de código abierto, con capacidades mejoradas como la arquitectura Mixture-of-Experts y una estética cinematográfica mejorada.
¿Wan 2.2 es realmente de código abierto?
Sí, Wan 2.2 es de código abierto, incluyendo el modelo TI2V-5B y los componentes de soporte para generación de video a partir de texto e imágenes.
¿Qué hardware necesito para usar Wan 2.2?
Wan 2.2 está optimizado para funcionar en GPUs de consumo como la NVIDIA RTX 4090, proporcionando generación de video de alta calidad a 720P@24fps.
¿Cuál es la diferencia entre T2V, I2V y TI2V en Wan 2.2?
T2V genera videos a partir de indicaciones de texto, I2V de imágenes estáticas, y TI2V admite entradas híbridas para mayor flexibilidad.
¿Puedo usar Wan 2.2 en proyectos comerciales?
Sí. La licencia de código abierto permite el uso académico e industrial. Siempre revisa el archivo de licencia para permisos específicos.
¿Cómo se compara Wan 2.2 con otros modelos comerciales?
Wan 2.2 supera a los modelos comerciales líderes en puntos de referencia clave como Wan-Bench 2.0, ofreciendo resultados de nivel industrial con total transparencia.
¿Qué resoluciones permite Wan 2.2?
Actualmente, Wan 2.2 permite la generación de video en 480P y 720P, con planes para escalabilidad futura en resoluciones.