Neueste Version

Wan 2.5 - Native Multimodale Video-KI

Erstes natives audio-visuelles Synchronisations-Videomodell. Perfekter Lip-Sync, Foto-Sing-und-Tanz-Funktion.

Wan 2.5 nutzt native multimodale Architektur zur Verarbeitung von Text, Bild, Video und Audio in einem einheitlichen Framework. Revolutionäre audiogesteuerte Generierung für perfekten Lip-Sync, ein Foto reicht für Sing-und-Tanz-Videos.

14B

Parameter

88%+

VBench

10s

Max. Dauer

1080p

Max. Auflösung

Jetzt testen Auf GitHub ansehen

Video-Vorschau

Kernfunktionen

Native multimodale Architektur

Audio-visuelle Synchronisationstechnologie

Perfekter Lip-Sync

Foto singen und tanzen

10-Sekunden-Videogenerierung

1080p/24fps HD

Multi-Personen-Dialogszenen

Audiogesteuerte Lippenbewegung

Technische Spezifikationen

Veröffentlichungsdatum	2025-10
Parameter	14B
VBench-Score	88%+
Max. Dauer	10s
Max. Auflösung	1080p/24fps
VRAM-Anforderung	24GB+
Lizenz	Apache 2.0

Andere Versionen

Wan 2.1

5s / 1080p

Wan 2.2

5s / 1080p

Wan 2.6

15s / 1080p

Wan 2.7

2-15s / 1080p

Wan AI

60s+ / 4K+

Zeitlich begrenzt

Bereit, erstaunliche Videos zu erstellen?

Schließen Sie sich Tausenden von Kreativen an, die Wan AI nutzen. Kostenlos, Open-Source und läuft auf Ihrer Hardware.

$1 Gratis-Guthaben

25% Cashback

50 Gratis-Generierungen

Jetzt Bonus sichern

Keine Kreditkarte erforderlich

10M+

Videos

500K+

Users

99.9%

Uptime

24/7

Support