Wan 2.7 Image+Video 全面上线
Qwen由阿里巴巴通义驱动

AI视频与图像创作平台
Wan AI

Wan 2.7全面上线。图像模型:千人千面捏脸、调色盘配色、3K token渲染,盲测国内第一。视频模型:原生音频、首尾帧控制、九宫格图生视频、指令编辑,1080p/15秒。Wan 2.1开源无审查。

15M+
已生成视频
800K+
活跃用户
4.9
用户评分
新品发布 — 2026年4月

Wan 2.7-Image
图像生成与编辑统一模型

Wan 2.7-Image针对AI生图中的审美疲劳、色彩失控等痛点,带来更具「活人感」的人物生成、精准色彩控制和超长文本渲染。人类偏好盲测评分国内第一。

千人千面

告别AI标准脸。支持骨相、眼眸(丹凤眼、杏仁眼、深邃眼窝)、脸型(鹅蛋脸、圆脸、方脸、长方脸)全方位定制,塑造极具辨识度、富有生命力的面孔。

脸型定制眼眸特征骨相调节

调色盘配色

一键提取参考图的色彩分布比例。无论是复刻名画色系,还是对齐品牌手册的严格配色,都能在保持构图的同时实现色彩精准迁移。

色彩提取品牌配色精准迁移

3K Token超长渲染

支持最高3000 token长文字输入,覆盖中英等12种语言。复杂表格、数学公式、整页A4论文内容都能达到印刷级清晰度。

12种语言3000 Token印刷级

交互式编辑

哪里不满意点哪里。通过框选指令在指定区域实现元素的添加、对齐或移动,像素级精准对齐创作意图。

点击编辑像素级精准添加/移动/对齐

多主体一致性

最高支持9张参考图,生成分镜脚本、电商套图、电影海报、多视角建筑图时,有效保持角色与风格统一,降低创作中的随机性。

9张参考图风格统一角色一致

组图生成(12张)

一次最多生成12张图片,批量制作同风格系列图、PPT配图、分镜脚本、电商模特套图及多视角建筑图。

最多12张系列创作多视角

生成与理解统一架构

Wan 2.7-Image采用领先的生成与理解统一架构,通过共享隐性空间内实现语义映射,从单纯像素拟合飞跃到底层语义认知。基于更大规模数据训练的Wan2.7-Image-pro也同步上线。

核心能力

覆盖视频生成、图像创作、编辑的全链路AI工具

文生视频

通过先进的AI理解能力,将您的文字描述转化为高质量视频。支持中文、英文、日语等多种语言。

图生视频

为静态图片注入动态效果。Wan 2.7支持九宫格多图生视频,提供更丰富的场景构图和叙事控制。

运动控制

精确的镜头运动和物体轨迹控制,打造专业级效果。支持平移、缩放、旋转等电影级运镜。

高清画质

视频最高1080P/24fps,图像达到印刷级清晰度。Wan 2.7在VBench评测得分90%+,人类偏好盲测国内第一。

多语言支持

原生支持中文、英文、日语、韩语、德语等多种语言的提示词,语义理解精准。

开源技术

Wan 2.1基于Apache 2.0协议完全开源。支持消费级显卡(8GB+显存)本地运行,或使用云端API访问新版本。

AI图像生成

Wan 2.7-Image图像生成与编辑统一模型。支持千人千面捏脸、调色盘配色、3K token文本渲染,一次最多生成12张组图。

无审查 / NSFW

Wan 2.1本地运行零内容过滤。你的GPU、你的规则——没有任何审查限制。GitHub和Hugging Face上有大量社区NSFW微调版本可用。

先进技术

业界领先的技术架构

基于前沿的Diffusion Transformer技术,结合MoE(混合专家)架构和原生多模态能力,在VBench国际评测中取得顶尖成绩。

Diffusion Transformer (DiT)

先进的基于Transformer的扩散模型,实现卓越的时序连贯性和复杂运动理解,生成逼真的视频内容。

Transformer扩散模型SOTA

因果3D VAE (Wan-VAE)

高效的时空压缩技术,4×8×8压缩比例,支持任意长度1080P视频编码,同时保持精确的时序信息。

4×8×8压缩1080P支持时序连贯

混合专家架构 (MoE)

总参数27B,激活参数14B,在同等参数规模下节省约50%计算资源,提升复杂场景和多角色交互的生成质量。

27B参数50%效率提升多专家协同

原生多模态

统一架构处理文本、图像、视频、音频。原生支持唇形同步,嘴型与语音精准匹配。

唇形同步音画一体统一模型

模型规格对比

指标Wan2.1Wan2.2Wan2.6Wan2.7
最高分辨率720P720P1080P1080P+
最长时长5s5s15s2-15s
帧率24fps24fps24fps24fps
参数量14B27B27B+27B+
VBench得分86.22%87.5%89%+90%+
图像生成--基础统一生成+编辑

Wan系列演进历程

从Wan 2.1到最新发布的Wan 2.7。Image模型(4月)和Video模型(3月底)均已上线云平台,开源版预计Q2 2026。

2025.02

Wan 2.1

  • 14B参数旗舰模型
  • VBench得分86.22%(全球第一)
  • 中英文字特效生成
  • 消费级显卡支持(6GB+)
2025.07

Wan 2.2

  • MoE架构(总参数27B)
  • 60+电影美学参数
  • 角色替换技术
  • 节省50%计算资源
2025.10

Wan 2.5

  • 原生多模态架构
  • 音画同步技术
  • 10秒视频生成
  • 照片唱跳功能
2025.12

Wan 2.6

  • 15秒视频(国内最长)
  • 多镜头叙事系统
  • 角色扮演与声音克隆
  • 完整唇形同步
最新版
2026.04

Wan 2.7

  • Image: 图像生成编辑统一模型,盲测第一
  • Video: 1080p/15秒/原生音频内置
  • 首尾帧控制 + 九宫格图生视频 + 指令编辑
  • 开源版预计Q2 2026发布
在线就绪

AI视频创作台

几秒钟内开始创建您的AI视频

模型:
5s
Wan 2.65s电影风格
1080p16:924fps
Preview
NSFW模式(18+内容)
预计生成时间~15s
消耗积分
10 积分限时免费

快捷提示词:

无限创意可能

从个人创作到专业制作,Wan AI赋能各行业创作者释放创意潜能。

短视频创作

为抖音、快手、B站创作引人入胜的短视频内容。通过简单的文字提示词生成创意视频。

生活vlog
美食教程
旅行分享
搞笑短剧

广告营销

以传统成本的一小部分制作专业的产品演示、品牌广告和营销素材。

产品展示
品牌故事
社媒广告
电商视频

影视动画

为影视前期制作和独立项目生成概念视频、分镜预览和动画序列。

概念可视化
分镜动画
特效预览
独立电影

教育培训

创建物理模拟、流程演示、互动学习材料等教育内容,让知识更生动。

科学模拟
历史重现
语言学习
教程视频

数字人与虚拟形象

生成逼真的数字人用于新闻播报、虚拟助手和互动娱乐。

虚拟主播
AI助手
虚拟偶像
客服机器人

游戏娱乐

为游戏行业创作游戏预告片、过场动画、角色动画和宣传内容。

游戏预告片
角色揭晓
过场动画预览
电竞集锦

Wan 2.7 vs 竞品全面对比

基于2026年4月数据,Wan 2.7与SeedDance 2.0、Sora 2、可灵3.0、Veo 3.1、Runway Gen-4.5对比。Wan 2.7-Image人类偏好评分国内第一。

对比指标Wan 2.7
推荐
SeedDance 2.0Sora 2Kling 3.0Veo 3.1Gen-4.5
最长时长2-15s15s25s10s10s10s
分辨率1080p1080p1080p4K/60fps1080p1080p
开源
(wan 2.1开源)
真人图像输入
视频参考数量5111
免费使用
指令编辑视频
唇形同步★★★★★★★★★☆★★★★☆★★★★☆★★★★☆★★★☆☆
风格一致性★★★★★★★★★☆★★★★☆★★★★☆★★★★☆★★★☆☆
成本Free$$$$$$$$$$$

常见问题解答

关于Wan AI视频生成器,您需要了解的一切。

Wan AI是阿里巴巴开发的最先进的AI视频生成模型系列。Wan 2.1完全开源(Apache 2.0协议),可在消费级显卡上本地运行。该系列提供15秒生成、多镜头叙事、原生唇形同步等独特功能。
Wan 2.1完全免费且开源。您可以从GitHub或Hugging Face下载模型权重并在本地运行。对于Wan 2.6等新版本,我们提供云端API服务。
对于轻量化1.3B模型,仅需6-8GB显存(RTX 3060或更好)。对于完整14B模型,建议24GB+显存(RTX 4090、A100)。模型支持INT8量化以降低显存需求。
Wan 2.7包含Image和Video两个模型,均已上线。 Wan 2.7-Image(4月1日上线):图像生成与编辑统一模型,六大核心功能——①千人千面捏脸(骨相/眼眸/脸型全定制);②调色盘精准配色;③3K token超长文本渲染(12种语言);④交互式编辑;⑤多主体一致性(最高9张参考图);⑥组图生成(最多12张)。人类偏好盲测国内第一,Wan2.7-Image-pro同步上线。 Wan 2.7-Video(3月底上线云平台):1080p、15秒、原生音频内置。5大升级——商业级画质、运动连贯性、原生音频集成、风格一致性、时序稳定性。新功能——首尾帧控制、九宫格图生视频、主体+声音克隆、指令编辑、视频复刻。积分永不过期(竞品均月度重置)。开源版预计Q2 2026发布。
Wan 2.7相比即梦有多项优势:①支持真人图像输入(即梦不支持);②最多5段视频参考(即梦仅1段);③2-15秒动态时长更灵活;④1080P视频生成;⑤Wan 2.1开源,可本地运行无限制。
Wan 2.6支持单次生成最长15秒的视频。Wan 2.7支持2-15秒的动态时长选择。如需更长视频,可以使用多镜头叙事功能创建连贯的序列,保持角色和场景的一致性。
支持!Wan 2.5及以后版本采用原生多模态架构,具有完整的音画同步能力。角色可以唱歌、说话,嘴型动作与音频输入完美匹配。
Sora在物理模拟和更长序列(25秒)方面表现出色,而Wan在多镜头叙事、唇形同步、中文支持方面具有优势。Wan 2.1是免费开源的,可在消费级显卡上运行,而Sora需要昂贵的云端基础设施。
当然可以!Wan采用Apache 2.0协议发布,允许无限制的商业使用。您可以将其用于广告、影视制作、内容创作及任何其他商业用途。
Wan对中文(母语级)、英语、日语、韩语、德语有出色的支持。模型可以理解这些语言的复杂提示词并相应地生成准确的视频。
Wan 2.1开源无审查,这是它最大的优势之一。在本地硬件上运行时没有任何内容过滤或限制,你可以完全控制生成内容。GitHub和Hugging Face上有大量社区微调版本,专门针对NSFW场景优化。相比Sora、可灵、即梦等竞品都有严格审查,Wan 2.1是目前唯一可以无限制使用的主流视频生成模型。
九宫格图生视频是Wan 2.7的创新功能。您可以提供九宫格布局(3×3网格)的多张图片,Wan 2.7会将这些图片智能地生成连贯的视频。这对于多场景构图、分镜设计和精确的叙事控制非常有用,是目前AI视频生成器中独一无二的功能。
Wan 2.7支持通过自然语言指令来编辑和复刻视频。您可以对已有视频下达编辑指令(如'把天空改成日落效果'、'让人物动作更流畅'),模型会按照指令修改视频。还可以复刻一个视频的风格和运动方式到新的素材上,实现风格迁移。
Wan 2.7相比SeedDance 2.0的优势:支持真人图像输入、最多5段视频参考(vs 1段)、2-15秒灵活时长。相比Sora:Wan免费开源,支持九宫格图生视频和指令编辑。相比可灵:Wan 2.1可本地运行无限制,多段视频参考更强大。不同需求适合不同工具。
限时活动

准备创作精彩视频了吗?

加入数千名使用Wan AI将创意变为现实的创作者。免费使用,Wan 2.1开源。

$1 免费赠金

25% 充值返利

50次免费生成

立即领取福利

无需信用卡

10M+

Videos

500K+

Users

99.9%

Uptime

24/7

Support