当前浏览中
频道AI 大模型
浏览量199
▸ AI 大模型 · 应用工具

万相2.6 应用工具

阿里通义万相最新发布的视频生成 AI 模型,支持文本/图像/参考视频多模态生成、多镜头叙事、角色扮演和原生音画同步,为 AI 工具使用者实现专业级短片创作与影视级内容自动化提供强大支持。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · zh
收录 2025年12月17日更新 2025年12月17日浏览 199

// 01 万相2.6 是什么

万相2.6 界面截图
万相2.6 · 界面预览

万相2.6 是什么

万相2.6阿里云通义万相 在 2025 年 12 月发布的新一代 AI 视频生成模型,相比此前版本(如万相2.5)全面提升了 画质、音效、指令遵循、多镜头叙事与专业级功能。它是国内首个具备 角色扮演功能 的视频生成模型,同时支持 多模态输入(文本、图像、参考视频)驱动视频内容生成,生成的视频最长可达 15 秒,并具备电影级的叙事结构输出能力。 新浪财经+1

万相2.6 已在 通义万相官网 以及阿里云百炼平台等通道上线,面向开发者、创作者和企业用户提供视频生成 API 服务。 新浪财经


核心能力与亮点解析

多模态输入与多任务生成

万相2.6 支持从不同输入模态生成视频,包括:

  • 文本生成视频(Text-to-Video):用户输入文字描述,AI 自动生成与语义一致的动态视频片段。 wavespeed.ai

  • 图像生成视频(Image-to-Video):以单张图像作为视觉基础,并结合提示词生成动态动作效果视频。 wavespeed.ai

  • 参考视频驱动(Reference-to-Video):上传一段参考视频后,模型提取主体形象、动作与音色,并根据指定提示或剧本语义创造新场景视频。 阿里云帮助中心

这种 多模态生成能力使万相2.6 能覆盖从广告片、短剧到创意展示等多种短视频创作需求。 Wan Video


多镜头叙事与电影级结构

不同于早期 AI 视频模型只能生成单镜头画面,万相2.6 提供 智能分镜叙事(Smart Multi-Shot Narrative) 功能,能根据用户提示词将一个故事拆分成多个镜头段落,并保持逻辑连贯和画面流畅过渡。 Wan Video

例如提示:

生成一段侦探在雨中疾跑的场景,包含特写、全景和跟随镜头

模型会自动生成多个镜头段落,实现 “导演式剪辑” 效果,这对于专业广告制作和剧情视频非常重要。 Wan Video


原生音画同步与精准唇动匹配

万相2.6 的另一个核心能力是 原生音画同步(Native AV Sync):模型能根据输入的音频或自动生成的声音驱动视频场景,同时让人物角色的口型与声音自然匹配。 Wan Video

这对于带对白、音乐或配音的视频尤为关键,使视频不仅看起来逼真,而且听觉与视觉一致。 Wan Video


专业角色扮演功能

万相2.6 是国内首个支持 角色扮演(Video Roleplay) 的 AI 视频模型,这意味着用户可以:

  • 上传某个人物的参考视频,

  • 模型自动提取该人物的形象、动作风格和声音特征,

  • 并将该“角色”重新放入新的生成视频场景中。 新浪财经

角色扮演功能特别适合 AI 演员、数字人 콘텐츠创作、互动故事片和定制化人物形象展示。 新浪财经


技术架构与创新点

专业叙事生成引擎

万相2.6 的内部架构结合了“电影级叙事生成引擎”,能够从自然语言提示中提取叙事结构,再将其映射到视频时间线。这样的能力降低了用户对分镜规划与脚本设计的专业要求。 Wan Video

多模态联合学习

模型训练通过联合使用文本、图像和视频数据,让 AI 同时理解视觉、语义和时间维度的信息,从而在生成过程中兼顾视觉一致性和故事连贯性。 Wan Video

音频特征建模与驱动控制

万相2.6 能识别音色、语速等声学特征,在生成阶段以这些信息作为生成条件,使视频中角色的语音动作自然流畅,与视觉内容完全匹配。 新浪财经


典型使用场景与案例

短片创作与广告制作

在广告制作或短片剧情创作中,万相2.6 可根据提示词自动生成包括多个镜头、角色对白、场景切换和背景音乐的视频。这大幅降低了剧本制作、拍摄与后期编辑的时间成本Wan Video

例如:

/generate subject:perfume brand storytelling shots:multi lighting:studio motion:slow-zoom

可以输出一段品牌故事片,包含多镜头切换及音画效果。 Wan Video


虚拟角色和数字人展演

角色扮演允许用户将真实人物或虚拟角色置入新的故事线。例如上传某个角色视频,再输入提示词“科幻探险故事”,模型将自动生成该角色在科幻场景中的完整片段,实现数字人情境化创作。 新浪财经


社交媒体与内容营销

万相2.6 的高质量输出和 15 秒叙事能力非常契合社交平台内容格式(如抖音、快手、Instagram Reels 等)。创作者只需简单提示即可生成足够吸引观众注意力的短片。 Wan Video


如何调用与集成万相2.6

通过阿里云百炼 API

开发者可以通过阿里云 通义万相视频生成 API 调用万相2.6 实现视频生成任务:

  1. 在阿里云控制台获取 API Key

  2. 使用 REST 接口创建视频生成任务;

  3. 通过任务 ID 轮询获取生成结果。 阿里云帮助中心

官方 API 支持异步调用,适合长时间生成任务(通常几分钟内完成)。 阿里云帮助中心

优化参数配置

通过 API,可指定输出分辨率(如 720p 或 1080p),视频时长(最长 15s),并可通过 negative prompt 控制不希望出现的视觉效果。 wavespeed.ai


提示词设计与最佳实践

为了获得理想输出结果,建议在提示词设计中明确:

  • 场景与动作细节(例如“探险、追逐、特写镜头”)

  • 镜头类型(如“全景、特写、跟随镜头”)

  • 角色设定与动作

  • 音频要求(如配乐类型或对白风格)

清晰、结构化的提示词通常会生成更符合预期的视频输出。 Wan Video


万相2.6 与竞争产品对比

与 OpenAI 的 Sora 2 等国际视频生成模型相比:

  • 万相2.6 特别强调 角色扮演与多镜头叙事

  • 支持 原生音画同步

  • 生成时长可达 15 秒

  • 在国内通义万相平台和阿里云有成熟的商业API支持。 Wan Video


// 02 核心 功能

  • 核心定位阿里通义万相最新发布的视频生成 AI 模型,支持文本/图像/参考视频多模态生成、多镜头叙事、角色扮演和原生音画同步,为 AI 工具使用者实现专业级短片创作与影视级内容自动化提供强大支持。
  • 分类索引当前归档在 AI 大模型 / 对话,方便和同频工具横向比较。
  • 能力标签关联标签包括 tech-cv、AI数字人、AI视频生成模型、AI虚拟角色、文本生成视频、图像生成视频。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

  • 快速判断是否适合当前任务结合 AI 大模型 / 对话 定位和 tech-cv、AI数字人、AI视频生成模型 标签,先判断它是否匹配你的工作流。
  • 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
  • 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。

// 04 常见 问题

万相2.6 是什么?
阿里通义万相最新发布的视频生成 AI 模型,支持文本/图像/参考视频多模态生成、多镜头叙事、角色扮演和原生音画同步,为 AI 工具使用者实现专业级短片创作与影视级内容自动化提供强大支持。
万相2.6 适合哪些场景?
可优先参考它所属的 AI 大模型 / 对话 分类,以及 tech-cv、AI数字人、AI视频生成模型、AI虚拟角色、文本生成视频 等标签。
万相2.6 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
万相2.6 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

同频段 更多信号

查看 AI 大模型 全部