CURRENTVIEWING
CH最近收录AI
VIEWS47
▸ 最近收录AI · SITES

Mamoda2.5 SITES

字节跳动团队推出的统一多模态生成与编辑模型,主要用于文本生成视频、图像编辑、视频编辑与多模态内容生成。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2026年5月25日更新 2026年5月25日浏览 47

// 01 Mamoda2.5 是什么

Mamoda2.5 是什么?

Mamoda2.5 是字节跳动团队推出的统一多模态生成与编辑模型,主要用于文本生成视频、图像编辑、视频编辑与多模态内容生成。该项目采用 AR-Diffusion 架构,并结合 Qwen3-VL-8B 与 MoE Diffusion Transformer(DiT)模型,实现图像理解、视频生成与编辑任务的统一处理。

Mamoda2.5 的核心功能

  • 文本生成视频(Text-to-Video)
  • 图像编辑
  • 视频编辑
  • 文本生成图像
  • 统一多模态生成框架
  • MoE Diffusion Transformer 架构
  • 支持风格迁移
  • 视频对象替换与删除
  • 角色与场景编辑
  • 支持 AR-Diffusion Workflow
  • 支持高分辨率视频生成
  • 开源模型与推理框架

Mamoda2.5 的定位是什么?

Mamoda2.5 的核心定位是 Unified Multimodal Generation Model(统一多模态生成模型)。

相比分别使用多个独立模型完成:

  • 图像生成
  • 视频生成
  • 图像编辑
  • 视频编辑

Mamoda2.5 更强调统一架构下的多任务处理能力。

项目采用:

  • Qwen3-VL-8B 多模态理解模型
  • MoE DiT 视频生成架构
  • AR-Diffusion Workflow

用于统一处理生成与编辑任务。

Mamoda2.5 的模型结构

公开资料显示,Mamoda2.5 采用细粒度 MoE(Mixture-of-Experts)DiT 架构。

模型包含:

  • 128 个 Routed Experts
  • Top-8 Routing
  • 25B 总参数规模
  • 约 3B 激活参数

该结构用于提升生成效率与推理速度。

项目页面显示,Mamoda2.5 可在单设备上完成:

  • 720p
  • 93 帧视频

的视频生成任务。

Mamoda2.5 的使用场景

1. 视频生成

Mamoda2.5 支持:

  • 文本生成视频
  • 电影风格视频
  • 动态镜头生成
  • 角色动画
  • 复杂场景生成

适合 AI 视频创作场景。

2. 视频编辑

项目支持:

  • 对象替换
  • 人物修改
  • 场景编辑
  • 天气修改
  • 风格迁移
  • 对象删除
  • 角色添加

等视频编辑任务。

3. 风格迁移

Mamoda2.5 支持:

  • 水墨风格
  • 吉卜力风格
  • 像素风格
  • 浮世绘风格
  • 印象派风格

等多种视觉风格转换。

4. 图像编辑

模型支持对图像进行:

  • 替换
  • 删除
  • 添加元素
  • 材质修改
  • 背景修改

适合 AI 图像编辑 Workflow。

5. 多模态生成研究

Mamoda2.5 同时面向:

  • 统一生成模型研究
  • Diffusion 架构实验
  • MoE 推理优化
  • 视频生成 Benchmark

等研究方向。

Mamoda2.5 的技术特点

公开资料显示,Mamoda2.5 重点优化了:

  • 统一多模态架构
  • 视频编辑速度
  • MoE 推理效率
  • 视频生成质量
  • 长序列生成能力

项目页面提到:

  • OpenVE-Bench
  • FiVE-Bench
  • Reco-Bench

等视频编辑 Benchmark 测试结果。

Mamoda2.5 是否开源?

是。Mamoda2.5 已公开:

  • 项目主页
  • 技术报告
  • GitHub 项目
  • 模型结构说明

公开页面显示,该项目由 Mamoda Team 与 ByteDance 团队发布。

Mamoda2.5 的技术方向

Mamoda2.5 涉及以下 AI 与视频方向:

  • Multimodal Generation
  • Text-to-Video
  • Video Editing
  • Diffusion Model
  • MoE DiT
  • Unified Generation Model
  • AR-Diffusion
  • AI Video Generation

该方向目前属于统一多模态生成模型的重要发展路线之一。

Mamoda2.5 的限制

  • 更偏研究与开发方向
  • 高质量视频生成需要较高算力
  • 长视频生成耗时较长
  • 复杂编辑任务仍可能出现不稳定结果
  • 视频一致性仍有优化空间
  • 本地部署门槛较高

目前来看,Mamoda2.5 更适合 AI 视频生成、视频编辑与多模态研究场景。

// 04 常见 问题

Mamoda2.5 是什么?
字节跳动团队推出的统一多模态生成与编辑模型,主要用于文本生成视频、图像编辑、视频编辑与多模态内容生成。
Mamoda2.5 适合哪些场景?
可优先参考它所属的 最近收录AI、AI 大模型 / 对话、AI 视频 分类,以及 相关能力 等标签。
Mamoda2.5 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
Mamoda2.5 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

搭档工具 // workflow0 条
◇ ◇ ◇
"关系待挖掘"
暂无搭档工具数据
▸ 我来推荐

同频段 更多信号

查看 最近收录AI 全部