// 01 融光 是什么
面向短剧和漫剧创作者的开源视频工作流
融光来自 GitHub 用户 Stonewuu 维护的开源项目 ai-fusion-video,仓库介绍将其定位为“基于 Agent 的全流程 AI 视频创作平台”。它不是一个单点文生视频模型,也不是只生成几秒素材的在线工具,而是围绕“剧本到分镜、分镜到图片、图片到视频片段”的完整流程做产品化封装。公开仓库显示项目采用 MIT License,适合内容创作者、短剧团队、漫剧创作者、AI 视频工作室以及希望私有化部署视频生产流程的开发者。
从项目形态看,融光更像一个可部署的 AI 视频生产后台,而不是消费级网页应用。它把视频创作中最容易断裂的几个环节串起来:先写剧本,再让 AI 拆解分镜,再生成分镜参考图,最后基于画面描述和参考图生成视频片段。对于需要持续产出短视频、剧情号、小说漫改或广告创意样片的团队来说,这种分镜驱动的流程比单次输入一句提示词更可控。
它解决的问题
AI 视频生成最大的痛点通常不是“生成一个镜头”,而是多个镜头之间的叙事连续性、画面一致性和素材管理。很多创作者会在剧本工具、绘图工具、视频生成平台、剪辑软件之间来回切换,提示词、参考图和生成结果散落在不同地方。融光的价值在于把这些步骤放进一个项目工作流里,让创作者围绕剧本和分镜推进,而不是只围绕单个素材试错。
它尤其适合有一定技术能力、愿意自部署的团队。如果只是偶尔生成一段视频,直接使用可灵、Runway、Pika、即梦等在线平台会更省事;如果想搭建自己的 AI 视频创作后台,融光的开源和可定制性更有意义。
核心能力
- 支持项目管理、剧本管理、分集和分场景结构化编辑,适合长内容拆分。
- 可将剧本自动拆解为分镜,生成画面描述、镜头语言等分镜信息。
- 集成 AI 绘图能力,支持多引擎文生图和图生图,用于生成分镜参考图。
- 支持基于分镜描述和参考图生成视频片段,形成从文字到动态画面的链路。
- 提供素材管理能力,可统一管理项目中的图片、视频等资源。
- 支持 OpenAI、Claude、Gemini、通义千问、DeepSeek、Ollama 等多模型接入。
- 支持本地、阿里云 OSS、腾讯 COS、MinIO 等存储后端。
- 技术栈为 Java 21、Spring Boot 3.5、Spring AI、Next.js 16、React 19 和 TypeScript。
如何使用
融光目前主要通过 GitHub 仓库部署使用,不是直接注册即用的 SaaS。项目推荐 Docker 一键部署,用户只需安装 Docker,克隆仓库后可通过 docker compose 启动;如果要源码开发,则需要准备 JDK 21、Node.js 20、pnpm 9 以及相关中间件环境。
- 从 GitHub 克隆 Stonewuu/ai-fusion-video 仓库。
- 复制并按需修改 .env 环境变量。
- 使用 docker compose up -d 启动服务。
- 通过本地端口访问 Web 界面,完成系统初始化。
- 在系统设置中配置所需的大模型、绘图、视频生成和存储服务密钥。
- 创建项目,编写剧本,生成分镜,再逐步生成图片和视频片段。
典型使用场景
在短剧创作中,编剧可以先写分集剧情,再由系统拆解为分场景分镜。创作者随后针对每个分镜生成参考图和视频片段,用于快速验证故事节奏和画面风格。
在小说漫剧或解说号场景中,团队可以把文字内容改写成分镜脚本,再批量生成画面素材和片段,减少手动整理提示词和素材文件的时间。
在广告创意阶段,策划可以快速生成多个产品短片方案的分镜和样片,用于内部评审或客户提案,而不是一开始就投入完整拍摄和后期成本。
与同类工具的差异
融光与 Runway、Pika、可灵这类视频生成平台的差异在于,它不主打单个模型效果,而是主打流程整合和私有化部署。闭源视频平台通常生成质量更成熟、使用门槛更低,但工作流和数据控制权有限;融光则更适合需要自定义模型供应商、存储方案和业务流程的团队。
它也不同于普通剪辑软件。剪辑软件解决的是后期编辑问题,融光更关注前期剧本、分镜和 AI 素材生成,是视频生产链路的上游工具。
价格与真实局限
融光本身是 MIT License 开源项目,公开仓库没有商业订阅价格。实际成本主要来自服务器、对象存储、数据库、Redis,以及 OpenAI、Claude、Gemini、通义千问、DeepSeek、视频生成模型等第三方 API 调用费用。免费并不代表零成本,尤其是批量生成图片和视频时,模型费用会成为主要支出。
它的优势是开源、可私有化、流程完整、多模型兼容,适合搭建自有 AI 视频工作流。局限也很清楚:部署和配置门槛高于在线工具,生成质量依赖外部模型,团队协作和全局智能 Agent 仍在 TODO 中。对于非技术创作者,它可能偏重;对于想掌控流程和数据的视频团队,它更值得研究和二次开发。
