PreenCut
T-02工具 实用 OPEN-SOURCEAPI

PreenCut

PreenCut 是一款开源 AI 视频检索与剪辑工具,支持语音识别(WhisperX)、LLM 分析、自然语言查询与批量处理,为 AI 工具使用者提供高效精准的视频片段检索和剪辑能力。

01

PreenCut 是什么

随着视频内容爆炸式增长,AI 工具使用者愈发需要一种轻松、高效的方式来检索和剪辑视频内容。PreenCut 正是为此而生的开源解决方案,它结合自动语音识别、LLM 分析和自然语言查询,助你从海量视频中快速提取高价值片段。


什么是 PreenCut?

PreenCut 是由 roothch 推出的开源 AI 驱动视频检索和剪辑工具,基于 MIT 许可发布在 GitHub 上。它内置 WhisperX,可精确识别音频内容,配合大型语言模型(如 DeepSeek、DouBao),支持用户通过自然语言提示快速找到视频片段并批量导出。


核心功能亮点

🎙 自动语音识别

调用 WhisperX 实现高准确率转录,支持英文和多种语言的音频识别,是检索流程的第一步

🧠 AI 分析与段落标注

利用 LLM 自动分析转录文本,生成摘要、标签和关键词,使内容结构化,易于检索

🔍 自然语言查询

支持如“找出所有产品演示片段”类型的自然语言提示,快速定位相关片段,无需手动设置时间戳

✂️ 智能剪辑导出

支持将多个检索结果导出为独立视频文件,或合并为一个剪辑,适用于会议回顾、内容剪辑和演示制作

📁 批量处理能力

批量定位并剪辑多段视频,适合整理大量素材或跨视频搜索同类片段。

🔁 重分析调试

可在结果上执行「Re-analyze」操作,调整提示词并重新分析,无需重新处理整个音频流程


安装与使用指南

git clone https://github.com/roothch/PreenCut.git cd PreenCut pip install -r requirements.txt # 安装 FFmpeg sudo apt install ffmpeg # 设置 LLM 服务 API Key export DEEPSEEK_V3_API_KEY=... export DOUBAO_1_5_PRO_API_KEY=... # 启动界面 python main.py

访问 http://localhost:7860,上传视频/音频并输入提示,即可生成检索结果表格并剪辑导出。


使用场景与适用人群

  • 🎥 内容创作者:快速截取长视频中精彩片段,用于短视频制作或内容汇编;

  • 🎓 教育工作者:为在线课程自动提炼关键讲解段落,便于复习分享;

  • 🧩 产品团队:批量找出“演示”或“问题说明”片段,用于用户培训;

  • 👁 研究人员 & 法律专家:快速定位访谈中的关键词讨论段;

  • 🧰 多文件处理:支持跨多个视频的关键词剪辑任务,提升效率。


常见问题(FAQ)

Q1:PreenCut 支持哪些文件格式?
支持 .mp4, .avi, .mov, .mkv, .ts, .mxf 视频格式和 .mp3, .wav, .flac 音频格式

Q2:可以无 API 使用吗?
LLM 分析依赖 DeepSeek 或 DouBao API,必须注册并设置对应环境变量;缺少 API 时仅能手动浏览文本内容

Q3:是否支持中文语音?
WhisperX 支持中文语音识别,但 LLM 模型需选择支持中文的版本并设置相应 API。

Q4:如何优化处理速度?
可通过配置 WhisperX 模型(如 tiny, base, large)调整识别精度与处理速度,还能增加 WHISPERX_BATCH_SIZE 调整性能

Q5:能处理超长视频吗?
可以,但建议先拆分成多段或批量上传,小片段处理更灵活高效;LLM 分析也支持分批结果合并处理


与竞品对比

功能 / 工具PreenCut手动剪辑(如 Premiere)商业智能剪辑平台
自动转录✅ WhisperX 高准确率❌ 需外部工具支持✅ 大多支持,但成本高
LLM 支持自然提示✅ 支持 DeepSeek 等分析模型❌ 不支持⚠️ 多为内嵌短提示功能
自然语言检索剪辑✅ 支持高级提示定位片段❌ 无需手动寻找✅ 支持,但价格昂贵
批量处理能力✅ 跨视频批处理⚠️ 手动导入片段✅ 专业但高成本
开源与免费✅ MIT 许可开源❌ 商业授权费用⚠️ 订阅、按量或授权付费

使用优化建议

  1. 启用大型转录模型:如大批量视频优先使用 large-v3 获得更准确转录;

  2. 编写精确提示词:例如“产品演示”“基准测试”提升召回率;

  3. 分批加载视频:将长视频拆段处理,缩短反馈时间;

  4. 复用 “Re-analyze” 功能:微调提示词,获得更符合任务的剪辑;

  5. 二次处理剪辑结果:使用 FFmpeg 或视频编辑软件优化视频质量。


未来展望

  • 支持 图像内容分析(OCR、视觉理解)增强检索能力;

  • 集成免费开放 LLM 模型;

  • 提供服务器端部署与容器镜像,支持团队协作;

  • 配置 GUI 导出“剪辑脚本”,适配后期编辑流程;

  • 开放插件架构用于扩展如情绪识别、字幕生成等能力。


总结

PreenCut 是一款高度契合 AI 工具使用者需求的开源视频检索与剪辑平台。它融合 WhisperX 语音识别、大语言模型分析和自然语言交互,大幅提升内容定位与剪辑效率。无论你是创作者、教师、产品团队或研究者,PreenCut 都能提升视频干预力与产出效率。

AI大学堂