讯飞听见

讯飞听见 iFlyrec

科大讯飞旗下中文语音转写顶级方案,覆盖会议、访谈、视频字幕、实时翻译全场景

会议纪要 Freemium 评分 4.5/5
🏢 科大讯飞 🔄 v2026 持续更新 💻 Web / iOS / Android / 桌面客户端 / 硬件录音笔 💰 ¥30 📅 2018-03-01 ⚖️ Commercial
系统分类: ✍️写作
能力标签: 🎙️语音 transcription chinese subtitle translation
平台:Web / iOS / Android / 桌面客户端 / 硬件录音笔 语言:多语言 更新:2026-04-20
讯飞听见 界面截图
行为数据
总外链点击 97
执行页带来 0
体验入口点击 51
收藏次数 0
官网入口点击 57
执行页体验点击 0
执行页官网点击 0
最高来源 排行榜 · 30
最近一次点击 工具页 -> 体验入口 · 22 小时前
访问官网
工具简介

适合会议记录、访谈整理、视频字幕、实时翻译与多语种音频转文字场景的专业级语音 AI 工具,中文识别准确率行业第一梯队。

底层模型 / Powered by

此工具基于以下 20 个 AI 模型构建或接入:

BGE-M3 S
智源研究院 · 🇨🇳 国内

智源 BGE 多语言向量模型,适合语义检索和 RAG。

BGE-Reranker S
智源研究院 · 🇨🇳 国内

BGE 重排模型,适合检索增强和搜索排序。

MiniMax M2 S 🔥
MiniMax · 🇨🇳 国内

MiniMax 新一代文本/Agent 模型,适合通用推理和工程应用。

Qwen Embedding S
阿里巴巴 · 🇨🇳 国内

通义文本向量模型,适合语义检索、RAG 和知识库。

Coze Agent S 🔥
字节跳动 · 🇨🇳 国内

扣子/Coze 智能体与工作流能力,适合无代码 Agent 和自动化场景。

Dify Agent S 🔥
Dify · 🇨🇳 国内

Dify 应用编排与 Agent 能力,适合企业应用和工作流搭建。

Hunyuan Image 3.0 S 🔥
腾讯 · 🇨🇳 国内

腾讯混元图像生成模型,适合中文图像生成和视觉创意。

Seedream 3.0 S
字节跳动 · 🇨🇳 国内

字节图像生成模型,适合海报、插画和视觉创意。

字节跳动 · 🇨🇳 国内

字节 Seedream 图像模型,适合图像生成、编辑和设计素材创作。

Wanxiang 2.1 S
阿里巴巴 · 🇨🇳 国内

通义万相图像模型,适合设计图、插画和电商素材。

Kling 1.6 S
快手 · 🇨🇳 国内

可灵上一代主力视频生成模型,适合短视频生成。

Kling 2.1 S 🔥
快手 · 🇨🇳 国内

快手可灵视频模型,适合视频生成、镜头控制和创意短片。

Seedance 1.0 Pro S
字节跳动 · 🇨🇳 国内

字节视频生成模型,适合文生视频和图生视频创作。

字节跳动 · 🇨🇳 国内

字节 Seed 系列视频生成模型,适合高质量短视频和剧情视频生成。

Wan2.1 S
阿里巴巴 · 🇨🇳 国内

阿里视频生成模型,适合视频生成与创意制作。

Wan2.2 S 🔥
阿里巴巴 · 🇨🇳 国内

阿里万相视频生成模型,适合文生视频和创意视频生产。

MiniMax · 🇨🇳 国内

MiniMax 音乐生成模型,适合歌曲、BGM 和音乐内容生成。

Doubao Speech S 🔥
字节跳动 · 🇨🇳 国内

豆包语音能力,适合配音、朗读、语音交互。

iFLYTEK Spark Speech S
科大讯飞 · 🇨🇳 国内

讯飞语音与星火能力,适合语音识别、合成和教育场景。

MiniMax · 🇨🇳 国内

MiniMax 语音合成模型,适合高质量配音与语音应用。

核心功能
  • 中文语音转文字(高精度)
  • 多语种识别(中英日韩等)
  • 实时翻译与字幕
  • 长录音批量转写
  • 关键词高亮与提取
  • 说话人分离
  • 视频字幕一键生成
  • 导出 Word/PDF/SRT/TXT 多格式
适用场景
  • 线下/线上会议纪要 / 新闻访谈整理 / 视频博主字幕 / 学术讲座转写 / 法律取证 / 医疗问诊
适合谁
📰
记者与内容创作者
适合访谈、播客、视频字幕等高频转写需求。
适配度:高
🏢
企业会议团队
适合定期会议纪要、跨语种线上沟通转录。
适配度:高
🎓
学生与教师
适合课堂录音整理、学术讲座转写、外语听力学习。
适配度:中高
优点与不足
优点
  • 中文识别准确率行业第一梯队
  • 多语种与方言支持丰富
  • 说话人分离效果稳定
  • 导出格式齐全(Word/SRT 等)
不足
  • 重度使用需付费时长包
  • 英文识别仍略逊于专业海外服务
  • 免费时长有限
NavXD 推荐理由

适合需要高精度中文语音转写、字幕生成与多语种翻译的会议、访谈、视频与学术场景。

主要用途:语音转文字与字幕生成

团队适配:适合记者、自媒体、企业会议团队、学生、教师、法律及医疗行业的语音转写需求。

评分明细
综合评分 4.5/5
质量 4.7/5
功能 4.5/5
易用性 4.6/5
性价比 4.3/5
🎯 NavXD 推荐指数 (V2) 数据驱动决策
57 综合推荐分 /100 观望
推荐公式:模型等级×40% + 能力×25% + 趋势×20% + 场景匹配×15%
能力得分 91/100
趋势热度 92/100
场景适配 46/100
价格方案
新用户免费
¥0
• 赠送 5 小时免费时长
• 基础识别功能
时长包
¥0.5+ /分钟
• 按需购买
• 不会过期
月度会员
¥30+ /月
• 不限转写时长(限速)
• 导出全格式
企业版
面议
• 团队管理 + API
• 私有化可选
编辑评测
NavXD 编辑部 ★★★★☆
站内评测

中文语音转写国内首选;说话人分离稳定可用;导出格式齐全工程友好;重度用户需要购买时长包,整体性价比合理。

立即使用

已经了解这个工具的核心信息后,可以直接前往官网继续体验。

前往官网

类似工具
主要竞品
  • VS 通义听悟
  • VS 腾讯会议转录
  • VS Otter.ai
常见问题
讯飞听见跟通义听悟怎么选?
讯飞听见识别准确率(特别是中文)略胜,行业垂直场景覆盖更深;通义听悟跟阿里云生态集成更顺,且免费额度更友好。日常会议两者都可,记者/学术等专业场景推荐讯飞。
免费版能用多久?
新用户注册赠送约 5 小时免费转写时长(具体以官网最新活动为准),日常轻量使用够用;超出后按时长包或会员收费。
中文方言识别效果如何?
主要方言(粤语、四川话、东北话等)有针对性识别,效果可用;冷门方言识别率会下降。建议先用一小段音频测试再批量处理。
更新日志
  • 2026-03-01 讯飞听见 2026 春季更新 NEW

    中英混合识别准确率提升;视频字幕导出支持更多格式;实时翻译延迟降低。