多语言支持

共 31 篇网址

排序

发布更新浏览点赞

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列，包含用于批量转录的 Voxtral Mini Transcribe V2 和用于实时转写的 Voxtral Realtime。该系列支持 13 种语言、精准说话人分离、上下文偏向、词级时间戳和极低延迟的实时转录能力，并提供开源权重与企业部署选项。

01370

大模型开源工具与社区 # 多语言支持 # 实时转录 # 语音转写

DeepSeek-OCR 2

DeepSeek-OCR 2 是 DeepSeek AI 发布的端到端 OCR（光学字符识别）视觉语言模型，基于 Visual Causal Flow 机制处理图像与文档输入，生成结构化文本输出（如 Markdown/JSON），用于复杂文档的逻辑顺序转录与布局感知识别。

01400

大模型最近收录AI # Markdown 输出 # OCR 模型 # 复杂布局识别

LightOnOCR-2-1B

LightOnOCR-2-1B 是一种开源的 1B 参数端到端 OCR（光学字符识别）模型，用于将文档图像（如 PDF、扫描件或照片）转化为清晰、自然排序的文本。模型在标准基准上提供高质量识别，并支持多种输入格式与布局类型。

01520

大模型最近收录AI # 图像检测 # 多语言支持 # 布局解析

Vidu Agent

Vidu 团队推出的 AI 视频创作智能体平台，通过“一键成片”技术与自动分镜编排，实现从视觉输入到成品输出的全流程视频生成，适用于广告、产品展示、短片与创意视频等多种场景。

01890

内容创作最近收录AI # AI分镜编辑 # AI视频创作智能体平台 # AI视频生成工具

Gemini TTS

Gemini TTS 是 Google 最新的文本转语音（Text-to-Speech）技术，通过 Gemini API 或 Google AI Studio 提供高质量、多语言、多角色语音合成服务。支持细粒度风格、语速、情绪与多语音输出控制，并可用于播客、课程、辅助工具与互动应用等场景。

01990

API与SDK 内容创作 # AI语音合成 # 多语言支持 # 文本转语音

Clueso

Clueso 是一款面向屏幕录制者的 AI 平台，可将录制内容自动转换为高质量产品视频与操作文档，支持多语言、本地协作与品牌定制，适合 AI 工具使用者快速生产培训与演示内容。

03580

最近收录AI 计算机视觉 # AI屏幕录制转视频 # AI视频生成 # 多语言支持

Decopy AI

Decopy AI 是一款免费一体化写作工具，涵盖 AI 内容检测、人性化润色、文档/视频摘要、数学题求解等功能，适合 AI 工具使用者提升内容质量与创作效率。

04560

教育与学习最近收录AI # AI人性化润色 # AI内容检测 # AI学术写作

EXAONE 4.0

EXAONE 4.0 是 LG AI Research 发布的混合智能大模型，集通用理解与多步推理于一体，提供 32B 高性能与 1.2B 本地部署版本，支持工具调用与多语言，是 AI 工具使用者进行开发集成的核心资源。

04030

大模型开源工具与社区 # 多语言支持 # 混合模型

Speakr

Speakr 是一款开源自托管应用，专注会议/音频转录、摘要、说话人识别和聊天交互，适合 AI 工具使用者轻松部署隐私安全的语音笔记平台。

05630

开源工具与社区最近收录AI # AI音频转录 # 多语言支持

QuickCreator

QuickCreator 是一款集 AI 写作、SEO 优化、博客托管与落地页生成于一体的全流程平台，通过关键词、语义分析与 SERP 模型，帮助用户快速创建高质量 SEO 内容并提升自然流量，是中国出海企业与营销用户的高效内容工具。

04470

关键词研究与分析内容优化 # AI内容营销平台 # AI博客写作 # SEO技术优化

Twocast

Twocast 是一款 AI 驱动的双人播客生成平台，支持从文章、网址或文档快速生成 3–9 分钟的 AI 对话播客，拥有多语言、多音色支持及下载功能，是内容创作者、教育者与营销人员的高效音频工具。

04680

教育与学习最近收录AI # AI Podcast Generator # AI内容创作 # AI双人播客

Mobvoi TicNote

TicNote 是一款融合硬件与 AI Agent（Shadow）的智能录音笔，支持高质量录音、实时转录、多语言翻译、概括摘要并进行深度项目处理，是 AI 用户提升生产力的实用利器。

06330

最近收录AI 自主智能系统 # AI Agent # AI录音 # 多语言支持

11.ai

11ai，即 ElevenLabs，由 Piotr Dąbkowski 和 Mati Staniszewski 于 2022 年创办，总部位于纽约，专注于开发高质量语音合成与克隆技术。

03700

API与SDK 最近收录AI # AI播客制作 # AI有声书 # AI语音克隆

学术猹

学术猹是网易有道推出的专业学术辅助平台，专注于论文智能降重、AI 内容去痕、跨语言互译、查重优化等全流程服务，为学生、研究者、教师提供安全高效的一站式学术写作解决方案。

04640

教育与学习最近收录AI # AIGC检测 # AI学术写作辅助工具 # AI检测

Essay Grader AI

Essay Grader 是一款 AI 驱动的在线论文评分平台，专为教育工作者和学生设计，支持批量上传、自定义评分标准、抄袭与 AI 检测、Google Classroom／Canvas 集成，显著提升评分效率与反馈质量。

02720

教育与学习最近收录AI # AI内容生成检测 # AI抄袭检测 # AI论文辅助评分工具

CreateVision AI

CreateVision AI 是一款完全免费的无登录 AI 图像生成平台，支持多引擎驱动、无限次高质量图像创作，为创意工作者、设计师、内容营销人员带来极致便捷与自由。

04600

免费AI工具最近收录AI # AI图像生成工具 # 多语言支持

Cognigy

Cognigy 是领先的企业级对话式 AI 编排平台，专为联络中心和客服场景打造低/无代码 AI Agent，实现多语言、多渠道自动化交互，提升用户体验、客服效率与业务成果。

03530

企业用户最近收录AI # Agent Copilot # Agentic AI 编排引擎 # AI Agent

SongGeneration

SongGeneration 是腾讯AILab开发的开源歌曲生成模型，基于 LeVo 架构与音乐编码器，可从歌词、风格描述与参考音频中并行生成和谐的“人声+伴奏”歌曲，支持中文与英文，适合 AI 工具使用者快速落地音乐创作。

04300

大模型开源工具与社区 # AI音乐生成 # 多语言支持

NeonLingo

NeonLingo 是一款 AI 助力的浏览器扩展插件，通过上下文关键词翻译、自动标注和词汇本，帮助用户在网页阅读中无缝学习外语，提升阅读效率与词汇记忆。

04130

教育与学习最近收录AI # AI 浏览器扩展插件 # AI翻译 # PDF文本识别

Bridgely

Bridgely 是一款 AI 驱动的浏览器扩展，支持 60 多种语言的实时翻译，适用于 WhatsApp、Slack、Telegram、LinkedIn 等平台，帮助用户轻松跨语言沟通，提升工作效率。

03230

最近收录AI 自然语言处理（NLP）# AI实时翻译 # AI浏览器扩展 # AI翻译引擎

Vocloner

一款完全免费的在线 AI 语音克隆工具，能够在几秒钟内通过上传音频样本来即时生成语音克隆模型，支持多语言和情感语调选择。

02930

教育与学习最近收录AI # AI语音克隆工具 # 多语言支持

Leoline

一款针对儿童的 AI 语音故事助手，纯语音交互，无须屏幕或打字。

03640

最近收录AI 语音识别与生成 # AI语音交互 # AI语音故事助手 # AI长文本故事生成

Eleven v3

由 ElevenLabs 于 2025 年 6 月推出的最新文本转语音（TTS）模型的 Alpha 版本。

03490

大模型最近收录AI # AI多角色对话 # AI广告配音 # AI情感表达

Qwen3 Reranker

阿里云通义千问团队于 2025 年 6 月发布的开源文本重排序（Reranking）模型，作为 Qwen3 Embedding 系列的一部分。

03070

大模型开源工具与社区 # AI信息检索 # 多语言支持 # 模型

Qwen3 Embedding

Qwen3 Embedding

阿里云通义千问团队于 2025 年 6 月推出的全新文本嵌入与重排序模型系列，专为文本表征、信息检索和排序任务设计。

02660

大模型智能推荐系统 # AI信息检索 # AI语义搜索 # AI问答

OpenAudio

Fish Audio 推出的新一代文本转语音（TTS）模型，旨在生成高度自然、富有情感的语音输出。

02680

大模型娱乐媒体 # AI播客能容创作 # AI有声书内容创作 # AI游戏角色语音

AI TransPDF

高效准确地将PDF文档翻译成多种语言的AI智能PDF文档翻译工具。

04741

教育与学习最近收录AI # AI翻译 # PDF翻译 # 图片内容翻译

Elsa Speak

Elsa Speak 是一款基于人工智能的英语口语矫正应用，通过实时发音反馈、个性化课程和覆盖7,100+场景的互动训练，帮助非母语用户提升发音准确性和语言流利度‌

07510

教育与学习自然语言处理（NLP）# AI英语口语矫正 # 即时语音反馈 # 多语言支持

DeepL

DeepL翻译网站是一个在线翻译工具，提供高质量的机器翻译服务。因其高质量的翻译效果和用户友好的界面，成为许多用户和企业的首选翻译工具。

01,2782

AI热门产品自然语言处理（NLP）# 在线翻译工具 # 多语言支持 # 文档翻译

AI PPT Maker

AI PPT Maker 为需要快速制作专业演示文稿的用户提供了一个高效、易用的解决方案。

06140

AI热门产品办公提效 # AI PDF # AI内容生成器 # AI图表生成器

Argil.ai

Argil.ai 是一个功能强大的 AI 视频创作平台，它利用人工智能技术，帮助用户轻松制作高质量的短视频，从而提升社交媒体品牌影响力。平台提供多种功能，包括 AI 克隆技术、智能脚本生成、一键生成视频等，让用户可以高效便捷地创作短视频。

04630

编程工具 # AI克隆技术 # 一键生成视频 # 多语言支持

AI大学堂