今天学点啥AI“塔子老师”自动拆解、生成幻灯片并配以生动讲解,同时配备互动测验与扩展阅读模块,兼顾趣味性与深度。02,2720教育与学习最近收录AI# AI SVG动画# AI 个性化讲解# AI 动态PPT
AI Fooler一款专业的 AI 音频处理工具,以免费使用、一键人声分离和伴奏提取闻名,支持多格式上传,适合音乐爱好者、内容创作者和音频剪辑者使用,在线体验无门槛,更高效地处理音频素材。09090最近收录AI语音识别与生成# AI伴奏提取# AI音频处理# stem分离工具
Fish Audio一个领先的 AI 生成式文本转语音(TTS)和语音克隆平台,基于开源的 Fish Speech 模型。05790最近收录AI语音识别与生成# AI语音克隆平台# AI语音库# Fish Speech 模型
阶跃AI融合网页搜索与知识库,支持文本、图像、文档、语音多种输入方式,提供实时对话、多轮交互、图文理解、文档问答及创作辅助等功能,旨在提升个人在工作、学习与生活中的效率与创造力。05670自然语言处理(NLP)计算机视觉# AI个人效率助手# AI代码助手# AI写作
智声云配智声云配(DubbingX)是一款由智声悦合(杭州)科技推出的 AI 配音与音色克隆平台,支持多语言、多情绪、歌声转换及 API 集成,适用于有声书、游戏、广告、虚拟人等场景,为 AI 用户提供高拟真可商用配音解决方案。04810最近收录AI语音识别与生成# AI智能配音工具# AI有声书制作# AI语音转换
Descript自动化转录、AI 助手、多机位切换等功能融入到同一界面,让创作者在文档式界面中轻松完成剪辑、字幕、配乐和特效处理。04750最近收录AI计算机视觉# AI GIF生成工具# AI助手# AI头像生成工具
DeepInfraDeepInfra 通过提供无缝、可扩展且经济高效的 AI 推理解决方案,正在改变 AI 景观。其专注于简单性、性能和负担能力,使其成为初创企业和企业的重要选择。04610大模型最近收录AI# AI语音合成# AI语音识别# 大语言模型(LLMS)
Pi(Presentation Intelligence)一款结合人工智能技术的演示内容分析和优化平台,专注于提升演讲者的表达表现、幻灯片内容质量以及听众互动效果。04190最近收录AI计算机视觉# AI 视频演示生成工具# AI内容分析# AI分析演讲
Unmute法国 AI 实验室 Kyutai 推出的一款高度模块化的语音 AI 系统,旨在为文本大语言模型(LLM)赋予实时语音交互能力。04100最近收录AI语音识别与生成# AI客服# AI语音交互# AI语音助手
MiniMax一家中国领先的人工智能公司及其核心产品与技术生态,涵盖公司背景、主要产品(包括文本到视频、图像生成、语音合成等)、技术架构、典型应用场景与商业模式。04000大模型最近收录AI# AI Agent# AI聊天机器人# AI艺术生成器
Mobvoi MCP Server出门问问(Mobvoi)于 2025 年 5 月 29 日正式发布的一款多模态 AI 服务平台。03960开源工具与社区最近收录AI# AI声音克隆# AI数字人# AI视频翻译
Qwen‑TTSQwen-TTS 是阿里云通义千问系列的高保真中英文语音合成模型,支持标准普通话、三种中文方言(北京话、上海话、四川话)及七种中英双语音色,通过流式输出实现快速、高质量语音生成。03940大模型最近收录AI# AI客服# AI语音助手# 文本转语音模型
BytePlusBytePlus是字节跳动旗下 AI 平台,为开发者和企业提供图像生成、语音识别、推荐系统、增强现实等一站式 AI 能力,适合 AI 工具使用者构建复杂智能应用。03890API与SDK企业用户# AI图像生成# AI视觉增强# 全栈AI服务
咔皮记账咔皮记账是商汤科技推出的 AI 原生记账与财务管理工具,具备自动语音记账、AI 财务分析、多账本支持、智能预算与情感手账等功能,上线半年即突破百万用户,深受年轻群体喜爱。03850最近收录AI语音识别与生成# AI财务分析# AI财务助手
Ming-lite-omni蚂蚁集团于 2025 年 5 月开源发布的统一多模态大模型,旨在实现文本、图像、音频和视频等多种模态的理解与生成能力。03810医疗与健康教育与学习# AI内容创作# AI医学影像分析# AI客服
National Gallery MixtapeGoogle Arts & Culture 与英国国家美术馆(The National Gallery)合作推出的一款互动式 AI 实验项目。03730最近收录AI计算机视觉# AI创意启发# AI艺术教育# AI音乐生成工具
EVI 3一款基于共情大语言模型(eLLM)技术的语音语言模型,能够同时处理文本和语音输入,生成自然、富有表现力的语音响应。03670医疗与健康大模型# AI 语音交互体验# 共情大语言模型(eLLM)# 语音语言模型
UdioUdio 是由前Google DeepMind团队研发的AI音乐生成平台,凭借其强大的文本到音乐的转换能力与开源生态,迅速成为全球音乐创作者的热门工具。用户仅需输入简单的文本描述,即可生成包含人声的高质量音乐作品,覆盖流行、电子、摇滚、古典等数十种风格,并支持多语言歌词创作。03660最近收录AI语音识别与生成# AI音乐生成器# Remix混音# 文本生成音乐
Higgs Audio V2Higgs Audio V2 是 Boson AI 发布的开源音频大语言模型,基于 1000 万小时语音数据训练,支持多说话人对话、情感语音、多语言语音生成,适合 AI 工具使用者构建语音 Agent 和音频应用。03620大模型开源工具与社区# AI情感语音合成# AI语音克隆# 音频生成与理解基础模型
TwocastTwocast 是一款 AI 驱动的双人播客生成平台,支持从文章、网址或文档快速生成 3–9 分钟的 AI 对话播客,拥有多语言、多音色支持及下载功能,是内容创作者、教育者与营销人员的高效音频工具。03450教育与学习最近收录AI# AI Podcast Generator# AI内容创作# AI双人播客
千音漫语探索“千音漫语”智能声音创作平台:从配音、翻译、声音克隆到语音识别,揭开其架构与应用秘密,助力 AI 用户构建高效多语种音视频创作流程。03390最近收录AI语音识别与生成# AI声音克隆# AI声音创作平台# AI有声书制作
LeVoLeVo 是由清华、大氪 AI Labs 联合开发的高保真音乐生成框架,支持歌词转歌、声乐与伴奏融合、DPO 多偏好对齐,适用于音乐创作、音频生成领域的 AI 工具用户。03300教育与学习最近收录AI# AI作曲辅助# AI音乐创作# AI音乐模型
HunyuanVideo-Avatar腾讯混元团队联合腾讯音乐天琴实验室(MuseV)于 2025 年 5 月 28 日发布并开源的语音驱动数字人模型。03300大模型最近收录AI# AI数字人# AI短视频生成工具# AI虚拟主播