ThinkSoundThinkSound 是一款基于 Chain-of-Thought 推理的多模态音频生成与编辑框架,支持任意模态输入(视频、文本、音频),可交互地为视频生成高质 Foley 声音、定向对象声音细化和自然语言音频编辑,适合 AI 工具使用者打造智能多模态内容流程。04240最近收录AI语音识别与生成# AI音频生成框架# 多模态音频生成
NeonLingoNeonLingo 是一款 AI 助力的浏览器扩展插件,通过上下文关键词翻译、自动标注和词汇本,帮助用户在网页阅读中无缝学习外语,提升阅读效率与词汇记忆。04230教育与学习最近收录AI# AI 浏览器扩展插件# AI翻译# PDF文本识别
Vibemotion深入解读 Vibemotion:第一个以单一句提示生成专业级动态图形视频的 AI 工具,适合 AI 创作者、内容营销与教育者,涵盖功能特性、使用流程、最佳实践与常见问答,助你快速掌握该平台的魔力。04220最近收录AI计算机视觉# AI视频生成工具
Fairies AIFairies 是一款革命性的通用 AI 代理工具,能够显著提升个人和团队的工作效率。它通过先进的自然语言处理技术和强大的多任务执行能力,帮助用户完成各种复杂工作。04220办公提效教育与学习# AI Agent# AI对话交互# 多任务处理
OpusClip ThumbnailOpusClip 团队推出的全新 AI 缩略图生成工具,旨在帮助 YouTube 创作者快速制作高点击率的缩略图。04220教育与学习最近收录AI# AI内容创作工具# AI缩略图生成工具
FlowDirectorFlowDirector是一款无需训练的文本驱动视频编辑新框架,通过 ODE 流式演化实现高精度、时序一致的视频修改,具备局部可控与语义对齐优势,适合创作者和开发者快速文本编辑视频。04210开源工具与社区最近收录AI# AI短视频制作# AI视频编辑框架
Aurora微软研究院于 2025 年发布的地球系统基础模型(Foundation Model),旨在通过人工智能技术实现更快速、精准且高效的天气和环境预测。04210大模型数据分析与预测# AI天气预测
AI Newsletter Generator帮助企业、内容创作者和营销人员高效创建个性化、专业的电子报内容。04200最近收录AI自然语言处理(NLP)# AI广告营销# AI数字营销# AI邮件助手
小凹语音输入法“小凹语音输入法” 是由 智谱 AI 推出的智能语音转写工具,支持高准确率语音识别、多场景语音输入与自动润色,帮助用户显著提升写作 /输入效率。04190最近收录AI语音识别与生成# AI润色工具# AI语音转写# AI语音输入
ChatPPTOpenPPT 是一款智能 AI 演示文稿生成工具,支持一键生成 PPT、在线编辑、主题美化和内容创作。无论是办公汇报、学术演讲还是营销策划,OpenPPT 都能帮助用户高效完成演示文稿制作,大幅提升工作效率与创作体验。04190最近收录AI自然语言处理(NLP)# AI PPT制作# AI文稿演示
Qwen VLo一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型,从核心能力、使用路径到实战案例和常见问题,详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。04190大模型最近收录AI# 多模态大语言模型# 文生图
乐享AI乐享AI助手是腾讯乐享推出的企业级智能学习秘书,融合 AI 问答、多模态搜索、内容创作、智能出题和考试陪练功能,助力企业内部高效协同与知识管理。04190企业用户教育与学习# AI企业知识库# AI内容生成# AI学习社区
Copysmith一款领先的 AI 文案生成平台,专为电商、营销人员和内容创作者设计,旨在通过人工智能技术提升内容创作效率和质量。04180内容优化自然语言处理(NLP)# AI SEO内容优化# AI内容优化# AI内容生成
EapyEapy 是一款由 Pozalabs 开发的 AI 音乐平台,专注于帮助音乐创作者轻松推广作品并提升创作效率。它允许用户上传音乐、图像和文本,生成高质量的在线推广页面,吸引唱片公司、A&R 代表和同步代理的注意。04170语音识别与生成# AI辅助作曲# AI音乐创作平台# AI音乐实时协作
MindBricks一款强大的 AI本地写作工具,支持创意构思、结构设计、自动润色、逻辑检查与全文生成,兼容 Windows 与 macOS 平台,无需登录及时启用,保障数据隐私与创作自由。04120API与SDK写作助手# AI审查# AI改写# AI本地写作工具
LONGLIVELONGLIVE 是由 NVlabs 推出的创新型 AI 技术项目,旨在通过先进的深度学习与生成算法,为长视频生成、内容复原与高质量视频处理提供强大支持。04110最近收录AI计算机视觉# 视频生成技术
RoboBrain2.0RoboBrain 2.0 是北京智源研究院推出的开源多模态机器人“大脑”,融合视觉、语言与交互推理,支持 7B/32B 模型,对各种实体任务进行空间、时间规划与闭环反馈,适合 AI 工具使用者快速集成机器人认知能力。04100大模型开源工具与社区# 机器人视觉-语言大模型
Rosebud全面解析 Rosebud:一款面向 AI 工具使用者的互动日记与个人成长平台,涵盖其核心功能、使用方法、科学依据、实战案例与常见问答,帮你深入了解如何通过 Rosebud 实现情绪管理、习惯培养与自我提升。04080最近收录AI自然语言处理(NLP)# AI 互动日记# AI心理成长平台# AI聊天机器人
OiaWrite基于 AI 的写作助手 OiaWrite,为内容创作者提供语法优化、风格建议、智能改写等功能,是提高写作效率与质量的理想 AI写作工具。04080最近收录AI自然语言处理(NLP)# AI写作工具# AI改写# AI润色
ComputerX深入解析 ComputerX:一款面向 AI 工具使用者的桌面智能 Agent,能够理解意图并自动完成电脑操作,从自动化任务到网页浏览,提升工作效率。04070最近收录AI自主智能系统# AI助手桌面Agent
OmniFlowOmniFlow 是松下与 UCLA 联合开发的多模态生成式 AI,实现文本、图像、音频之间的 Any‑to‑Any 转换,极大降低训练数据成本,适用于内容创作、无障碍辅助与多媒体生成。04060最近收录AI计算机视觉# 图生文本# 图生音频# 多模态生成式AI
SignGemmaGoogle DeepMind 于 2025 年 5 月推出的一款先进的 AI 手语翻译模型,旨在打破听障人士在沟通中的障碍。04060医疗与健康大模型# 多模态AI模型# 手语翻译模型
字节跳动SeedSeed LiveInterpret 2.0 是字节跳动 Seed 团队推出的端到端双向中英文语音同传模型,支持零样本声音克隆、超低延迟(约 2–3 秒)实时翻译,适用于 AI 工具使用者与跨语言交流场景。04030最近收录AI语音识别与生成# AI声音克隆# AI翻译
MOSS‑TTSDMOSS‑TTSD 是 OpenMOSS 推出的开源中英双语对话语音合成模型,通过低比特率编码器与 Qwen3 架构支持零样本多说话人克隆和超长对话生成,适合 AI 工具使用者打造自然 expressive 会话播客、访谈等语音应用。03950大模型最近收录AI# AI客服# AI播客# AI语音生成框架
SendShortSendShort 是一款面向 AI 工具使用者的短视频自动化生成平台,通过一键剪辑、配字幕、配音、音轨、B-roll 和多语言翻译,助力内容创作者高效制作并发布视频短片。03940最近收录AI计算机视觉# AI短视频内容创作# AI配音生成# 多语言翻译
Kimi CodeKimi Code 是 Kimi 平台提供的 AI 编程辅助工具,它旨在通过自然语言提示、视觉输入和集成开发环境插件辅助开发者完成代码生成、调试、重构、测试及工作流自动化,兼容终端 CLI 和主流 IDE,并通过 API 密钥集成到多种工具链中。03930最近收录AI编程工具# AI 编程助手# CLI# IDE 集成
Kuse AI一款基于无限画布(Canvas)设计的多模态 AI 助手平台,旨在帮助用户以可视化方式整理、分析和生成内容。03920教育与学习最近收录AI# AI Agent# AI无限画布# 多模态AI助手平台
ChatPs一款突破性的 Photoshop插件,通过自然语言交互实现图像编辑、生成与重绘,支持文生图、局部重绘、智能抠图、无损放大等功能,无需掌握复杂操作,适合设计师与创作者提升效率。03910交互设计创意设计# AI图像生成# AI平面设计# AI换脸
LipSync.videoLipSync.video —— 功能强大的 AI视频生成工具,支持图像生成视频、人像口型同步,适合内容创作者与营销用户。03910教育与学习最近收录AI# AI拟合唇动# AI视频生成工具# AI语音合成
PlayDiffusionPlay AI 公司推出的开源音频编辑模型,基于先进的扩散模型(diffusion model)构建,专注于提供高效的音频精细编辑与修复功能。03900大模型开源工具与社区# AI配音# AI音频编辑模型# 播客制作
VuiVui——一款轻量级、轻量级语音对话模型(Lightweight Voice Dialogue Model),具备上下文感知与声纹克隆能力的开源 on‑device 模型。03890开源工具与社区最近收录AI# AI个人助理# AI声音克隆# AI多角色对话
ClaudiaClaudia 是一款由 Asterisk(YC 支持团队)开发的开源桌面 GUI 工具,专为 Anthropic 的 Claude Code 设计,集成会话管理、Agent 生产、自定义代理、多模态支持、使用分析和版本检查点,是开发者与 AI 协作的终极“指挥中心”。03880开源工具与社区自主智能系统# AI Agent# AI桌面应用
ContentV ContentV——字节跳动开源的 文生视频模型框架, 基于 80 亿参数设计,具备多阶段训练、高效流匹配和人类反馈强化机制,可生成高质量视频。03880最近收录AI模型管理与部署# AI短视频制作# AI视频剪辑# AI视频脚本
Flowe使用 FloweAI 提升工作效率:从自动撰写邮件到制作演示文稿,FloweAI 让 AI 真正“帮你完成任务”。本指南全方位解析功能、优势与常见问题,帮助你快速上手。03860办公提效最近收录AI# AI PPT生成# AI内容创作# AI助手
DBiM一款领先的 元宇宙在线平台,融合 AI Agent、数字人、3D建模与虚拟展览等功能,助力企业和个人用户在元宇宙环境中开展商业活动,实现数字化沉浸式交易与互动。03830最近收录AI自主智能系统# AI 3D建模# AI Agent# AI数字人克隆