EVI 3一款基于共情大语言模型(eLLM)技术的语音语言模型,能够同时处理文本和语音输入,生成自然、富有表现力的语音响应。04710医疗与健康大模型# AI 语音交互体验# 共情大语言模型(eLLM)# 语音语言模型
seo.ing通过多智能体协作,帮助用户高效生成优化良好的内容,适用于各种需要SEO内容的场景。04710内容优化最近收录AI# AI Article Generator# AI SEO Content Generator# AI SEO助手
CatchMeCatchMe 是一款 AI 内容鉴别平台,支持在线检测图像、视频和音频是否由 AI 生成,有效应对换脸、换声诈骗和深伪内容风险,适合 AI 工具使用者保障内容真伪安全。04690最近收录AI计算机视觉# AI内容检测工具# AI图像鉴伪# AI视频真实性检测
MirrorMeMirrorMe 是阿里巴巴团队推出的实时高保真音频驱动半身动画扩散模型,结合 LTX 视频基础架构与音频适配器,实现 lip-sync、表情与手势同步生成,适合 AI 工具使用者打造交互式数字人影像。04680最近收录AI计算机视觉# AI内容创作工具# AI虚拟直播# 多语言虚拟助理
Mureka V7Mureka V7 是 Skywork AI 发布的最新 AI 音乐生成模型,基于 MusiCoT Chain‑of‑Musical‑Thought 技术,实现结构化、真实感极强的旋律和人声效果,适合 AI 工具使用者快速制作高质量原创音乐。04670大模型最近收录AI# AI音乐创作工具# AI音乐模型
FreeGen一款完全免费的 AI文生图片工具,支持无限制在线图像生成、风格、色调、构图与灯光选择,且无需注册,适合设计师、内容创作者及社交媒体运营者快速获取高质量视觉素材。04670免费AI工具最近收录AI# AI内容创作# AI图像生成工具# AI影视创意
FilmAction首个国内一体化 A电影创作平台,通过 AI 驱动的剧情生成、角色设定、分镜制作、配音配乐及4K视频输出,帮助创作者无门槛制作短片与广告,实现“人人皆导演”梦想。04670最近收录AI计算机视觉# AI创作平台# AI导演# AI电影创作平台
Stream‑OmniStream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合(文本、图像、语音)并生成文本和语音回应,具备边听边列文字中转、轻量训练与同声互动能力,是 AI 工具使用者构建多模态界面的优秀起点。04650开源工具与社区教育者与研究人员# AI聊天机器人# AI语音助手# 多模态聊天应用
Kwai Keye‑VLKwai Keye‑VL 是快手推出的 8 B 参数多模态大语言模型,聚焦动态短视频理解与视觉推理,支持图文与视频输入。本文深入分析其架构、性能、使用指南与 FAQ,助 AI 用户快速掌握。04640大模型最近收录AI# AI视频内容摘要# AI视频问答# 多模态大型模型
Trenz一款专为 TikTok Shop 商家、内容创作者和品牌方打造的 AI 驱动的社交电商智能分析与内容创作平台。04640数据分析与预测最近收录AI# AI内容创作平台# AI文案生成工具# AI电商分析平台
Vid2World将预训练的视频扩散模型(Video Diffusion Models)转化为可交互的世界模型(Interactive World Models)。04620最近收录AI计算机视觉# AI游戏模拟# AI视频生成# 世界模型
OpenArt Studio Ghibli AI生成器OpenArt Studio Ghibli AI生成器是一款在线AI工具,旨在帮助用户生成受吉卜力工作室风格启发的艺术作品。04620计算机视觉# AI吉卜力风格# AI照片滤镜# 文生图
Higgs Audio V2Higgs Audio V2 是 Boson AI 发布的开源音频大语言模型,基于 1000 万小时语音数据训练,支持多说话人对话、情感语音、多语言语音生成,适合 AI 工具使用者构建语音 Agent 和音频应用。04590大模型开源工具与社区# AI情感语音合成# AI语音克隆# 音频生成与理解基础模型
PaperRedPaperRed 是一款面向学术写作与内容创作者的 AI 驱动文本处理平台,集抄袭检测、AI 内容识别、智能改写和格式优化于一体,提供免费检测与深度重写能力,是学生、研究者与内容工作者的高效写作助手。04590最近收录AI自然语言处理(NLP)# AIGC检测# aigc降重# AI写作
LeVoLeVo 是由清华、大氪 AI Labs 联合开发的高保真音乐生成框架,支持歌词转歌、声乐与伴奏融合、DPO 多偏好对齐,适用于音乐创作、音频生成领域的 AI 工具用户。04580教育与学习最近收录AI# AI作曲辅助# AI音乐创作# AI音乐模型
WonderPlay斯坦福大学与犹他大学联合推出的创新型框架,旨在从单张图片和用户定义的动作生成动态的三维(3D)场景。04580最近收录AI计算机视觉# AI 3D场景生成# AI动态广告内容# AI影视特效制作
Autodesk Flow StudioAutodesk 推出的一款基于浏览器的 AI 驱动视觉特效平台,旨在简化 CG 角色与真人视频的集成流程。04580计算机视觉# AI CG角色生成# AI 驱动视觉特效平台# AI动作捕捉
VoxtralVoxtral 是由 Mistral 推出的首款开源语音理解模型系列,支持高精度转录、语音问答、多语言识别与函数调用,提供 24B 和 3B 两种参数规模,适合 AI 工具使用者本地部署或云端集成。04550大模型开源工具与社区# AI摘要生成# AI语音转录# AI语音问答
AgentforceAgentforce 的核心在于其深度集成于 Salesforce 平台,利用 Data Cloud 统一客户数据,并通过 Atlas 推理引擎模拟人类思维和规划能力。04540最近收录AI自主智能系统# Agent Builder# AI Agent# AI CRM
Hunyuan3D‑PolyGenHunyuan3D‑PolyGen 是腾讯混元3D系列的最新旗舰级模型,以生产级“Art‑Grade”网格拓扑为目标,支持三角/四边形网格、高压缩编码与自动重拓扑,能减少 70% 制作时间、提升 35% 拓扑整洁度,是游戏开发者与 3D 艺术师的创作助力。04530API与SDK大模型# AI 3D艺术设计# AI游戏开发
AnimaTensorAnimaTensor 是一个专为动漫风格设计的开源 SDXL 模型,由 Animagine XL 4.0-Zero 微调而成,训练于 840 万张 Danbooru 图像,支持 V‑prediction、Zero-terminal SNR 和高分辨率生成,适合内容创作者快速制作高质量动漫艺术作品。04530大模型最近收录AI# Stable Diffusion XL动漫模型微调# stable diffusion 模型# 模型下载
CAR由字节跳动与复旦大学联合提出的一种自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在处理各类任务时的推理效率与准确性。04530最近收录AI计算机视觉# 多模态任务# 自适应推理框架# 视觉问答
Pixel Reasoner一款前沿的开源视觉语言模型(VLM),旨在突破传统“文字链式思维(Chain-of-Thought, CoT)”的局限,首次实现了“像素空间链式思维”能力。04530最近收录AI计算机视觉# AI多模态