dhxiaoheiyun

应无所住,而生其心。
可灵O1

可灵O1

可灵O1 是由 可灵AI 发布的全球首款统一多模态视频生成大模型,支持图片、视频与文字混合输入,实现从文生图/文生视频/图生视频到视频编辑的一站式创作流程,适合内容创作者、电商、广告商与自媒体用户快速生成短视频与营销内容。
02300
传声港

传声港

传声港 是一个 AI 驱动的新媒体综合服务平台,整合网络媒体、自媒体/网红资源、内容创作与发布、舆情监测与效果分析,为品牌、企业和自媒体提供一站式内容发布、宣传推广和运营管理服务。
02820
Vidi2

Vidi2

Vidi2 是由 ByteDance 发布的 12 B 多模态视频理解与创作模型,支持长视频解析、精确时空定位 (Spatio-Temporal Grounding)、自动剪辑与脚本生成,是内容创作、短视频制作、影视剪辑与视频理解研究的新利器。
01730
Temvideo.ai

Temvideo.ai

Temvideo.ai 是一款面向电商、内容创作者与品牌商的 AI 视频生成 /编辑平台,通过 AI-agent 和模板机制,将图片、脚本或产品素材自动生成广告视频、产品展示、社交媒体短视频等,大幅节省剪辑与制作时间,适合电商卖家、内容创作者、跨境品牌快速输出优质视频。
01990
GELab-Zero

GELab-Zero

GELab-Zero 是由 StepFun AI 团队开源的一款轻量级 GUI Agent — 能本地部署、运行于普通硬件上的 4B GUI 智能体,支持跨 App 界面自动交互、多设备任务分发、隐私保护,适合开发者、自动化工程师、普通用户用于手机 /移动设备自动化、批量操作、任务自动化和智能脚本构建。
01450
Spokenly

Spokenly

Spokenly 是一款适用于 macOS / iOS 的智能语音听写与语音-驱动输入工具,支持 100+ 语言、离线转写与云服务、实时语音转文字、AI 文本润色、语音命令控制,适合写作、会议记录、聊天、编程、文档编辑等各种文本输入场景。
02070
StepAudio R1

StepAudio R1

StepAudio R1 是首个真正能对音频进行“Chain-of-Thought(CoT)推理 / 深度分析”的开源音频语言模型,支持对说话、音乐、环境音进行理解、推理与分析,适合开发者、研究者、内容创作者用于音频理解、分析、检索与多模态工具构建。
01900
闪电说

闪电说

闪电说是一款端侧优先的 AI 语音输入工具,主打毫秒级语音识别与本地处理,支持 Windows 和 macOS。它通过 AI 优化和即时转写,让语音输入比传统键盘快 4 倍,同时保护用户隐私,适合写作、编程、聊天、会议记录等多种场景。
04290
Uigenius

Uigenius

Uigenius 是一款 AI 辅助 UI/UX 设计工具 —— 通过自然语言、手绘草图或截图,就能快速生成高保真界面原型并一键导出 HTML / Vue / React 代码,是产品经理、设计师、开发者、初创团队加速原型与开发效率的有力助手。
02420
Depth Anything 3

Depth Anything 3

Depth Anything 3 (DA3) 是 ByteDance-Seed 团队开源的下一代通用 3D 视觉重建模型,可从任意数量与任意视角的图像/视频输入中恢复空间一致的 3D 几何结构,包括深度图、相机位姿、三维点云与新视图合成,非常适合视觉创作者、3D 艺术师、研究者与开发者进行几何估计、3D 重建与视觉内容创作。
02530
讯飞输入法

讯飞输入法

讯飞输入法是由 科大讯飞 出品的一款多模式智能中文输入法,支持语音、拼音、手写、拍照 OCR、方言识别等多种输入方式,并可高度自定义键盘皮肤与输入体验,适合日常聊天、办公、学习与跨语言沟通用户。
02290
ChatExcel

ChatExcel

ChatExcel 是一款由 AI 驱动的“聊天式 Excel”工具 —— 通过自然语言与表格对话,就能完成数据分析、公式生成、表格清洗、图表制作等复杂操作,显著降低 Excel 使用门槛。
02,7080