UnityVideo一个面向 AI 研究与工具使用者的多模态、多任务视频生成框架,通过统一视觉模态(例如深度、光流、骨骼和分割掩码等)与训练范式,显著提升 AI 视频合成的质量、一致性与现实世界对齐能力。本文深度介绍 UnityVideo 的原理、技术构成、应用场景与常见问题解答。0950最近收录AI框架与库# AI视频生成框架
Gemini TTSGemini TTS 是 Google 最新的文本转语音(Text-to-Speech)技术,通过 Gemini API 或 Google AI Studio 提供高质量、多语言、多角色语音合成服务。支持细粒度风格、语速、情绪与多语音输出控制,并可用于播客、课程、辅助工具与互动应用等场景。0620API与SDK内容创作# AI语音合成# 多语言支持# 文本转语音
Gemini Deep ResearchGemini Deep Research 是由 Google 发布的高级研究型 AI 代理,通过 Gemini API(Interactions API)支持复杂多步骤研究任务自动规划、搜索、阅读与综合,能够生成详尽的报告并融合 Web 与自有数据资源,是构建自动化智能研究、市场分析、竞争情报与长流程信息整合的利器。0730API与SDK最近收录AI# AI Agent
GPT-5.1-Codex-MaxGPT-5.1-Codex-Max 是 OpenAI 最新推出的前沿编程 AI 模型,具备长任务处理、多窗口上下文 (compaction)、更高效率和更强智能推理能力。01050最近收录AI编程工具# AI编程助手
PYPROXYPYPROXY擁有超過9000萬個真實住宅ip,覆蓋190多個國家,提供最強大、最靈活的代理網絡。快速可靠的服務,實惠的價格和專業的支持團隊-您的首選解決方案,優質代理基礎設施,爲您的業務提供最佳代理。02840API与SDK大模型 API# AI模型训练# SEO优化# 数字营销
OceanBase PowerRAGOceanBase PowerRAG 是一款开箱即用的 RAG 应用开发工具,打通数据层、检索层与生成层,为 AI 工具使用者提供文档知识库、智能问答、图像比对、数据分析等全流程能力。03840API与SDK最近收录AI# AI 检索增强生成
SuperDesignSuperDesign 是首款开源设计 Agent,内嵌 IDE 内,通过自然语言生成 UI Mockup、组件与线框布局,适合 AI 工具使用者快速构建设计原型。04550开源工具与社区最近收录AI# AI Agent# 自然语言生成 UI
MonkeyCodeMonkeyCode 是长亭科技开源的企业级智能编程助手,支持私有化部署、离线使用、自然语言编程与代码安全扫描,适合 AI 工具使用者在研发团队中提升效率与品质。03780企业用户开源工具与社区# AI代码补全# AI编程助手# 自然语言编程
Qwen3‑CoderQwen3‑Coder 是阿里巴巴开源的最强 AI 编码模型,采用 480B MoE 架构,支持 256K–1M 长上下文、Agentic 自动编程,性能媲美 Claude Sonnet 和 GPT‑4,为 AI 工具使用者提供顶级本地部署代码助手。03190开源工具与社区最近收录AI# Agentic 编程能力# AI代码生成
ShellAgent 2.0ShellAgent 2.0 是 MyShell 推出的零代码应用构建工具,用户通过自然语言即可创建、部署和货币化 AI 应用,适合 AI 工具使用者快速搭建生产级 Agent。03460最近收录AI模型管理与部署# AI助手开发# AI零代码开发# 应用生成Agent
Seed‑XSeed‑X 是 ByteDance Seed 团队开源的 7B 多语言翻译 LLM,支持 28 种语言双向翻译,性能媲美 Gemini‑2.5、GPT‑4、DeepSeek‑R1,适合希望构建本地翻译系统的 AI 工具使用者。04990大模型开源工具与社区# 多语言翻译模型
OpenReasoning‑NemotronOpenReasoning‑Nemotron 是一个开源推理增强 LLM 系列,采用 DeepSeek‑R1 蒸馏技术,在数学、科学与代码问答任务中实现 SOTA 性能,支持 GenSelect 多路径生成,适合 AI 工具使用者加强推理能力。02670大模型最近收录AI# 小体量推理模型
OpenBBOpenBB 是一个开源、可扩展的金融数据与投资研究平台,提供 CLI、Python SDK、Web API 和 Workspace,可接入多源数据并支持 AI 助手,适合 AI 工具使用者与金融分析师使用。04660API与SDK开源工具与社区# AI金融分析助手# AI金融研究工具
BytePlusBytePlus是字节跳动旗下 AI 平台,为开发者和企业提供图像生成、语音识别、推荐系统、增强现实等一站式 AI 能力,适合 AI 工具使用者构建复杂智能应用。03880API与SDK企业用户# AI图像生成# AI视觉增强# 全栈AI服务
Trae SoloTRAE SOLO 是 ByteDance 推出的全流程自动化开发助手,通过“上下文工程”实现从需求到部署的端到端软件交付,支持开发者、产品经理与小团队高效协作。02140最近收录AI编程工具# AI编程工具# AI编程平台# Context Engineer
RoboOS 2.0RoboOS 2.0 是北京智源研究院推出的开源多智能体机器人操作系统,支持跨形体协作、集成 RoboBrain 认知大脑、技能库和共享内存,为 AI 工具使用者提供部署机器人智能系统的完整解决方案。03840API与SDK开源工具与社区
Grok 4Grok 4 是 xAI 推出的最新大语言模型,具备实时网络搜索、原生工具调用、多 Agent 推理与多模态能力,适合开发者与 AI 工具使用者用于复杂推理与多场景部署。02050API与SDK大模型# AI实时搜索# 多Agent架构# 强化学习
Skywork‑R1V 3.0Skywork‑R1V 3.0 是一款开源的多模态视觉‑语言推理模型,采用视觉 CoT、强化学习优化,在 MMMU、MathVista 等多项测试中实现开源最佳性能,适合 AI 工具使用者部署与实验。03920大模型开源工具与社区# AI Agent# 多模态模型# 视觉模型
HumanOmniV2全面解析 HumanOmniV2——多模态推理大模型,聚焦上下文理解与人类意图识别,兼具视觉、语音与逻辑评估能力,助力 AI 工具使用者构建更智能的人机交互系统。03580大模型最近收录AI# 多模态推理模型
Hunyuan3D‑PolyGenHunyuan3D‑PolyGen 是腾讯混元3D系列的最新旗舰级模型,以生产级“Art‑Grade”网格拓扑为目标,支持三角/四边形网格、高压缩编码与自动重拓扑,能减少 70% 制作时间、提升 35% 拓扑整洁度,是游戏开发者与 3D 艺术师的创作助力。03120API与SDK大模型# AI 3D艺术设计# AI游戏开发
NativeMindNativeMind 是一款完全本地运行、开源隐私保护的浏览器 AI 插件,通过集成 Ollama 在浏览器端使用强大开源大模型,支持多模型切换、网页摘要、跨标签聊天、隐私搜索与文本润色,适合注重数据安全的 AI 工具使用者。03060大模型最近收录AI# AI写作辅助# AI文本润色# AI浏览器插件
Higress MCPHigress MCP 是阿里巴巴开源的 AI 原生 API 网关,支持将 OpenAPI 接口一键转换为 Model Context Protocol (MCP) 服务,提供跨模型统一调用、多模型负载均衡、细粒度认证及审计日志,助力 AI 工具使用者高效接入实际业务系统。02800API与SDK开源工具与社区# MCP插件
CodeBuddy IDECodeBuddy IDE 是一款 AI 驱动的全流程开发平台,通过智能代码生成、架构规划、实时部署与多模型集成,让 AI 工具使用者与非技术创意者也能“从想法到上线”快速构建可扩展应用。03020最近收录AI编程工具# AI代码生成# AI原生编码# AI开发伙伴
FlashDocsFlashDocs 是首款 AI 驱动的演示文稿自动化平台,通过 API、PPT 和 Google Slides 插件,实现从 Markdown、数据表、图表一键生成品牌化、有模板可控的专业幻灯片,适合 AI 工具使用者与开发者高效集成流程。02200API与SDK最近收录AI
TRAE AgentTRAE Agent 是字节跳动开源的一款 LLM 驱动的智能代码助手,通过命令行接口支持多模型、多工具组合,可自动完成软件工程任务,适合 AI 工具使用者构建高效开发流程。03020最近收录AI集成开发环境(IDE)# AI Agent# AI IDE# AI修复BUG
DeepSeek R1T2DeepSeek R1T2 Chimera 是 TNG Technology Consulting 基于 Assembly‑of‑Experts 方法打造的 Tri‑Mind 混合型 LLM,兼顾高推理能力、低延迟与开放开源,适合 AI 工具使用者在本地部署高效问答与生成任务。02320大模型开源工具与社区# AI问答机器人# 混合式大语言模型
Kyutai TTSKyutai TTS 是 Kyutai 团队首个实时流式文本转语音模型,支持英语和法语,具备声线克隆、超低延迟(约220ms)、长音频稳定输出与字级时间戳,可部署本地化、适配 LLM,对 AI 工具使用者极具吸引力。03120大模型开源工具与社区# AI声线克隆# 实时流式文本转语音模型# 文本转语音
DyadDyad 是一款免费、开源、可本地运行的 AI 应用构建平台,支持无锁定环境、多模型接入、即时预览与 Pro 增强模式,适合开发者与创作者快速构建 AI 聊天、工具、代码助手等应用。06820API与SDK开源工具与社区# AI代码助手# AI写作助手# AI多模型接入
课件帮“课件帮”是一款由天源迪科推出的AI智能课件制作平台,支持一键生成PPT课件、转视频微课、智能出题和数字人讲解,助力教育者和职场人士提升内容制作效率。03520API与SDK教育与学习# AI PPT制作# AI数字人# AI智能课件制作平台
AlphaGenomeAlphaGenome 是 Google DeepMind 推出的革命性 AI 基因组模型,可处理高达一百万碱基对的 DNA 序列,在单碱基分辨率下预测上千种分子功能特征,并通过对比分析突变效应助力疾病与生物学研究,将“基因暗物质”转化为可解释信息。02740API与SDK大模型# AI基因组模型
Gemini CLIGemini CLI 是 Google 发布的开源 AI 终端代理,通过将 Gemini 2.5 Pro 引入命令行,让开发者无需切换环境即可编写代码、调试、生成内容和执行任务,支持 Model Context Protocol、搜索集成与脚本自动化,个人账户即可免费获得 60 次/分钟、1 000 次/天额度,是开发效率的强力提升工具。02710免费AI工具开源工具与社区# AI代码辅助# AI内容创作# AI终端代理
Seed1.6Seed1.6 是字节跳动火山引擎最新推出的多模态大模型系列,支持256K超长上下文、多模态理解、深度思考与 GUI 操作,拥有“全能版”、“思考版”与“极速版”等多种配置,性能、响应速度和成本都实现显著突破。03100API与SDK大模型# AI内容创作# AI编程助手# 大语言模型
Gemini Robotics On‑DeviceGemini Robotics On‑Device 是 Google DeepMind 推出的本地运行 VLA(Vision‑Language‑Action)机器人模型,具备高通用性、高灵活性和低延迟响应,能在无互联网环境中执行复杂操作任务,并通过 SDK 支持快速定制化与开发者部署。03580API与SDK制造业与工业# 机器人模型
11.ai11ai,即 ElevenLabs,由 Piotr Dąbkowski 和 Mati Staniszewski 于 2022 年创办,总部位于纽约,专注于开发高质量语音合成与克隆技术。02730API与SDK最近收录AI# AI播客制作# AI有声书# AI语音克隆
子曰3(Confucius3‑Math)子曰3(Confucius3‑Math)是网易有道开源的 14B 数学大模型,专注 K‑12 教育,具备高考题 98.5 分实力,可在 RTX 4090 D 单卡上运行,服务成本仅 0.15 美元/百万 tokens,性价比极高。01880大模型开源工具与社区# AI数学辅导工具# K‑12 数学教育# 数学推理大模型
Comate AI IDEComate AI IDE 是百度推出的下一代 AI 编程助手,融合 ERNIE/Wenxin 大模型,支持一键草稿转代码、自动补全、单元测试生成、AI 问答等全流程功能,覆盖 100+ 语言及主流 IDE,显著提升开发效率,适合开发者及企业用户。01680最近收录AI编程工具# AI 原生开发工具# AI 编程助手# AI代码生成
IttybitIttybit 是一款专为开发者设计的多媒体 API 平台,提供跨平台视频、音频和图像存储、处理、转码、分析、字幕生成与自动处理工作流程,配备全球 CDN 和 AI 智能服务,助力 AI 工具使用者高效集成媒体功能。01900API与SDK最近收录AI
Surge AISurge AI 是一款领先的 AI 数据标注平台,为语言模型、内容审核与搜索排序等提供高质量的人类反馈与 RLHF 服务,凭借高标准质控、专家标注团队及实时 API 接入,已帮助 OpenAI、Anthropic、Cohere 等公司提升模型性能,是 AI 工具使用者首选。04570API与SDK最近收录AI# AI内容审核# AI数据标注# 搜索质量评估
MoonBitMoonBit 是一款专为 AI 原生构建的通用编程语言与开发平台,支持 WebAssembly、JS、Native 多后端,具备内置 AI 助手、云 IDE 与高性能工具链,帮助开发者快速构建高质量系统。03480开源工具与社区最近收录AI# AI原生语言设计# AI辅助开发
Kontext AIKontext AI 利用先进的 FLUX Kontext 模型,提供上下文感知的图像生成与编辑服务,支持文本+图像提示、角色一致编辑、高速响应,适合设计师、内容创作者与营销人员。02330API与SDK免费AI工具# AI图像生成# AI图像编辑# AI图片增强
Redirecting…Kimi‑Dev 是 MoonshotAI 推出的开源 编码 LLM,采用强化学习方案 BugFixer 与 TestWriter 双模架构,支持自动补丁生成、测试编写,SWE‑bench 验证准确率达 60.4%,适合开发者和研究者部署使用。03400免费AI工具大模型# 编码大语言模型
DreamActor‑H1DreamActor-H1 是首款高保真人-商品演示视频生成模型,采用 Diffusion Transformer、3D 姿态引导与语义增强技术,在电商中实现真实手势交互与产品呈现。03430大模型开源工具与社区# AI电商平台内容生成# AI高保真视频生成# 视频生成模型