功能类型

共 790 篇网址

AI商业 AI常用工具 AI教育 AI服装设计 AI热门产品 AI生活助理 SEO优化与推广 SEO工具专业自媒体交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图文图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN 外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 API AI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI 精选AI 集成开发环境（IDE）免费AI工具

自然语言处理（NLP）计算机视觉语音识别与生成数据分析与预测自动化与机器人智能推荐系统自主智能系统

排序

发布更新浏览点赞

Firecrawl

Mendable AI 推出的一款开源 AI 深度研究工具，旨在通过智能搜索和内容合成，帮助用户高效获取高质量的信息。

02610

教育与学习最近收录AI # AI内容合成 # AI搜索

Banana Slides

一个基于 nano banana pro 强大模型的开源 AI PPT 生成工具，它如何通过自然语言驱动、文件解析与素材上传等机制实现高质量、定制化的演示文稿自动生成，适用于个人用户与开发者场景。本文系统梳理核心功能、技术架构、使用方法与常见问题。

02550

最近收录AI 计算机视觉 # AI PPT 生成工具

Depth Anything 3

Depth Anything 3 (DA3) 是 ByteDance-Seed 团队开源的下一代通用 3D 视觉重建模型，可从任意数量与任意视角的图像／视频输入中恢复空间一致的 3D 几何结构，包括深度图、相机位姿、三维点云与新视图合成，非常适合视觉创作者、3D 艺术师、研究者与开发者进行几何估计、3D 重建与视觉内容创作。

02550

内容创作大模型 # AI 3D艺术

Buzz Cut Filter

一款让你轻松预览剃光头风格的 AI 工具快速预览剃光头效果，无需剃发即可在线体验多种短发风格，适合好奇尝试、新造型预览和社交娱乐。

02550

最近收录AI 计算机视觉 # AI人脸识别 # AI内容创作 # AI在线图片处理工具

MovieFlow

MovieFlow 是一款基于人工智能的全自动视频创作与影片生成平台，它能够将用户的故事描述、剧本或简单提示转化为完整的高质量视频作品。

02540

最近收录AI 计算机视觉 # AI 视频创作平台

GeminiGen AI

一个基于先进人工智能的多模态内容生成平台。

02530

内容创作教育与学习 # AI 图像生成 # AI 视频生成 # AI 语音生成

Questas

Questas 是一款 AI 驱动的互动故事与多媒体内容生成平台，允许用户通过文字提示快速生成图像与视频，并构建“分支／选择你的冒险 (choose-your-own-adventure)”式的互动故事。适合创作者、教育者、游戏设计师、小团队与内容运营者，无需编程或美术基础，即可打造沉浸式故事体验。

02530

内容创作娱乐媒体 # AI视频生成工具 # 故事编辑器 # 文生图

Tbox AI 浏览器

Tbox AI 浏览器是一款为内容创作与知识管理而设计的智能浏览器，通过网页剪藏、AI 辅助写作 /摘要 /翻译 /知识库整理等功能，帮助创作者、内容运营者和知识工作者高效获取、整理与再创作信息。

02500

最近收录AI 自主智能系统 # AI浏览器

Fotor

Fotor 以其全面且高效的图片编辑功能，成为了现代数字创意和营销的重要工具，让用户在快速处理图片的同时，也能尽情释放创意灵感。

02500

计算机视觉 # AI吉卜力风格 # AI图片编辑器 # AI抠图

Qwen-Image-Layered

由 Qwen 团队开发的图像分层 AI 模型，可以将单张图像自动分解成多个可独立可编辑的 RGBA 图层，实现类似专业图像编辑软件的分层操作。

02490

大模型开源工具与社区 # 图像分层模型

GPT-5.1-Codex-Max

GPT-5.1-Codex-Max 是 OpenAI 最新推出的前沿编程 AI 模型，具备长任务处理、多窗口上下文 (compaction)、更高效率和更强智能推理能力。

02490

最近收录AI 编程工具 # AI编程助手

Vora

Vora 是一个由 Fineshare 提供的 AI 视频生成与编辑平台，支持将文本提示或图片转换为高清、无水印、带配音的视频，也支持提示词生成、视频增强与水印移除，是内容创作者、电商卖家、营销人员、社交媒体运营者制作短视频与广告视频的便捷工具。

02440

内容创作最近收录AI # AI视频内容创作 # AI视频增强 # AI视频生成工具

NitroGen

一个全新的视觉-动作基础模型（Vision-Action Foundation Model），由 NVIDIA 等机构联合研发并开源，专注于通用游戏智能体的学习与控制。

02420

大模型最近收录AI # AI游戏开发 # AI视觉编码器

Google Workspace Studio

Google Workspace Studio 是 Google 推出的 no-code AI 代理构建平台，允许用户通过自然语言在 Gmail、Drive、Chat、Docs 等 Workspace 应用中一键创建、管理和共享智能 AI agent，自动化日常任务与复杂工作流程，适合企业、团队及普通用户提升办公效率。

02420

最近收录AI 编程工具 # AI Agent # AI-powered agent

SkyBot

SkyBot 是 Skywork 平台推出的 7×24 小时云端 AI 助理，基于 Cloud VM 与即时通讯集成，可主动执行多步骤复杂任务、长期记忆用户偏好，并支持 WhatsApp、Telegram 等 IM 工具实时交互，用于信息整理、数据分析、自动化任务及个人办公流程管理。

02390

最近收录AI 自主智能系统 # 云端AI助理 # 即时通讯交互 # 多步骤任务执行

PosterCopilot

PosterCopilot 是由南京大学、LibLib.ai 与中国科学院自动化所联合推出的 AI 海报设计框架，通过布局推理、审美强化学习与分层可控编辑，为专业海报布局和设计流程提供自动化与迭代式编辑能力，适合设计师、营销人员与创意团队使用。

02370

开源工具与社区最近收录AI # AI海报设计 # AI视觉艺术

Workus

Workus 是一个基于 AI 智能代理的 B2B 商业网络平台，用于自动识别高意向买家、优化客户开发流程、实现多渠道智能沟通与高价值商机交付。

02360

企业用户最近收录AI # AI 智能代理 # 动态优化反馈 # 商机交付

Runable

一个基于人工智能的创意生成与数字任务自动化平台，支持通过自然语言提示创建幻灯片、网站、报告、播客、图像、文档和视频等各类内容，帮助用户显著提升内容创作与工作效率。

02350

最近收录AI 自主智能系统 # AI 幻灯片生成 # AI创意生成 # AI报告撰写

Kairos 3.0

大晓机器人推出的开源世界模型，专为具身智能、机器人环境理解与动态预测设计。

02350

大模型开源工具与社区 # 世界模型 # 图像转视频 # 文本转视频

字节跳动Seed

字节跳动发布的通用 Agent AI 模型。

02330

大模型最近收录AI # Agent 大模型 # 多模态智能体

GPT Image 1.5

OpenAI 发布的最新图像生成与编辑 AI 模型，作为 ChatGPT Images 的核心引擎，它以最高达 4× 更快的生成速度、更强的指令执行力、精细细节保留与创意转换能力为特性，支持创意图像生成、照片编辑与视觉工作流自动化。

02330

内容创作大模型 # AI图像生成模型 # AI图像编辑模型 # 文本生成图像

SHARP

苹果推出的开源单目视图 3D 场景合成模型。

02320

内容创作大模型 # AI 3D渲染

可灵O1

可灵O1 是由可灵AI 发布的全球首款统一多模态视频生成大模型，支持图片、视频与文字混合输入，实现从文生图／文生视频／图生视频到视频编辑的一站式创作流程，适合内容创作者、电商、广告商与自媒体用户快速生成短视频与营销内容。

02320

大模型最近收录AI # AI图像生成 # AI视频创作工具 # AI视频创作平台

讯飞输入法

讯飞输入法是由科大讯飞出品的一款多模式智能中文输入法，支持语音、拼音、手写、拍照 OCR、方言识别等多种输入方式，并可高度自定义键盘皮肤与输入体验，适合日常聊天、办公、学习与跨语言沟通用户。

02300

内容创作最近收录AI # AI输入法

Z-Image

Z-Image 是阿里通义 (Tongyi MAI) 发布的高效 6 B 图像生成与编辑基础模型，支持高逼真度渲染、中英双语文本、低资源运行与快速推理，为创作者、设计师和开发者提供了兼顾质量与效率的开放图像生成方案。

02300

大模型开源工具与社区 # AI图像生成模型 # AI图像编辑模型 # 文生图

OctoCodingBench

OctoCodingBench 是一个针对编码智能体评估的数据集，包含多源指令任务、系统提示与评估检查项，用于测量智能体在多样编码任务中的规则遵从性与执行能力。

02270

最近收录AI 自主智能系统 # Docker 任务环境 # 指令遵从评估 # 智能体评估

Gemini Deep Research

Gemini Deep Research 是由 Google 发布的高级研究型 AI 代理，通过 Gemini API（Interactions API）支持复杂多步骤研究任务自动规划、搜索、阅读与综合，能够生成详尽的报告并融合 Web 与自有数据资源，是构建自动化智能研究、市场分析、竞争情报与长流程信息整合的利器。

02270

API与SDK 最近收录AI # AI Agent

Disco

Google 最新推出的实验性 AI 浏览体验，该工具由Gemini 3 大模型驱动，通过自动将浏览器标签页转化为交互式 Web 应用（称为 GenTabs），重新定义浏览器与 AI 协作体验。本文面向 AI 工具使用者详细介绍其核心功能、使用方式、优势与常见问题。

02240

最近收录AI 自主智能系统 # AI浏览器

PallasAI

Pallas AI 是一款专注于 AI 时代品牌 /内容 /营销优化的 GEO-Agent 平台，通过自动化诊断、内容生成、竞争分析与实时监控，帮助品牌提升在 AI 搜索与对话推荐中的可见性，适合品牌主、电商卖家、内容运营者、小团队使用。

02230

最近收录AI 自然语言处理（NLP）# AI SEO # AI搜索优化 # AI营销

AgentCPM-Explore

AgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型，在多项长程智能体基准测试中取得领先表现，支持超 100 轮持续环境交互，并提供配套的开源训练与评测基础设施。

02220

大模型开源工具与社区 # 强化学习框架 # 智能体模型 # 端侧部署

Claude-Mem

Claude-Mem 是一个专为 Claude Code 设计的开源持久记忆插件，通过自动捕获 AI 会话中的上下文、工具调用和观察，并将经 AI 压缩与结构化后的关键信息注入未来会话，实现跨会话记忆持续、语义搜索与自然语言历史检索等功能，大幅提升长期项目协作体验。

02190

开源工具与社区最近收录AI

黄小仙来也

一个基于人工智能与东方命理融合的在线 AI 八字分析与命理服务平台，提供八字排盘、深度报告、正缘画像、AI 命理助理和每日宜忌等功能。

02160

最近收录AI 自然语言处理（NLP）# AI 命理分析平台

Gemini 3 DeepThink

Gemini 3 DeepThink 是 Google 推出的新版 AI 推理 /多模态模型，通过增强算力与并行推理机制，实现对复杂数学、科学、逻辑、编程、创意任务的深度思考与解决，是科研、学习、开发、创作和高级思维任务用户的新利器。

02160

教育者与研究人员最近收录AI # Agentic

VoiceSculptor

VoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成（Instruct TTS）系统，基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性，并可用于声音设计与语音合成任务。

02150

开源工具与社区最近收录AI # AI语音克隆

Mulan

一款基于 AI 的创新视频创作平台，包括其核心功能、产品优势、使用指南与用户常见问题解答。

02140

内容创作最近收录AI # AI视频创作 # AI视频生成平台

FLUX.2 [klein]

FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族，支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能，适用于研究、开发和交互式视觉智能应用。

02130

大模型开源工具与社区 # 低延迟推理 # 多参考图像支持 # 实时图像生成

WorkAny Bot

WorkAny Bot 是基于 OpenClaw 框架的云端 AI 智能体，支持 7×24 小时在线运行、接入多种 AI 模型、自定义插件及多渠道交互。它具备长期记忆、任务执行与自动化能力，可通过 Web 或即时通讯应用完成查询、内容生成、编程支持及办公自动化等任务。

02110

最近收录AI 自主智能系统 # AI智能体 # 持续在线 # 插件扩展

Spokenly

Spokenly 是一款适用于 macOS / iOS 的智能语音听写与语音-驱动输入工具，支持 100+ 语言、离线转写与云服务、实时语音转文字、AI 文本润色、语音命令控制，适合写作、会议记录、聊天、编程、文档编辑等各种文本输入场景。

02090

最近收录AI 语音识别与生成 # AI语音转文字

Bandy AI

什么是 Bandy AI Bandy AI 是一款专注于电...

02080

最近收录AI 计算机视觉 # 电商AI agent

Seedance 1.5 Pro

字节跳动 Seed 团队最新发布的音视频联合生成 AI 模型。该模型具备专业级音画同步、高质量视频生成、复杂叙事理解与多模态输入支持，为内容创作者及 AI 工具使用者提供强大的短片和影视级视频创作能力。

02080

内容创作大模型 # AI情感短片视频生成 # AI视频生成 # 音视频联合生成模型

Gemini TTS

Gemini TTS 是 Google 最新的文本转语音（Text-to-Speech）技术，通过 Gemini API 或 Google AI Studio 提供高质量、多语言、多角色语音合成服务。支持细粒度风格、语速、情绪与多语音输出控制，并可用于播客、课程、辅助工具与互动应用等场景。

02080

API与SDK 内容创作 # AI语音合成 # 多语言支持 # 文本转语音

Laper

一个专为编剧和影视创作者打造的 AI 剧本创作与协作平台。

02070

内容创作最近收录AI # AI剧本创作平台 # AI剧本生成

Vidu Agent

Vidu 团队推出的 AI 视频创作智能体平台，通过“一键成片”技术与自动分镜编排，实现从视觉输入到成品输出的全流程视频生成，适用于广告、产品展示、短片与创意视频等多种场景。

02040

内容创作最近收录AI # AI分镜编辑 # AI视频创作智能体平台 # AI视频生成工具

FLUX.2

FLUX.2 是 Black Forest Labs 推出的新一代 AI 图像生成与编辑模型，支持最多 10 张参考图、多参考融合、高达 4MP 的高精度输出、复杂文本渲染和品牌级一致性，适合设计师、营销、产品可视化和创意团队进行专业级图像创作。

02030

内容创作大模型 # AI图像模型 # AI图像编辑 # 文生图像

GPT-5.3 Codex

GPT-5.3 Codex 是 OpenAI 于 2026 年推出的最新编码与智能代理模型变体，集成于 Codex 生态系统中，针对真实软件工程任务、代理协作和长流程执行进行了优化，提供跨环境集成与专业工作流支持。

02020

最近收录AI 编程工具 # GPT-5.3-Codex # 专业推理 # 智能代理

NeverCap

一款提供“真正无限”AI 音频与视频转录服务的平台。

02020

教育者与研究人员最近收录AI # AI视频转录 # AI音频转录

Temvideo.ai

Temvideo.ai 是一款面向电商、内容创作者与品牌商的 AI 视频生成 /编辑平台，通过 AI-agent 和模板机制，将图片、脚本或产品素材自动生成广告视频、产品展示、社交媒体短视频等，大幅节省剪辑与制作时间，适合电商卖家、内容创作者、跨境品牌快速输出优质视频。

02020

内容创作最近收录AI # AI 视频 Agent # AI电商助手 # AI视频智能体

FrogBoss

FrogBoss 是由微软研究院研究团队利用复杂合成 bug 生成方法（BugPilot）训练出的开源编程智能体模型，专用于软件工程任务评估与调试技能提升，在 SWE-Bench-Verified 等基准测试中达到领先表现。

01990

大模型最近收录AI # SWE-Bench-Verified 基准 # 合成 bug 训练 # 复杂 bug 生成

SAM Audio

Meta 推出的统一多模态音频分离 AI 模型。

01970

大模型最近收录AI # AI音频处理 # 多模态音频分离模型

StepAudio R1

StepAudio R1 是首个真正能对音频进行“Chain-of-Thought（CoT）推理 / 深度分析”的开源音频语言模型，支持对说话、音乐、环境音进行理解、推理与分析，适合开发者、研究者、内容创作者用于音频理解、分析、检索与多模态工具构建。

01910

开源工具与社区最近收录AI

AI大学堂