AI工具导航
AI工具导航站长导航教师导航服装业导航自媒体导航娱乐业导航
  • AI工具应用集
  • AI博客文章
  • 账号购买
    • 账号合租
  • AI投稿
  • AI排行榜
  • 提示词商城
      • 未登录
        登录后即可体验更多功能
    • AI工具应用集
    • AI博客文章
    • 账号购买
      • 账号合租
    • AI投稿
    • AI排行榜
    • 提示词商城
    未登录
    登录后即可体验更多功能

    功能类型

    共 778 篇网址
    AI商业AI常用工具AI教育AI服装设计AI热门产品AI生活助理SEO优化与推广SEO工具交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 APIAI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI精选AI集成开发环境(IDE)免费AI工具
    自然语言处理(NLP)计算机视觉语音识别与生成数据分析与预测自动化与机器人智能推荐系统自主智能系统
    排序
    发布更新浏览点赞
    Vidu Q2参考生Pro

    Vidu Q2参考生Pro

    Vidu Q2参考生Pro 是 Vidu 平台推出的参考生视频生成模型,支持多模态输入(视频与图片),用于生成高一致性、精细化的视频内容,涵盖人物、场景、动作与特效等创作需求。
    050
    大模型最近收录AI# AI视频编辑# Vidu Q2参考生Pro# 人物表情迁移
    VibeVoice-ASR

    VibeVoice-ASR

    VibeVoice-ASR 是微软开源的一体化自动语音识别(ASR)模型,支持单次处理最长约 60 分钟连续音频,并输出包含说话者标识、时间戳与转录文本的结构化结果,适用于会议、讲座、播客等长音频语音识别场景。
    080
    最近收录AI语音识别与生成# 时间戳# 热词识别# 结构化转录
    Clawdbot

    Clawdbot

    Clawdbot 是开源的自托管 AI 助手与智能代理系统,可在本地运行并与 WhatsApp、Telegram、Discord、Signal、iMessage 等通信平台集成,支持消息响应、自动化任务执行、持久上下文记忆与扩展技能安装。
    0100
    AI常用工具最近收录AI# 持久 context 记忆# 插件技能系统# 本地 AI 助手
    FrogBoss

    FrogBoss

    FrogBoss 是由微软研究院研究团队利用复杂合成 bug 生成方法(BugPilot)训练出的开源编程智能体模型,专用于软件工程任务评估与调试技能提升,在 SWE-Bench-Verified 等基准测试中达到领先表现。
    0210
    大模型最近收录AI# SWE-Bench-Verified 基准# 合成 bug 训练# 复杂 bug 生成
    AgentCPM-Explore

    AgentCPM-Explore

    AgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。
    0330
    大模型开源工具与社区# 强化学习框架# 智能体模型# 端侧部署
    TranslateGemma

    TranslateGemma

    TranslateGemma 是 Google 推出的开放式多语言机器翻译模型系列,基于 Gemma 3 架构构建,支持 55 种语言的文本与图像内文字翻译,提供多种参数规模以适应不同部署场景。
    0340
    大模型开源工具与社区# Gemma 3# 图像内文字翻译# 多语言翻译
    FLUX.2 [klein]

    FLUX.2 [klein]

    FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族,支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能,适用于研究、开发和交互式视觉智能应用。
    0360
    大模型开源工具与社区# 低延迟推理# 多参考图像支持# 实时图像生成
    Workus

    Workus

    Workus 是一个基于 AI 智能代理的 B2B 商业网络平台,用于自动识别高意向买家、优化客户开发流程、实现多渠道智能沟通与高价值商机交付。
    0300
    企业用户最近收录AI# AI 智能代理# 动态优化反馈# 商机交付
    OctoCodingBench

    OctoCodingBench

    OctoCodingBench 是一个针对编码智能体评估的数据集,包含多源指令任务、系统提示与评估检查项,用于测量智能体在多样编码任务中的规则遵从性与执行能力。
    0260
    最近收录AI自主智能系统# Docker 任务环境# 指令遵从评估# 智能体评估
    女娲智能体OS

    女娲智能体OS

    女娲智能体OS 是一个通用智能体操作系统平台,支持零代码 AI 智能体创建、工作流编排、RAG 知识库与多端发布,旨在为 AI 工具使用者提供开发、部署与管理智能体的能力。
    0440
    企业用户最近收录AI# RAG 知识库# 工作流自动化# 通用智能体
    VoiceSculptor

    VoiceSculptor

    VoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。
    0410
    开源工具与社区最近收录AI# AI语音克隆
    黄小仙来也

    黄小仙来也

    一个基于人工智能与东方命理融合的在线 AI 八字分析与命理服务平台,提供八字排盘、深度报告、正缘画像、AI 命理助理和每日宜忌等功能。
    0300
    最近收录AI自然语言处理(NLP)# AI 命理分析平台
    UI-TARS Desktop

    UI-TARS Desktop

    UI-TARS Desktop 是由字节跳动开源的桌面端 GUI Agent 工具,基于 UI-TARS 视觉语言模型(VLM),可通过自然语言控制计算机界面,实现图形界面识别与操作。
    0360
    大模型开源工具与社区# 桌面 GUI Agent# 视觉语言模型(VLM)
    Vidu Agent

    Vidu Agent

    Vidu 团队推出的 AI 视频创作智能体平台,通过“一键成片”技术与自动分镜编排,实现从视觉输入到成品输出的全流程视频生成,适用于广告、产品展示、短片与创意视频等多种场景。
    0430
    内容创作最近收录AI# AI分镜编辑# AI视频创作智能体平台# AI视频生成工具
    01Agent

    01Agent

    面向内容创作者的一站式 AI 图文创作智能体平台,支持从智能选题、图文生成、视觉设计、智能排版到多平台发布的全流程自动化内容创作。
    0460
    内容创作最近收录AI# 01Agent# 01Editor# AI图文创作
    NitroGen

    NitroGen

    一个全新的视觉-动作基础模型(Vision-Action Foundation Model),由 NVIDIA 等机构联合研发并开源,专注于通用游戏智能体的学习与控制。
    0530
    大模型最近收录AI# AI游戏开发# AI视觉编码器
    Step-DeepResearch

    Step-DeepResearch

    一款由 StepFun 团队开源的 端到端深度研究智能体 AI 模型。
    0590
    大模型开源工具与社区# agent# 反思调整# 多轮信息检索
    Runable

    Runable

    一个基于人工智能的 创意生成与数字任务自动化平台,支持通过自然语言提示创建幻灯片、网站、报告、播客、图像、文档和视频等各类内容,帮助用户显著提升内容创作与工作效率。
    0510
    最近收录AI自主智能系统# AI 幻灯片生成# AI创意生成# AI报告撰写
    MovieFlow

    MovieFlow

    MovieFlow 是一款基于人工智能的 全自动视频创作与影片生成平台,它能够将用户的故事描述、剧本或简单提示转化为完整的高质量视频作品。
    0500
    最近收录AI计算机视觉# AI 视频创作平台
    Qwen-Image-Layered

    Qwen-Image-Layered

    由 Qwen 团队开发的 图像分层 AI 模型,可以将单张图像自动分解成多个可独立可编辑的 RGBA 图层,实现类似专业图像编辑软件的分层操作。
    0490
    大模型开源工具与社区# 图像分层模型
    FlowyAIPC

    FlowyAIPC

    一款支持完全本地部署与离线运行的 AI 办公助手与 AIPC 生产力平台。
    0620
    最近收录AI模型管理与部署# AI 文本生成工具# AIPC生产力工具# AI会议助手
    GeminiGen AI

    GeminiGen AI

    一个基于先进人工智能的 多模态内容生成平台。
    0560
    内容创作教育与学习# AI 图像生成# AI 视频生成# AI 语音生成
    Bandy AI

    Bandy AI

    什么是 Bandy AI Bandy AI 是一款专注于 电...
    0540
    最近收录AI计算机视觉# 电商AI agent
    NeverCap

    NeverCap

    一款提供“真正 无限”AI 音频与视频转录服务的平台。
    0610
    教育者与研究人员最近收录AI# AI视频转录# AI音频转录
    VTP

    VTP

    MiniMax-AI 海螺视频团队开源的 Visual Tokenizer Pre-training 视觉生成模型预训练框架。
    0700
    内容创作最近收录AI# AI图像生成
    Laper

    Laper

    一个专为编剧和影视创作者打造的 AI 剧本创作与协作平台。
    0530
    内容创作最近收录AI# AI剧本创作平台# AI剧本生成
    Kairos 3.0

    Kairos 3.0

    大晓机器人推出的 开源世界模型,专为具身智能、机器人环境理解与动态预测设计。
    0750
    大模型开源工具与社区# 世界模型# 图像转视频# 文本转视频
    SHARP

    SHARP

    苹果推出的开源单目视图 3D 场景合成模型。
    0640
    内容创作大模型# AI 3D渲染
    字节跳动Seed

    字节跳动Seed

    字节跳动发布的通用 Agent AI 模型。
    0700
    大模型最近收录AI# Agent 大模型# 多模态智能体
    SAM Audio

    SAM Audio

    Meta 推出的统一多模态音频分离 AI 模型。
    0640
    大模型最近收录AI# AI音频处理# 多模态音频分离模型
    Step-GUI

    Step-GUI

    阶跃星辰团队发布的 开源 AI GUI Agent 系列模型与基础设施,覆盖其核心技术、架构、功能、应用场景、部署方法与常见问题。
    0880
    最近收录AI自主智能系统# 开放式 GUI Agent
    Xiaomi MiMo Studio

    Xiaomi MiMo Studio

    小米推出的在线 AI 聊天与推理平台。
    0560
    最近收录AI自然语言处理(NLP)# AI聊天平台
    GPT Image 1.5

    GPT Image 1.5

    OpenAI 发布的最新图像生成与编辑 AI 模型,作为 ChatGPT Images 的核心引擎,它以 最高达 4× 更快的生成速度、更强的指令执行力、精细细节保留与创意转换能力 为特性,支持创意图像生成、照片编辑与视觉工作流自动化。
    0570
    内容创作大模型# AI图像生成模型# AI图像编辑模型# 文本生成图像
    88查

    88查

    阿里巴巴旗下推出的 免费 AI 企业信息查询平台。
    01400
    商业产品与订阅服务最近收录AI# 88查# AI企业信息查询平台# AI查
    Live Avatar

    Live Avatar

    一个面向 AI 工具使用者的先进 实时音频驱动交互式头像生成系统。
    0710
    大模型最近收录AI# AI视频生成# AI视频通话
    Seedance 1.5 Pro

    Seedance 1.5 Pro

    字节跳动 Seed 团队最新发布的 音视频联合生成 AI 模型。该模型具备专业级音画同步、高质量视频生成、复杂叙事理解与多模态输入支持,为内容创作者及 AI 工具使用者提供强大的短片和影视级视频创作能力。
    0570
    内容创作大模型# AI情感短片视频生成# AI视频生成# 音视频联合生成模型
    万相2.6

    万相2.6

    阿里通义万相最新发布的视频生成 AI 模型,支持文本/图像/参考视频多模态生成、多镜头叙事、角色扮演和原生音画同步,为 AI 工具使用者实现专业级短片创作与影视级内容自动化提供强大支持。
    0690
    大模型最近收录AI# AI数字人# AI虚拟角色# AI视频生成模型
    LightX2V

    LightX2V

    一个轻量级、高性能的视频生成推理框架。
    0830
    内容创作最近收录AI# AI视频生成# 图像生成视频# 文本生成视频
    Disco

    Disco

    Google 最新推出的实验性 AI 浏览体验,该工具由Gemini 3 大模型驱动,通过自动将浏览器标签页转化为交互式 Web 应用(称为 GenTabs),重新定义浏览器与 AI 协作体验。本文面向 AI 工具使用者详细介绍其核心功能、使用方式、优势与常见问题。
    0720
    最近收录AI自主智能系统# AI浏览器
    Banana Slides

    Banana Slides

    一个基于 nano banana pro 强大模型的开源 AI PPT 生成工具,它如何通过自然语言驱动、文件解析与素材上传等机制实现高质量、定制化的演示文稿自动生成,适用于个人用户与开发者场景。本文系统梳理核心功能、技术架构、使用方法与常见问题。
    0850
    最近收录AI计算机视觉# AI PPT 生成工具
    Mulan

    Mulan

    一款基于 AI 的创新视频创作平台,包括其核心功能、产品优势、使用指南与用户常见问题解答。
    0550
    内容创作最近收录AI# AI视频创作# AI视频生成平台
    Claude-Mem

    Claude-Mem

    Claude-Mem 是一个专为 Claude Code 设计的开源持久记忆插件,通过自动捕获 AI 会话中的上下文、工具调用和观察,并将经 AI 压缩与结构化后的关键信息注入未来会话,实现跨会话记忆持续、语义搜索与自然语言历史检索等功能,大幅提升长期项目协作体验。
    0720
    开源工具与社区最近收录AI
    Gemini TTS

    Gemini TTS

    Gemini TTS 是 Google 最新的文本转语音(Text-to-Speech)技术,通过 Gemini API 或 Google AI Studio 提供高质量、多语言、多角色语音合成服务。支持细粒度风格、语速、情绪与多语音输出控制,并可用于播客、课程、辅助工具与互动应用等场景。
    0620
    API与SDK内容创作# AI语音合成# 多语言支持# 文本转语音
    Gemini Deep Research

    Gemini Deep Research

    Gemini Deep Research 是由 Google 发布的高级研究型 AI 代理,通过 Gemini API(Interactions API)支持复杂多步骤研究任务自动规划、搜索、阅读与综合,能够生成详尽的报告并融合 Web 与自有数据资源,是构建自动化智能研究、市场分析、竞争情报与长流程信息整合的利器。
    0730
    API与SDK最近收录AI# AI Agent
    Qwen3-Omni-Flash

    Qwen3-Omni-Flash

    Qwen3-Omni-Flash 是阿里巴巴 Qwen 团队于 2025 年 12 月 1 日发布的下一代原生全模态(omni-modal)大模型,支持文本、图像、音频和视频等多种输入,并能实时流式输出文本与自然语音,具备高效多模态理解与交互能力,覆盖 119 种文本语言及多语言语音交互,实现真正无缝实时 AI 体验。
    0860
    内容创作大模型# AI语音助手# 多语言语音输出
    PosterCopilot

    PosterCopilot

    PosterCopilot 是由南京大学、LibLib.ai 与中国科学院自动化所联合推出的 AI 海报设计框架,通过布局推理、审美强化学习与分层可控编辑,为专业海报布局和设计流程提供自动化与迭代式编辑能力,适合设计师、营销人员与创意团队使用。
    0730
    开源工具与社区最近收录AI# AI海报设计# AI视觉艺术
    GLM-TTS

    GLM-TTS

    GLM-TTS 是一款由 Zhipu AI 开源的工业级 文本转语音(TTS) 系统,支持零样本音色克隆、情感表达控制与流式生成。它采用双阶段架构与多奖励强化学习,可实现高质量自然语音合成,适用于语音助手、有声读物、客服、教育等多种场景。
    01440
    内容创作开源工具与社区# AI有声读物# AI语音克隆# 文本转语音(TTS)
    Questas

    Questas

    Questas 是一款 AI 驱动的互动故事与多媒体内容生成平台,允许用户通过文字提示快速生成图像与视频,并构建“分支/选择你的冒险 (choose-your-own-adventure)”式的互动故事。适合创作者、教育者、游戏设计师、小团队与内容运营者,无需编程或美术基础,即可打造沉浸式故事体验。
    01260
    内容创作娱乐媒体# AI视频生成工具# 故事编辑器# 文生图
    Vora

    Vora

    Vora 是一个由 Fineshare 提供的 AI 视频生成与编辑平台,支持将文本提示或图片转换为高清、无水印、带配音的视频,也支持提示词生成、视频增强与水印移除,是内容创作者、电商卖家、营销人员、社交媒体运营者制作短视频与广告视频的便捷工具。
    0960
    内容创作最近收录AI# AI视频内容创作# AI视频增强# AI视频生成工具
    PallasAI

    PallasAI

    Pallas AI 是一款专注于 AI 时代品牌 /内容 /营销优化的 GEO-Agent 平台,通过自动化诊断、内容生成、竞争分析与实时监控,帮助品牌提升在 AI 搜索与对话推荐中的可见性,适合品牌主、电商卖家、内容运营者、小团队使用。
    0740
    最近收录AI自然语言处理(NLP)# AI SEO# AI搜索优化# AI营销
    加载更多
    AI大学堂
    AI工具导航
    XD导航,是一个导航分类平台,为广大用户推荐各行业优秀的网址,APP,软件等,更加迎合用户,精细化,职业化,专业化,让不同小众化用户能有更好的用户体验,同时XD导航也是一个浏览器主页,提供了不同主流搜索引擎入口,和官网首页链接入口导航,整理分类了各网址、APP/资源、书籍等,提升效能,一键必达,还有AI技术运用,资讯分享等,欢迎您使用。

    友链申请隐私政策广告合作关于我们免责声明

    扫码加QQ群AI工具导航
    扫码加QQ群
    Copyright © 2026 AI工具导航 滇ICP备2023005905号-3 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍
    热门AI工具搜索
    TraeAI大学堂星辰Agent问小白绘蛙讯飞文书有言AI