AI工具导航
AI工具导航站长导航教师导航服装业导航自媒体导航娱乐业导航
  • AI工具应用集
  • AI博客文章
  • 账号购买
    • 账号合租
  • AI投稿
  • AI排行榜
  • 提示词商城
      • 未登录
        登录后即可体验更多功能
    • AI工具应用集
    • AI博客文章
    • 账号购买
      • 账号合租
    • AI投稿
    • AI排行榜
    • 提示词商城
    未登录
    登录后即可体验更多功能

    计算机视觉

    共 360 篇网址
    探索最前沿的计算机视觉 AI 工具,涵盖图像识别、目标检测、图像分割、姿态估计、OCR 等核心技术。AI工具导航平台汇聚国内外优质的计算机视觉应用与开源项目,助力开发者、研究者和企业高效构建视觉智能系统。
    AI商业AI常用工具AI教育AI服装设计AI热门产品AI生活助理SEO优化与推广SEO工具交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 APIAI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI精选AI集成开发环境(IDE)免费AI工具
    自然语言处理(NLP)计算机视觉语音识别与生成数据分析与预测自动化与机器人智能推荐系统自主智能系统
    排序
    发布更新浏览点赞
    Picit AI

    Picit AI

    Picit AI 是一款免费在线 AI 图像创作与编辑平台,集成文本生成、滤镜、美化、背景抠图、水印擦除等功能,适合 AI 工具使用者轻松完成图像生成与优化。
    03350
    最近收录AI计算机视觉# AI去水印# AI图像生成工具# AI图像编辑平台
    MirrorMe

    MirrorMe

    MirrorMe 是阿里巴巴团队推出的实时高保真音频驱动半身动画扩散模型,结合 LTX 视频基础架构与音频适配器,实现 lip-sync、表情与手势同步生成,适合 AI 工具使用者打造交互式数字人影像。
    03490
    最近收录AI计算机视觉# AI内容创作工具# AI虚拟直播# 多语言虚拟助理
    蚂蚁ppt

    蚂蚁ppt

    蚂蚁PPT 是一款由宁波灵达网络推出的 AI 在线幻灯片生成平台,提供一句话、文档、Markdown 输入,智能匹配模板和图片,自动生成 PPT 大纲、内容与演讲备注,适合教育、商务和职场 AI 工具使用者快速创建专业演示。
    02760
    最近收录AI计算机视觉# AI PPT制作平台
    OmniGen2

    OmniGen2

    OmniGen2 是由 VectorSpaceLab 发布的开源多模态生成模型,通过双路径解码架构支持文本生成、图像合成、图像编辑和上下文驱动的视觉生成,适合 AI 工具使用者构建统一视觉应用。
    01820
    开源工具与社区最近收录AI# 多模态生成模型
    Ovis‑U1

    Ovis‑U1

    Ovis‑U1 是阿里巴巴 AIDC‑AI 推出的 30 亿参数统一多模态模型,集图像理解、文本生成、图像生成与编辑能力于一体,适合 AI 工具使用者快速构建多功能视觉交互应用。
    02580
    大模型计算机视觉# 多模态模型
    AnimaX

    AnimaX

    AnimaX 是阿里巴巴 DAMO Academy 推出的最新文本驱动 3D 动画框架,利用视频扩散与骨架控制让静态模型动起来,适合 AI 工具使用者构建高质量 3D 动画。
    03140
    大模型开源工具与社区# 3D模型生成动画# AI 3D艺术制作# AI虚拟人物交互
    Vibemotion

    Vibemotion

    深入解读 Vibemotion:第一个以单一句提示生成专业级动态图形视频的 AI 工具,适合 AI 创作者、内容营销与教育者,涵盖功能特性、使用流程、最佳实践与常见问答,助你快速掌握该平台的魔力。
    02870
    最近收录AI计算机视觉# AI视频生成工具
    Qwen VLo

    Qwen VLo

    一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型,从核心能力、使用路径到实战案例和常见问题,详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。
    02990
    大模型最近收录AI# 多模态大语言模型# 文生图
    MultiAgentPPT

    MultiAgentPPT

    MultiAgentPPT 是一款开源工具,通过多 AI Agent 协同自动生成 PPT 结构、内容及视觉设计,支持自定义模板与 Azure OpenAI 集成,适合内容创作者、业务人员快速制作专业演示文稿。
    03530
    最近收录AI计算机视觉# AI PPT生成工具# 多Agent协同PPT 生成工具
    FilMaster

    FilMaster

    FilMaster 是首个融合电影摄影学原理与全流程生成式 AI 的自动化电影制作系统,从剧本到后期输出提供专业级可编辑作品。本文深度解析其架构、技术、使用场景与常见问题,助 AI 工具使用者理解并落地 “FilMaster” 这一革新系统。
    04520
    最近收录AI计算机视觉# AI内容创作# AI短片导演# AI视频生成
    4D‑LRM

    4D‑LRM

    4D‑LRM 是一款由 Ziqiao Ma 等人提出的 Transformer 驱动大规模时空重建模型,基于 4D 高斯混合表示,实现从稀疏视角与时间点输入,到任意视角与任意时间点的连续动态重建。本文详解其架构、性能、使用指南与常见问题,帮助 AI 工具用户掌握 4D‑LRM。
    03250
    大模型最近收录AI# 4D时空重建模型# AI 4D场景生成# AI影视制作
    Game Worlds

    Game Worlds

    Game Worlds 是 Runway 推出的 AI 驱动交互式游戏平台,允许用户通过自然语言创建带图像和文本的冒险游戏,无需编码。本文深度解析其功能、使用指南、应用场景、技术原理及常见问题,帮助 AI 工具使用者快速上手。
    04750
    最近收录AI计算机视觉# AI游戏场景生成# 无代码交互式游戏创作工具
    课件帮

    课件帮

    “课件帮”是一款由天源迪科推出的AI智能课件制作平台,支持一键生成PPT课件、转视频微课、智能出题和数字人讲解,助力教育者和职场人士提升内容制作效率。
    03530
    API与SDK教育与学习# AI PPT制作# AI数字人# AI智能课件制作平台
    Kwai Keye‑VL

    Kwai Keye‑VL

    Kwai Keye‑VL 是快手推出的 8 B 参数多模态大语言模型,聚焦动态短视频理解与视觉推理,支持图文与视频输入。本文深入分析其架构、性能、使用指南与 FAQ,助 AI 用户快速掌握。
    03560
    大模型最近收录AI# AI视频内容摘要# AI视频问答# 多模态大型模型
    DRA‑Ctrl

    DRA‑Ctrl

    探索 DRA-Ctrl —— “Dimension‑Reduction Attack!” 的最新进展。本文讲解其原理、应用场景(如图像修复、边缘到图像、深度生成等),并详细介绍安装部署与常见问题,助 AI 用户快速上手。
    02300
    最近收录AI计算机视觉# 模型训练
    MiniWork

    MiniWork

    MiniWork 是一站式 AI 工具平台,集成写作助手、图像编辑、PDF 转换、营销分析、SEO 优化等多功能,支持 GPT‑4o、Claude 3.7、Gemini 2.5 等多种模型,适用于内容创作者、运营人员和职场精英,提升工作效率。
    01770
    写作助手最近收录AI# AI图像生成# AI图像编辑# AI工具平台
    石榴AI

    石榴AI

    石榴AI是一款由北京祥亮科技推出的全能 AI 数字人及视频创作平台,支持文本/音频驱动视频生成、数字人定制、API 接入,助力短视频博主、教育与企业内容创作者高效输出。
    03130
    最近收录AI计算机视觉# AI数字人# AI数字人定制# AI视频创作平台
    AnimaTensor

    AnimaTensor

    AnimaTensor 是一个专为动漫风格设计的开源 SDXL 模型,由 Animagine XL 4.0-Zero 微调而成,训练于 840 万张 Danbooru 图像,支持 V‑prediction、Zero-terminal SNR 和高分辨率生成,适合内容创作者快速制作高质量动漫艺术作品。
    03210
    大模型最近收录AI# Stable Diffusion XL动漫模型微调# stable diffusion 模型# 模型下载
    OmniAvatar

    OmniAvatar

    OmniAvatar 是由浙江大学与阿里巴巴联合开发的开源音频驱动全身 avatar 视频生成模型,支持精确 lip‑sync、自然身体动作、文本控制和背景调节,适用于播客、教育、娱乐等多场景,高效、可定制。
    03700
    开源工具与社区最近收录AI# AI视频生成框架# LoRA 微调
    ImmerseGen

    ImmerseGen

    ImmerseGen 是由 ByteDance 与浙江大学联合研发的 AI 驱动沉浸式 3D 世界生成框架,借助 agent 指导与 alpha‑textured 几何 proxy,实现轻量级、高保真的 VR 场景创建,适配实时渲染,是面向 AI 工具使用者的强大沉浸制作利器。
    02140
    最近收录AI计算机视觉# AI 3D场景生成# AI VR开发# AI框架
    万兴天幕AI

    万兴天幕AI

    万兴天幕(Wondershare Tomoviee)是万兴科技最新一代音视频多媒体大模型 2.0,由万兴与华为云联合打造,具备视频、图像、音频生成能力,通过天天幕创作广场和 API 引擎,为 AI 工具使用者和开发者提供一站式创作方案。
    02530
    大模型最近收录AI# AI扩图# AI艺术生成工具# AI视频翻译
    Hunyuan‑GameCraft

    Hunyuan‑GameCraft

    Hunyuan‑GameCraft 是腾讯 推出的高动态交互游戏视频生成框架,支持键鼠输入控制、长序列一致性、自回归延伸与模型蒸馏,在超百万条 AAA 游戏录像上训练,适配实时部署,显著提升互动沉浸体验。
    01910
    最近收录AI计算机视觉# AI视频生成# 游戏视频生成框架
    PosterCraft

    PosterCraft

    PosterCraft 是开源的高质量美学海报生成框架,通过多阶段优化流程实现精准文本渲染、高级布局与视觉–语言反馈,免费提供模型、数据和在线体验,适合设计师、内容创作者和研究者。
    01800
    最近收录AI计算机视觉# AI海报生成框架
    CreateVision AI

    CreateVision AI

    CreateVision AI 是一款完全免费的无登录 AI 图像生成平台,支持多引擎驱动、无限次高质量图像创作,为创意工作者、设计师、内容营销人员带来极致便捷与自由。
    03070
    免费AI工具最近收录AI# AI图像生成工具# 多语言支持
    PreenCut

    PreenCut

    PreenCut 是一款开源 AI 视频检索与剪辑工具,支持语音识别(WhisperX)、LLM 分析、自然语言查询与批量处理,为 AI 工具使用者提供高效精准的视频片段检索和剪辑能力。
    02410
    开源工具与社区数据分析与预测# AI段落标注# AI视频剪辑工具# AI视频检索工具
    DroneDeploy

    DroneDeploy

    DroneDeploy 是领先的全栈无人机现实捕获平台,支持自动飞行规划、地图与 3D 模型生成、AI 驱动的测量与监控,面向建设、农业、能源、采矿等行业用户,提升飞行与图像数据处理效率。
    05310
    最近收录AI计算机视觉# AI 3D模型# AI摄影测量# AI无人机飞行规划
    燕雀光年

    燕雀光年

    燕雀光年(Yanque Light‑Year)是一款国内领先的 AI 平台,专注于智能 Logo、动态 Logo、包装与 VI 视觉识别设计,提供 5 种创作模式和可商用设计,适用于创业者、设计小白与品牌团队。
    05980
    最近收录AI计算机视觉# AI Logo 生成平台# AI LOGO设计工具
    MindOmni

    MindOmni

    MindOmni 是腾讯 ARC Lab 推出的统一多模态大语言模型,通过三阶段训练与 RGPO 强化学习,支持图像理解、推理生成与图像编辑,展现出色的数学与视觉推理能力,是面向 AI 工具使用者的开源实用助手。
    02840
    大模型开源工具与社区# 多模态大语言模型
    Stream‑Omni

    Stream‑Omni

    Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合(文本、图像、语音)并生成文本和语音回应,具备边听边列文字中转、轻量训练与同声互动能力,是 AI 工具使用者构建多模态界面的优秀起点。
    03200
    开源工具与社区教育者与研究人员# AI聊天机器人# AI语音助手# 多模态聊天应用
    Labubu live wallpaper

    Labubu live wallpaper

    Labubu live wallpaper 是一款深受 Labubu 收藏者和动态主题爱好者喜爱的高清动态壁纸平台,提供免费可下载的 HD/4K 动态锁屏,适配 iOS 与 Android,教程简单,引爆社交媒体话题。
    01960
    最近收录AI计算机视觉# AI壁纸生成工具
    Vidduo

    Vidduo

    Vidduo 是一款 AI 视频生成平台,支持从文字或静态图片快速生成 1080p 多镜头短片,具备语义精准理解、风格多样化和流畅运动效果,适合 AI 工具使用者用于内容创意、短视频营销和快速原型。
    02120
    最近收录AI计算机视觉# AI短视频创作# AI视频生成平台
    Makefilm

    Makefilm

    Makefilm 是一款功能强大的全能 AI 视频平台,支持从文字和静态图片生成高质量短视频,内置 AI 配音、字幕生成/去除、视频剪辑和下载器,热门创作者和品牌借它快速打造社交媒体视频内容。
    02370
    最近收录AI计算机视觉# AI字幕生成# AI视频创作平台# AI配音
    Avido.ai

    Avido.ai

    Avido.ai 是一款面向内容创作者的 AI 视频生成平台,支持脚本生成、图像动效、人声配音和背景音乐,自动输出高质量无脸社交短视频,并可发布至 YouTube 和 TikTok,助力创作者高效产出,轻松扩展品牌影响力。
    02440
    最近收录AI计算机视觉# AI视频创作平台# AI配音
    Midjourney Video

    Midjourney Video

    Midjourney Video 是 Midjourney 推出的第一款 AI 视频生成工具,支持基于静态图像生成短视频片段,具备镜头控制、Motion 模式、无限扩展等功能;本文深度解析 Midjourney Video 的功能、使用方式、定价策略与行业创新,帮助 AI 工具使用者全面了解这一视频制作新平台。
    02000
    最近收录AI计算机视觉# AI视频扩展# AI视频生成工具# 图像转视频
    Surge AI

    Surge AI

    Surge AI 是一款领先的 AI 数据标注平台,为语言模型、内容审核与搜索排序等提供高质量的人类反馈与 RLHF 服务,凭借高标准质控、专家标注团队及实时 API 接入,已帮助 OpenAI、Anthropic、Cohere 等公司提升模型性能,是 AI 工具使用者首选。
    04580
    API与SDK最近收录AI# AI内容审核# AI数据标注# 搜索质量评估
    Hailuo Video Agent

    Hailuo Video Agent

    Hailuo Video Agent 是 Hailuo AI 推出的 AI 驱动视频创作助手,支持文字转视频、图像动画、人像替换与镜头控制等功能,是内容创作者、营销人员和教育者的高效工具。
    01890
    教育与学习最近收录AI# AI内容创作# AI社交推广# AI高质量短视频生成
    LinGen

    LinGen

    LinGen 是一款创新的线性复杂度文本生成视频框架,利用 MATE 模块实现高分辨率分钟级视频生成,显著降低算力需求,适合 AI 工具使用者在单 GPU 上探索长视频创作。
    02120
    最近收录AI计算机视觉# AI影视内容制作# AI长视频生成# 文本到视频生成模型
    EX-4D

    EX-4D

    EX-4D 是一项最新的 4D 视频合成技术,通过“Depth Watertight Mesh”提升极端视角下单目输入视频的几何一致性与视觉质量,适合 AI 工具使用者和计算机视觉研究者探索视频生成与合成应用。
    01930
    最近收录AI计算机视觉# AI增强现实内容生成# AI影视短片制作# AI视频漫游
    VFX8

    VFX8

    VFX8 是一站式 AI 制片工场,提供从分镜脚本、角色设计到视频生成的全流程 AI 支持,助力影视创作者快速落地优质作品。本文详解功能特点、使用场景与常见问题,帮你全面了解 VFX8。
    01950
    教育与学习最近收录AI# AI制片工厂# AI影视创作# AI视频生成
    EmbodiedGen

    EmbodiedGen

    EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具,支持多模态资产(图像、文本、布局)生成具实体感的 3D 交互环境,适合机器人训练、仿真与生成式 AI 研究者使用。
    02510
    开源工具与社区最近收录AI# AI 纹理生成# 图像生成3D# 文本生成3D
    OmniFlow

    OmniFlow

    OmniFlow 是松下与 UCLA 联合开发的多模态生成式 AI,实现文本、图像、音频之间的 Any‑to‑Any 转换,极大降低训练数据成本,适用于内容创作、无障碍辅助与多媒体生成。
    02740
    最近收录AI计算机视觉# 图生文本# 图生音频# 多模态生成式AI
    Hailuo 02

    Hailuo 02

    Hailuo 02 是 MiniMax 推出的最新 AI 视频生成模型,支持文本和图像转视频,具备 768p、10 秒时长选项,具备物理仿真、摄像机控制、高成本效能比,超越 Google Veo 3,适合创作者与开发者使用。
    02000
    大模型最近收录AI# AI短视频生成# 图像转视频# 文本转视频
    Sparc3D

    Sparc3D

    Sparc3D 是一款开源的高分辨率稀疏三维重建与生成框架,结合 Sparcubes 和 Sparconv‑VAE 技术,可实现 1024³ mesh 重建与文本/图像到 3D 模型生成,适用于游戏、VR、3D 打印等应用场景。
    05250
    开源工具与社区最近收录AI# AI 3D打印# AI VR场景生成# AI游戏场景生成
    Labubu Wallpaper

    Labubu Wallpaper

    Labubu Wallpaper 是 AI 生成的 Pop Mart Labubu 角色壁纸平台,提供高清静态与动态桌面/手机背景,支持个性化定制、节日主题及 live wallpaper,面向壁纸爱好者和AI工具用户。
    02370
    免费AI工具最近收录AI# AI Labubu玩偶风格# Labubu AI 壁纸
    Kontext AI

    Kontext AI

    Kontext AI 利用先进的 FLUX Kontext 模型,提供上下文感知的图像生成与编辑服务,支持文本+图像提示、角色一致编辑、高速响应,适合设计师、内容创作者与营销人员。
    02330
    API与SDK免费AI工具# AI图像生成# AI图像编辑# AI图片增强
    FlowDirector

    FlowDirector

    FlowDirector是一款无需训练的文本驱动视频编辑新框架,通过 ODE 流式演化实现高精度、时序一致的视频修改,具备局部可控与语义对齐优势,适合创作者和开发者快速文本编辑视频。
    03090
    开源工具与社区最近收录AI# AI短视频制作# AI视频编辑框架
    Flux Context

    Flux Context

    fluxcontext.app 是一款强大的 AI 在线图像编辑 平台,提供在线的照片修复、动漫风格转换、水印移除、人物与背景替换等专业功能,适合摄影师、设计师与内容创作者快速提升视觉质量。
    01810
    最近收录AI计算机视觉# AI去水印# AI图像增强# AI图像风格迁移
    Morphic

    Morphic

    Morphic 是一款革命性的 AI 全能工作室,集图片生成、视频创作、动画、角色模型训练于一体,通过 Canvas + Copilot + Compose 的三合一设计,让影视制作人、设计师和创作者高效落地视觉叙事。
    01970
    最近收录AI计算机视觉# AI内容创作# AI动画制作# AI图像生成
    Dzine (formerly Stylar.ai)

    Dzine (formerly Stylar.ai)

    Dzine 是一款功能强大的 AI 图像生成平台,结合文本→图像与图像编辑、风格迁移、图层控制与协作功能,适合设计师、创意者快速生成与修改高质量图像,轻松完成 Logo、角色设计、产品图等多场景创作。
    01830
    最近收录AI计算机视觉# AI图像生成平台# AI图像风格迁移# 图生图
    MAGREF

    MAGREF

    MAGREF是一款先进的 视频生成框架,通过“Masked Guidance”实现多参考图像与文本提示驱动的视频合成,支持目标一致性、动态遮罩与像素级特征融合,助力研究者和开发者探索高质量、多主体视频生成新路径。
    01990
    开源工具与社区最近收录AI# AI电影人物合成# AI短视频生成# AI虚拟角色互动
    加载更多
    AI大学堂
    AI工具导航
    XD导航,是一个导航分类平台,为广大用户推荐各行业优秀的网址,APP,软件等,更加迎合用户,精细化,职业化,专业化,让不同小众化用户能有更好的用户体验,同时XD导航也是一个浏览器主页,提供了不同主流搜索引擎入口,和官网首页链接入口导航,整理分类了各网址、APP/资源、书籍等,提升效能,一键必达,还有AI技术运用,资讯分享等,欢迎您使用。

    友链申请隐私政策广告合作关于我们免责声明

    扫码加QQ群AI工具导航
    扫码加QQ群
    Copyright © 2026 AI工具导航 滇ICP备2023005905号-3 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍
    热门AI工具搜索
    TraeAI大学堂星辰Agent问小白绘蛙讯飞文书有言AI