计算机视觉

共 364 篇网址

探索最前沿的计算机视觉 AI 工具，涵盖图像识别、目标检测、图像分割、姿态估计、OCR 等核心技术。AI工具导航平台汇聚国内外优质的计算机视觉应用与开源项目，助力开发者、研究者和企业高效构建视觉智能系统。

AI商业 AI常用工具 AI教育 AI服装设计 AI热门产品 AI生活助理 SEO优化与推广 SEO工具专业自媒体交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图文图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN 外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 API AI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI 精选AI 集成开发环境（IDE）免费AI工具

自然语言处理（NLP）计算机视觉语音识别与生成数据分析与预测自动化与机器人智能推荐系统自主智能系统

排序

发布更新浏览点赞

OiiOii

OiiOii 是一款面向创作者与普通用户的 AI 动画代理工具，旨在将你的想象通过图像、文字提示快速生成动画或短片。

03910

内容创作娱乐媒体 # AI动画代理 # AI动画生成工具 # AI故事生成工具

DeepEyes

DeepEyes是一款由小红书与西安交通大学联合研发的多模态...

03910

API与SDK 医疗与健康 # 多模态大模型 # 多模态推理 # 用图思考

Plask Motion

一款基于 AI 的视频到 3D 动画动作捕捉与渲染工具。

03910

娱乐媒体最近收录AI # AI 3D捕捉 # AI动画 # 视频转3D

CatchMe

CatchMe 是一款 AI 内容鉴别平台，支持在线检测图像、视频和音频是否由 AI 生成，有效应对换脸、换声诈骗和深伪内容风险，适合 AI 工具使用者保障内容真伪安全。

03900

最近收录AI 计算机视觉 # AI内容检测工具 # AI图像鉴伪 # AI视频真实性检测

可灵2.1

快手推出的最新一代 AI 视频生成工具，于 2025 年 5 月 29 日正式发布。

03900

教育与学习最近收录AI # AI广告制作 # AI短视频创作 # AI视频生成工具

HunyuanVideo-Avatar

腾讯混元团队联合腾讯音乐天琴实验室（MuseV）于 2025 年 5 月 28 日发布并开源的语音驱动数字人模型。

03900

大模型最近收录AI # AI数字人 # AI短视频生成工具 # AI虚拟主播

Illusion Diffusion

融合了文本到图像生成与光学幻觉效果，赋予用户将普通照片、设计或文字转化为引人注目的艺术作品的能力。

03900

娱乐媒体计算机视觉 # AI图像幻觉 # AI图像生成工具 # AI艺术生成器

AnimaTensor

AnimaTensor 是一个专为动漫风格设计的开源 SDXL 模型，由 Animagine XL 4.0-Zero 微调而成，训练于 840 万张 Danbooru 图像，支持 V‑prediction、Zero-terminal SNR 和高分辨率生成，适合内容创作者快速制作高质量动漫艺术作品。

03890

大模型最近收录AI # Stable Diffusion XL动漫模型微调 # stable diffusion 模型 # 模型下载

PartCrafter

PartCrafter ——首个支持从单张 RGB 图像生成结构化 3D 模型的 AI 工具。

03870

大模型教育与学习 # 3D生成模型 # AI 3D打印原型设计 # AI虚拟现实模型搭建

Pixel Reasoner

一款前沿的开源视觉语言模型（VLM），旨在突破传统“文字链式思维（Chain-of-Thought, CoT）”的局限，首次实现了“像素空间链式思维”能力。

03860

最近收录AI 计算机视觉 # AI多模态

MTVCrafter

一款面向开放世界人像动画的 AI 视频生成框架，旨在通过直接建模原始 3D 动作序列，实现高质量的人像动画生成。

03850

最近收录AI 计算机视觉 # AI 3D动作建模 # AI视频生成工具 # 人像动画生成

Stream‑Omni

Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合（文本、图像、语音）并生成文本和语音回应，具备边听边列文字中转、轻量训练与同声互动能力，是 AI 工具使用者构建多模态界面的优秀起点。

03840

开源工具与社区教育者与研究人员 # AI聊天机器人 # AI语音助手 # 多模态聊天应用

CAR

由字节跳动与复旦大学联合提出的一种自适应推理框架，旨在提升大型语言模型（LLM）和多模态大型语言模型（MLLM）在处理各类任务时的推理效率与准确性。

03840

最近收录AI 计算机视觉 # 多模态任务 # 自适应推理框架 # 视觉问答

WUI.AI

WUI.AI 是一款专注于人工智能视频编辑与优化的工具，面向视频创作者、播客制作者及社交媒体营销人员，致力于通过AI技术将长视频快速转化为适配TikTok、Instagram、YouTube Shorts等平台的短视频，显著提升内容生产效率与传播效果。

03830

最近收录AI 视频制作 # AI video editing # AI-powered video clips # AI写作编辑助手

Hunyuan3D‑PolyGen

Hunyuan3D‑PolyGen 是腾讯混元3D系列的最新旗舰级模型，以生产级“Art‑Grade”网格拓扑为目标，支持三角/四边形网格、高压缩编码与自动重拓扑，能减少 70% 制作时间、提升 35% 拓扑整洁度，是游戏开发者与 3D 艺术师的创作助力。

03810

API与SDK 大模型 # AI 3D艺术设计 # AI游戏开发

AnimaX

AnimaX 是阿里巴巴 DAMO Academy 推出的最新文本驱动 3D 动画框架，利用视频扩散与骨架控制让静态模型动起来，适合 AI 工具使用者构建高质量 3D 动画。

03810

大模型开源工具与社区 # 3D模型生成动画 # AI 3D艺术制作 # AI虚拟人物交互

MMaDA

实现跨文本推理、多模态理解和文本到图像生成等多个领域的卓越性能。

03810

大模型开源工具与社区 # AI多模态理解 # AI文本推理 # 文生图

Freepik AI Image Generator

通过简单的文本提示将用户的创意转化为高质量的视觉内容。

03810

最近收录AI 计算机视觉 # AI图像增强器 # AI图像转视频 # AI背景生成器

NeuralCam

全场景 AI 拍摄与编辑，包括人像背景替换、超分辨率放大、AI 宏观拍摄，甚至在 Mac 平台提供 AI 视频增强功能。

03790

最近收录AI 计算机视觉 # AI摄影增强 # AI背景移除 # AI视频增强

VidMe AI

一款专注于将脚本快速转换为专业 UGC 式短视频的平台。

03790

最近收录AI 计算机视觉 # AI UGC视频工具 # AI个性化视频生成工具 # AI头像生成

ToonCrafter AI

图像到视频扩散技术将静态卡通图像转化为流畅的动画。

03790

开源工具与社区计算机视觉 # AI卡通图像生成

FilmAction

首个国内一体化 A电影创作平台，通过 AI 驱动的剧情生成、角色设定、分镜制作、配音配乐及4K视频输出，帮助创作者无门槛制作短片与广告，实现“人人皆导演”梦想。

03780

最近收录AI 计算机视觉 # AI创作平台 # AI导演 # AI电影创作平台

PhotoRoom

快速创建专业级的产品照片和视觉内容。

03780

企业用户商业产品与订阅服务 # AI产品描述生成器 # AI产品美化 # AI图像编辑平台

Ghibli Art

Ghibli Art AI 是一款免费在线工具，利用 ChatGPT 的 AI 技术，将用户的照片或文字描述转换为吉卜力风格的艺术作品。

03780

计算机视觉 # AI吉卜力风格 # 文本生成吉卜力风格艺术 # 照片转吉卜力风格艺术

CreateVision AI

CreateVision AI 是一款完全免费的无登录 AI 图像生成平台，支持多引擎驱动、无限次高质量图像创作，为创意工作者、设计师、内容营销人员带来极致便捷与自由。

03770

免费AI工具最近收录AI # AI图像生成工具 # 多语言支持

FreeGen

一款完全免费的 AI文生图片工具，支持无限制在线图像生成、风格、色调、构图与灯光选择，且无需注册，适合设计师、内容创作者及社交媒体运营者快速获取高质量视觉素材。

03770

免费AI工具最近收录AI # AI内容创作 # AI图像生成工具 # AI影视创意

Dolphin

ByteDance开发的多模态文档图像解析模型，处理包含文本、表格、图形和公式等交织元素的复杂文档图像而设计。

03770

大模型开源工具与社区 # 多模态处理 # 数据提取

Face Swap AI

视频、照片和GIF的人脸互换设计。

03760

娱乐媒体最近收录AI # AI人脸互换 # AI视频换脸 # AI视频编辑

AI Colors

一款基于人工智能的免费在线配色工具，旨在帮助设计师、开发者及创意工作者快速生成高质量的调色板。

03760

交互设计创意设计 # AI在线配色工具 # AI背景生成器 # AI艺术生成器

Luma AI

Luma AI 推出的先进视频编辑工具，集成于其旗舰平台 Dream Machine 中。

03750

最近收录AI 计算机视觉 # AI游戏开发 # AI电影制作 # AI视频编辑工具

4D‑LRM

4D‑LRM 是一款由 Ziqiao Ma 等人提出的 Transformer 驱动大规模时空重建模型，基于 4D 高斯混合表示，实现从稀疏视角与时间点输入，到任意视角与任意时间点的连续动态重建。本文详解其架构、性能、使用指南与常见问题，帮助 AI 工具用户掌握 4D‑LRM。

03730

大模型最近收录AI # 4D时空重建模型 # AI 4D场景生成 # AI影视制作

Trenz

一款专为 TikTok Shop 商家、内容创作者和品牌方打造的 AI 驱动的社交电商智能分析与内容创作平台。

03730

数据分析与预测最近收录AI # AI内容创作平台 # AI文案生成工具 # AI电商分析平台

Cartwheel

一款创新的 AI 驱动 3D 动画平台，旨在通过自然语言输入和视频素材，快速生成可编辑的高质量角色动画，显著降低动画制作的技术门槛和时间成本。

03730

最近收录AI 计算机视觉 # AI广告创意 # AI影视制作 # AI游戏开发

UIsnapper

一个基于人工智能的 UI 助手工具，旨在将设计师或产品经理的界面截图转化为高质量的 prompt 指令，快速用于生成可编辑的界面原型或设计素材。

03720

最近收录AI 计算机视觉 # AI UI助手工具 # AI图像分析 # Prompt 智能生成

Video Background Remover

一款基于人工智能的视频背景移除工具，能够智能识别视频中的人物或主体，并自动去除背景，无需绿幕或专业设备。

03700

内容创作教育与学习 # AI背景替换 # AI视频背景移除工具

AI Video Composer

AI Video Composer 是一种利用人工智能技术自...

03690

计算机视觉语音识别与生成 # AI滤镜 # AI特效 # AI视频剪辑工具

石榴AI

石榴AI是一款由北京祥亮科技推出的全能 AI 数字人及视频创作平台，支持文本/音频驱动视频生成、数字人定制、API 接入，助力短视频博主、教育与企业内容创作者高效输出。

03680

最近收录AI 计算机视觉 # AI数字人 # AI数字人定制 # AI视频创作平台

Chance AI

AI 驱动视觉搜索引擎，旨在通过先进的视觉智能技术，让用户能够通过视觉内容与世界互动。

03680

最近收录AI 计算机视觉 # AI搜索引擎 # AI视觉搜索引擎

AI SVG Generator

一款利用AI生成可缩放矢量图形（SVG）的在线工具。

03680

最近收录AI 计算机视觉 # AI图形设计 # AI艺术生成工具 # AI设计生成工具

OpusClip Thumbnail

OpusClip 团队推出的全新 AI 缩略图生成工具，旨在帮助 YouTube 创作者快速制作高点击率的缩略图。

03650

教育与学习最近收录AI # AI内容创作工具 # AI缩略图生成工具

万象驭影

万象驭影是北京矩阵像素科技推出的多模态 AI 视频创作平台，整合多智能体与跨模态技术，支持批量剪辑、精细剪辑与一站式投放，面向企业营销与内容创作者优化视频产能与成本。

03640

最近收录AI 计算机视觉 # AI视频制作 # AI视频剪辑 # 多模态智能视频创作平台

FlowDirector

FlowDirector是一款无需训练的文本驱动视频编辑新框架，通过 ODE 流式演化实现高精度、时序一致的视频修改，具备局部可控与语义对齐优势，适合创作者和开发者快速文本编辑视频。

03640

开源工具与社区最近收录AI # AI短视频制作 # AI视频编辑框架

Livideo AI

一款专注于本地化、免费且无限制的 AI 视频换脸工具。

03640

最近收录AI 计算机视觉 # AI换脸

Flair AI

创建高质量的产品摄影场景。

03640

最近收录AI 计算机视觉 # AI 设计工具 # AI图像编辑工具 # AI模特生成

3DTown

普林斯顿大学、哥伦比亚大学和 Cyberever AI 联合推出的开源 AI 框架，旨在从单张俯视图图像生成逼真且连贯的三维城镇场景。

03620

教育与学习最近收录AI # AI游戏开发 # AI虚拟现实 # 三维内容生成

腾讯混元

腾讯于2025年5月推出的首个工业级 AIGC（人工智能生成内容）游戏内容生产引擎。

03620

娱乐媒体最近收录AI # AI 2D 美术生成 # AI 美术管线 # AI游戏引擎

XJoy AI

XJoy AI是一款人工智能驱动的虚拟女友应用，旨在为用户提供个性化的情感陪伴和互动体验。通过先进的AI技术，用户可以与虚拟女友进行自然流畅的对话，分享日常生活、情感和兴趣爱好。

03600

最近收录AI 计算机视觉 # AI女友 # AI情感伴侣 # AI角色扮演生成器

Qwen VLo

一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型，从核心能力、使用路径到实战案例和常见问题，详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。

03590

大模型最近收录AI # 多模态大语言模型 # 文生图

ReelUp

一款视频电商平台，允许商家将产品视频转化为互动式、可购物的体验。

03590

最近收录AI 网站性能和技术SEO # AI视频优化 # AI视频电商平台

IDM VTON Online

提供高度真实的虚拟试穿体验。

03580

计算机视觉 # AI时尚设计师 # AI虚拟试衣工具

AI大学堂