计算机视觉

共 364 篇网址

探索最前沿的计算机视觉 AI 工具，涵盖图像识别、目标检测、图像分割、姿态估计、OCR 等核心技术。AI工具导航平台汇聚国内外优质的计算机视觉应用与开源项目，助力开发者、研究者和企业高效构建视觉智能系统。

AI商业 AI常用工具 AI教育 AI服装设计 AI热门产品 AI生活助理 SEO优化与推广 SEO工具专业自媒体交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图文图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN 外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 API AI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI 精选AI 集成开发环境（IDE）免费AI工具

自然语言处理（NLP）计算机视觉语音识别与生成数据分析与预测自动化与机器人智能推荐系统自主智能系统

排序

发布更新浏览点赞

SeaArt AI

SeaArt AI 是一款多功能 AI 艺术平台，支持文字/图像转图、视频生成、模型训练与角色聊天，提供多风格创作、高清输出与社区化协作，适合 AI 工具使用者探索跨媒体创作流程。

02940

最近收录AI 计算机视觉 # AI内容创意社区 # AI增强工具 # AI艺术生成工具

看往

看往是一款专注跨境电商和海外营销的AI一站式视觉/视频内容处理平台，提供电商主图生成、智能抠图、模特替换、视频字幕翻译、多语言配音等功能，适合AI工具使用者高效制作海外营销素材。

07880

最近收录AI 计算机视觉 # ai模特换肤 # ai背景更换 # ai裁剪

星流Agent

星流Agent 是 LiblibAI 推出的中文本土化多模态设计智能体，继承 Lovart 的 AI 创作能力，支持文字、图像、视频、3D 模型多场景一站式交付，适合 AI 工具使用者快速产出视觉内容。

06990

最近收录AI 自主智能系统 # AI去除背景 # AI图片 # AI生图

绘想

“绘想”是百度推出的基于MuseSteamer视频大模型的 AI 视频创作平台，通过一张图片即可生成电影级动态视频，实现音画合一、镜头可控、操作零门槛，适合 AI 工具使用者快速产出专业短片。

04160

最近收录AI 计算机视觉 # AI短剧制作 # AI视频创作平台 # 视频生成模型

Picit AI

Picit AI 是一款免费在线 AI 图像创作与编辑平台，集成文本生成、滤镜、美化、背景抠图、水印擦除等功能，适合 AI 工具使用者轻松完成图像生成与优化。

04760

最近收录AI 计算机视觉 # AI去水印 # AI图像生成工具 # AI图像编辑平台

MirrorMe

MirrorMe 是阿里巴巴团队推出的实时高保真音频驱动半身动画扩散模型，结合 LTX 视频基础架构与音频适配器，实现 lip-sync、表情与手势同步生成，适合 AI 工具使用者打造交互式数字人影像。

03990

最近收录AI 计算机视觉 # AI内容创作工具 # AI虚拟直播 # 多语言虚拟助理

蚂蚁ppt

蚂蚁PPT 是一款由宁波灵达网络推出的 AI 在线幻灯片生成平台，提供一句话、文档、Markdown 输入，智能匹配模板和图片，自动生成 PPT 大纲、内容与演讲备注，适合教育、商务和职场 AI 工具使用者快速创建专业演示。

03250

最近收录AI 计算机视觉 # AI PPT制作平台

OmniGen2

OmniGen2 是由 VectorSpaceLab 发布的开源多模态生成模型，通过双路径解码架构支持文本生成、图像合成、图像编辑和上下文驱动的视觉生成，适合 AI 工具使用者构建统一视觉应用。

02160

开源工具与社区最近收录AI # 多模态生成模型

Ovis‑U1

Ovis‑U1 是阿里巴巴 AIDC‑AI 推出的 30 亿参数统一多模态模型，集图像理解、文本生成、图像生成与编辑能力于一体，适合 AI 工具使用者快速构建多功能视觉交互应用。

03110

大模型计算机视觉 # 多模态模型

AnimaX

AnimaX 是阿里巴巴 DAMO Academy 推出的最新文本驱动 3D 动画框架，利用视频扩散与骨架控制让静态模型动起来，适合 AI 工具使用者构建高质量 3D 动画。

03790

大模型开源工具与社区 # 3D模型生成动画 # AI 3D艺术制作 # AI虚拟人物交互

Vibemotion

深入解读 Vibemotion：第一个以单一句提示生成专业级动态图形视频的 AI 工具，适合 AI 创作者、内容营销与教育者，涵盖功能特性、使用流程、最佳实践与常见问答，助你快速掌握该平台的魔力。

03400

最近收录AI 计算机视觉 # AI视频生成工具

Qwen VLo

一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型，从核心能力、使用路径到实战案例和常见问题，详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。

03590

大模型最近收录AI # 多模态大语言模型 # 文生图

MultiAgentPPT

MultiAgentPPT 是一款开源工具，通过多 AI Agent 协同自动生成 PPT 结构、内容及视觉设计，支持自定义模板与 Azure OpenAI 集成，适合内容创作者、业务人员快速制作专业演示文稿。

04030

最近收录AI 计算机视觉 # AI PPT生成工具 # 多Agent协同PPT 生成工具

FilMaster

FilMaster 是首个融合电影摄影学原理与全流程生成式 AI 的自动化电影制作系统，从剧本到后期输出提供专业级可编辑作品。本文深度解析其架构、技术、使用场景与常见问题，助 AI 工具使用者理解并落地 “FilMaster” 这一革新系统。

05210

最近收录AI 计算机视觉 # AI内容创作 # AI短片导演 # AI视频生成

4D‑LRM

4D‑LRM 是一款由 Ziqiao Ma 等人提出的 Transformer 驱动大规模时空重建模型，基于 4D 高斯混合表示，实现从稀疏视角与时间点输入，到任意视角与任意时间点的连续动态重建。本文详解其架构、性能、使用指南与常见问题，帮助 AI 工具用户掌握 4D‑LRM。

03710

大模型最近收录AI # 4D时空重建模型 # AI 4D场景生成 # AI影视制作

Game Worlds

Game Worlds 是 Runway 推出的 AI 驱动交互式游戏平台，允许用户通过自然语言创建带图像和文本的冒险游戏，无需编码。本文深度解析其功能、使用指南、应用场景、技术原理及常见问题，帮助 AI 工具使用者快速上手。

05370

最近收录AI 计算机视觉 # AI游戏场景生成 # 无代码交互式游戏创作工具

课件帮

“课件帮”是一款由天源迪科推出的AI智能课件制作平台，支持一键生成PPT课件、转视频微课、智能出题和数字人讲解，助力教育者和职场人士提升内容制作效率。

04270

API与SDK 教育与学习 # AI PPT制作 # AI数字人 # AI智能课件制作平台

Kwai Keye‑VL

Kwai Keye‑VL 是快手推出的 8 B 参数多模态大语言模型，聚焦动态短视频理解与视觉推理，支持图文与视频输入。本文深入分析其架构、性能、使用指南与 FAQ，助 AI 用户快速掌握。

04040

大模型最近收录AI # AI视频内容摘要 # AI视频问答 # 多模态大型模型

DRA‑Ctrl

探索 DRA-Ctrl —— “Dimension‑Reduction Attack!” 的最新进展。本文讲解其原理、应用场景（如图像修复、边缘到图像、深度生成等），并详细介绍安装部署与常见问题，助 AI 用户快速上手。

02810

最近收录AI 计算机视觉 # 模型训练

MiniWork

MiniWork 是一站式 AI 工具平台，集成写作助手、图像编辑、PDF 转换、营销分析、SEO 优化等多功能，支持 GPT‑4o、Claude 3.7、Gemini 2.5 等多种模型，适用于内容创作者、运营人员和职场精英，提升工作效率。

02370

写作助手最近收录AI # AI图像生成 # AI图像编辑 # AI工具平台

石榴AI

石榴AI是一款由北京祥亮科技推出的全能 AI 数字人及视频创作平台，支持文本/音频驱动视频生成、数字人定制、API 接入，助力短视频博主、教育与企业内容创作者高效输出。

03650

最近收录AI 计算机视觉 # AI数字人 # AI数字人定制 # AI视频创作平台

AnimaTensor

AnimaTensor 是一个专为动漫风格设计的开源 SDXL 模型，由 Animagine XL 4.0-Zero 微调而成，训练于 840 万张 Danbooru 图像，支持 V‑prediction、Zero-terminal SNR 和高分辨率生成，适合内容创作者快速制作高质量动漫艺术作品。

03850

大模型最近收录AI # Stable Diffusion XL动漫模型微调 # stable diffusion 模型 # 模型下载

OmniAvatar

OmniAvatar 是由浙江大学与阿里巴巴联合开发的开源音频驱动全身 avatar 视频生成模型，支持精确 lip‑sync、自然身体动作、文本控制和背景调节，适用于播客、教育、娱乐等多场景，高效、可定制。

04130

开源工具与社区最近收录AI # AI视频生成框架 # LoRA 微调

ImmerseGen

ImmerseGen 是由 ByteDance 与浙江大学联合研发的 AI 驱动沉浸式 3D 世界生成框架，借助 agent 指导与 alpha‑textured 几何 proxy，实现轻量级、高保真的 VR 场景创建，适配实时渲染，是面向 AI 工具使用者的强大沉浸制作利器。

02610

最近收录AI 计算机视觉 # AI 3D场景生成 # AI VR开发 # AI框架

万兴天幕AI

万兴天幕（Wondershare Tomoviee）是万兴科技最新一代音视频多媒体大模型 2.0，由万兴与华为云联合打造，具备视频、图像、音频生成能力，通过天天幕创作广场和 API 引擎，为 AI 工具使用者和开发者提供一站式创作方案。

02940

大模型最近收录AI # AI扩图 # AI艺术生成工具 # AI视频翻译

Hunyuan‑GameCraft

Hunyuan‑GameCraft 是腾讯推出的高动态交互游戏视频生成框架，支持键鼠输入控制、长序列一致性、自回归延伸与模型蒸馏，在超百万条 AAA 游戏录像上训练，适配实时部署，显著提升互动沉浸体验。

02280

最近收录AI 计算机视觉 # AI视频生成 # 游戏视频生成框架

PosterCraft

PosterCraft 是开源的高质量美学海报生成框架，通过多阶段优化流程实现精准文本渲染、高级布局与视觉–语言反馈，免费提供模型、数据和在线体验，适合设计师、内容创作者和研究者。

02130

最近收录AI 计算机视觉 # AI海报生成框架

CreateVision AI

CreateVision AI 是一款完全免费的无登录 AI 图像生成平台，支持多引擎驱动、无限次高质量图像创作，为创意工作者、设计师、内容营销人员带来极致便捷与自由。

03740

免费AI工具最近收录AI # AI图像生成工具 # 多语言支持

PreenCut

PreenCut 是一款开源 AI 视频检索与剪辑工具，支持语音识别（WhisperX）、LLM 分析、自然语言查询与批量处理，为 AI 工具使用者提供高效精准的视频片段检索和剪辑能力。

02890

开源工具与社区数据分析与预测 # AI段落标注 # AI视频剪辑工具 # AI视频检索工具

DroneDeploy

DroneDeploy 是领先的全栈无人机现实捕获平台，支持自动飞行规划、地图与 3D 模型生成、AI 驱动的测量与监控，面向建设、农业、能源、采矿等行业用户，提升飞行与图像数据处理效率。

06050

最近收录AI 计算机视觉 # AI 3D模型 # AI摄影测量 # AI无人机飞行规划

燕雀光年

燕雀光年（Yanque Light‑Year）是一款国内领先的 AI 平台，专注于智能 Logo、动态 Logo、包装与 VI 视觉识别设计，提供 5 种创作模式和可商用设计，适用于创业者、设计小白与品牌团队。

06560

最近收录AI 计算机视觉 # AI Logo 生成平台 # AI LOGO设计工具

MindOmni

MindOmni 是腾讯 ARC Lab 推出的统一多模态大语言模型，通过三阶段训练与 RGPO 强化学习，支持图像理解、推理生成与图像编辑，展现出色的数学与视觉推理能力，是面向 AI 工具使用者的开源实用助手。

03270

大模型开源工具与社区 # 多模态大语言模型

Stream‑Omni

Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合（文本、图像、语音）并生成文本和语音回应，具备边听边列文字中转、轻量训练与同声互动能力，是 AI 工具使用者构建多模态界面的优秀起点。

03820

开源工具与社区教育者与研究人员 # AI聊天机器人 # AI语音助手 # 多模态聊天应用

Labubu live wallpaper

Labubu live wallpaper 是一款深受 Labubu 收藏者和动态主题爱好者喜爱的高清动态壁纸平台，提供免费可下载的 HD/4K 动态锁屏，适配 iOS 与 Android，教程简单，引爆社交媒体话题。

02490

最近收录AI 计算机视觉 # AI壁纸生成工具

Vidduo

Vidduo 是一款 AI 视频生成平台，支持从文字或静态图片快速生成 1080p 多镜头短片，具备语义精准理解、风格多样化和流畅运动效果，适合 AI 工具使用者用于内容创意、短视频营销和快速原型。

02520

最近收录AI 计算机视觉 # AI短视频创作 # AI视频生成平台

Makefilm

Makefilm 是一款功能强大的全能 AI 视频平台，支持从文字和静态图片生成高质量短视频，内置 AI 配音、字幕生成/去除、视频剪辑和下载器，热门创作者和品牌借它快速打造社交媒体视频内容。

02770

最近收录AI 计算机视觉 # AI字幕生成 # AI视频创作平台 # AI配音

Avido.ai

Avido.ai 是一款面向内容创作者的 AI 视频生成平台，支持脚本生成、图像动效、人声配音和背景音乐，自动输出高质量无脸社交短视频，并可发布至 YouTube 和 TikTok，助力创作者高效产出，轻松扩展品牌影响力。

02820

最近收录AI 计算机视觉 # AI视频创作平台 # AI配音

Midjourney Video

Midjourney Video 是 Midjourney 推出的第一款 AI 视频生成工具，支持基于静态图像生成短视频片段，具备镜头控制、Motion 模式、无限扩展等功能；本文深度解析 Midjourney Video 的功能、使用方式、定价策略与行业创新，帮助 AI 工具使用者全面了解这一视频制作新平台。

02360

最近收录AI 计算机视觉 # AI视频扩展 # AI视频生成工具 # 图像转视频

Surge AI

Surge AI 是一款领先的 AI 数据标注平台，为语言模型、内容审核与搜索排序等提供高质量的人类反馈与 RLHF 服务，凭借高标准质控、专家标注团队及实时 API 接入，已帮助 OpenAI、Anthropic、Cohere 等公司提升模型性能，是 AI 工具使用者首选。

05260

API与SDK 最近收录AI # AI内容审核 # AI数据标注 # 搜索质量评估

Hailuo Video Agent

Hailuo Video Agent 是 Hailuo AI 推出的 AI 驱动视频创作助手，支持文字转视频、图像动画、人像替换与镜头控制等功能，是内容创作者、营销人员和教育者的高效工具。

02380

教育与学习最近收录AI # AI内容创作 # AI社交推广 # AI高质量短视频生成

LinGen

LinGen 是一款创新的线性复杂度文本生成视频框架，利用 MATE 模块实现高分辨率分钟级视频生成，显著降低算力需求，适合 AI 工具使用者在单 GPU 上探索长视频创作。

02580

最近收录AI 计算机视觉 # AI影视内容制作 # AI长视频生成 # 文本到视频生成模型

EX-4D

EX-4D 是一项最新的 4D 视频合成技术，通过“Depth Watertight Mesh”提升极端视角下单目输入视频的几何一致性与视觉质量，适合 AI 工具使用者和计算机视觉研究者探索视频生成与合成应用。

02370

最近收录AI 计算机视觉 # AI增强现实内容生成 # AI影视短片制作 # AI视频漫游

VFX8

VFX8 是一站式 AI 制片工场，提供从分镜脚本、角色设计到视频生成的全流程 AI 支持，助力影视创作者快速落地优质作品。本文详解功能特点、使用场景与常见问题，帮你全面了解 VFX8。

02360

教育与学习最近收录AI # AI制片工厂 # AI影视创作 # AI视频生成

EmbodiedGen

EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具，支持多模态资产（图像、文本、布局）生成具实体感的 3D 交互环境，适合机器人训练、仿真与生成式 AI 研究者使用。

02950

开源工具与社区最近收录AI # AI 纹理生成 # 图像生成3D # 文本生成3D

OmniFlow

OmniFlow 是松下与 UCLA 联合开发的多模态生成式 AI，实现文本、图像、音频之间的 Any‑to‑Any 转换，极大降低训练数据成本，适用于内容创作、无障碍辅助与多媒体生成。

03320

最近收录AI 计算机视觉 # 图生文本 # 图生音频 # 多模态生成式AI

Hailuo 02

Hailuo 02 是 MiniMax 推出的最新 AI 视频生成模型，支持文本和图像转视频，具备 768p、10 秒时长选项，具备物理仿真、摄像机控制、高成本效能比，超越 Google Veo 3，适合创作者与开发者使用。

02520

大模型最近收录AI # AI短视频生成 # 图像转视频 # 文本转视频

Sparc3D

Sparc3D 是一款开源的高分辨率稀疏三维重建与生成框架，结合 Sparcubes 和 Sparconv‑VAE 技术，可实现 1024³ mesh 重建与文本/图像到 3D 模型生成，适用于游戏、VR、3D 打印等应用场景。

05870

开源工具与社区最近收录AI # AI 3D打印 # AI VR场景生成 # AI游戏场景生成

Labubu Wallpaper

Labubu Wallpaper 是 AI 生成的 Pop Mart Labubu 角色壁纸平台，提供高清静态与动态桌面/手机背景，支持个性化定制、节日主题及 live wallpaper，面向壁纸爱好者和AI工具用户。

02810

免费AI工具最近收录AI # AI Labubu玩偶风格 # Labubu AI 壁纸

Kontext AI

Kontext AI 利用先进的 FLUX Kontext 模型，提供上下文感知的图像生成与编辑服务，支持文本+图像提示、角色一致编辑、高速响应，适合设计师、内容创作者与营销人员。

02900

API与SDK 免费AI工具 # AI图像生成 # AI图像编辑 # AI图片增强

FlowDirector

FlowDirector是一款无需训练的文本驱动视频编辑新框架，通过 ODE 流式演化实现高精度、时序一致的视频修改，具备局部可控与语义对齐优势，适合创作者和开发者快速文本编辑视频。

03630

开源工具与社区最近收录AI # AI短视频制作 # AI视频编辑框架

AI大学堂