Pixel Reasoner一款前沿的开源视觉语言模型(VLM),旨在突破传统“文字链式思维(Chain-of-Thought, CoT)”的局限,首次实现了“像素空间链式思维”能力。03340最近收录AI计算机视觉# AI多模态
CatchMeCatchMe 是一款 AI 内容鉴别平台,支持在线检测图像、视频和音频是否由 AI 生成,有效应对换脸、换声诈骗和深伪内容风险,适合 AI 工具使用者保障内容真伪安全。03320最近收录AI计算机视觉# AI内容检测工具# AI图像鉴伪# AI视频真实性检测
HunyuanVideo-Avatar腾讯混元团队联合腾讯音乐天琴实验室(MuseV)于 2025 年 5 月 28 日发布并开源的语音驱动数字人模型。03300大模型最近收录AI# AI数字人# AI短视频生成工具# AI虚拟主播
NeuralCam全场景 AI 拍摄与编辑,包括人像背景替换、超分辨率放大、AI 宏观拍摄,甚至在 Mac 平台提供 AI 视频增强功能。03290最近收录AI计算机视觉# AI摄影增强# AI背景移除# AI视频增强
Ghibli ArtGhibli Art AI 是一款免费在线工具,利用 ChatGPT 的 AI 技术,将用户的照片或文字描述转换为吉卜力风格的艺术作品。 03260计算机视觉# AI吉卜力风格# 文本生成吉卜力风格艺术# 照片转吉卜力风格艺术
4D‑LRM4D‑LRM 是一款由 Ziqiao Ma 等人提出的 Transformer 驱动大规模时空重建模型,基于 4D 高斯混合表示,实现从稀疏视角与时间点输入,到任意视角与任意时间点的连续动态重建。本文详解其架构、性能、使用指南与常见问题,帮助 AI 工具用户掌握 4D‑LRM。03250大模型最近收录AI# 4D时空重建模型# AI 4D场景生成# AI影视制作
Video Background Remover一款基于人工智能的视频背景移除工具,能够智能识别视频中的人物或主体,并自动去除背景,无需绿幕或专业设备。03240内容创作教育与学习# AI背景替换# AI视频背景移除工具
WUI.AIWUI.AI 是一款专注于人工智能视频编辑与优化的工具,面向视频创作者、播客制作者及社交媒体营销人员,致力于通过AI技术将长视频快速转化为适配TikTok、Instagram、YouTube Shorts等平台的短视频,显著提升内容生产效率与传播效果。03230最近收录AI视频制作# AI video editing# AI-powered video clips# AI写作编辑助手
AnimaTensorAnimaTensor 是一个专为动漫风格设计的开源 SDXL 模型,由 Animagine XL 4.0-Zero 微调而成,训练于 840 万张 Danbooru 图像,支持 V‑prediction、Zero-terminal SNR 和高分辨率生成,适合内容创作者快速制作高质量动漫艺术作品。03220大模型最近收录AI# Stable Diffusion XL动漫模型微调# stable diffusion 模型# 模型下载
Cartwheel一款创新的 AI 驱动 3D 动画平台,旨在通过自然语言输入和视频素材,快速生成可编辑的高质量角色动画,显著降低动画制作的技术门槛和时间成本。03220最近收录AI计算机视觉# AI广告创意# AI影视制作# AI游戏开发
Stream‑OmniStream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合(文本、图像、语音)并生成文本和语音回应,具备边听边列文字中转、轻量训练与同声互动能力,是 AI 工具使用者构建多模态界面的优秀起点。03200开源工具与社区教育者与研究人员# AI聊天机器人# AI语音助手# 多模态聊天应用
PartCrafterPartCrafter ——首个支持从单张 RGB 图像生成结构化 3D 模型 的 AI 工具。03170大模型教育与学习# 3D生成模型# AI 3D打印原型设计# AI虚拟现实模型搭建
Hunyuan3D‑PolyGenHunyuan3D‑PolyGen 是腾讯混元3D系列的最新旗舰级模型,以生产级“Art‑Grade”网格拓扑为目标,支持三角/四边形网格、高压缩编码与自动重拓扑,能减少 70% 制作时间、提升 35% 拓扑整洁度,是游戏开发者与 3D 艺术师的创作助力。03150API与SDK大模型# AI 3D艺术设计# AI游戏开发
UIsnapper一个基于人工智能的 UI 助手工具,旨在将设计师或产品经理的界面截图转化为高质量的 prompt 指令,快速用于生成可编辑的界面原型或设计素材。03150最近收录AI计算机视觉# AI UI助手工具# AI图像分析# Prompt 智能生成
AnimaXAnimaX 是阿里巴巴 DAMO Academy 推出的最新文本驱动 3D 动画框架,利用视频扩散与骨架控制让静态模型动起来,适合 AI 工具使用者构建高质量 3D 动画。03140大模型开源工具与社区# 3D模型生成动画# AI 3D艺术制作# AI虚拟人物交互
CAR由字节跳动与复旦大学联合提出的一种自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在处理各类任务时的推理效率与准确性。03140最近收录AI计算机视觉# 多模态任务# 自适应推理框架# 视觉问答
石榴AI石榴AI是一款由北京祥亮科技推出的全能 AI 数字人及视频创作平台,支持文本/音频驱动视频生成、数字人定制、API 接入,助力短视频博主、教育与企业内容创作者高效输出。03130最近收录AI计算机视觉# AI数字人# AI数字人定制# AI视频创作平台
FreeGen一款完全免费的 AI文生图片工具,支持无限制在线图像生成、风格、色调、构图与灯光选择,且无需注册,适合设计师、内容创作者及社交媒体运营者快速获取高质量视觉素材。03100免费AI工具最近收录AI# AI内容创作# AI图像生成工具# AI影视创意
Seedance 1.0字节跳动旗下火山引擎推出的旗舰 视频生成基础模型,支持图像转视频、文本转视频,具备多镜头无缝拼接、影视级运镜和高语义理解能力。本文深度剖析 Seedance 1.0 的功能、使用指南、技术亮点与应用场景,并配常见问题 FAQ,助力 AI 工具用户掌握这款创新模型。03100大模型最近收录AI# 图生视频# 文生视频# 视频生成模型
FlowDirectorFlowDirector是一款无需训练的文本驱动视频编辑新框架,通过 ODE 流式演化实现高精度、时序一致的视频修改,具备局部可控与语义对齐优势,适合创作者和开发者快速文本编辑视频。03090开源工具与社区最近收录AI# AI短视频制作# AI视频编辑框架
3DTown普林斯顿大学、哥伦比亚大学和 Cyberever AI 联合推出的开源 AI 框架,旨在从单张俯视图图像生成逼真且连贯的三维城镇场景。03090教育与学习最近收录AI# AI游戏开发# AI虚拟现实# 三维内容生成
CreateVision AICreateVision AI 是一款完全免费的无登录 AI 图像生成平台,支持多引擎驱动、无限次高质量图像创作,为创意工作者、设计师、内容营销人员带来极致便捷与自由。03070免费AI工具最近收录AI# AI图像生成工具# 多语言支持
OpusClip ThumbnailOpusClip 团队推出的全新 AI 缩略图生成工具,旨在帮助 YouTube 创作者快速制作高点击率的缩略图。03070教育与学习最近收录AI# AI内容创作工具# AI缩略图生成工具
万象驭影万象驭影 是北京矩阵像素科技推出的多模态 AI 视频创作平台,整合多智能体与跨模态技术,支持批量剪辑、精细剪辑与一站式投放,面向企业营销与内容创作者优化视频产能与成本。03060最近收录AI计算机视觉# AI视频制作# AI视频剪辑# 多模态智能视频创作平台
FilmAction首个国内一体化 A电影创作平台,通过 AI 驱动的剧情生成、角色设定、分镜制作、配音配乐及4K视频输出,帮助创作者无门槛制作短片与广告,实现“人人皆导演”梦想。03050最近收录AI计算机视觉# AI创作平台# AI导演# AI电影创作平台
Trenz一款专为 TikTok Shop 商家、内容创作者和品牌方打造的 AI 驱动的社交电商智能分析与内容创作平台。03020数据分析与预测最近收录AI# AI内容创作平台# AI文案生成工具# AI电商分析平台
Qwen VLo一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型,从核心能力、使用路径到实战案例和常见问题,详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。02990大模型最近收录AI# 多模态大语言模型# 文生图
XJoy AIXJoy AI是一款人工智能驱动的虚拟女友应用,旨在为用户提供个性化的情感陪伴和互动体验。通过先进的AI技术,用户可以与虚拟女友进行自然流畅的对话,分享日常生活、情感和兴趣爱好。02980最近收录AI计算机视觉# AI女友# AI情感伴侣# AI角色扮演生成器
LONGLIVELONGLIVE 是由 NVlabs 推出的创新型 AI 技术项目,旨在通过先进的深度学习与生成算法,为长视频生成、内容复原与高质量视频处理提供强大支持。02900最近收录AI计算机视觉# 视频生成技术