绘想“绘想”是百度推出的基于MuseSteamer视频大模型的 AI 视频创作平台,通过一张图片即可生成电影级动态视频,实现音画合一、镜头可控、操作零门槛,适合 AI 工具使用者快速产出专业短片。03620最近收录AI计算机视觉# AI短剧制作# AI视频创作平台# 视频生成模型
Picit AIPicit AI 是一款免费在线 AI 图像创作与编辑平台,集成文本生成、滤镜、美化、背景抠图、水印擦除等功能,适合 AI 工具使用者轻松完成图像生成与优化。03350最近收录AI计算机视觉# AI去水印# AI图像生成工具# AI图像编辑平台
MirrorMeMirrorMe 是阿里巴巴团队推出的实时高保真音频驱动半身动画扩散模型,结合 LTX 视频基础架构与音频适配器,实现 lip-sync、表情与手势同步生成,适合 AI 工具使用者打造交互式数字人影像。03480最近收录AI计算机视觉# AI内容创作工具# AI虚拟直播# 多语言虚拟助理
蚂蚁ppt蚂蚁PPT 是一款由宁波灵达网络推出的 AI 在线幻灯片生成平台,提供一句话、文档、Markdown 输入,智能匹配模板和图片,自动生成 PPT 大纲、内容与演讲备注,适合教育、商务和职场 AI 工具使用者快速创建专业演示。02740最近收录AI计算机视觉# AI PPT制作平台
OmniGen2OmniGen2 是由 VectorSpaceLab 发布的开源多模态生成模型,通过双路径解码架构支持文本生成、图像合成、图像编辑和上下文驱动的视觉生成,适合 AI 工具使用者构建统一视觉应用。01810开源工具与社区最近收录AI# 多模态生成模型
Ovis‑U1Ovis‑U1 是阿里巴巴 AIDC‑AI 推出的 30 亿参数统一多模态模型,集图像理解、文本生成、图像生成与编辑能力于一体,适合 AI 工具使用者快速构建多功能视觉交互应用。02580大模型计算机视觉# 多模态模型
AnimaXAnimaX 是阿里巴巴 DAMO Academy 推出的最新文本驱动 3D 动画框架,利用视频扩散与骨架控制让静态模型动起来,适合 AI 工具使用者构建高质量 3D 动画。03140大模型开源工具与社区# 3D模型生成动画# AI 3D艺术制作# AI虚拟人物交互
Vibemotion深入解读 Vibemotion:第一个以单一句提示生成专业级动态图形视频的 AI 工具,适合 AI 创作者、内容营销与教育者,涵盖功能特性、使用流程、最佳实践与常见问答,助你快速掌握该平台的魔力。02870最近收录AI计算机视觉# AI视频生成工具
Qwen VLo一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型,从核心能力、使用路径到实战案例和常见问题,详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。02980大模型最近收录AI# 多模态大语言模型# 文生图
MultiAgentPPTMultiAgentPPT 是一款开源工具,通过多 AI Agent 协同自动生成 PPT 结构、内容及视觉设计,支持自定义模板与 Azure OpenAI 集成,适合内容创作者、业务人员快速制作专业演示文稿。03530最近收录AI计算机视觉# AI PPT生成工具# 多Agent协同PPT 生成工具
FilMasterFilMaster 是首个融合电影摄影学原理与全流程生成式 AI 的自动化电影制作系统,从剧本到后期输出提供专业级可编辑作品。本文深度解析其架构、技术、使用场景与常见问题,助 AI 工具使用者理解并落地 “FilMaster” 这一革新系统。04520最近收录AI计算机视觉# AI内容创作# AI短片导演# AI视频生成
4D‑LRM4D‑LRM 是一款由 Ziqiao Ma 等人提出的 Transformer 驱动大规模时空重建模型,基于 4D 高斯混合表示,实现从稀疏视角与时间点输入,到任意视角与任意时间点的连续动态重建。本文详解其架构、性能、使用指南与常见问题,帮助 AI 工具用户掌握 4D‑LRM。03250大模型最近收录AI# 4D时空重建模型# AI 4D场景生成# AI影视制作
Game WorldsGame Worlds 是 Runway 推出的 AI 驱动交互式游戏平台,允许用户通过自然语言创建带图像和文本的冒险游戏,无需编码。本文深度解析其功能、使用指南、应用场景、技术原理及常见问题,帮助 AI 工具使用者快速上手。04750最近收录AI计算机视觉# AI游戏场景生成# 无代码交互式游戏创作工具
课件帮“课件帮”是一款由天源迪科推出的AI智能课件制作平台,支持一键生成PPT课件、转视频微课、智能出题和数字人讲解,助力教育者和职场人士提升内容制作效率。03520API与SDK教育与学习# AI PPT制作# AI数字人# AI智能课件制作平台
Kwai Keye‑VLKwai Keye‑VL 是快手推出的 8 B 参数多模态大语言模型,聚焦动态短视频理解与视觉推理,支持图文与视频输入。本文深入分析其架构、性能、使用指南与 FAQ,助 AI 用户快速掌握。03560大模型最近收录AI# AI视频内容摘要# AI视频问答# 多模态大型模型
DRA‑Ctrl探索 DRA-Ctrl —— “Dimension‑Reduction Attack!” 的最新进展。本文讲解其原理、应用场景(如图像修复、边缘到图像、深度生成等),并详细介绍安装部署与常见问题,助 AI 用户快速上手。02300最近收录AI计算机视觉# 模型训练
MiniWorkMiniWork 是一站式 AI 工具平台,集成写作助手、图像编辑、PDF 转换、营销分析、SEO 优化等多功能,支持 GPT‑4o、Claude 3.7、Gemini 2.5 等多种模型,适用于内容创作者、运营人员和职场精英,提升工作效率。01770写作助手最近收录AI# AI图像生成# AI图像编辑# AI工具平台
石榴AI石榴AI是一款由北京祥亮科技推出的全能 AI 数字人及视频创作平台,支持文本/音频驱动视频生成、数字人定制、API 接入,助力短视频博主、教育与企业内容创作者高效输出。03130最近收录AI计算机视觉# AI数字人# AI数字人定制# AI视频创作平台
AnimaTensorAnimaTensor 是一个专为动漫风格设计的开源 SDXL 模型,由 Animagine XL 4.0-Zero 微调而成,训练于 840 万张 Danbooru 图像,支持 V‑prediction、Zero-terminal SNR 和高分辨率生成,适合内容创作者快速制作高质量动漫艺术作品。03210大模型最近收录AI# Stable Diffusion XL动漫模型微调# stable diffusion 模型# 模型下载
OmniAvatarOmniAvatar 是由浙江大学与阿里巴巴联合开发的开源音频驱动全身 avatar 视频生成模型,支持精确 lip‑sync、自然身体动作、文本控制和背景调节,适用于播客、教育、娱乐等多场景,高效、可定制。03690开源工具与社区最近收录AI# AI视频生成框架# LoRA 微调
ImmerseGenImmerseGen 是由 ByteDance 与浙江大学联合研发的 AI 驱动沉浸式 3D 世界生成框架,借助 agent 指导与 alpha‑textured 几何 proxy,实现轻量级、高保真的 VR 场景创建,适配实时渲染,是面向 AI 工具使用者的强大沉浸制作利器。02140最近收录AI计算机视觉# AI 3D场景生成# AI VR开发# AI框架
万兴天幕AI万兴天幕(Wondershare Tomoviee)是万兴科技最新一代音视频多媒体大模型 2.0,由万兴与华为云联合打造,具备视频、图像、音频生成能力,通过天天幕创作广场和 API 引擎,为 AI 工具使用者和开发者提供一站式创作方案。02530大模型最近收录AI# AI扩图# AI艺术生成工具# AI视频翻译
Hunyuan‑GameCraftHunyuan‑GameCraft 是腾讯 推出的高动态交互游戏视频生成框架,支持键鼠输入控制、长序列一致性、自回归延伸与模型蒸馏,在超百万条 AAA 游戏录像上训练,适配实时部署,显著提升互动沉浸体验。01910最近收录AI计算机视觉# AI视频生成# 游戏视频生成框架
PosterCraftPosterCraft 是开源的高质量美学海报生成框架,通过多阶段优化流程实现精准文本渲染、高级布局与视觉–语言反馈,免费提供模型、数据和在线体验,适合设计师、内容创作者和研究者。01800最近收录AI计算机视觉# AI海报生成框架
CreateVision AICreateVision AI 是一款完全免费的无登录 AI 图像生成平台,支持多引擎驱动、无限次高质量图像创作,为创意工作者、设计师、内容营销人员带来极致便捷与自由。03060免费AI工具最近收录AI# AI图像生成工具# 多语言支持
PreenCutPreenCut 是一款开源 AI 视频检索与剪辑工具,支持语音识别(WhisperX)、LLM 分析、自然语言查询与批量处理,为 AI 工具使用者提供高效精准的视频片段检索和剪辑能力。02410开源工具与社区数据分析与预测# AI段落标注# AI视频剪辑工具# AI视频检索工具
DroneDeployDroneDeploy 是领先的全栈无人机现实捕获平台,支持自动飞行规划、地图与 3D 模型生成、AI 驱动的测量与监控,面向建设、农业、能源、采矿等行业用户,提升飞行与图像数据处理效率。05310最近收录AI计算机视觉# AI 3D模型# AI摄影测量# AI无人机飞行规划
燕雀光年燕雀光年(Yanque Light‑Year)是一款国内领先的 AI 平台,专注于智能 Logo、动态 Logo、包装与 VI 视觉识别设计,提供 5 种创作模式和可商用设计,适用于创业者、设计小白与品牌团队。05980最近收录AI计算机视觉# AI Logo 生成平台# AI LOGO设计工具
MindOmniMindOmni 是腾讯 ARC Lab 推出的统一多模态大语言模型,通过三阶段训练与 RGPO 强化学习,支持图像理解、推理生成与图像编辑,展现出色的数学与视觉推理能力,是面向 AI 工具使用者的开源实用助手。02840大模型开源工具与社区# 多模态大语言模型
Stream‑OmniStream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合(文本、图像、语音)并生成文本和语音回应,具备边听边列文字中转、轻量训练与同声互动能力,是 AI 工具使用者构建多模态界面的优秀起点。03190开源工具与社区教育者与研究人员# AI聊天机器人# AI语音助手# 多模态聊天应用
Labubu live wallpaperLabubu live wallpaper 是一款深受 Labubu 收藏者和动态主题爱好者喜爱的高清动态壁纸平台,提供免费可下载的 HD/4K 动态锁屏,适配 iOS 与 Android,教程简单,引爆社交媒体话题。01950最近收录AI计算机视觉# AI壁纸生成工具
VidduoVidduo 是一款 AI 视频生成平台,支持从文字或静态图片快速生成 1080p 多镜头短片,具备语义精准理解、风格多样化和流畅运动效果,适合 AI 工具使用者用于内容创意、短视频营销和快速原型。02110最近收录AI计算机视觉# AI短视频创作# AI视频生成平台
MakefilmMakefilm 是一款功能强大的全能 AI 视频平台,支持从文字和静态图片生成高质量短视频,内置 AI 配音、字幕生成/去除、视频剪辑和下载器,热门创作者和品牌借它快速打造社交媒体视频内容。02370最近收录AI计算机视觉# AI字幕生成# AI视频创作平台# AI配音
Avido.aiAvido.ai 是一款面向内容创作者的 AI 视频生成平台,支持脚本生成、图像动效、人声配音和背景音乐,自动输出高质量无脸社交短视频,并可发布至 YouTube 和 TikTok,助力创作者高效产出,轻松扩展品牌影响力。02440最近收录AI计算机视觉# AI视频创作平台# AI配音
Midjourney VideoMidjourney Video 是 Midjourney 推出的第一款 AI 视频生成工具,支持基于静态图像生成短视频片段,具备镜头控制、Motion 模式、无限扩展等功能;本文深度解析 Midjourney Video 的功能、使用方式、定价策略与行业创新,帮助 AI 工具使用者全面了解这一视频制作新平台。01990最近收录AI计算机视觉# AI视频扩展# AI视频生成工具# 图像转视频
Surge AISurge AI 是一款领先的 AI 数据标注平台,为语言模型、内容审核与搜索排序等提供高质量的人类反馈与 RLHF 服务,凭借高标准质控、专家标注团队及实时 API 接入,已帮助 OpenAI、Anthropic、Cohere 等公司提升模型性能,是 AI 工具使用者首选。04580API与SDK最近收录AI# AI内容审核# AI数据标注# 搜索质量评估
Hailuo Video AgentHailuo Video Agent 是 Hailuo AI 推出的 AI 驱动视频创作助手,支持文字转视频、图像动画、人像替换与镜头控制等功能,是内容创作者、营销人员和教育者的高效工具。01890教育与学习最近收录AI# AI内容创作# AI社交推广# AI高质量短视频生成
LinGenLinGen 是一款创新的线性复杂度文本生成视频框架,利用 MATE 模块实现高分辨率分钟级视频生成,显著降低算力需求,适合 AI 工具使用者在单 GPU 上探索长视频创作。02120最近收录AI计算机视觉# AI影视内容制作# AI长视频生成# 文本到视频生成模型
EX-4DEX-4D 是一项最新的 4D 视频合成技术,通过“Depth Watertight Mesh”提升极端视角下单目输入视频的几何一致性与视觉质量,适合 AI 工具使用者和计算机视觉研究者探索视频生成与合成应用。01930最近收录AI计算机视觉# AI增强现实内容生成# AI影视短片制作# AI视频漫游
VFX8VFX8 是一站式 AI 制片工场,提供从分镜脚本、角色设计到视频生成的全流程 AI 支持,助力影视创作者快速落地优质作品。本文详解功能特点、使用场景与常见问题,帮你全面了解 VFX8。01950教育与学习最近收录AI# AI制片工厂# AI影视创作# AI视频生成
EmbodiedGenEmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具,支持多模态资产(图像、文本、布局)生成具实体感的 3D 交互环境,适合机器人训练、仿真与生成式 AI 研究者使用。02510开源工具与社区最近收录AI# AI 纹理生成# 图像生成3D# 文本生成3D
OmniFlowOmniFlow 是松下与 UCLA 联合开发的多模态生成式 AI,实现文本、图像、音频之间的 Any‑to‑Any 转换,极大降低训练数据成本,适用于内容创作、无障碍辅助与多媒体生成。02740最近收录AI计算机视觉# 图生文本# 图生音频# 多模态生成式AI
Hailuo 02Hailuo 02 是 MiniMax 推出的最新 AI 视频生成模型,支持文本和图像转视频,具备 768p、10 秒时长选项,具备物理仿真、摄像机控制、高成本效能比,超越 Google Veo 3,适合创作者与开发者使用。02000大模型最近收录AI# AI短视频生成# 图像转视频# 文本转视频
Sparc3DSparc3D 是一款开源的高分辨率稀疏三维重建与生成框架,结合 Sparcubes 和 Sparconv‑VAE 技术,可实现 1024³ mesh 重建与文本/图像到 3D 模型生成,适用于游戏、VR、3D 打印等应用场景。05250开源工具与社区最近收录AI# AI 3D打印# AI VR场景生成# AI游戏场景生成
Labubu WallpaperLabubu Wallpaper 是 AI 生成的 Pop Mart Labubu 角色壁纸平台,提供高清静态与动态桌面/手机背景,支持个性化定制、节日主题及 live wallpaper,面向壁纸爱好者和AI工具用户。02370免费AI工具最近收录AI# AI Labubu玩偶风格# Labubu AI 壁纸
Kontext AIKontext AI 利用先进的 FLUX Kontext 模型,提供上下文感知的图像生成与编辑服务,支持文本+图像提示、角色一致编辑、高速响应,适合设计师、内容创作者与营销人员。02330API与SDK免费AI工具# AI图像生成# AI图像编辑# AI图片增强
FlowDirectorFlowDirector是一款无需训练的文本驱动视频编辑新框架,通过 ODE 流式演化实现高精度、时序一致的视频修改,具备局部可控与语义对齐优势,适合创作者和开发者快速文本编辑视频。03090开源工具与社区最近收录AI# AI短视频制作# AI视频编辑框架
Flux Contextfluxcontext.app 是一款强大的 AI 在线图像编辑 平台,提供在线的照片修复、动漫风格转换、水印移除、人物与背景替换等专业功能,适合摄影师、设计师与内容创作者快速提升视觉质量。01810最近收录AI计算机视觉# AI去水印# AI图像增强# AI图像风格迁移
MorphicMorphic 是一款革命性的 AI 全能工作室,集图片生成、视频创作、动画、角色模型训练于一体,通过 Canvas + Copilot + Compose 的三合一设计,让影视制作人、设计师和创作者高效落地视觉叙事。01970最近收录AI计算机视觉# AI内容创作# AI动画制作# AI图像生成
Dzine (formerly Stylar.ai)Dzine 是一款功能强大的 AI 图像生成平台,结合文本→图像与图像编辑、风格迁移、图层控制与协作功能,适合设计师、创意者快速生成与修改高质量图像,轻松完成 Logo、角色设计、产品图等多场景创作。01830最近收录AI计算机视觉# AI图像生成平台# AI图像风格迁移# 图生图