DeepSeek-OCR 2DeepSeek-OCR 2 是 DeepSeek AI 发布的端到端 OCR(光学字符识别)视觉语言模型,基于 Visual Causal Flow 机制处理图像与文档输入,生成结构化文本输出(如 Markdown/JSON),用于复杂文档的逻辑顺序转录与布局感知识别。030大模型最近收录AI# Markdown 输出# OCR 模型# 复杂布局识别
LightOnOCR-2-1BLightOnOCR-2-1B 是一种开源的 1B 参数端到端 OCR(光学字符识别)模型,用于将文档图像(如 PDF、扫描件或照片)转化为清晰、自然排序的文本。模型在标准基准上提供高质量识别,并支持多种输入格式与布局类型。090大模型最近收录AI# 图像检测# 多语言支持# 布局解析
Vidu AgentVidu 团队推出的 AI 视频创作智能体平台,通过“一键成片”技术与自动分镜编排,实现从视觉输入到成品输出的全流程视频生成,适用于广告、产品展示、短片与创意视频等多种场景。0430内容创作最近收录AI# AI分镜编辑# AI视频创作智能体平台# AI视频生成工具
Gemini TTSGemini TTS 是 Google 最新的文本转语音(Text-to-Speech)技术,通过 Gemini API 或 Google AI Studio 提供高质量、多语言、多角色语音合成服务。支持细粒度风格、语速、情绪与多语音输出控制,并可用于播客、课程、辅助工具与互动应用等场景。0620API与SDK内容创作# AI语音合成# 多语言支持# 文本转语音
CluesoClueso 是一款面向屏幕录制者的 AI 平台,可将录制内容自动转换为高质量产品视频与操作文档,支持多语言、本地协作与品牌定制,适合 AI 工具使用者快速生产培训与演示内容。02700最近收录AI计算机视觉# AI屏幕录制转视频# AI视频生成# 多语言支持
Decopy AIDecopy AI 是一款免费一体化写作工具,涵盖 AI 内容检测、人性化润色、文档/视频摘要、数学题求解等功能,适合 AI 工具使用者提升内容质量与创作效率。03280教育与学习最近收录AI# AI人性化润色# AI内容检测# AI学术写作
EXAONE 4.0EXAONE 4.0 是 LG AI Research 发布的混合智能大模型,集通用理解与多步推理于一体,提供 32B 高性能与 1.2B 本地部署版本,支持工具调用与多语言,是 AI 工具使用者进行开发集成的核心资源。02810大模型开源工具与社区# 多语言支持# 混合模型
SpeakrSpeakr 是一款开源自托管应用,专注会议/音频转录、摘要、说话人识别和聊天交互,适合 AI 工具使用者轻松部署隐私安全的语音笔记平台。04250开源工具与社区最近收录AI# AI音频转录# 多语言支持
QuickCreatorQuickCreator 是一款集 AI 写作、SEO 优化、博客托管与落地页生成于一体的全流程平台,通过关键词、语义分析与 SERP 模型,帮助用户快速创建高质量 SEO 内容并提升自然流量,是中国出海企业与营销用户的高效内容工具。03130关键词研究与分析内容优化# AI内容营销平台# AI博客写作# SEO技术优化
TwocastTwocast 是一款 AI 驱动的双人播客生成平台,支持从文章、网址或文档快速生成 3–9 分钟的 AI 对话播客,拥有多语言、多音色支持及下载功能,是内容创作者、教育者与营销人员的高效音频工具。03450教育与学习最近收录AI# AI Podcast Generator# AI内容创作# AI双人播客
Mobvoi TicNoteTicNote 是一款融合硬件与 AI Agent(Shadow)的智能录音笔,支持高质量录音、实时转录、多语言翻译、概括摘要并进行深度项目处理,是 AI 用户提升生产力的实用利器。05120最近收录AI自主智能系统# AI Agent# AI录音# 多语言支持
11.ai11ai,即 ElevenLabs,由 Piotr Dąbkowski 和 Mati Staniszewski 于 2022 年创办,总部位于纽约,专注于开发高质量语音合成与克隆技术。02740API与SDK最近收录AI# AI播客制作# AI有声书# AI语音克隆
学术猹学术猹 是网易有道推出的专业学术辅助平台,专注于论文智能降重、AI 内容去痕、跨语言互译、查重优化等全流程服务,为学生、研究者、教师提供安全高效的一站式学术写作解决方案。03060教育与学习最近收录AI# AIGC检测# AI学术写作辅助工具# AI检测
Essay Grader AIEssay Grader 是一款 AI 驱动的在线论文评分平台,专为教育工作者和学生设计,支持批量上传、自定义评分标准、抄袭与 AI 检测、Google Classroom/Canvas 集成,显著提升评分效率与反馈质量。01940教育与学习最近收录AI# AI内容生成检测# AI抄袭检测# AI论文辅助评分工具
CreateVision AICreateVision AI 是一款完全免费的无登录 AI 图像生成平台,支持多引擎驱动、无限次高质量图像创作,为创意工作者、设计师、内容营销人员带来极致便捷与自由。03060免费AI工具最近收录AI# AI图像生成工具# 多语言支持
CognigyCognigy 是领先的企业级对话式 AI 编排平台,专为联络中心和客服场景打造低/无代码 AI Agent,实现多语言、多渠道自动化交互,提升用户体验、客服效率与业务成果。02640企业用户最近收录AI# Agent Copilot# Agentic AI 编排引擎# AI Agent
SongGenerationSongGeneration 是腾讯AILab开发的开源歌曲生成模型,基于 LeVo 架构与音乐编码器,可从歌词、风格描述与参考音频中并行生成和谐的“人声+伴奏”歌曲,支持中文与英文,适合 AI 工具使用者快速落地音乐创作。03000大模型开源工具与社区# AI音乐生成# 多语言支持
NeonLingoNeonLingo 是一款 AI 助力的浏览器扩展插件,通过上下文关键词翻译、自动标注和词汇本,帮助用户在网页阅读中无缝学习外语,提升阅读效率与词汇记忆。03190教育与学习最近收录AI# AI 浏览器扩展插件# AI翻译# PDF文本识别
BridgelyBridgely 是一款 AI 驱动的浏览器扩展,支持 60 多种语言的实时翻译,适用于 WhatsApp、Slack、Telegram、LinkedIn 等平台,帮助用户轻松跨语言沟通,提升工作效率。02150最近收录AI自然语言处理(NLP)# AI实时翻译# AI浏览器扩展# AI翻译引擎
Vocloner一款完全免费的在线 AI 语音克隆工具,能够在几秒钟内通过上传音频样本来即时生成语音克隆模型,支持多语言和情感语调选择。01920教育与学习最近收录AI# AI语音克隆工具# 多语言支持
Eleven v3由 ElevenLabs 于 2025 年 6 月推出的最新文本转语音(TTS)模型的 Alpha 版本。02380大模型最近收录AI# AI多角色对话# AI广告配音# AI情感表达
Qwen3 Reranker阿里云通义千问团队于 2025 年 6 月发布的开源文本重排序(Reranking)模型,作为 Qwen3 Embedding 系列的一部分。02110大模型开源工具与社区# AI信息检索# 多语言支持# 模型
Qwen3 Embedding阿里云通义千问团队于 2025 年 6 月推出的全新文本嵌入与重排序模型系列,专为文本表征、信息检索和排序任务设计。01690大模型智能推荐系统# AI信息检索# AI语义搜索# AI问答
OpenAudioFish Audio 推出的新一代文本转语音(TTS)模型,旨在生成高度自然、富有情感的语音输出。01850大模型娱乐媒体# AI播客能容创作# AI有声书内容创作# AI游戏角色语音
Elsa SpeakElsa Speak 是一款基于人工智能的英语口语矫正应用,通过实时发音反馈、个性化课程和覆盖7,100+场景的互动训练,帮助非母语用户提升发音准确性和语言流利度05970教育与学习自然语言处理(NLP)# AI英语口语矫正# 即时语音反馈# 多语言支持
DeepLDeepL翻译网站是一个在线翻译工具,提供高质量的机器翻译服务。因其高质量的翻译效果和用户友好的界面,成为许多用户和企业的首选翻译工具。01,0802AI热门产品自然语言处理(NLP)# 在线翻译工具# 多语言支持# 文档翻译
Argil.aiArgil.ai 是一个功能强大的 AI 视频创作平台,它利用人工智能技术,帮助用户轻松制作高质量的短视频,从而提升社交媒体品牌影响力。平台提供多种功能,包括 AI 克隆技术、智能脚本生成、一键生成视频等,让用户可以高效便捷地创作短视频。03570编程工具# AI克隆技术# 一键生成视频# 多语言支持