Hy-MT1.5-1.8B-1.25bit 如何收费？

Hy-MT1.5-1.8B-1.25bit 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CH最近收录AI

▸ 最近收录AI · SITES

Hy-MT1.5-1.8B-1.25bit SITES

腾讯混元与 AngelSlim 的端侧翻译模型。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2026年5月31日更新 2026年5月31日浏览 3

// 01 Hy-MT1.5-1.8B-1.25bit 是什么

来自腾讯混元与 AngelSlim 的端侧翻译模型

Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队 Hy-MT1.5 翻译模型的超低比特量化版本，模型权重由 AngelSlim 相关账号在 Hugging Face 和魔搭社区发布。它不是通用聊天模型，而是面向机器翻译任务做专门优化的小参数模型。公开资料显示，Hy-MT1.5 系列由腾讯混元团队打造，包含 1.8B 和 7B 两个规模，重点支持多语言互译、术语干预、上下文翻译和格式保持。

这个 1.25bit 版本的核心价值在于端侧部署。普通大模型翻译往往依赖云端 API 或较大的本地模型，而 Hy-MT1.5-1.8B-1.25bit 通过 AngelSlim 的低比特量化，把 1.8B 翻译模型压缩到约 440MB 级别，使离线翻译、移动端翻译和低资源设备部署变得更现实。

它解决的问题

很多翻译场景并不适合完全依赖云端服务，例如隐私文本、出差弱网环境、企业内网资料、移动端实时翻译和需要控制成本的大规模调用。Hy-MT1.5-1.8B-1.25bit 面向的正是这类场景：在尽量保持翻译质量的前提下，把模型压缩到可以在端侧运行的体积。

它更适合开发者、移动应用团队、离线翻译工具开发者和需要私有化翻译能力的企业。对于普通用户来说，它不是一个直接打开网页就能使用的翻译网站，而更像一个可集成到 App、客户端或本地推理框架中的翻译模型。

核心能力

基于 Hy-MT1.5-1.8B 翻译模型量化而来，底座模型参数规模为 1.8B。
公开资料显示，1.25bit 版本模型体积约 440MB，另有 2bit 版本约 574MB。
支持 33 种语言，并覆盖 5 种民族语言或方言变体。
公开报道提到其覆盖 1056 个翻译方向，适合多语言互译场景。
Hy-MT1.5 系列支持术语干预、上下文翻译和带格式翻译等高级翻译能力。
魔搭社区提供 GGUF 版本，并放出了 Android Demo APK，方便测试端侧离线翻译效果。
AngelSlim 仓库信息显示，1.25bit 模型后续还发布了 STQ1_0 kernel，并向 llama.cpp 提交相关支持。

如何使用

Hy-MT1.5-1.8B-1.25bit 的使用方式主要分为模型下载、端侧测试和工程集成三类。开发者可以从 Hugging Face 或魔搭社区获取模型文件；如果只是体验效果，可以下载魔搭社区提供的 Android Demo APK；如果要集成到本地应用或服务中，则需要使用 GGUF、llama.cpp 或相关推理框架进行适配。

进入 Hugging Face 或魔搭社区模型页，确认模型文件、格式和使用说明。
如果需要在国内环境下载，可优先尝试魔搭社区提供的模型文件和 Demo APK。
如果只是体验端侧翻译，可安装 Android Demo APK 进行测试。
如果要做工程集成，可选择 GGUF 模型，并结合 llama.cpp 生态或移动端推理框架适配。
正式部署前需要测试目标设备上的速度、内存占用、语言覆盖和翻译质量。

典型使用场景

在移动端翻译 App 中，Hy-MT1.5-1.8B-1.25bit 可以作为离线翻译核心能力。用户在没有网络或不希望上传文本时，仍然可以完成中英、日韩、欧洲语言以及部分民族语言相关翻译。

在企业内网环境中，它适合处理不方便调用公网翻译 API 的文档和短文本。例如企业内部资料、客户沟通记录、技术文档片段，可以在本地或私有设备上完成翻译。

在硬件或边缘设备场景中，440MB 级别模型体积让翻译能力更容易嵌入终端设备，例如随身翻译设备、离线助手或行业专用终端。

与同类模型的差异

它与普通翻译 API 的差异在于本地化和端侧部署能力。商业 API 通常接入简单、质量稳定，但依赖网络和服务费用；Hy-MT1.5-1.8B-1.25bit 更适合需要离线、隐私、低成本长期运行的场景。

它与大参数开源翻译模型的差异在于体积和部署门槛。大模型可能在复杂语境下更强，但端侧部署成本高；这个 1.25bit 版本则把重点放在“够小、够快、能离线”上。

价格与使用成本

目前公开模型页没有看到单独的商业定价信息，模型权重和 GGUF 文件已公开发布。实际成本主要来自设备适配、推理框架集成和质量测试。对于开发者来说，它的性价比体现在可本地部署和可减少长期 API 调用成本；但如果只是偶尔翻译几句话，直接使用在线翻译服务会更省事。

真实优势与局限

Hy-MT1.5-1.8B-1.25bit 的优势很明确：体积小、面向端侧、支持多语言、具备离线翻译潜力，并且背后有腾讯混元和 AngelSlim 压缩技术路线支撑。它适合做端侧翻译产品和私有化翻译能力验证。

局限也同样清楚。1.25bit 属于极低比特量化，虽然官方强调翻译质量和效率，但具体到不同设备、不同语言对、长文本和专业术语场景，仍需要实测验证。它也不是面向普通用户的网页工具，缺少工程能力的用户直接使用门槛较高。对于追求最高翻译质量、复杂文档排版或企业级 SLA 的场景，仍需要和云端商业翻译 API 或更大规模模型一起评估。