Gemini 3.1 Flash TTS
T-03模型 长尾

Gemini 3.1 Flash TTS

Google 推出的低延迟文本转语音模型。

01

Gemini 3.1 Flash TTS 是什么

Gemini 3.1 Flash TTS 是 Google 推出的实时文本转语音模型,面向低延迟语音生成与语音 Agent 场景。Google 官方表示,该模型支持自然语音输出、可控语调与表达式标签(Expressive Audio Tags),可通过自然语言精确控制语速、语气与旁白风格。模型已通过 Gemini API、Google AI Studio 与 Vertex AI 提供预览接入,并支持多语言语音生成。

核心功能

  • 低延迟语音生成
  • 支持表达式语音标签
  • 支持多语言 TTS
  • 自然语音输出
  • 支持 Gemini API

使用场景

  • AI 配音
  • 语音助手
  • 实时播报
  • 语音 Agent
  • 内容创作

适合谁用

适合语音 AI 开发者与内容创作者

常见问题

**Q: Gemini 3.1 Flash TTS 是什么?**

Gemini 3.1 Flash TTS 是 Google 推出的实时文本转语音模型。

**Q: Gemini 3.1 Flash TTS 怎么用?**

开发者可通过 Gemini API、AI Studio 或 Vertex AI 调用模型能力。

**Q: Gemini 3.1 Flash TTS 收费吗?**

通常按 API 调用量与语音生成时长收费。

资料来源

  • https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-tts-preview
  • https://ai-bot.cn/gemini-3-1-flash-tts/
AI大学堂