Step‑Audio‑AQAAStep‑Audio‑AQAA 是 StepFun 出品的一款端到端大规模音频–语言模型,支持音频问答任务,从原始音频直接生成自然语音回答,具备情感、语速、方言控制,高保真响应,非常适合 AI 工具使用者构建交互式音频智能系统。02970大模型最近收录AI# AI音色控制# 双重编码器# 端到端处理