OpenClaw TTS 让你的大龙虾开口说话

辉哥收录于编程技巧项目实战和 AI技术教程 OpenClaw

2026-03-12 2026-03-12 约 900 字预计阅读 2 分钟 - 次阅读 - 条评论

OpenClaw自带支持文本转语音（TTS）功能，利用ElevenLabs、OpenAI或Edge TTS技术将文本转换为音频。
它支持多种配置选项和服务提供商，具有自动摘要和语音合成功能，用户可以通过配置文件或命令行进行详细设置。

支持的服务提供商

Edge TTS：首选或备用提供商，无需API密钥，默认使用微软Edge浏览器的在线神经网络语音合成服务。
以下设置在中国需要翻墙
ElevenLabs：可作为主要服务提供商或备用供应商。
OpenAI：可作为主要服务提供商或备用选项，也可用于生成摘要。

Edge TTS相关说明

Edge TTS是一种公开的网页服务，没有明确的SLA或使用限额规定，被视为“尽力而为”的服务。
微软的Speech REST API规定每次请求的音频播放时间上限为10分钟，Edge TTS的限制可能与此相当或更低。
Edge TTS支持语音配置选项和输出格式，但并非所有选项都为Edge服务所支持。

配置选项

API密钥：使用OpenAI或ElevenLabs服务时需要配置ELEVENLABS_API_KEY或OPENAI_API_KEY。
默认设置：如果没有API密钥，OpenClaw默认使用Edge TTS功能（除非用户通过设置禁用该功能）。
优先级：如果配置了多个提供者，系统会优先使用所选的提供者，其他提供者作为备用选项。

自动语音合成功能

默认状态：默认关闭，需要在配置文件中启用。
启用方式：通过配置文件中的messages.tts.auto或命令行/tts always（别名/tts on）启用。
Edge TTS：当语音合成功能处于启用状态时，Edge TTS会默认被激活。

配置文件示例

Edge TTS主模式（无需API密钥）

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
{
  messages: {
    tts: {
      auto: "always",
      provider: "edge",
      edge: {
        enabled: true,
        voice: "en-US-MichelleNeural",
        lang: "en-US",
        outputFormat: "audio-24khz-48kbitrate-mono-mp3",
        rate: "+10%",
        pitch: "-5%",
      },
    },
  },
}

模型驱动覆盖

默认情况下，模型可以发出TTS指令来覆盖单个回复的语音。
可以通过配置文件禁用所有模型覆盖或设置允许的覆盖选项（如允许切换提供商）。

ElevenLabs申请API

https://elevenlabs.io/app/settings

官方文档

https://docs.openclaw.ai/tts

原文链接： https://www.17you.com/programming/openclaw-tts-edge-elevenlabs-openai/ 已复制！

编程和技术

寻找技术支持帮助和技术合伙人一起搞事。

请点击联系我

OpenClaw TTS 让你的大龙虾开口说话

支持的服务提供商

Edge TTS相关说明

配置选项

自动语音合成功能

配置文件示例

Edge TTS主模式（无需API密钥）

模型驱动覆盖

ElevenLabs申请API

官方文档

相关内容

目录