OpenClaw TTS 让你的大龙虾开口说话

OpenClaw自带支持文本转语音(TTS)功能,利用ElevenLabs、OpenAI或Edge TTS技术将文本转换为音频。
它支持多种配置选项和服务提供商,具有自动摘要和语音合成功能,用户可以通过配置文件或命令行进行详细设置。

支持的服务提供商

  • Edge TTS:首选或备用提供商,无需API密钥,默认使用微软Edge浏览器的在线神经网络语音合成服务。
  • 以下设置在中国需要翻墙
  • ElevenLabs:可作为主要服务提供商或备用供应商。
  • OpenAI:可作为主要服务提供商或备用选项,也可用于生成摘要。

Edge TTS相关说明

  • Edge TTS是一种公开的网页服务,没有明确的SLA或使用限额规定,被视为“尽力而为”的服务。
  • 微软的Speech REST API规定每次请求的音频播放时间上限为10分钟,Edge TTS的限制可能与此相当或更低。
  • Edge TTS支持语音配置选项和输出格式,但并非所有选项都为Edge服务所支持。

配置选项

  • API密钥:使用OpenAI或ElevenLabs服务时需要配置ELEVENLABS_API_KEYOPENAI_API_KEY
  • 默认设置:如果没有API密钥,OpenClaw默认使用Edge TTS功能(除非用户通过设置禁用该功能)。
  • 优先级:如果配置了多个提供者,系统会优先使用所选的提供者,其他提供者作为备用选项。

自动语音合成功能

  • 默认状态:默认关闭,需要在配置文件中启用。
  • 启用方式:通过配置文件中的messages.tts.auto或命令行/tts always(别名/tts on)启用。
  • Edge TTS:当语音合成功能处于启用状态时,Edge TTS会默认被激活。

配置文件示例

Edge TTS主模式(无需API密钥)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
{
  messages: {
    tts: {
      auto: "always",
      provider: "edge",
      edge: {
        enabled: true,
        voice: "en-US-MichelleNeural",
        lang: "en-US",
        outputFormat: "audio-24khz-48kbitrate-mono-mp3",
        rate: "+10%",
        pitch: "-5%",
      },
    },
  },
}

模型驱动覆盖

  • 默认情况下,模型可以发出TTS指令来覆盖单个回复的语音。
  • 可以通过配置文件禁用所有模型覆盖或设置允许的覆盖选项(如允许切换提供商)。

ElevenLabs申请API

https://elevenlabs.io/app/settings

官方文档

https://docs.openclaw.ai/tts

原文链接: https://www.17you.com/programming/openclaw-tts-edge-elevenlabs-openai/ 已复制!
编程和技术

寻找技术支持帮助和技术合伙人一起搞事。

请点击联系我


相关内容