OmniVoice-Studio:本地开源AI影视配音与声音克隆工具

OmniVoice‑Studio 是一款 本地部署、全栈开源 的 AI 影视级音频配音、声音克隆与语音生成工具。它基于开源 OmniVoice 600 语言零样本扩散模型,无需 API 密钥和云端服务,直接在本地运行,兼顾隐私与高效。

概述

  • 本地 AI 影视配音工作室,支持 视频配音、人声分离、声音克隆、语音生成 全流程
  • 跨平台兼容,自动调用 GPU/CPU 加速,无云端依赖,隐私性强

核心功能

  • 视频配音:转录、翻译、重新配音,可导出指定音轨,输出 MP4 格式
  • 人声分离:内置 demucs,自动分离人声与背景音乐,保留原背景音
  • 声音克隆与设计:仅需 3 秒音频即可克隆声音;支持按标签自定义新音色
  • 精细混音:配音片段独立音量调节(0‑200%),支持广播级音频平衡
  • 便捷操作:快捷键 workflow、实时系统资源监控、拖拽上传、撤销/重做
  • 多 speaker 支持:自动区分说话人,分配独立音色,本地项目持久化存储

部署方式

  • Docker 一键部署(推荐)
    • 克隆仓库 → 进入目录 → 执行 docker compose up --build -d
    • 访问 http://localhost:8000 使用
  • 本地开发部署
    • 前置安装 ffmpeg、Bun、uv
    • 分别启动后端(uv)与前端(bun),端口 5173/8000
    • 首次运行自动下载约 1.2 GB 模型权重

开发与更新

项目地址: https://github.com/debpalash/OmniVoice-Studio

原文链接: https://www.17you.com/tool/omnivoice-studio-ai-voice-cloning/ 已复制!
脚本编程和自动化工具

寻找技术支持帮助和技术合伙人一起搞事。

请点击联系我


相关内容