OmniVoice-Studio:本地开源AI影视配音与声音克隆工具
目录
OmniVoice‑Studio 是一款 本地部署、全栈开源 的 AI 影视级音频配音、声音克隆与语音生成工具。它基于开源 OmniVoice 600 语言零样本扩散模型,无需 API 密钥和云端服务,直接在本地运行,兼顾隐私与高效。
概述
- 本地 AI 影视配音工作室,支持 视频配音、人声分离、声音克隆、语音生成 全流程
- 跨平台兼容,自动调用 GPU/CPU 加速,无云端依赖,隐私性强
核心功能
- 视频配音:转录、翻译、重新配音,可导出指定音轨,输出 MP4 格式
- 人声分离:内置 demucs,自动分离人声与背景音乐,保留原背景音
- 声音克隆与设计:仅需 3 秒音频即可克隆声音;支持按标签自定义新音色
- 精细混音:配音片段独立音量调节(0‑200%),支持广播级音频平衡
- 便捷操作:快捷键 workflow、实时系统资源监控、拖拽上传、撤销/重做
- 多 speaker 支持:自动区分说话人,分配独立音色,本地项目持久化存储
部署方式
- Docker 一键部署(推荐)
- 克隆仓库 → 进入目录 → 执行
docker compose up --build -d - 访问
http://localhost:8000使用
- 克隆仓库 → 进入目录 → 执行
- 本地开发部署
- 前置安装 ffmpeg、Bun、uv
- 分别启动后端(uv)与前端(bun),端口 5173/8000
- 首次运行自动下载约 1.2 GB 模型权重
开发与更新
原文链接:
https://www.17you.com/tool/omnivoice-studio-ai-voice-cloning/
已复制!
脚本编程和自动化工具
寻找技术支持帮助和技术合伙人一起搞事。