OmniVoice-Studio：本地开源AI影视配音与声音克隆工具 - 自游人 - 专注AI旅行与赚钱技术的自由行社区 17you.com

辉哥收录于实用工具与脚本

2026-04-17 2026-07-18 约 500 字预计阅读 1 分钟 0 条评论 0 次阅读

目录

OmniVoice‑Studio 是一款 本地部署、全栈开源 的 AI 影视级音频配音、声音克隆与语音生成工具。它基于开源 OmniVoice 600 语言零样本扩散模型，无需 API 密钥和云端服务，直接在本地运行，兼顾隐私与高效。

概述

本地 AI 影视配音工作室，支持 视频配音、人声分离、声音克隆、语音生成 全流程
跨平台兼容，自动调用 GPU/CPU 加速，无云端依赖，隐私性强

核心功能

视频配音：转录、翻译、重新配音，可导出指定音轨，输出 MP4 格式
人声分离：内置 demucs，自动分离人声与背景音乐，保留原背景音
声音克隆与设计：仅需 3 秒音频即可克隆声音；支持按标签自定义新音色
精细混音：配音片段独立音量调节（0‑200%），支持广播级音频平衡
便捷操作：快捷键 workflow、实时系统资源监控、拖拽上传、撤销/重做
多 speaker 支持：自动区分说话人，分配独立音色，本地项目持久化存储

部署方式

Docker 一键部署（推荐）
- 克隆仓库 → 进入目录 → 执行 docker compose up --build -d
- 访问 http://localhost:8000 使用
本地开发部署
- 前置安装 ffmpeg、Bun、uv
- 分别启动后端（uv）与前端（bun），端口 5173/8000
- 首次运行自动下载约 1.2 GB 模型权重

开发与更新

项目地址： https://github.com/debpalash/OmniVoice-Studio

原文链接： https://www.17you.com/tool/omnivoice-studio-ai-voice-cloning/ 已复制！

脚本编程和自动化工具

寻找技术支持帮助和技术合伙人一起搞事。

请点击联系我

相关内容

📝 评论功能需要启用 JavaScript

你可以在评论区留下你的想法，所有留言都会在审核后展示。

发现新版本

当前站点有新版本可用。