众力资讯网

本地跑 AI 语音克隆的开源神器来了! ElevenLabs 又贵又要上传音频

本地跑 AI 语音克隆的开源神器来了!

ElevenLabs 又贵又要上传音频?试试 OmniVoice Studio,直接在桌面本地完成零样本语音克隆、语音设计和电影级视频配音!

无需 API Key、无云端、无账号,全程本地运行,支持 646 种语言,3 秒样本就能克隆任意声音。还内置了实时听写小组件、声源分离、说话人分离、批量配音队列,甚至能给 AI 生成的音频打上不可见水印。

GitHub:github.com/debpalash/OmniVoice-Studio

主要功能: - 零样本语音克隆:3 秒样本 → 克隆任意声音,支持 646 种语言 - 语音设计:自由调节性别、年龄、口音、音调、语速、情感和方言 - 视频配音:输入 YouTube 链接或本地文件 → 自动转录、翻译、重配音、导出 MP4 - 全局听写小部件:⌘+⇧+Space 在任意应用中实时转写并自动粘贴 - 声源分离 + 说话人分离:Demucs + Pyannote,自动识别“谁说了什么” - 批量队列:一次扔 50 个视频,自动跑完带进度条 - 完全本地:无密钥、无云端、无隐私泄露,支持 CUDA / MPS / ROCm / CPU - MCP Server:可直接在 Claude、Cursor 等 MCP 客户端中调用

支持 macOS、Windows、Linux,一键安装桌面 App,或用 Docker / Bun 源码运行。

开源工具 AI语音 本地部署