微信扫码
添加专属顾问
我要投稿
OmniVoice Studio让你免费在本地实现电影级配音,支持3秒声音克隆和646种语言,无需联网,保护隐私。 核心内容: 1. 项目核心功能:3秒零样本语音克隆与电影级视频自动配音 2. 高级特性:全局实时听写、人声分离、批量处理与AI水印 3. 安装与技术支持:跨平台部署方案与多种TTS/ASR引擎介绍
实时听写 + 3秒零样本语音克隆 + 646种语言视频配音,全程本地运行,无需账号、无需API密钥!
它能让你在自己的电脑上完成:
全部本地运行,完全免费开源!
⌘ + ⇧ + Space 即可在任意应用中实时转录并自动粘贴OmniVoice Studio 支持 Windows、macOS、Linux 三大平台,提供以下三种使用方式:
1. 最推荐 - 桌面应用(最简单)
直接下载安装包(macOS DMG / Windows MSI / Linux AppImage),安装后启动即可。首次会自动下载所需模型,之后使用非常方便。
2. Docker 一键部署
适合有服务器或喜欢容器化的用户,一条命令即可启动,支持 CPU 和 NVIDIA GPU。
3. 从源码运行(开发者推荐)
git clone https://github.com/debpalash/OmniVoice-Studio.git
cd OmniVoice-Studio
bun install && bun run dev
支持热重载,方便二次开发和修改。
主要 TTS 引擎(多引擎可切换):
语音识别(ASR):
说话人区分(Diarization):Pyannote-audio + WhisperX。
人声分离:Demucs(保留背景音乐)。
其他音频处理:
GPU/硬件加速:
项目对显存要求友好,8GB显存也能通过自动卸载机制正常运行。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-15
2026年了,我强烈推荐你用一用Codex,功能太全面了!附使用指南
2026-05-14
DAA度量Agent,百度智能云率先重构AI云
2026-05-14
美团 LongCat 开源 General 365:树立推理评测新标尺
2026-05-14
终端里住进了一个叫 Claude Code 的搭档
2026-05-14
小企业专属Claude来了!一键接入全套业务流,不用写代码AI自动算账催款
2026-05-14
重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案
2026-05-14
别再一步步确认了:/goal让AI编程真正自己干活
2026-05-14
MiniMax 推出了 Mavis,活脱脱的 Agent「三省六部」
2026-04-15
2026-02-14
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-04-07
2026-03-21
2026-02-20
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22
2026-04-18