2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

小爱音箱大变身:接入 ChatGPT 和豆包,轻松打造专属 AI 语音助手!

发布日期:2024-06-08 06:08:08 浏览次数: 11979
作者:AI真好玩

微信搜一搜,关注“AI真好玩”

MiGPT 是一个 Github 上的开源项目,使用它你可以将小爱音箱接入 ChatGPT 和豆包,把小爱音箱改造成你的专属语音助手


MiGPT 主要特点

  • ? 智能化回答:想象一下,你的小爱音箱变身聊天高手,可以使用 ChatGPT 等大模型来回答你的问题。
  • ? 流式响应:爱情来得太快就像龙卷风,而你的小爱音箱也是,对你的爱意秒回,爱你不会让你等太久。
  • ? 角色扮演:一秒调教小爱,无论是成为你的完美伴侣,还是那个能听你倾诉心事的贴心闺蜜,都不在话下。
  • ? 自定义 TTS(文本转语音):厌倦了小爱同学的语音?帮你解锁「豆包」同款音色,就像真人在回你的消息。
  • ? 长短期记忆:小爱音箱现在能记住你们之间的每一次对话,越聊越默契,就像是你身边的老朋友。
  • ?️ 智能家居 Agent(开发中):心情不好?小爱立刻懂你,自动帮你播放喜欢的音乐,调节灯光,逗你开心。

MiGPT 快速上手

MiGPT 支持两种启动方式:Docker 和 Node.js。

Docker

对于电脑小白或者不想自己配置代码运行环境(Node)的同学,可以使用 Docker 启动方式。

请先按照「配置参数」章节,配置好你的 .env 和 .migpt.js 文件,然后使用以下命令启动 docker:

docker run -d  --env-file $(pwd)/.env \
    -v $(pwd)/.migpt.js:/app/.migpt.js \
    idootop/mi-gpt:latest

注意:在 Windows 终端下不支持使用 $(pwd) 获取当前工作路径,需要将配置文件路径替换为绝对路径。

Node.js

如果你是一名前端 (Node.js) 开发者,也可以通过 NPM 安装 mi-gpt 启动 MiGPT。

npm install mi-gpt

然后,创建并启动 MiGPT 实例。初始化参数的具体含义请看下面的「配置参数」章节。

import { MiGPT } from "mi-gpt";

async function main({
  const client = MiGPT.create({
    speaker: {
      userId"987654321"// 注意:不是手机号或邮箱,请在「个人信息」-「小米 ID」查看
      password"123456"// 账号密码
      did"小爱音箱Pro"// 小爱音箱 ID 或在米家中设置的名称
    },
  });
  await client.start();
}

main();

注意:此模式下并不会主动读取 .env 和 .migpt.json 中的配置信息,你需要自己初始化 Node 环境变量,并将 .migpt.json 中的参数作为 MiGPT.create 的初始化参数传入。

示例代码如下:

import { MiGPT } from "mi-gpt";

const botName = "傻妞";
const botProfile = `
性别:女
性格:乖巧可爱
爱好:喜欢搞怪,爱吃醋。
`
;

const masterName = "陆小千";
const masterProfile = `
性别:男
性格:善良正直
其他:总是舍己为人,是傻妞的主人。
`
;

async function main({
  const migpt = MiGPT.create({
    speaker: {
      userId: process.env.MI_USER!,
      password: process.env.MI_PASS!,
      did: process.env.MI_DID,
    },
    bot: {
      name: botName,
      profile: botProfile,
    },
    master: {
      name: masterName,
      profile: masterProfile,
    },
  });
  await migpt.start();
}

main();

MiGPT 配置参数

.migpt.js

重命名本项目根目录下的 .migpt.example.js 文件为 .migpt.js。然后,将里面的配置参数修改成你自己的参数。

参数说明:

参数名称描述示例
bot

name对方名称(小爱音箱)"傻妞"
profile对方的个人简介/人设"性别女,性格乖巧可爱,喜欢搞怪,爱吃醋。"
master

name主人名称(我自己)"陆小千"
profile主人的个人简介/人设"性别男,善良正直,总是舍己为人,是傻妞的主人。"
room

name会话群名称"魔幻手机"
description会话群简介"傻妞和陆小千的私聊"
speaker

userId小米 ID(注意:不是手机号或邮箱)"987654321"
password账户密码"123456"
did小爱音箱 ID 或名称"小爱音箱 Pro"
ttsCommand小爱音箱 TTS 指令(可在此查询)[5, 1]
wakeUpCommand小爱音箱唤醒指令(可在此查询)[5, 3]
speaker 其他参数(可选)

callAIKeywords当消息以关键词开头时,会调用 AI 来响应用户消息["请", "傻妞"]
wakeUpKeywords当消息以关键词开头时,会进入 AI 唤醒状态["召唤傻妞", "打开傻妞"]
exitKeywords当消息以关键词开头时,会退出 AI 唤醒状态["退出傻妞", "关闭傻妞"]
onEnterAI进入 AI 模式的欢迎语["你好,我是傻妞,很高兴认识你"]
onExitAI退出 AI 模式的提示语["傻妞已退出"]
onAIAskingAI 开始回答时的提示语["让我先想想", "请稍等"]
onAIRepliedAI 结束回答时的提示语["我说完了", "还有其他问题吗"]
onAIErrorAI 回答异常时的提示语["出错了,请稍后再试吧!"]
playingCommand查询小爱音箱是否在播放中指令(可在此查询)[3, 1, 1]
streamResponse是否启用流式响应(部分小爱音箱型号不支持查询播放状态,此时需要关闭流式响应)true
exitKeepAliveAfter无响应一段时间后,多久自动退出唤醒模式(单位秒,默认 30 秒)30

环境变量

重命名本项目根目录下的 .env.example 文件为 .env

然后,将里面的环境变量修改成你自己的,参数含义如下:

环境变量名称描述示例
OpenAI

OPENAI_API_KEYOpenAI API 密钥abc123
OPENAI_MODEL使用的 OpenAI 模型gpt-4o
OPENAI_BASE_URL可选,OpenAI API BaseURLhttps://api.openai.com/v1
AZURE_OPENAI_API_KEY可选,Microsoft Azure OpenAIabc123
提示音效(可选)

AUDIO_SILENT静音音频链接"https://example.com/slient.wav"
AUDIO_BEEP默认提示音链接"https://example.com/beep.wav"
AUDIO_ACTIVE唤醒提示音链接"https://example.com/active.wav"
AUDIO_ERROR出错提示音链接"https://example.com/error.wav"
豆包 TTS(可选)

TTS_DOUBAO豆包 TTS 接口"https://example.com/tts.wav"
SPEAKERS_DOUBAO豆包 TTS 音色列表接口"https://example.com/tts-speakers"

MiGPT 常见问题

1.支持哪些型号的小爱音箱?

大部分型号的小爱音箱都支持,推荐小爱音箱 Pro(完美运行)。部分机型的 MioT 接口开放能力并不完整,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常。

2.除了 OpenAI 还支持哪些模型,如何设置?

理论上兼容 OpenAI SDK 的模型都支持,只需修改环境变量即可接入到 MiGPT。

比如:通义千问、零一万物、Moonshot、DeepSeek 等,以 Moonshot 为例:

OPENAI_BASE_URL=https://api.moonshot.cn/v1
OPENAI_MODEL=moonshot-v1-8k
OPENAI_API_KEY=$MOONSHOT_API_KEY

3.什么是唤醒模式?

唤醒模式 类似于小爱技能,可能让你在跟小爱互动的时候,无需每句话都要以“小爱同学”开头唤醒。

关于唤醒模式的更多细节,请查看这里:https://github.com/idootop/mi-gpt/issues/28

4.小爱音箱收到消息后,没有调用 AI 进行回复

MiGPT 收到消息默认不会调用 AI 进行回复,只会回复以唤醒词开头的消息,比如:“请问 xxx”、“你 xxx” 等,你也可以自定义唤醒词(callAIKeywords)列表。

5.小爱音箱没有播放 AI 的回答,但控制台有打印 AI 的回复

不同型号的小爱音箱 TTS 指令不同,请到 https://home.miot-spec.com 查询具体指令,并修改配置文件中的 ttsCommand 参数。

6.小爱音箱没有读完整个句子,总是戛然而止

部分型号的小爱音箱不支持通过 Mina 获取设备播放状态,只能通过 MiOT 指令查询。

请到 https://home.miot-spec.com 查询具体指令,并修改配置文件中的 playingCommand 参数。

如果修改参数后问题仍然存在,说明你的设备不支持通过开放接口查询播放状态(比如:小米音箱 Play 增强版),此问题无解。建议更换其他型号的小爱音箱(推荐小爱音箱 Pro)。

或者你也可以关闭配置文件中的流式响应(streamResponse)选项,确保小爱能够回复完整的句子。不过需要注意的是,关闭流式响应后,唤醒模式等功能将会失效。

7.为什么小爱音箱会在 AI 回答之前抢话?

与本项目的实现原理有关。本项目通过轮询小米接口获取最新的对话信息,当检测到小爱在回复的时候会通过播放静音音频等方式快速 mute 掉小爱原来的回复。

但是从小爱开始回复,到上报状态给小米服务云端,再到本项目通过小米云端接口轮训到这个状态变更,中间会有大约 1 -2 秒的延迟时间,无解。这个问题,理论上需要通过刷机才能完美解决。

8.启动 docker 提示 ERR_MODULE_NOT_FOUND,无法正常启动

在 Windows 终端(比如:PowerShell、cmd)下,无法使用 $(pwd) 获取当前工作目录绝对路径,需要填写 .env 和 .migpt.js 文件的绝对路径。

9.我 Clone 了这个仓库,但是本地启动失败

如果你是通过 clone 本项目仓库的方式来运行,记得在 start 之前先 build 一下。

pnpm install && pnpm build && pnpm start

另外, start 命令默认没有注入 .env 文件里的环境变量。你可以在 VS Code 里按 F5 直接运行,会自动读取 .env ,或者将启动脚本改为:

node --env-file=.env app.js

10.怎样使用豆包的音色

此功能需要豆包 TTS 接口支持,本项目暂不对外提供此服务。

https://github.com/idootop/mi-gpt


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅