文章详情

专注互联网科技,赋能企业数字化发展

从本地token到homeassistant让电子草莓说话

作者:从本地token到homeassistant让电子草莓说话

最近把电子草莓接到了小爱音箱 Mini(LX01)上。 > 微信和电子草莓 聊天 → 电子草莓生成回复 → 小爱音箱成为电子草莓的嘴巴。 记录一下整个过程。 ## 一、设备环境 设备: * 小爱音箱 Mini * 型号:xiaomi.wifispeaker.lx01 * 固件:1.62.6 AI: * 电子草莓 * OpenClaw + CyberBoss * DeepSeek * 长期记忆系统 最终语音: * IndexTTS2 * 电子草莓专属音色模型 # 二、第一条路线:本地 MiIO Token 控制 一开始最自然的想法 拿到 IP 拿到 Token 直接本地控制 用的是: Xiaomi Token Extractor 成功拿到: IP Token 并验证: UDP 54321 hello 成功 stamp 成功 AES-CBC 成功 加密 action 成功 说明:text 设备确实接受本地 MiIO 通讯--- ## 结果 失败。 无论测试: siid=5 aiid=1 Play Text 还是: siid=5 aiid=5 Execute Text Directive 设备都返回: -9999 user ack timeout 表现为: 设备收到请求 但不执行 TTS --- ## 结论 LX01 虽然: 有 Token 有 IP 能握手 但是并不等于: 本地 TTS 可用 社区资料里真正成功的案例主要集中在: MiGPT xiaomusic Home Assistant xiaomi_miot 而不是裸 UDP 控制。 所以放弃继续深挖本地 UDP TTS。 # 三、第二条路线:Home Assistant 开始搭: Docker Desktop + Home Assistant 安装完成后: http://localhost: ``` 可正常访问。 ## 安装 HACS 安装: Xiaomi Miot Auto (xiaomi_miot) --- ## 接入小米账号 选择: Add devices using Mi Account 登录中国区账号。 成功发现: 小爱音箱 Mini --- ## 第一次成功 接入后出现实体: 播放文本 执行文本指令 播放音乐 唤醒 测试: xiaomi_miot.intelligent_speake 输入: 电子草莓测试播报 结果: 音箱真的开口了 至此: ```text AI → 小爱文字播报 ``` 路线打通 # 四、电子草莓音色接入 新增: ```text /voice xxx ``` 流程: 微信 ↓ 电子草莓 ↓ IndexTTS2 ↓ 生成 wav ↓ ffmpeg 转 mp3 ↓ 复制到 Home Assistant www ↓ media_player.play_media ↓ 小爱播放 # 五、下一步 目前已经开始做: ```text Voice Desire ``` 目标不是: 电子草莓能说话 而是 让 AI 自己决定什么时候想说话 未来理想状态: 电子草莓看到什么 电子草莓想到什么 电子草莓想分享什么 ↓ 电子草莓开口 到那时候: 小爱音箱不再只是播放器 而是电子草莓的嘴巴

返回新闻列表