本地部署的ASR-LLM-TTS语音交互助手进一步完善,在前期实现的VAD实时检测对话、自由打断、多模态-多语种问答等功能基础上,进一步添加声纹识别、自由定制唤醒词、历史对话记忆功能。自由定制唤醒词通过ASR功能实现,使用汉字转为拼音的小技巧来提高召回率。声纹识别通过阿里开源的CAM++实现,其使用中文数据训练,适配中文对话场景。此期针对新功能进行demo演示,历史功能请查看前两期视频。和各位共享, 视频播放量 17457、弹幕量 6、点赞数 371、投硬币枚数 228、收藏人数 1030、转发人数 111, 视频作者 ABexit, 作者简介 U R SO CUTE !,相关视频:打造你自己的语音交互助手,实时对话-任意打断-多模态-多语种 | ASR-LLM-TTS大升级,如何为 AI 添加记忆功能?Memobase 与 Dify 的完美结合,用Python做一个语音聊天机器人(完整)接入AI,python实现语音识别功能-喂饭式教学(附文档 源码),讯飞唤醒+VOSK语音识别+DEEPSEEK大模型+讯飞离线合成实现纯离线大模型智能语音问答,搭建你自己的本地语音交互助手 | 环境安装教程来啦,搭建自己的语音对话大模型 | ASR+LLM+TTS串联,LiveKit + Groq:打造低延迟、可实时打断的 AI 语音对话应用 | 安装与配置全教程,ASR→LLM→TTS:AI 语音延时怎么算?,FunASR 语音识别 流式推理 唤醒词控制
www.bilibili.com