该服务实现了一个端到端的实时语音交互系统,核心流程为:音频流接收→VAD 检测语音片段→(可选)说话人验证→ASR 转文本→表情格式化→实时返回。适用于需要实时语音转写并增强可读性(如带情感 / 事件表情)的场景,如实时会议记录、语音助手等。
chatglm-6b的项目代码
chatglm2-6b的项目代码