Sign in
Sign up
Explore
Enterprise
Education
Search
Help
Terms of use
About Us
Explore
Enterprise
Education
Gitee Premium
Gitee AI
AI teammates
Sign in
Sign up
Fetch the repository succeeded.
Open Source
>
Development Lib
>
Audio Process
&&
Donate
Please sign in before you donate.
Cancel
Sign in
Scan WeChat QR to Pay
Cancel
Complete
Prompt
Switch to Alipay.
OK
Cancel
Watch
Unwatch
Watching
Releases Only
Ignoring
27
Star
344
Fork
113
PaddlePaddle
/
PaddleSpeech
Code
Issues
14
Pull Requests
1
Wiki
Insights
Pipelines
Service
JavaDoc
PHPDoc
Quality Analysis
Jenkins for Gitee
Tencent CloudBase
Tencent Cloud Serverless
悬镜安全
Aliyun SAE
Codeblitz
SBOM
Don’t show this again
Update failed. Please try again later!
Remove this flag
Content Risk Flag
This task is identified by
as the content contains sensitive information such as code security bugs, privacy leaks, etc., so it is only accessible to contributors of this repository.
接收处理websocket接口的ASR语音流能支持异步处理返回识别内容吗?
Backlog
#I5GGFM
pengar
Opened this issue
2022-07-11 13:33
代码 \server\ws\asr_socket.py 是接收从websocket发来语音流,从代码里看是循环监听 websocket 收到的流消息,当有收到语音流消息时就调用 PaddleASRConnectionHanddler 进行语音识别,识别出内容后同步下发返回给websocket客户端。这种模式对于一段完整语音的识别是比较好又简单的。 但是在实际语音流的使用场情下,客户端每一次发来的语音流只是指定大小的数据块,并不是一段完整话,有时是有语音内容,也有是静音空内容,也有时候是一段话已经说结束了(停顿了几秒)。 意思是websocket可以不需要每次都返回识别内容,只需要收集到语音流能识别到一定程度后才异步返回下发返回给websocket客户端。这样使ASR服务有充足的识别时间,达到指定识别效果(分数)才返回给客户端这样才更理想,也能由ASR判断语音讲话是否已经结束(静音)。
代码 \server\ws\asr_socket.py 是接收从websocket发来语音流,从代码里看是循环监听 websocket 收到的流消息,当有收到语音流消息时就调用 PaddleASRConnectionHanddler 进行语音识别,识别出内容后同步下发返回给websocket客户端。这种模式对于一段完整语音的识别是比较好又简单的。 但是在实际语音流的使用场情下,客户端每一次发来的语音流只是指定大小的数据块,并不是一段完整话,有时是有语音内容,也有是静音空内容,也有时候是一段话已经说结束了(停顿了几秒)。 意思是websocket可以不需要每次都返回识别内容,只需要收集到语音流能识别到一定程度后才异步返回下发返回给websocket客户端。这样使ASR服务有充足的识别时间,达到指定识别效果(分数)才返回给客户端这样才更理想,也能由ASR判断语音讲话是否已经结束(静音)。
Comments (
1
)
Sign in
to comment
Status
Backlog
Backlog
Doing
Done
Closed
Assignees
Not set
Labels
Not set
Label settings
Milestones
No related milestones
No related milestones
Pull Requests
None yet
None yet
Successfully merging a pull request will close this issue.
Branches
No related branch
Branches (11)
Tags (16)
develop
dependabot/npm_and_yarn/demos/speech_web/web_client/semver-5.7.2
dependabot/npm_and_yarn/demos/speech_web/web_client/vite-2.9.16
speechx
r1.4
r1.3
r1.2
r1.1
r1.0
r0.2
r0.1
r1.4.1
r1.4.0
r1.3.0
r1.2.0
r1.1.0
r1.0.1
r1.0.0
r1.0.0a
r0.2.0
r0.1.2
r0.1.1
r0.1.0
v2.1.1
v2.1.0
v1.1
v1.0
Planed to start   -   Planed to end
-
Top level
Not Top
Top Level: High
Top Level: Medium
Top Level: Low
Priority
Not specified
Serious
Main
Secondary
Unimportant
参与者(1)
1
https://gitee.com/paddlepaddle/PaddleSpeech.git
git@gitee.com:paddlepaddle/PaddleSpeech.git
paddlepaddle
PaddleSpeech
PaddleSpeech
Going to Help Center
Search
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
Comment
Repository Report
Back to the top
Login prompt
This operation requires login to the code cloud account. Please log in before operating.
Go to login
No account. Register