Fay是一个完整的开源项目,包含Fay控制器及数字人模型,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、Her。
LipSync ChatBot 这个聊天机器人基本上是一个python语音识别聊天机器人,具有可视化的字符支持功能,可以进行口型同步。
3D Chatbot与IBM Watson语音转文本,助理以及Oculus Lipsync在Unity上进行语音转文本
OPT(Omni-Perception Pre-Trainer)是全场景感知预训练模型的简称,中文名字叫紫东太初,是中科院自动化和华为联合研发的多模态预训练模型,本仓是紫东太初十亿参数级别模型的MindSpore版本代码,包含预训练模型及多个下游任务模型。
II-RPA 是全面智能公司出品的一款RPA工具。它基于智能化数据处理业务模型,运用自主开发的自然语义分析引擎、逻辑计算单元、算法建模单元、图像识别等技术,通过模拟人对统一业务系统的各环节业务操作,进行逻辑判断和智能化操作结合人工智能的应用实现工作流程中的自动化。
AnyQ(ANswer Your Questions) 开源项目主要包含面向FAQ集合的问答系统框架、文本语义匹配工具SimNet。本开源项目受国家重点研发计划“云计算和大数据”专项支持(项目号 2018YFB1004300 )
DMKit作为UNIT的开源对话管理模块,可以无缝对接UNIT的理解能力,并赋予开发者多状态的复杂对话流程管理能力,还可以低成本对接外部知识库,迅速丰富话术信息量。
[python3.6] 运用tf实现自然场景文字检测,keras/pytorch实现ctpn+crnn+ctc实现不定长场景文字OCR识别
crnn实现水平和垂直方向中文文字识别,欢迎关注,试用和反馈问题... ...