# chinese-ocr **Repository Path**: findry/chinese-ocr ## Basic Information - **Project Name**: chinese-ocr - **Description**: 基于tensorflow、keras/pytorch实现对自然场景的文字检测及端到端的OCR中文文字识别 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2019-10-09 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 基于tensorflow、keras/pytorch实现对自然场景的文字检测及端到端的OCR中文文字识别 # 实现功能 - [x] 文字方向检测:VGG - [x] 文本检测:CTPN - [x] 不定长OCR识别:CRNN + CTC ## 环境部署 ``` Bash sh setup.sh ``` # 模型训练 ## 训练keras版本的crnn ``` Bash cd train/keras-train & python train.py ``` ## 训练pytorch版本的crnn ``` Bash cd train/pytorch-train & python train.py ``` # 文字方向检测 在VGG16模型的基础上进行迁移学习,训练文字方向检测(0、90、180、270度)分类模型,详细代码参考angle/predict.py文件,训练图片100000张,准确率95.10%。 模型下载地址: * [baidu pan](https://pan.baidu.com/s/1nwEyxDZ) * [google drive](https://drive.google.com/file/d/14o6RL-cjyRq5XLP7UlKkt8KlDnMuw5Z_/view) # 文字检测 支持CPU、GPU环境,一键部署,文本检测训练参考:[https://github.com/eragonruan/text-detection-ctpn](https://github.com/eragonruan/text-detection-ctpn) # OCR端到端识别 ## 采用GRU + CTC端到端识别技术,实现不分隔识别不定长文字 提供keras与pytorch版本的训练代码,在理解keras的基础上,可以切换到pytorch版本,此版本更稳定 # 识别结果展示 ## 文字检测及OCR识别结果