# PaddleOCRLabel **Repository Path**: soasoft/paddle-ocrlabel ## Basic Information - **Project Name**: PaddleOCRLabel - **Description**: No description available - **Primary Language**: C# - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 31 - **Created**: 2021-09-14 - **Last Updated**: 2021-09-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # PaddleOCRLabel #### 介绍 PaddleOCRLabel是基于百度飞桨(PaddleOCR)开发的一款半自动标注平台。 #### 开发所需的先决条件 1. Windows 10系统 2. Visual Studio 2017 3. Python3.7 #### 单独运行(不开发)所需的先决条件 1. Windows 10系统 2. .NET 4.x 3. Python3.7 #### 安装教程 1. 运行python_rest python_rest是一个使用Python Flask编写的Rest服务,调用paddleocr库,获取扫描识别后的文字。(python_rest所用到的Python第三方库请自行安装) 运行命令: cd python_rest python rest.py 将在本机启动一个http://127.0.0.1:5000的服务。 注意:目前python_rest服务只能安装在exe程序运行所在的电脑上(后面会介绍原因) 2. 运行paddle_ocrlabel项目 使用Visual Studio 2017打开paddle_ocrlabel目录下的paddle_ocrlabel.sln即可。 3. 不使用Visual Studio 2017,直接运行paddle_ocrlabel 解压缩PaddleOCRLabel-Release-1.0.zip,运行paddle_ocrlabel.exe即可 #### python_rest服务列表 python_rest目前支持三个服务: 1. http://127.0.0.1:5000/detect [POST]输入参数为图片本地的路径,只返回侦测区域 2. http://127.0.0.1:5000/recognition [POST]输入参数为图片本地的路径,返回侦测区域和识别文本 3. http://127.0.0.1:5000/regregion [POST]输入参数为图片本地的路径和局部区域的坐标,返回这个局部区域的识别文本 #### 使用说明 1. 点击软件左上角的“打开目录”按钮,打开要标注的图片所在的目录。 2. 点击软件左下角的某张图片,点击“单张标注按钮”,对该图片进行标注。 3. 点击软件左上角的“全部标注按钮”,对该目录下的所有图片进行标注。 4. 点击标注按钮后,获取到的标注区域,会显示在图片上为蓝色边框的矩形框,并自动保存在本地。 5. 软件中间的标注区域,虚线为安全区域分界线,手动标注只能在安全区域内进行。 6. 对服务返回的标注结果不满意?可以手动标注,包括以下几个步骤: 6.1) 点击软件右上角的“启动矩形标注”按钮,然后就可以在软件中间的标注区域,用鼠标圈选区域了。新选的区域的边框为橙色。同时,会在软件左下角的标注区域的列表中新增一个条目,显示新增标注区域的坐标。 6.2) 点击软件右上角的“重新识别选中区域”按钮,会调用python_rest服务,返回该区域的文字,显示在软件左下角的标注区域的列表中。 7. 对于返回的识别区域的坐标和文字,显示在软件左下角的标注区域的列表中。有两种排序方式,一种是通用的横排版书籍(自上而下,从左到右),另一种是竖排版的古籍(从右到左,自上而下),可以灵活切换。 8. 对于手动标注和重新识别文字的结果,可以保存至本地,点击软件右上角的“保存标注”按钮即可,也可以使用快捷键Ctrl+S。 9. 手动标注过程中,支持回滚操作,点击软件右上角的“撤销标注”按钮即可,也可以使用快捷键Ctrl+Z。 10. 软件左上角的的单选框,默认选中“只检测文字区域”,这样python_rest服务只返回检测到的区域的坐标,而不进行文字识别,这样很快就能返回结果。如果选择“检测区域,并识别文字”,则python_rest服务不光返回区域的坐标,还会返回识别的文字,接口速度要比前面的慢一些。 #### 待完善的功能点 1. 对标注拖放、缩放的功能 2. 标注的四点标注功能 3. 图片的放大和缩小 4. python_rest服务支持多线程 5. python_rest服务支持接收图片的base64编码作为参数 6. 在paddle_ocrlabel标注平台,可配置要连接的python_rest服务的ip地址和端口 7. 删除选中的标注点 #### 参与贡献 1. 希望小伙伴们加入到paddle_ocrlabel标注平台的开发和建设中。