# TestOCRWeb

**Repository Path**: fightroad/test-ocrweb

## Basic Information

- **Project Name**: TestOCRWeb
- **Description**: 一个PaddleOCR识别WebApi项目
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-12-20
- **Last Updated**: 2025-12-20

## Categories & Tags

**Categories**: Uncategorized

**Tags**: PaddleOCR, TestOCRWeb

## README

# PaddleOCR TestWeb

PaddleOCR 的 Web 测试应用程序，提供 OCR 功能的 Web 界面。

## 功能特点

- 📷 **图片OCR识别**：支持 PNG、JPG、BMP 等图片格式
- 📄 **PDF文档识别**：支持PDF文档的OCR识别
- 🔧 **文本后处理**：提供多种文本后处理模式
- 🌐 **Web界面**：友好的Web操作界面
- ⚙️ **灵活配置**：支持多种OCR参数配置

## 界面预览

![界面截图1](doc/ocr1.png)

![界面截图2](doc/ocr2.png)

## 快速开始

```bash
# 运行程序
./TestWeb.exe

# 访问应用
# 浏览器打开：http://localhost:5000
```

## 使用说明

### 图片识别

1. 选择图片文件
2. 选择后处理模式
3. 点击"开始识别"
4. 查看识别结果

### PDF识别

1. 选择PDF文件
2. 配置识别参数：
   - 后处理模式
   - 是否优先提取文本层
   - 渲染DPI设置
3. 点击"开始识别"
4. 查看识别结果

### 文本后处理测试

1. 输入测试文本（每行一个文本块）
2. 选择后处理模式
3. 点击"测试后处理"
4. 查看处理结果

## 配置参数

### PDF渲染DPI

| DPI值 | 说明 | 适用场景 |
|-------|------|----------|
| **96-100** | 速度最快 | 清晰的电子文档 |
| **120** | **平衡速度和质量（推荐）** | 大部分PDF文档 |
| **150-200** | 高质量 | 复杂文档、小字体 |
| **300** | 打印质量 | 需要最高精度的场景 |

## API 接口

### 图片识别
```
POST /api/ocr/recognize
Content-Type: multipart/form-data
参数：
- file: 图片文件
- mode: 后处理模式（可选）
```

### PDF识别
```
POST /api/ocr/recognize-pdf
Content-Type: multipart/form-data
参数：
- file: PDF文件
- mode: 后处理模式（可选）
- tryExtractTextLayer: 是否优先提取文本层（可选）
- pdfRenderDpi: PDF渲染DPI（可选）
```

### 文本后处理测试
```
POST /api/ocr/test-post-process
Content-Type: application/json
参数：
- textBlocks: 文本块列表
- mode: 后处理模式
```

## 注意事项

1. **首次使用**：会自动下载OCR模型文件
2. **文件大小**：单exe文件较大（100-200MB），因为包含了.NET运行时
3. **启动速度**：首次启动可能较慢，后续启动会快一些
4. **内存使用**：OCR处理需要较多内存，建议至少4GB RAM
5. **文件格式**：支持常见图片格式和PDF文档

## 故障排除

### 常见问题

1. **启动失败**
   - 检查端口5000是否被占用

2. **OCR识别失败**
   - 检查图片文件是否损坏
   - 检查文件格式是否支持
   - 查看控制台错误信息

3. **PDF识别失败**
   - 检查PDF文件是否损坏
   - 检查PDF是否加密
   - 尝试调整DPI设置

### 日志查看

程序运行时的日志会输出到控制台，可以查看详细的错误信息。

## 更新日志

### v1.0.0
- 初始版本
- 支持图片和PDF的OCR识别
- 提供Web界面
- 支持多种文本后处理模式
- 支持单exe文件发布