# einvoice
**Repository Path**: tomhat/einvoice
## Basic Information
- **Project Name**: einvoice
- **Description**: 电子发票识别,可识别大部分地区的电子普票、电子专票、火车票,文件类型支持 pdf
- **Primary Language**: Java
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 1
- **Forks**: 1
- **Created**: 2025-01-17
- **Last Updated**: 2025-12-01
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 电子发票识别
```xml
org.apache.pdfbox
pdfbox
3.0.2
```
### 简介
电子发票识别,可识别大部分地区的电子普票、电子专票、火车票,文件类型支持 pdf
OldInvoiceExtractor 是旧版发票识别,识别内容比较全面
NewInvoiceExtractor 是新版发票识别, 识别关键信息
InvoiceExtractor 是结合了旧版和新版发票识别,识别内容为旧版和新版的并集
TrainTicketExtractor 火车票识别
**发票区别主要是通过`发票代码`来判断是旧版还是新版,旧版发票包含发票代码而新版发票没有**
### 引用
```xml
cn.net.asiacom
invoice
1.0
```
### 调用
* InvoiceExtractor 普通发票|专用发票解析类
> InvoiceExtractor.extract(file);
* TrainTicketExtractor 火车票解析类
> TrainTicketExtractor.extract(file);
1. 新版发票因格式不统一,目前还不能识别发票详情;
2. 火车票识别信息;