# einvoice **Repository Path**: tomhat/einvoice ## Basic Information - **Project Name**: einvoice - **Description**: 电子发票识别,可识别大部分地区的电子普票、电子专票、火车票,文件类型支持 pdf - **Primary Language**: Java - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2025-01-17 - **Last Updated**: 2025-12-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 电子发票识别 ```xml org.apache.pdfbox pdfbox 3.0.2 ``` ### 简介 电子发票识别,可识别大部分地区的电子普票、电子专票、火车票,文件类型支持 pdf OldInvoiceExtractor 是旧版发票识别,识别内容比较全面 NewInvoiceExtractor 是新版发票识别, 识别关键信息 InvoiceExtractor 是结合了旧版和新版发票识别,识别内容为旧版和新版的并集 TrainTicketExtractor 火车票识别 **发票区别主要是通过`发票代码`来判断是旧版还是新版,旧版发票包含发票代码而新版发票没有** ### 引用 ```xml cn.net.asiacom invoice 1.0 ``` ### 调用 * InvoiceExtractor 普通发票|专用发票解析类 > InvoiceExtractor.extract(file); * TrainTicketExtractor 火车票解析类 > TrainTicketExtractor.extract(file); 1. 新版发票因格式不统一,目前还不能识别发票详情; 2. 火车票识别信息;