# utools-batchReader **Repository Path**: empyrealtear/utools-batchReader ## Basic Information - **Project Name**: utools-batchReader - **Description**: 为归档统计文件编写的utools插件,缝了一些前端库的功能,主要用于整理票据 - **Primary Language**: JavaScript - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-04-29 - **Last Updated**: 2024-04-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 票据小助手 - 概要:基于javascript语言,读取电子票据内容 - 仓库:[utools-batchReader](https://github.com/empyrealtear/utools-batchReader) ## 一、界面功能 - [x] 表格预设列函数编辑页(基于javascript语言) - [x] 表格支持清空行 - [x] 支持合并PDF及OFD预览图至单个PDF中 - [x] 支持拆分并重命名PDF及OFD预览图至压缩包中 - [ ] 待办:覆盖式重命名 ## 二、运行原理 ### pdf电子文档 - [x] 使用pdf.js逐页读取电子票据 - [x] 渲染为图片并用opencv分割单元格 - [x] 对pdf文本排序分组,分为表内外文本 - [x] 配置预设列取数函数,提取字段信息 - [ ] 待办:一票多页、纯图片格式 ### ofd版式文件 - [x] 使用jszip库读取ofd版式文件压缩内容 - [x] 依据OFD.xml逐项遍历xml文件 - [x] 依据CustomTags.xml,标注Content.xml数据 - [x] 配置预设列取数函数,提取字段信息 - [ ] 待办:ofd转pdf ## 三、更新记录 - v0.0.4 优化表格列排序逻辑,修复分页及合并下载逻辑,提高预览图片精度 - v0.0.3 调整opencv识别表格参数,优化界面 - v0.0.2 添加ofd版式文件支持,优化界面 - v0.0.1 初始化测试 ## 四、引用仓库 - [utools-plugin-template](https://github.com/QC2168/utools-plugin-template) - [opencv.js](https://github.com/TechStark/opencv-js) - [pdf.js](https://github.com/mozilla/pdf.js) - [pdf-lib.js](https://github.com/Hopding/pdf-lib) - [ofd.js](https://github.com/DLTech21/ofd.js)