# python-work **Repository Path**: mn_1127/python-work ## Basic Information - **Project Name**: python-work - **Description**: python学习 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-04-26 - **Last Updated**: 2023-04-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # python-work #### 介绍 python语言学习,从实际的业务场景需求出发学习使用python来开发使用的小功能 #### 软件架构 单脚本运行,每个脚本解决一个实际问题 #### 安装教程 前置条件:python版本3.7+ ,为了确保能够正常运行建议在miniconda3环境下,构建一个全新的python3.7基板出来。 1. 首先安装依赖: ```shell script pip install -r requirements.txt ``` 2. 执行src下的代码 ```shell script python idc-10.py ``` #### 业务场景说明 1. 国家医保局或者国家标准制定委员会制定的很多文件都是以PDF文件的形式进行发布的,PDF文件有很好的优点,但是再转成结构化数据比较困难。故采用python语言的工具包来将PDF文件转化为结构化的数据库表或者更加灵活的Excle文件。 技术方案: ``` 采用pdfplumber组件进行品PDF文件的读取,使用pandas组件进行数据的转化、过滤,最后使用pandas的to_excle或者to_sql函数进数据写入文件或者数据库 ```