# csv_compare **Repository Path**: Tim_o/csv_compare ## Basic Information - **Project Name**: csv_compare - **Description**: 1.对比2分CSV文件内容是否一致 2.支持先排序再对比 3.将不一致的部分列举出来(对比结果在excel中,方便查看) 4.使用pandas内置方法,对于大数据的处理速度优秀(亲测速度杠杠滴) - **Primary Language**: Unknown - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-03-06 - **Last Updated**: 2023-03-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 功能介绍 1. 对比2分CSV文件内容是否一致 2. 支持先排序再对比 3. 将不一致的部分列举出来(对比结果在excel中,方便查看) 4. 使用pandas内置方法,对于大数据的处理速度优秀(亲测速度杠杠滴) # 使用指引 1. 分别将两份CSV文件的绝对路径赋予hive_file_path、mysql_file_path(顺序无所谓) 2. 运行函数csv_compare(若需要先排序再对比可写入sort=True) 1. 不排序对比 ![image](images/csv_compare_02.gif) 2. 先排序,再对比 ![image](images/csv_compare_02.gif) 3. 如果只想得到一份排序后的文件,可以使用方法sort_file_new ![image](images/sort_file_new.gif)