# data_analysis_01 **Repository Path**: ailark/data_analysis_01 ## Basic Information - **Project Name**: data_analysis_01 - **Description**: 用Python实现简单的数据分析和可视化。 AI->Python分析工具->完成数据分析。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-20 - **Last Updated**: 2025-10-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # da_demo_01 · 数据分析与可视化演示 本项目对数据集 `da_demo_01.csv` 进行清洗、统计与可视化,生成多类图表与 Markdown 分析报告,帮助快速了解销售渠道、客户行业、商品表现与时间趋势等核心指标。 ## 目录结构 - `data_analysis.py`:主分析脚本,读取 `./da_demo_01.csv`,生成图表与报告 - `font_test.py`:中文字体显示测试脚本,会生成 `font_test.png` - `requirements.txt`:Python 依赖列表 - `analysis_report.md`:分析报告文件(运行后自动更新) ## 环境准备 - 建议 Python 3.9+ - 安装依赖: ```bash pip install -r requirements.txt ``` 依赖包括:`pandas`、`matplotlib`、`seaborn`、`numpy`、`openpyxl`。 ## 数据源 - 默认数据路径:`./da_demo_01.csv` - 若你的目录结构不同,请在 `data_analysis.py` 中修改如下代码中的路径: ```python df = load_and_clean_data('./da_demo_01.csv') ``` ## 快速开始 在本目录下运行: ```bash python data_analysis.py ``` 运行后会完成数据加载、清洗、统计分析,并生成图表与报告。 ## 输出内容 脚本运行完成后将在本目录生成: - `sales_analysis.png`:销售分析图表(渠道占比、行业销售额、月度趋势、热力图) - `product_analysis.png`:商品分析图表(价格分布、销量分布、价格-销量关系、Top 商品) - `customer_analysis.png`:客户分析图表(行业分布、付款周期、各行业平均订单金额、渠道箱线图) - `comprehensive_dashboard.png`:综合仪表板(KPI、渠道占比、月度趋势、价格分布、行业排行、关系图、热力图) - `analysis_report.md`:Markdown 分析报告(关键发现与业务建议) ## 数据字段要求 数据文件需包含以下字段(列名需一致): - `下单日期`、`付款日期`(日期类型) - `价格`、`销量`(数值类型) - `渠道`、`客户行业`、`商品名称` 脚本将自动计算: - `销售额 = 价格 * 销量` - `付款周期 = 付款日期 - 下单日期`(天) ## 字体与中文显示 - 为确保图表中文显示正常,脚本设置了可用的中文字体(如 `Hiragino Sans GB`、`Songti SC`、`PingFang HK` 等)。 ## 常见问题 - 文件路径错误(`FileNotFoundError`):确认 `./da_demo_01.csv` 存在;或修改脚本中的路径。 - 中文显示为方块/乱码:按需调整 `plt.rcParams['font.sans-serif']` 中的字体列表,或安装对应字体。 - 无 GUI 环境运行报错:如果因 `plt.show()` 造成问题,可注释相关行或设置后端为 `Agg`(例如:`MPLBACKEND=Agg`)。 ## 许可与贡献 此示例主要用于学习与演示,欢迎在此基础上扩展功能(如增加命令行参数、更多分析维度、导出交互式可视化等)。