# 网站日志分析工具 **Repository Path**: sinma/webloganalysis ## Basic Information - **Project Name**: 网站日志分析工具 - **Description**: 网站日志分析工具是一款专为Web运维人员、安全分析师和网站管理员设计的桌面日志分析工具。它能够快速解析和分析各种Web服务器日志文件,提供深入的流量分析、安全威胁检测、用户行为洞察和性能监控,帮助您全面了解网站运行状况。 - **Primary Language**: C# - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: https://www.sinma.net/ - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-21 - **Last Updated**: 2026-01-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 🌐 Web Log Analyzer | 网站日志分析工具
![Version](https://img.shields.io/badge/version-1.3.2-blue.svg) ![.NET](https://img.shields.io/badge/.NET-8.0-purple.svg) ![Platform](https://img.shields.io/badge/platform-Windows-lightgrey.svg) ![License](https://img.shields.io/badge/license-Commercial-red.svg) **专业的Web服务器日志分析工具,支持Apache、Nginx、IIS等多种日志格式** [功能特性](#-功能特性) • [快速开始](#-快速开始) • [详细介绍](#-详细介绍) • [技术栈](#-技术栈) • [更新日志](#-更新日志)
--- ## 📖 简介 **Web Log Analyzer** 是一款专为Web运维人员、安全分析师和网站管理员设计的桌面日志分析工具。它能够快速解析和分析各种Web服务器日志文件,提供深入的流量分析、安全威胁检测、用户行为洞察和性能监控,帮助您全面了解网站运行状况。 ### 核心价值 - 🚀 **高效解析** - 快速处理大型日志文件,支持多线程并行分析 - 🔍 **深度分析** - 多维度数据分析,从流量、性能、安全到用户行为 - 🛡️ **安全防护** - 智能识别攻击模式,提供威胁评分和黑名单建议 - 📊 **可视化** - 精美的图表展示,支持交互式数据探索 - 📄 **专业报告** - 一键生成Excel和PDF专业分析报告 - 🌍 **精准定位** - 集成CZDB纯真IP库,中国IP精确到城市和运营商 --- ## ✨ 功能特性 ### 🎯 核心功能 #### 1. 多格式日志解析 - ✅ **Apache** - Combined/Common格式 - ✅ **Nginx** - 默认和自定义格式 - ✅ **IIS** - W3C扩展日志格式 - ✅ **自定义格式** - 支持正则表达式配置 #### 2. 全方位数据分析 **📈 流量分析** - 总请求数、独立访客统计 - 状态码分布和时间趋势 - Top URL、Top IP排行 - HTTP方法分布 - 每小时请求分布 - Top 404错误页面 **⚡ 性能分析** - 平均响应时间统计 - 响应时间分位数(P50/P75/P90/P95/P99) - 响应时间分布区间 - 慢请求识别(>1秒) - URL性能排行 - 每小时性能趋势 **🔒 安全分析** - 安全威胁检测(SQL注入、XSS、路径遍历) - 攻击IP识别和威胁评分 - IP黑名单建议(威胁评分≥50) - 可疑活动模式识别 - 爬虫和Bot检测 - 攻击类型分类统计 **🛡️ 威胁分析** - 威胁IP详细信息(等级、评分、攻击次数) - 首次发现和最后活动时间 - 威胁行为模式分析 - 自动生成黑名单建议 - 威胁趋势分析 **👤 用户行为分析** - 会话统计和访问深度 - 浏览器和操作系统分布 - 设备类型识别 - 文件类型访问统计 - 用户路径分析 - 跳出率计算 **🌍 地理位置分析** - 基于CZDB纯真IP库的精准定位 - 国家、省份、城市级别统计 - 运营商(ISP)分布 - 地理热力图可视化 - 区域访问趋势 **🕷️ 爬虫分析** - 搜索引擎爬虫统计(Google、Baidu、Bing等) - 恶意爬虫识别 - 爬虫类型分布 - 爬虫访问频率分析 **🔗 来源分析** - Referrer来源统计 - 搜索引擎来源分析 - 社交媒体引流统计 - 直接访问 vs 外部链接 #### 3. 数据可视化 **📊 图表类型** - 折线图 - 时间趋势分析 - 柱状图 - 分类数据对比 - 饼图 - 占比分布展示 - 热力图 - 二维数据密度 - 树状图 - 层级数据展示 **🎨 交互功能** - 图表缩放和平移 - 数据点详情查看 - 时间范围筛选(0-23小时) - 图表导出(PNG/JPEG/SVG) - 实时数据刷新 #### 4. 报告导出 **📄 Excel报告(11个工作表)** - 概览总结 - 流量分析详细数据 - 性能分析统计 - 用户行为数据 - 安全分析记录 - 地理位置分布 - 爬虫统计 - 来源分析 - 洞察和建议 - 图表可视化 - 完整数据清单 **📋 PDF报告** - 专业排版布局 - 完整数据表格 - 洞察和建议 - 未授权版本水印 - 页眉页脚定制 **🖼️ 图表导出** - PNG格式(高清) - JPEG格式(压缩) - SVG格式(矢量图) #### 5. 高级功能 **⚙️ 智能洞察** - 自动生成分析洞察 - 异常模式识别 - 优化建议推荐 - 安全风险提示 - 性能瓶颈定位 **🎯 数据筛选** - 时间范围筛选 - IP地址筛选 - URL路径筛选 - 状态码筛选 - 自定义条件筛选 --- ## 🚀 快速开始 ### 系统要求 - **操作系统**: Windows 10/11 (64位) - **运行时**: .NET 8.0 Runtime(已内置于独立发布版) - **内存**: 最低2GB,推荐4GB+ - **磁盘**: 500MB可用空间(不含日志文件) ### 安装步骤 #### 方法一:安装包安装(推荐) 1. 下载最新版安装包 `WebLogAnalyzer_v1.3.0_Setup.exe` 2. 双击运行安装程序 3. 按照安装向导完成安装 4. 从开始菜单或桌面快捷方式启动程序 #### 方法二:绿色版(免安装) 1. 下载绿色版压缩包 2. 解压到任意目录 3. 双击 `web_log_analyzer.exe` 启动程序 ### 首次使用 1. **启动程序** - 双击运行主程序 2. **授权验证** - 点击菜单栏「关于」→ 输入授权码 → 保存并验证 3. **导入日志** - 点击「导入日志」按钮选择日志文件 4. **开始分析** - 程序自动识别格式并开始解析 5. **查看结果** - 切换不同Tab查看分析结果 6. **导出报告** - 点击「导出为Excel」或「导出为PDF」生成报告 --- ## 📘 详细介绍 ### 工作流程 ```mermaid graph LR A[选择日志文件] --> B[自动识别格式] B --> C[流式解析] C --> D[数据分析] D --> E[可视化展示] E --> F{需要报告?} F -->|是| G[导出Excel/PDF] F -->|否| H[继续分析] G --> I[完成] H --> A ``` ### 支持的日志格式示例 #### Apache Combined格式 ``` 192.168.1.100 - - [25/Oct/2025:14:23:45 +0800] "GET /index.html HTTP/1.1" 200 4523 "https://google.com" "Mozilla/5.0..." ``` #### Nginx默认格式 ``` 192.168.1.100 - - [25/Oct/2025:14:23:45 +0800] "GET /api/users HTTP/1.1" 200 2341 "https://example.com" "Mozilla/5.0..." 0.045 ``` #### IIS W3C扩展格式 ``` 2025-10-25 14:23:45 192.168.1.100 GET /home 200 0 0 1234 234 125 ``` ## 🔧 技术栈 ### 核心技术 - **框架**: .NET 8.0 / C# 12 - **UI**: WPF (Windows Presentation Foundation) - **架构**: MVVM (Model-View-ViewModel) - **异步**: async/await + Task并行库 ### 主要依赖库 | 库名称 | 版本 | 用途 | |--------|------|------| | **MaterialDesignThemes** | 5.1.0 | Material Design UI组件 | | **LiveChartsCore.SkiaSharpView.WPF** | 2.0.0-rc2 | 图表可视化 | | **EPPlus** | 7.0.5 | Excel文件生成 | | **QuestPDF** | 2024.3.0 | PDF文档生成 | | **UAParser** | 3.1.47 | User-Agent解析 | | **Serilog** | 3.1.1 | 日志记录 | | **Newtonsoft.Json** | 13.0.3 | JSON序列化 | | **MessagePack** | 2.5.140 | 高性能序列化 | ### 自研组件 - **StreamParser** - 高性能流式日志解析器 - **CSharpAnalyzerService** - 多维度数据分析引擎 - **ChartInteractionService** - 图表交互服务 - **GeoIPService** - 基于CZDB的IP地理定位 - **LicenseManager** - 企业级授权管理 - **ExportService** - 报告导出服务 --- ## 📊 性能指标 | 指标 | 数值 | 说明 | |------|------|------| | 解析速度 | 50-100 MB/s | 取决于硬件配置 | | 支持文件大小 | 10 GB+ | 流式处理,内存占用可控 | | 内存占用 | < 2 GB | 大文件分析时 | | 报告生成 | < 30 秒 | 10万条日志 | | 启动时间 | < 3 秒 | 冷启动 | --- ## 📝 更新日志 ## 更新日志 v1.3.2 - 当前版本 + 更新纯真IP库到20260114版本 ## 更新日志 v1.3.1 + 合并安全与威胁分析 + 增加响应时间设置教程 + 更新纯真IP地址库到20251203 ### v1.3.0 (2025-11-21) **🎉 新增功能** - ✨ 新增6个Tab页的独立PDF导出功能(流量、性能、安全、威胁、用户行为、爬虫) - ✨ 新增威胁分析和爬虫分析的专门Compose方法 - ✨ 新增所有数据展示区域的导出按钮 - ✨ Excel和PDF导出支持分节独立导出 **🔧 优化改进** - 🎨 统一导出按钮样式(Excel绿色、PDF蓝色) - 🔐 强化Excel导出的授权验证 - 📄 PDF报告内容专业化,每个Tab生成专门内容 - 🖼️ 未授权版本PDF和图片自动添加水印 **🐛 Bug修复** - 修复所有PDF导出内容相同的问题 - 修复StaticResource引用错误 - 修复SpiderDetail属性访问错误 ### v1.2.0 (2025-11-01) **🎉 新增功能** - ✨ 集成CZDB纯真IP库,中国IP精准定位 - ✨ 完善Excel报告,增加至11个工作表 - ✨ 新增地理位置分析独立窗口 - ✨ 新增爬虫分析Tab页 - ✨ 新增来源分析功能 **🔧 优化改进** - 🎨 优化授权验证流程,支持离线模式 - 📊 优化数据展示格式 - 🔐 授权码加密存储到注册表 **🐛 Bug修复** - 修复城市数据显示问题 - 修复性能分析响应时间数据缺失 ### v1.1.0 (2025-10-26) **🎉 新增功能** - ✨ 实现完整的流量分析功能 - ✨ 新增安全威胁检测 - ✨ 新增用户行为分析 - ✨ 支持Excel和PDF报告导出 **🔧 优化改进** - 🎨 优化UI界面布局 - 📊 优化图表展示效果 ### v1.0.0 (2025-10-20) **🎉 首次发布** - ✨ 支持Apache和Nginx日志解析 - ✨ 基础流量统计功能 - ✨ 图表可视化展示 - ✨ 基础报告导出 --- ## 🗺️ 开发路线图 ### 近期计划 (1-2个月) - [ ] 大文件处理优化(流式读取、多线程并行) - [ ] 实时日志监控功能 - [ ] PDF报告添加图表 - [ ] 深色主题支持 - [ ] 批处理功能 ### 中期计划 (3-6个月) - [ ] SQLite数据库集成 - [ ] 智能告警系统 - [ ] AI异常检测 - [ ] 威胁情报集成 - [ ] RESTful API接口 ### 长期愿景 (6-12个月) - [ ] SaaS云服务版本 - [ ] 插件系统架构 - [ ] 移动端应用 - [ ] 多租户支持 - [ ] 分布式部署 详见 [TODO.md](todo.md) 完整开发计划。 --- ## 🤝 贡献与反馈 ### 报告问题 如遇到Bug或有功能建议,请通过以下方式反馈: - 📧 **邮箱**: sinma@qq.com - 💬 **QQ**: 42033223 - 🌐 **官网**: https://www.sinma.net/ ### 功能请求 欢迎提出新功能建议,我们会认真评估每一个提案。 ### 商业合作 - 企业定制开发 - 技术支持服务 - 授权合作 - OEM合作 --- ## 👨‍💻 关于作者 **sinma** - 全栈开发工程师 - 🌐 个人网站: https://www.sinma.net/ - 📧 邮箱: sinma@qq.com - 💬 QQ: 42033223 --- ## 📄 许可证 本软件为商业软件,需要购买授权码后使用。 - ✅ 授权用户享有完整功能使用权 - ⚠️ 未授权用户功能受限 - ❌ 禁止逆向工程、破解和二次分发 - ℹ️ 详见授权协议 --- ## 🙏 致谢 感谢以下开源项目和服务: - [.NET Foundation](https://dotnetfoundation.org/) - .NET平台 - [MaterialDesignInXAML](https://github.com/MaterialDesignInXAML/MaterialDesignInXamlToolkit) - UI组件 - [LiveCharts2](https://github.com/beto-rodriguez/LiveCharts2) - 图表库 - [EPPlus](https://github.com/EPPlusSoftware/EPPlus) - Excel处理 - [QuestPDF](https://github.com/QuestPDF/QuestPDF) - PDF生成 - [CZDB](https://cz88.net/) - 纯真IP库 ---
**⭐ 如果觉得这个项目不错,欢迎Star支持!** **📧 联系我们**: sinma@qq.com | **💬 QQ**: 42033223 **Copyright © 2026 [sinma.net](https://www.sinma.net/). All rights reserved.**