# crawler_bjp_database **Repository Path**: dplearning/crawler_bjp_database ## Basic Information - **Project Name**: crawler_bjp_database - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-14 - **Last Updated**: 2026-01-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 保健食品注册信息爬虫 这是一个用于爬取保健食品注册信息的爬虫程序。 ## 功能特点 - 自动访问保健食品注册信息系统 - 自动搜索"增强免疫力"相关的保健食品 - 爬取产品名称、保健功能和主要原料信息 - 支持多页数据爬取 - 数据保存为Excel和JSON格式 ## 环境要求 - Python 3.7+ - Chrome浏览器 - 稳定的网络连接 ## 安装步骤 1. 安装所需的Python包: ```bash pip install -r requirements.txt ``` 2. 确保已安装Chrome浏览器 ## 使用方法 直接运行Python脚本: ```bash python health_food_crawler.py ``` ## 输出文件 - `health_food_data.xlsx`: Excel格式的数据文件 - `health_food_data.json`: JSON格式的数据文件 ## 注意事项 1. 请确保网络连接稳定 2. 程序运行过程中请勿关闭浏览器窗口 3. 如需修改爬取页数,可以在代码中修改`max_pages`参数 4. 如需启用无头模式,请取消注释代码中的相关配置