# crawler_bjp_database

**Repository Path**: dplearning/crawler_bjp_database

## Basic Information

- **Project Name**: crawler_bjp_database
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-14
- **Last Updated**: 2026-01-14

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 保健食品注册信息爬虫

这是一个用于爬取保健食品注册信息的爬虫程序。

## 功能特点

- 自动访问保健食品注册信息系统
- 自动搜索"增强免疫力"相关的保健食品
- 爬取产品名称、保健功能和主要原料信息
- 支持多页数据爬取
- 数据保存为Excel和JSON格式

## 环境要求

- Python 3.7+
- Chrome浏览器
- 稳定的网络连接

## 安装步骤

1. 安装所需的Python包：
```bash
pip install -r requirements.txt
```

2. 确保已安装Chrome浏览器

## 使用方法

直接运行Python脚本：
```bash
python health_food_crawler.py
```

## 输出文件

- `health_food_data.xlsx`: Excel格式的数据文件
- `health_food_data.json`: JSON格式的数据文件

## 注意事项

1. 请确保网络连接稳定
2. 程序运行过程中请勿关闭浏览器窗口
3. 如需修改爬取页数，可以在代码中修改`max_pages`参数
4. 如需启用无头模式，请取消注释代码中的相关配置