# pansearch爬虫 **Repository Path**: qianchilang/pansearch-crawler ## Basic Information - **Project Name**: pansearch爬虫 - **Description**: 爬取https://www.pansearch.me/网站夸克链接 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2024-11-02 - **Last Updated**: 2025-01-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # pansearch爬虫 ![输入图片说明](%E9%A1%B5%E9%9D%A2%E5%B1%95%E7%A4%BA.png) ## 介绍 夸克网盘爬虫是一个专门用于爬取 https://www.pansearch.me/ 网站上的夸克网盘链接的工具。 它能够自动收集、存储和管理这些链接,并提供查询和检测失效链接的功能。 win整合包下载: [https://pan.quark.cn/s/9c69c0266296](https://pan.quark.cn/s/9c69c0266296) 主要功能包括: 1. 爬取 pansearch.me 网站上的夸克网盘链接 2. 将有效链接保存到本地数据库 3. 按日期范围查询已保存的链接 4. 检测并标记失效的链接 请注意:本工具仅供学习和研究使用,请遵守相关法律法规和网站使用条款。 ## 软件架构 本项目使用 Python 编写,主要依赖以下技术和库: - Streamlit:用于构建交互式 Web 界面 - SQLite:用于本地数据存储 - Requests:用于发送 HTTP 请求 - BeautifulSoup:用于解析 HTML 内容 - 其他 Python 标准库:如 re, datetime, random 等 软件架构采用模块化设计,主要包括: - 爬虫模块:负责从网页获取链接 - 数据库模块:处理数据的存储和查询 - 链接检测模块:检查链接的有效性 - Web 界面模块:提供用户交互界面 #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request