# spider **Repository Path**: mrchai/spider ## Basic Information - **Project Name**: spider - **Description**: 一个基于JavaSE的爬虫小程序,相关技术:jdk11+,HttpRequest,IO流,File类等 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-10-31 - **Last Updated**: 2023-10-31 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # spider #### 介绍 一个基于JavaSE的爬虫小程序,相关技术:jdk11+,HttpRequest,IO流,File类等 #### 软件架构 软件架构说明 #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 具体操作步骤如下示例代码: ```java //1.创建爬虫对象 Spider spider = new Spider(); //2.设置目标网址 spider.setUrl("https://pvp.qq.com/web201605/herolist.shtml"); //3.设置爬取规则:正则表达式 spider.setRegex("game.gtimg.cn/images/yxzj/img201606/heroimg/.+?\\.jpg"); //4.设置资源存储目录 spider.setDownloadDir("C:\\Users\\Administrator\\Desktop\\code\\img"); //5.开始爬取 spider.download(); ``` > 以上代码执行完毕之后: > 1. 下载的文件将存储在指定目录`C:\\Users\\Administrator\\Desktop\\code\\img`下 > 2. 桌面上将会生成`spider_logs`目录(日志目录) > 3. 日志目录下会产生一个以日期命名的日志文件,如:`2023-10-31.log` #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)