# 爬虫代码 **Repository Path**: yoshihikoAa/crawler-code ## Basic Information - **Project Name**: 爬虫代码 - **Description**: 代码保存 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-10-02 - **Last Updated**: 2021-12-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 网络爬虫代码 #### 介绍 代码保存,python。 #### 软件架构 软件架构说明 #### 安装教程--MongoDB 1. 在windows下安装MongoDB(主要按照菜鸟教程:[https://www.runoob.com/mongodb/mongodb-window-install.html](http://)) 2. PyMongo的安装 (1)直接pip install pymongo (2)如果报错,下载whl文件,网址:[https://www.lfd.uci.edu/~gohlke/pythonlibs/ ](http://) (3)可以查看教程:[https://blog.csdn.net/songrenqing/article/details/80650433](http://) #### 使用说明 1. 爬取文本内容: a.正则表达式; b.xpath方法; c.Beautifulsoup方法; 2. 爬取图片、音频、视频 3. Python数据库——MongoDB,用来保存数据 4. 异步加载和请求头;(目前正在学) #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)