# 贝壳网站数据爬取练习 **Repository Path**: liu-lingjun/beike-website-data-parser ## Basic Information - **Project Name**: 贝壳网站数据爬取练习 - **Description**: 利用python爬取贝壳网站北京租房房源2000多条数据,可以观察下北京租房市场。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 4 - **Forks**: 0 - **Created**: 2021-11-04 - **Last Updated**: 2024-07-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 贝壳网站数据爬虫练习 #### 介绍 利用python爬取贝壳网站上北京租房房源2000多条数据,可以观察下北京租房市场。 #### 软件架构 软件架构说明 包括parser_beike.ipynb爬虫文件和data_beike.csv、data_beike_new.csv两个数据文件 #### 安装教程 1. 利用jupyter打开parser_beike.ipynb文件运行即可 2. 输出的文件名最好根据自己需要修改一下 3. 在爬取的过程中可能被识别到爬虫而暂停,这时候从失败的网站的下一个重新开始即可。 #### 使用说明 1. parser_beike.ipynb为爬虫文件 2. data_beike.csv为最终爬取的贝壳网站上2000多条北京租房数据 3. data_beike_new.csv为计算北京租房平价单月每平方米的价格,大致为126.58元/平方米。