# scenery_spider_web **Repository Path**: aetherbyte/scenery_spider_web ## Basic Information - **Project Name**: scenery_spider_web - **Description**: No description available - **Primary Language**: Python - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-11-25 - **Last Updated**: 2024-11-25 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 1、项目介绍 本项目Scrapy进行数据爬取,并使用Django框架+PyEcharts实现可视化大屏。效果如下: ![image-20230612133737420](./README.assets/image-20230612133737420.png) ![f280a159-35f3-4d8a-bcef-012dd20dd279](./README.assets/f280a159-35f3-4d8a-bcef-012dd20dd279.png) ![91c6e606-349a-498f-9e9a-6e5b0ea3f3b4](./README.assets/91c6e606-349a-498f-9e9a-6e5b0ea3f3b4.png) 每个模块都有详情页,可以通过点击首页各个模块的标签,进行访问。 基于数据可视化的游客行为分析系统,包含以下几类图表: - 景点数量各区县分布地图 - 景点数量各区县分布图 - 景点评分分布图 - 景点浏览时间分布图 - 景点评论词云图 - 景点浏览人数占比分析 - 景点人数占比分析 - 景点评分数据排名 还有登录注册界面,可以自己注册账号。 ### 2、python库安装 本项目使用的python环境是3.8,Django4.0。(建议3.8及以上,不然可能装不了Django4) **这里以conda环境为例:** ```shell # 创建虚拟环境 conda create --name py38 python=3.8.13 # 激活环境 conda activate py38 # 安装库 pip install -i https://pypi.douban.com/simple -r requirements.txt ``` ### 3、MySQL部署 #### 3.1、创建库 ```shell # 创建数据库 create database hunan_web; # 使用数据库 use hunan_web; ``` #### 3.2、设置数据库信息 在 [settings.py](hunan_web/settings.py)文件中修改数据库连接信息 ```python DATABASES = { "default": { "ENGINE": "django.db.backends.mysql", 'OPTIONS': { 'charset': 'utf8mb4', }, "NAME": "hunan_web", "USER": "用户名", "PASSWORD": "密码", "HOST": "127.0.0.1", "POST": 3306 } } ``` #### 3.3、创建表 sql文件存在了部分数据,可以直接使用。 ```shell # 切换数据库, hunan_web可以替换成你要使用的数据库名 use hunan_web; # 导入数据,推荐使用绝对路径 source ./new_hunan_web.sql ``` ### 4、爬虫运行 ##### 进行增量爬取 ```shell # 启动scrapy爬虫 scrapy crawl qunaer ``` ![image-20230612145034448](./README.assets/image-20230612145034448.png) 运行可能会有问题,使用以下方法解决 ```shell # ImportError: cannot import name 'SSLv3_METHOD' from 'OpenSSL.SSL' pip3 install pyopenssl==22.0.0 # AttributeError: module 'lib' has no attribute 'OpenSSL_add_all_algorithms' pip3 install cryptography==38.0.4 ``` 如果上面的方法也不能解决,就把scrapy库升级到最新版本。 ```python # 升级 pip install --upgrade scrapy ``` ### 5、web运行 启动后根据提示访问链接即可。 ```python # 运行web,默认8000端口 python manage.py runserver ``` ![image-20230612141826864](./README.assets/image-20230612141826864.png) ### 6、总结 完成上面的部署就可以运行本程序了。 如果你想采集其他城市的数据进行分析,可以修改 [qunaer.py](spider_qunaer/spiders/qunaer.py) 中的链接地址。 如果你想绘制其他的图形,可以修改 [all_map.py](mainapp/utils/all_map.py) 中的pyecharts代码,并适当修改 [views.py](mainapp/views.py) 。 ### 其他 看到很多小伙伴star了,感谢你们喜欢这个项目。如果遇到问题可以提交issue给我一起改进这个项目吧。 也看到了很多小伙伴转载到其他平台了,希望可以注明出处让更多人看到,谢谢你们。