# webmagic-study
**Repository Path**: ghiantian/webmagic-learn
## Basic Information
- **Project Name**: webmagic-study
- **Description**: webmagic学习,爬取CSDN博客,爬取爱奇艺视频,使用redis缓存爬虫爬过的url
- **Primary Language**: Java
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 4
- **Forks**: 1
- **Created**: 2019-11-12
- **Last Updated**: 2023-10-26
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
## webmagic-study
### 介绍
1. 使用webmagic爬取CSDN博客,爬取爱奇艺视频,使用redis缓存爬虫爬过的url
### 后端技术
springBoot、mysql、springBoot Data JPA、webmagic、redis
### 运行效果
1. 电影列表页面
> 使用webmagic从爱奇艺官网上爬取电影标题、url等数据,并且将爬虫数据存放MySQL数据库中。电影列表页面渲染如下,点击解析播放可以播放该视频。
2. 电影列表数据库数据
> 使用webmagic从爱奇艺官网爬取数据,并且将数据存放mysql数据中。
3. CSDN博客列表页面
> 使用webmagic从CSDN网站爬取数据,并且将数据存放mysql数据中。博客列表页面渲染如下,点击博客标题可以查看博客内容。

4. CSDN博客列表数据库中的爬虫数据
> 使用webmagic从CSDN网站爬取数据,并且将数据存放mysql数据中。

5. 从CSDN爬取博客数据,效果如下图。

### 本地运行
修改resource目录下 application-dev.properties
### 待完成
1. 电影列表,支持多种搜索(根据电影名称、时间)
2. 电影图片url错误,待解决
3. 数据支持增量插入,定时插入
4. 视频支持切换播放线路,vip视频解析url