# cartoon-cat **Repository Path**: BattleCall/cartoon-cat ## Basic Information - **Project Name**: cartoon-cat - **Description**: 漫画喵 一键下载漫画~ - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-12-17 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # cartoon-cat > 小喵发现 tazhe.com 这个网站访问不了了。不知道之后会不会重新开放。那么这么项目暂时就不能正常工作了。。。 > 不过其他的漫画网站的结构其实和 **tazhe漫画** 是差不多的。大家可以参考博客,做一些小的修改就能爬取其他的网站了。 > > **补充:** > 最近又发现了一个网站 36mh.com,正好有想看的一拳超人,于是乎就又改了一下这个工具,居然还可以用,哈哈。 > 只需要修改一下css选择器和结束判断,很爽! 漫画喵 使用selenium + PhantomJs搭建的简单漫画爬虫工具。 博客地址: http://www.miaoerduo.com/python/爬虫-漫画喵的100行逆袭.html 可以用于抓取 https://m.36mh.com 的漫画资源。(这个是手机版的页面,比较容易分析) 需要selenium和浏览器的支持。想试用的童鞋可以看看上述的博客,里面介绍了具体的环境要求。 使用: 在 https://m.36mh.com 上搜索漫画,例如:*一拳超人* 找到相应的漫画,进入。记住漫画的首页地址,这里是:https://m.36mh.com/manhua/yiquanchaoren/ 参考demo.py,设置相应的参数: ```python #-*- coding: utf-8 -*- import cartoon_cat as cc if __name__ == '__main__': site = 'https://m.36mh.com/manhua/yiquanchaoren/' crawler = cc.CartoonCat( site=site, # 漫画首页 begin=0, # 起始章节 end=-1, # 结束章节,为负数表明不设结束章节 save_folder='/path/to/download', # 保存路径,不存在会自动创建 browser=cc.BrowserType.PHANTOMJS, # 浏览器类型:FIREFOX,CHROME,SAFARI,IE,PHANTOMJS driver='path/to/phantomjs') # 驱动程序路径,firefox不需要                                   # 其他的可以从 https://pypi.python.org/pypi/selenium 下载 crawler.start() ```