利用node.js写一个爬取知乎妹纸图的小爬虫


Posted in Javascript onMay 03, 2017

前言

说起写node爬虫的原因,真是羞羞呀。一天,和往常一样,晚上吃过饭便刷起知乎来,首页便是推荐的你见过最漂亮的女生长什么样?,点进去各种漂亮的妹纸爆照啊!!!,看的我好想把这些好看的妹纸照片都存下来啊!一张张点击保存,就在第18张得时候,突然想起。我特么不是程序员么,这种手动草做的事,怎么能做,不行我不能丢程序员的脸了,于是便开始这次爬虫之旅。

原理

初入爬虫的坑,没有太多深奥的理论知识,要获取知乎上帖子中的一张图片,我把它归结为以下几步。

  • 准备一个url(当然是诸如你见过最漂亮的女生长什么样??)
  • 获取这个url的html内容,并分析其中的dom结构,遍历找到这些漂亮的妹纸图片url
  • 获取图片内容
  • 将图片内容写入本地文件

开始动手

大概知道原理之后我们就可以开干了

准备一个url

这个最简单了,去知乎随便一搜就是一大把,我们以

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家学习或者使用node.js能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
动态调用css文件——jquery的应用
Feb 20 Javascript
用javascript获取textarea中的光标位置
May 06 Javascript
利用JQuery为搜索栏增加tag提示
Jun 22 Javascript
JavaScript 通过模式匹配实现重载
Aug 12 Javascript
读jQuery之一(对象的组成)
Jun 11 Javascript
js去空格技巧分别去字符串前后、左右空格
Oct 21 Javascript
对于Form表单reset方法的新认识
Mar 05 Javascript
javascript中对变量类型的判断方法
Aug 09 Javascript
jQuery实现立体式数字动态增加(animate方法)
Dec 21 Javascript
深入理解react-router@4.0 使用和源码解析
May 23 Javascript
详解webpack-dev-server使用http-proxy解决跨域问题
Jan 13 Javascript
javascript实现雪花飘落效果
Aug 19 Javascript
Vue实现双向数据绑定
May 03 #Javascript
Angular 4.x 路由快速入门学习
May 03 #Javascript
javaScript 逻辑运算符使用技巧整理
May 03 #Javascript
浅谈Node.js轻量级Web框架Express4.x使用指南
May 03 #Javascript
vue的Virtual Dom实现snabbdom解密
May 03 #Javascript
JavaScript中undefined和null的区别
May 03 #Javascript
Node.js对MongoDB数据库实现模糊查询的方法
May 03 #Javascript
You might like
Optimizer与Debugger兼容性问题的解决方法
2008/12/01 PHP
php使用codebase生成随机数
2014/03/25 PHP
php5.2以下版本无json_decode函数的解决方法
2014/05/25 PHP
PHP和Shell实现检查SAMBA与NFS Server是否存在
2015/01/07 PHP
php自定义函数br2nl实现将html中br换行符转换为文本输入中换行符的方法【与函数nl2br功能相反】
2017/02/17 PHP
Yii框架布局文件的动态切换操作示例
2019/11/11 PHP
document.getElementById介绍
2011/09/13 Javascript
利用JQuery动画制作滑动菜单项效果实现步骤及代码
2013/02/07 Javascript
js获取通过ajax返回的map型的JSONArray的方法
2014/01/09 Javascript
js中传递特殊字符(+,&)的方法
2014/01/16 Javascript
javascript清空table表格的方法
2015/05/14 Javascript
JS实现的另类手风琴效果网页内容切换代码
2015/09/08 Javascript
详解JavaScript编程中的数组结构
2015/10/24 Javascript
JavaScript无缝滚动效果的实例代码
2017/03/27 Javascript
jQuery的时间datetime控件在AngularJs中的使用实例(分享)
2017/08/17 jQuery
Vue ElementUI之Form表单验证遇到的问题
2017/08/21 Javascript
Python深拷贝与浅拷贝用法实例分析
2019/05/05 Python
使用python+whoosh实现全文检索
2019/12/09 Python
简单了解python调用其他脚本方法实例
2020/03/26 Python
python json.dumps中文乱码问题解决
2020/04/01 Python
python 利用toapi库自动生成api
2020/10/19 Python
如何在scrapy中集成selenium爬取网页的方法
2020/11/18 Python
CSS3 Backgrounds属性相关介绍
2011/05/11 HTML / CSS
Get The Label中文官网:英国运动时尚购物平台
2017/04/19 全球购物
英文自荐信
2013/12/15 职场文书
运动会入场式解说词
2014/02/18 职场文书
放飞中国梦演讲稿
2014/04/23 职场文书
关于环保的活动方案
2014/08/25 职场文书
大学生村官工作总结2015
2015/04/09 职场文书
银行催款通知书
2015/04/17 职场文书
2015年数学教师工作总结
2015/05/20 职场文书
单位证明范文
2015/06/18 职场文书
2016年第二十届“母亲节暨幸福工程救助贫困母亲活动日”活动总结
2016/04/06 职场文书
历史名人教你十五个读书方法,赶快Get起来!
2019/07/18 职场文书
redis连接被拒绝的解决方案
2021/04/12 Redis
golang为什么要统一错误处理
2022/04/03 Golang