利用node.js写一个爬取知乎妹纸图的小爬虫


Posted in Javascript onMay 03, 2017

前言

说起写node爬虫的原因,真是羞羞呀。一天,和往常一样,晚上吃过饭便刷起知乎来,首页便是推荐的你见过最漂亮的女生长什么样?,点进去各种漂亮的妹纸爆照啊!!!,看的我好想把这些好看的妹纸照片都存下来啊!一张张点击保存,就在第18张得时候,突然想起。我特么不是程序员么,这种手动草做的事,怎么能做,不行我不能丢程序员的脸了,于是便开始这次爬虫之旅。

原理

初入爬虫的坑,没有太多深奥的理论知识,要获取知乎上帖子中的一张图片,我把它归结为以下几步。

  • 准备一个url(当然是诸如你见过最漂亮的女生长什么样??)
  • 获取这个url的html内容,并分析其中的dom结构,遍历找到这些漂亮的妹纸图片url
  • 获取图片内容
  • 将图片内容写入本地文件

开始动手

大概知道原理之后我们就可以开干了

准备一个url

这个最简单了,去知乎随便一搜就是一大把,我们以

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家学习或者使用node.js能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
jquery自动完成插件(autocomplete)应用之PHP版
Dec 15 Javascript
js控制表单奇偶行样式的简单方法
Jul 31 Javascript
JS画5角星方法介绍
Sep 17 Javascript
jtable列中自定义button示例代码
Nov 21 Javascript
jquery关于事件冒泡和事件委托的技巧及阻止与允许事件冒泡的三种实现方法
Nov 27 Javascript
完全深入学习Bootstrap表单
Nov 28 Javascript
JS实现发送短信验证后按钮倒计时功能(防止刷新倒计时失效)
Jul 07 Javascript
react中的ajax封装实例详解
Oct 17 Javascript
vue.js todolist实现代码
Oct 29 Javascript
微信小程序获取手机网络状态的方法【附源码下载】
Dec 08 Javascript
浅谈vuejs实现数据驱动视图原理
Feb 23 Javascript
详解vue中在循环中使用@mouseenter 和 @mouseleave事件闪烁问题解决方法
Apr 07 Javascript
Vue实现双向数据绑定
May 03 #Javascript
Angular 4.x 路由快速入门学习
May 03 #Javascript
javaScript 逻辑运算符使用技巧整理
May 03 #Javascript
浅谈Node.js轻量级Web框架Express4.x使用指南
May 03 #Javascript
vue的Virtual Dom实现snabbdom解密
May 03 #Javascript
JavaScript中undefined和null的区别
May 03 #Javascript
Node.js对MongoDB数据库实现模糊查询的方法
May 03 #Javascript
You might like
牡丹941资料
2021/03/01 无线电
德生H-501的评价与改造
2021/03/02 无线电
生成静态页面的PHP类
2006/11/25 PHP
使用ThinkPHP+Uploadify实现图片上传功能
2014/06/26 PHP
PHP爬虫之百万级别知乎用户数据爬取与分析
2016/01/22 PHP
两个select之间option的互相添加操作(jquery实现)
2009/11/12 Javascript
javascript中的变量是传值还是传址的?
2010/04/19 Javascript
基于jquery的文本框与autocomplete结合使用(asp.net+json)
2012/05/30 Javascript
jQuery+css实现图片滚动效果(附源码)
2013/03/18 Javascript
各种页面定时跳转(倒计时跳转)代码总结
2013/10/24 Javascript
JS页面延迟执行一些方法(整理)
2013/11/11 Javascript
js弹出确认是否删除对话框
2014/03/27 Javascript
JS简单实现城市二级联动选择插件的方法
2015/08/19 Javascript
11种ASP连接数据库的方法
2015/09/18 Javascript
jQuery ajaxForm()的应用
2016/10/14 Javascript
js实现键盘自动打字效果
2016/12/23 Javascript
Angular使用$http.jsonp发送跨站请求的方法
2017/03/16 Javascript
基于vue开发的在线付费课程应用过程
2018/01/25 Javascript
vue异步加载高德地图的实现
2018/06/19 Javascript
vue计算属性computed、事件、监听器watch的使用讲解
2019/01/21 Javascript
Python3实现的腾讯微博自动发帖小工具
2013/11/11 Python
Python中isnumeric()方法的使用简介
2015/05/19 Python
python实现网站的模拟登录
2016/01/04 Python
Python实现的基于优先等级分配糖果问题算法示例
2018/04/25 Python
Numpy中的数组搜索中np.where方法详细介绍
2021/01/08 Python
Python入门基础之数字字符串与列表
2021/02/01 Python
基于Modernizr 让网站进行优雅降级的分析
2013/04/21 HTML / CSS
电子商务专业学生的学习自我评价
2013/10/27 职场文书
汽车维修专业个人求职信范文
2014/01/01 职场文书
校长就职演讲稿
2014/01/06 职场文书
公司财务流程之主管工作流程
2014/03/03 职场文书
企业精细化管理实施方案
2014/03/23 职场文书
建筑工地质量标语
2014/06/12 职场文书
车辆工程专业求职信
2014/06/14 职场文书
python基础详解之if循环语句
2021/04/24 Python
win11系统中dhcp服务异常什么意思? Win11 DHCP服务异常修复方法
2022/04/08 数码科技