利用node.js写一个爬取知乎妹纸图的小爬虫


Posted in Javascript onMay 03, 2017

前言

说起写node爬虫的原因,真是羞羞呀。一天,和往常一样,晚上吃过饭便刷起知乎来,首页便是推荐的你见过最漂亮的女生长什么样?,点进去各种漂亮的妹纸爆照啊!!!,看的我好想把这些好看的妹纸照片都存下来啊!一张张点击保存,就在第18张得时候,突然想起。我特么不是程序员么,这种手动草做的事,怎么能做,不行我不能丢程序员的脸了,于是便开始这次爬虫之旅。

原理

初入爬虫的坑,没有太多深奥的理论知识,要获取知乎上帖子中的一张图片,我把它归结为以下几步。

  • 准备一个url(当然是诸如你见过最漂亮的女生长什么样??)
  • 获取这个url的html内容,并分析其中的dom结构,遍历找到这些漂亮的妹纸图片url
  • 获取图片内容
  • 将图片内容写入本地文件

开始动手

大概知道原理之后我们就可以开干了

准备一个url

这个最简单了,去知乎随便一搜就是一大把,我们以

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家学习或者使用node.js能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
javascript笔试题目附答案@20081025_jb51.net
Oct 26 Javascript
Javascript 自适应高度的Tab选项卡
Apr 05 Javascript
jquery属性过滤选择器使用示例
Jun 18 Javascript
jQuery读取和设定KindEditor值的方法
Nov 22 Javascript
js实现选中复选框文字变色的方法
Aug 14 Javascript
jQuery实现向下滑出的平滑下拉菜单效果
Aug 21 Javascript
JS两个数组比较,删除重复值的巧妙方法(推荐)
Jun 03 Javascript
JS短信验证码倒计时功能的实现(没有验证码,只有倒计时)
Oct 27 Javascript
easyui简介_动力节点Java学院整理
Jul 14 Javascript
基于vue实现滚动条滚动到指定位置对应位置数字进行tween特效
Apr 18 Javascript
js图片查看器插件用法示例
Jun 22 Javascript
详解基于 Node.js 的轻量级云函数功能实现
Jul 08 Javascript
Vue实现双向数据绑定
May 03 #Javascript
Angular 4.x 路由快速入门学习
May 03 #Javascript
javaScript 逻辑运算符使用技巧整理
May 03 #Javascript
浅谈Node.js轻量级Web框架Express4.x使用指南
May 03 #Javascript
vue的Virtual Dom实现snabbdom解密
May 03 #Javascript
JavaScript中undefined和null的区别
May 03 #Javascript
Node.js对MongoDB数据库实现模糊查询的方法
May 03 #Javascript
You might like
用PHP实现登陆验证码(类似条行码状)
2006/10/09 PHP
在PHP3中实现SESSION的功能(三)
2006/10/09 PHP
PHPWind与Discuz截取字符函数substrs与cutstr性能比较
2011/12/05 PHP
php实现的双向队列类实例
2014/09/24 PHP
PHP MVC框架路由学习笔记
2016/03/02 PHP
PHP扩展Swoole实现实时异步任务队列示例
2019/04/13 PHP
非常好的js代码
2006/06/27 Javascript
不用AJAX和IFRAME,说说真正意义上的ASP+JS无刷新技术
2008/09/25 Javascript
js时间戳格式化成日期格式的多种方法
2013/11/11 Javascript
动态载入js提高网页打开速度的方法
2014/07/04 Javascript
Javascript定义类(class)的三种方法详解
2015/03/13 Javascript
JS中setTimeout的巧妙用法前端函数节流
2016/03/24 Javascript
浅谈jquery中的each方法$.each、this.each、$.fn.each
2016/06/23 Javascript
使用Ajax生成的Excel文件并下载的实例
2016/11/21 Javascript
jQuery菜单实例(全选,反选,取消)
2017/08/28 jQuery
element vue Array数组和Map对象的添加与删除操作
2018/11/14 Javascript
Vue+Element UI+Lumen实现通用表格分页功能
2019/02/02 Javascript
vue+iview框架实现左侧动态菜单功能的示例代码
2020/07/23 Javascript
以911新闻为例演示Python实现数据可视化的教程
2015/04/23 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
2016/07/01 Python
Python中摘要算法MD5,SHA1简介及应用实例代码
2018/01/09 Python
Python基于百度AI实现OCR文字识别
2020/04/02 Python
使用python-cv2实现视频的分解与合成的示例代码
2020/10/26 Python
python如何写个俄罗斯方块
2020/11/06 Python
详解HTML5中的manifest缓存使用
2015/09/09 HTML / CSS
使用Html5 Stream开发实时监控系统
2020/06/02 HTML / CSS
HTML5页面无缝闪开的问题及解决方案
2020/06/11 HTML / CSS
新西兰领先的鞋类和靴子网上商城:Merchant 1948
2017/09/08 全球购物
建筑设计专业求职自我评价
2014/03/02 职场文书
汇源肾宝广告词
2014/03/20 职场文书
2014年度安全生产目标管理责任书
2014/07/25 职场文书
2014年小学校长工作总结
2014/12/08 职场文书
考博导师推荐信范文
2015/03/27 职场文书
读《庄子》有感:美而不自知
2019/11/06 职场文书
Sleuth+logback 设置traceid 及自定义信息方式
2021/07/26 Java/Android
MySQL对数据表已有表进行分区表的实现
2021/11/01 MySQL