利用node.js写一个爬取知乎妹纸图的小爬虫


Posted in Javascript onMay 03, 2017

前言

说起写node爬虫的原因,真是羞羞呀。一天,和往常一样,晚上吃过饭便刷起知乎来,首页便是推荐的你见过最漂亮的女生长什么样?,点进去各种漂亮的妹纸爆照啊!!!,看的我好想把这些好看的妹纸照片都存下来啊!一张张点击保存,就在第18张得时候,突然想起。我特么不是程序员么,这种手动草做的事,怎么能做,不行我不能丢程序员的脸了,于是便开始这次爬虫之旅。

原理

初入爬虫的坑,没有太多深奥的理论知识,要获取知乎上帖子中的一张图片,我把它归结为以下几步。

  • 准备一个url(当然是诸如你见过最漂亮的女生长什么样??)
  • 获取这个url的html内容,并分析其中的dom结构,遍历找到这些漂亮的妹纸图片url
  • 获取图片内容
  • 将图片内容写入本地文件

开始动手

大概知道原理之后我们就可以开干了

准备一个url

这个最简单了,去知乎随便一搜就是一大把,我们以

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家学习或者使用node.js能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
用jquery来定位
Feb 20 Javascript
在javaScript中关于submit和button的区别介绍
Oct 20 Javascript
分享2个jQuery插件--jquery.fileupload与artdialog
Dec 26 Javascript
jQuery实现响应鼠标背景变化的动态菜单效果代码
Aug 27 Javascript
jquery.validate提示错误信息位置方法
Jan 22 Javascript
微信小程序 wx.uploadFile在安卓手机上面the same task is working问题解决
Dec 14 Javascript
layui框架中layer父子页面交互的方法分析
Nov 15 Javascript
Koa2微信公众号开发之消息管理
May 16 Javascript
Element-ui tree组件自定义节点使用方法代码详解
Sep 17 Javascript
Vue结合后台导入导出Excel问题详解
Feb 19 Javascript
JS面试题中深拷贝的实现讲解
May 07 Javascript
vue实现滚动鼠标滚轮切换页面
Dec 13 Vue.js
Vue实现双向数据绑定
May 03 #Javascript
Angular 4.x 路由快速入门学习
May 03 #Javascript
javaScript 逻辑运算符使用技巧整理
May 03 #Javascript
浅谈Node.js轻量级Web框架Express4.x使用指南
May 03 #Javascript
vue的Virtual Dom实现snabbdom解密
May 03 #Javascript
JavaScript中undefined和null的区别
May 03 #Javascript
Node.js对MongoDB数据库实现模糊查询的方法
May 03 #Javascript
You might like
谈一谈收音机的高放电路
2021/03/02 无线电
便携利器 — TECSUN PL-365简评
2021/03/02 无线电
PHP4实际应用经验篇(3)
2006/10/09 PHP
ie与session丢失(新窗口cookie丢失)实测及解决方案
2013/07/15 PHP
ThinkPHP2.0读取MSSQL提示Incorrect syntax near the keyword 'AS'的解决方法
2014/06/25 PHP
jquery不支持toggle()高(新)版本的问题解决
2016/09/24 PHP
详解PHP用substr函数截取字符串中的某部分
2016/12/03 PHP
Div Select挡住的解决办法
2008/08/07 Javascript
javascript倒计时功能实现代码
2012/06/07 Javascript
JavaScript将相对地址转换为绝对地址示例代码
2013/07/19 Javascript
node.js中的querystring.stringify方法使用说明
2014/12/10 Javascript
JS+CSS实现的拖动分页效果实例
2015/05/11 Javascript
浅谈node模块与npm包管理工具
2018/01/03 Javascript
Vue 自定义动态组件实例详解
2018/03/28 Javascript
JavaScript类型相关的常用操作总结
2019/02/14 Javascript
vue 路由子组件created和mounted不起作用的解决方法
2019/11/05 Javascript
使用vuex存储用户信息到localStorage的实例
2019/11/11 Javascript
JS数组方法push()、pop()用法实例分析
2020/01/18 Javascript
基于脚手架创建Vue项目实现步骤详解
2020/08/03 Javascript
[02:41]辉夜杯现场一家三口 “我爸玩风行 我玩血魔”
2015/12/27 DOTA
[14:24]Optic Gaming vs PSG LGD BO3
2018/06/07 DOTA
Python中条件判断语句的简单使用方法
2015/08/21 Python
使用Python将数组的元素导出到变量中(unpacking)
2016/10/27 Python
基于Python中求和函数sum的用法详解
2018/06/28 Python
Python日志无延迟实时写入的示例
2019/07/11 Python
Django中create和save方法的不同
2019/08/13 Python
jupyter notebook清除输出方式
2020/04/10 Python
Python基于network模块制作电影人物关系图
2020/06/19 Python
深入解析HTML5中的Blob对象的使用
2015/09/08 HTML / CSS
英国鲜花递送:Blossoming Gifts
2020/07/10 全球购物
非常详细的C#面试题集
2016/07/13 面试题
司机职责范本
2014/03/08 职场文书
主题教育活动总结
2014/05/05 职场文书
求职简历自荐信怎么写
2015/03/26 职场文书
2016年艾滋病宣传活动总结
2016/04/01 职场文书
使用Python脚本对GiteePages进行一键部署的使用说明
2021/05/27 Python