Node.js爬取豆瓣数据实例分析


Posted in Javascript onMarch 05, 2018

一直自以为自己vue还可以,一直自以为webpack还可以,今天在慕课逛node的时候,才发现,自己还差的很远。众所周知,vue-cli基于webpack,而webpack基于node,对node不了解,谈什么了解webpack。所以就自己给自己出了一道题,爬取豆瓣数据,目前还处于初级阶段。今天就浅谈爬取到豆瓣的数据,再另一个页面用自己的方式展现,后续会跟进。

1、需要解决的问题

  1. 搭建服务
  2. 怎么处理爬到的数据
  3. 怎么自动打开默认浏览器

2、搭建服务

搭建服务有好几种方式,一开始我用的http,但是http有个弊端就是不能解析https协议的url,所以就用了express,解析https协议的网址我用了request包,豆瓣的网址是https的,

今天爬取的是https://movie.douban.com/chart这个网址;如下图,我要获取的有三个部分,图片、电影名字、电影链接.

Node.js爬取豆瓣数据实例分析

Node.js爬取豆瓣数据实例分析

3、怎么处理爬到的数据

我们用request爬到的数据,怎么处理呢?cheerio包可以让我们像Jq那样处理爬到的html数据。

①、首先解析数据,取到爬取网页的html数据;

Node.js爬取豆瓣数据实例分析

②、然后利用cheerio包操作爬到的数据,取到你想要的数据。

Node.js爬取豆瓣数据实例分析

③、取到数据,创建html,输出到页面。如下图,我用的字符串拼接,办法有点笨,还没有找到更好的办法。

Node.js爬取豆瓣数据实例分析

4、怎么自动打开默认浏览器

不知道你有没有看vue-cli中webpack的配置,自动打开浏览器,vue-cli用的opn包.

Node.js爬取豆瓣数据实例分析

这个包用起来很方便,引入包,直接调用opn(url)即可;

5、展示

Node.js爬取豆瓣数据实例分析

Node.js爬取豆瓣数据实例分析

Javascript 相关文章推荐
firefox中用javascript实现鼠标位置的定位
Jun 17 Javascript
javascript 原型继承介绍
Aug 30 Javascript
ie下jquery.getJSON的缓存问题的处理方法
Mar 29 Javascript
Jquery响应回车键直接提交表单操作代码
Jul 25 Javascript
jQuery控制TR显示隐藏的三种常用方法
Aug 21 Javascript
JavaScript如何实现对数字保留两位小数一位自动补零
Dec 18 Javascript
JQuery实现网页右侧随动广告特效
Jan 17 Javascript
jQuery实现的表头固定效果实例【附完整demo源码下载】
Aug 01 Javascript
jQuery实现遍历XML节点和属性的方法示例
Apr 29 jQuery
JS实现的贪吃蛇游戏案例详解
May 01 Javascript
Vue指令之 v-cloak、v-text、v-html实例详解
Aug 08 Javascript
文章或博客自动生成章节目录索引(支持三级)的实现代码
May 10 Javascript
基于Vue渲染与插件的加载顺序的问题详解
Mar 05 #Javascript
AjaxUpLoad.js实现文件上传
Mar 05 #Javascript
JsChart组件使用详解
Mar 04 #Javascript
ionic2中使用自动生成器的方法
Mar 04 #Javascript
Vue.directive()的用法和实例详解
Mar 04 #Javascript
Vue.directive 自定义指令的问题小结
Mar 04 #Javascript
JavaScript图片处理与合成总结
Mar 04 #Javascript
You might like
php获取文件大小的方法
2014/02/26 PHP
PHP数组中头部和尾部添加元素的方法(array_unshift,array_push)
2017/04/10 PHP
Js+Dhtml:WEB程序员简易开发工具包(预先体验版)
2006/11/07 Javascript
js变量以及其作用域详解
2020/07/18 Javascript
当鼠标移动时出现特效的JQuery代码
2013/11/08 Javascript
JavaScript给每一个li节点绑定点击事件的实现方法
2016/12/01 Javascript
jQuery制作图片旋转效果
2017/02/02 Javascript
使用ionic播放轮询广告的实现方法(必看)
2017/04/24 Javascript
JS实现标签滚动切换效果
2017/12/25 Javascript
jQuery实现带右侧索引功能的通讯录示例【附源码下载】
2018/04/17 jQuery
Vue中使用webpack别名的方法实例详解
2018/06/19 Javascript
详解vue组件中使用路由方法
2019/02/12 Javascript
微信小程序实现页面跳转传递参数(实体,对象)
2019/08/12 Javascript
Js实现粘贴上传图片的原理及示例
2020/12/09 Javascript
利用python实现微信头像加红色数字功能
2018/03/26 Python
python抓取网站的图片并下载到本地的方法
2018/05/22 Python
Django框架HttpRequest对象用法实例分析
2019/11/01 Python
wxpython绘制音频效果
2019/11/18 Python
在Tensorflow中实现梯度下降法更新参数值
2020/01/23 Python
Python 定义只读属性的实现方式
2020/03/05 Python
Python如何使用队列方式实现多线程爬虫
2020/05/12 Python
Python如何在单元测试中给对象打补丁
2020/08/03 Python
Perfume’s Club意大利官网:欧洲美妆电商
2019/05/03 全球购物
瑞典最大的儿童用品网上商店:pinkorblue.se
2021/03/09 全球购物
GWT的应用有哪两种部署模式
2012/12/21 面试题
涉外文秘个人求职的自我评价
2013/10/07 职场文书
写好自荐信的技巧
2013/11/08 职场文书
护士检查书
2014/01/17 职场文书
双语教学实施方案
2014/03/23 职场文书
建设工地安全标语
2014/06/07 职场文书
授权委托书样本及填写说明
2014/09/19 职场文书
2015年幼儿园保育工作总结
2015/05/12 职场文书
整脏治乱工作简报
2015/07/21 职场文书
redis配置文件中常用配置详解
2021/04/14 Redis
Python数据类型最全知识总结
2021/05/31 Python
 python中的元类metaclass详情
2022/05/30 Python