Node.js爬取豆瓣数据实例分析


Posted in Javascript onMarch 05, 2018

一直自以为自己vue还可以,一直自以为webpack还可以,今天在慕课逛node的时候,才发现,自己还差的很远。众所周知,vue-cli基于webpack,而webpack基于node,对node不了解,谈什么了解webpack。所以就自己给自己出了一道题,爬取豆瓣数据,目前还处于初级阶段。今天就浅谈爬取到豆瓣的数据,再另一个页面用自己的方式展现,后续会跟进。

1、需要解决的问题

  1. 搭建服务
  2. 怎么处理爬到的数据
  3. 怎么自动打开默认浏览器

2、搭建服务

搭建服务有好几种方式,一开始我用的http,但是http有个弊端就是不能解析https协议的url,所以就用了express,解析https协议的网址我用了request包,豆瓣的网址是https的,

今天爬取的是https://movie.douban.com/chart这个网址;如下图,我要获取的有三个部分,图片、电影名字、电影链接.

Node.js爬取豆瓣数据实例分析

Node.js爬取豆瓣数据实例分析

3、怎么处理爬到的数据

我们用request爬到的数据,怎么处理呢?cheerio包可以让我们像Jq那样处理爬到的html数据。

①、首先解析数据,取到爬取网页的html数据;

Node.js爬取豆瓣数据实例分析

②、然后利用cheerio包操作爬到的数据,取到你想要的数据。

Node.js爬取豆瓣数据实例分析

③、取到数据,创建html,输出到页面。如下图,我用的字符串拼接,办法有点笨,还没有找到更好的办法。

Node.js爬取豆瓣数据实例分析

4、怎么自动打开默认浏览器

不知道你有没有看vue-cli中webpack的配置,自动打开浏览器,vue-cli用的opn包.

Node.js爬取豆瓣数据实例分析

这个包用起来很方便,引入包,直接调用opn(url)即可;

5、展示

Node.js爬取豆瓣数据实例分析

Node.js爬取豆瓣数据实例分析

Javascript 相关文章推荐
JCalendar 日历控件 v1.0 beta[兼容IE&Firefox] 有文档和例子
May 30 Javascript
jquery.cookie.js 操作cookie实现记住密码功能的实现代码
Apr 27 Javascript
php对mongodb的扩展(初识如故)
Nov 11 Javascript
js中switch case循环实例代码
Dec 30 Javascript
js和jquery如何获取图片真实的宽度和高度
Sep 28 Javascript
jQuery-1.9.1源码分析系列(十一)DOM操作续之克隆节点
Dec 01 Javascript
JavaScript深度复制(deep clone)的实现方法
Feb 19 Javascript
JQuery手速测试小游戏实现思路详解
Sep 20 Javascript
JS实现汉字与Unicode码相互转换的方法详解
Apr 28 Javascript
5 种JavaScript编码规范
Jan 30 Javascript
Node.Js中实现端口重用原理详解
May 03 Javascript
使用pkg打包ThinkJS项目的方法步骤
Dec 30 Javascript
基于Vue渲染与插件的加载顺序的问题详解
Mar 05 #Javascript
AjaxUpLoad.js实现文件上传
Mar 05 #Javascript
JsChart组件使用详解
Mar 04 #Javascript
ionic2中使用自动生成器的方法
Mar 04 #Javascript
Vue.directive()的用法和实例详解
Mar 04 #Javascript
Vue.directive 自定义指令的问题小结
Mar 04 #Javascript
JavaScript图片处理与合成总结
Mar 04 #Javascript
You might like
第一节--面向对象编程
2006/11/16 PHP
用PHP中的 == 运算符进行字符串比较
2006/11/26 PHP
php防攻击代码升级版
2010/12/29 PHP
PHP使用Pear发送邮件(Windows环境)
2016/01/05 PHP
PHP编程快速实现数组去重的方法详解
2017/07/22 PHP
使用jQuery简化Ajax开发 Ajax开发入门
2009/10/14 Javascript
JS小功能(onmouseover实现选择月份)实例代码
2013/11/28 Javascript
纯JavaScript实现获取onclick、onchange等事件的值
2014/12/29 Javascript
js获取checkbox值的方法
2015/01/28 Javascript
使用console进行性能测试
2015/04/27 Javascript
CSS3实现动态背景登录框的代码
2015/07/28 Javascript
Jquery+Ajax+PHP+MySQL实现分类列表管理(下)
2015/10/28 Javascript
基于JavaScript代码实现pc与手机之间的跳转
2015/12/23 Javascript
老生常谈 js中this的指向
2016/06/30 Javascript
react.js 获取真实的DOM节点实例(必看)
2017/04/17 Javascript
详解webpack 配合babel 将es6转成es5 超简单实例
2017/05/02 Javascript
vue中node_modules中第三方模块的修改使用详解
2019/05/31 Javascript
微信小程序实现列表左右滑动
2020/11/19 Javascript
[02:40]DOTA2英雄基础教程 先知
2013/11/29 DOTA
Python实现的文本编辑器功能示例
2017/06/30 Python
Python面向对象编程基础解析(二)
2017/10/26 Python
python实现单向链表详解
2018/02/08 Python
音频处理 windows10下python三方库librosa安装教程
2020/06/20 Python
python创建文本文件的简单方法
2020/08/30 Python
html5 外链式实现加减乘除的代码
2019/09/04 HTML / CSS
Roxy美国官网:澳大利亚冲浪、滑雪健身品牌
2016/07/30 全球购物
瑞典网上购买现代和复古家具:Reforma
2019/10/21 全球购物
介绍一下Python中webbrowser的用法
2013/05/07 面试题
怎么写有吸引力的自荐信
2013/11/17 职场文书
实习推荐信格式模板
2015/03/27 职场文书
常住证明范本
2015/06/23 职场文书
结婚典礼主持词
2015/06/29 职场文书
2016计算机专业毕业生自荐信
2016/01/28 职场文书
2016优秀护士先进个人事迹材料
2016/02/25 职场文书
pytorch常用数据类型所占字节数对照表一览
2021/05/17 Python
Golang 并发下的问题定位及解决方案
2022/03/16 Golang