服务器 NodeJs

使用nodejs下载风景壁纸

Posted in NodeJs onFebruary 05, 2017

需要用到的第三方模块有：

superagent

superagent-charset （手动指定编码，解决GBK中文乱码）

cheerio

express

async （并发控制）

完整的代码，可以在我的github中可以下载。主要的逻辑逻辑在 netbian.js 中。

以彼岸桌面（http://www.netbian.com/）栏目下的风景壁纸（http://www.netbian.com/fengjing/index.htm）为例进行讲解。

1. 分析URL

不难发现：

首页：栏目/index.htm

分页：栏目/index_具体页码.htm

知道这个规律，就可以批量下载壁纸了。

2. 分析壁纸缩略图，找到对应壁纸的大图

使用chrome的开发者工具，可以发现，缩略图列表在 class="list"的div里，a标签的href属性的值就是单张壁纸所在的页面。

使用nodejs下载风景壁纸

部分代码：

request
 .get(url)
 .end(function(err, sres){
 var $ = cheerio.load(sres.text);
 var pic_url = []; // 中等图片链接数组
 $('.list ul', 0).find('li').each(function(index, ele){
 var ele = $(ele);
 var href = ele.find('a').eq(0).attr('href'); // 中等图片链接
 if(href != undefined){
 pic_url.push(url_model.resolve(domain, href));
 }
 });
});

3. 以“http://www.netbian.com/desk/17662.htm”继续分析

打开这个页面，发现此页面显示的壁纸，依旧不是最高的分辨率。

点击“下载壁纸”按钮里的链接，打开新的页面。

使用nodejs下载风景壁纸

4. 以“http://www.netbian.com/desk/17662-1920x1080.htm”继续分析

打开这个页面，我们最终要下载的壁纸，放在一个table里面。如下图，http://img.netbian.com/file/2017/0203/bb109369a1f2eb2e30e04a435f2be466.jpg

才是我们最终要下载的图片的URL（幕后BOSS终于现身了(＠￣?￣＠)）。

使用nodejs下载风景壁纸

下载图片的代码：

request
.get(wallpaper_down_url)
.end(function(err, img_res){
 if(img_res.status == 200){
 // 保存图片内容
 fs.writeFile(dir + '/' + wallpaper_down_title + path.extname(path.basename(wallpaper_down_url)), img_res.body, 'binary', function(err){
 if(err) console.log(err);
 });
 }
});

打开浏览器，访问 http://localhost:1314/fengjing

选择栏目和页面，点击“开始”按钮：

使用nodejs下载风景壁纸

并发请求服务器，下载图片。

使用nodejs下载风景壁纸

完成~

使用nodejs下载风景壁纸

图片的存放目录按照栏目+页码的形式保存。

使用nodejs下载风景壁纸

附上完整的图片下载的代码：

/**
 * 下载图片
 * @param {[type]} url [图片URL]
 * @param {[type]} dir [存储目录]
 * @param {[type]} res [description]
 * @return {[type]} [description]
 */
var down_pic = function(url, dir, res){
 var domain = 'http://www.netbian.com'; // 域名
 request
 .get(url)
 .end(function(err, sres){
 var $ = cheerio.load(sres.text);
 var pic_url = []; // 中等图片链接数组
 $('.list ul', 0).find('li').each(function(index, ele){
 var ele = $(ele);
 var href = ele.find('a').eq(0).attr('href'); // 中等图片链接
 if(href != undefined){
 pic_url.push(url_model.resolve(domain, href));
 }
 });
 var count = 0; // 并发计数器
 var wallpaper = []; // 壁纸数组
 var fetchPic = function(_pic_url, callback){
 count++; // 并发加1
 var delay = parseInt((Math.random() * 10000000) % 2000);
 console.log('现在的并发数是:' + count + ', 正在抓取的图片的URL是:' + _pic_url + ' 时间是:' + delay + '毫秒');
 setTimeout(function(){
 // 获取大图链接
 request
 .get(_pic_url)
 .end(function(err, ares){
  var $$ = cheerio.load(ares.text);
  var pic_down = url_model.resolve(domain, $$('.pic-down').find('a').attr('href')); // 大图链接
  count--; // 并发减1
  // 请求大图链接
  request
  .get(pic_down)
  .charset('gbk') // 设置编码, 网页以GBK的方式获取
  .end(function(err, pic_res){
  var $$$ = cheerio.load(pic_res.text);
  var wallpaper_down_url = $$$('#endimg').find('img').attr('src'); // URL
  var wallpaper_down_title = $$$('#endimg').find('img').attr('alt'); // title
  // 下载大图
  request
  .get(wallpaper_down_url)
  .end(function(err, img_res){
  if(img_res.status == 200){
  // 保存图片内容
  fs.writeFile(dir + '/' + wallpaper_down_title + path.extname(path.basename(wallpaper_down_url)), img_res.body, 'binary', function(err){
   if(err) console.log(err);
  });
  }
  });
  wallpaper.push(wallpaper_down_title + '下载完毕<br />');
  });
  callback(null, wallpaper); // 返回数据
 });
 }, delay);
 };
 // 并发为2,下载壁纸
 async.mapLimit(pic_url, 2, function(_pic_url, callback){
 fetchPic(_pic_url, callback);
 }, function (err, result){
 console.log('success');
 res.send(result[0]); // 取下标为0的元素
 });
 });
};

特别需要注意的两点：

1. “彼岸桌面”网页的编码是“GBK”的。而nodejs本身只支持“UTF-8”编码。这里我们引入“superagent-charset”模块，用于处理“GBK”的编码。

附上github里的一个例子

https://github.com/magicdawn/superagent-charset

使用nodejs下载风景壁纸

2. nodejs是异步的，同一时间发送大量的请求，有可能被服务器认为是恶意请求而拒绝。因此这里引入“async”模块，用于并发的处理，使用的方法是：mapLimit。

mapLimit(arr, limit, iterator, callback)

这个方法有4个参数：

第1个参数是数组。

第2个参数是并发请求的数量。

第3个参数是迭代器，通常是一个函数。

第4个参数是并发执行后的回调。

这个方法的作用是将arr中的每个元素同时并发limit次拿给iterator去执行，执行结果传给最后的callback。

后话

至此，便完成了图片的下载。

完整的代码，已经放在github上

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，同时也希望多多支持三水点靠木！

使用nodejs下载风景壁纸

- Author -

卡卡小狮子

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

NodeJs 相关文章推荐

使用forever管理nodejs应用教程

Jun 03 NodeJs

14款NodeJS Web框架推荐

Jul 11 NodeJs

NodeJs中的VM模块详解

May 06 NodeJs

nodeJs内存泄漏问题详解

Sep 05 NodeJs

nodejs进阶(6)—连接MySQL数据库示例

Jan 07 NodeJs

nodejs入门教程六：express模块用法示例

Apr 24 NodeJs

Nodejs--post的公式详解

Apr 29 NodeJs

Nodejs回调加超时限制两种实现方法

Jun 09 NodeJs

NodeJS设计模式总结【单例模式,适配器模式,装饰模式,观察者模式】

Sep 06 NodeJs

Nodejs技巧之Exceljs表格操作用法示例

Nov 06 NodeJs

详解nodejs内置模块

May 06 NodeJs

nodejs利用readline提示输入内容实例代码

Jul 15 NodeJs

nodeJs链接Mysql做增删改查的简单操作

Feb 04 #NodeJs

nodejs基础应用

Feb 03 #NodeJs

nodejs基础知识

Feb 03 #NodeJs

windows 下安装nodejs 环境变量设置

Feb 02 #NodeJs

图片上传之FileAPI与NodeJs

Jan 24 #NodeJs

初探nodeJS

Jan 24 #NodeJs

进阶之初探nodeJS

Jan 24 #NodeJs

You might like

修改Zend引擎实现PHP源码加密的原理及实践

2008/04/14 PHP

php数组函数序列之array_flip() 将数组键名与值对调

2011/11/07 PHP

PHP中把错误日志保存在系统日志中（Windows系统）

2015/06/23 PHP

php curl发送请求实例方法

2019/08/01 PHP

javascript 用原型继承来实现对象系统

2010/03/22 Javascript

JavaScript作用域链使用介绍

2013/08/29 Javascript

jQuery实现类似老虎机滚动抽奖效果

2015/08/06 Javascript

原生JavaScript编写canvas版的连连看游戏

2016/05/29 Javascript

Bootstrap页面布局基础知识全面解析

2016/06/13 Javascript

BootStrap智能表单实战系列(十一)级联下拉的支持

2016/06/13 Javascript

jQuery学习笔记之回调函数

2016/08/15 Javascript

使用UrlConnection实现后台模拟http请求的简单实例

2017/01/04 Javascript

jQuery插件FusionCharts绘制ScrollColumn2D图效果示例【附demo源码下载】

2017/03/22 jQuery

jQuery.ajax向后台传递数组问题的解决方法

2017/05/12 jQuery

Vue.js实现一个todo-list的上移下移删除功能

2017/06/26 Javascript

浅谈关于axios和session的一些事

2017/07/13 Javascript

微信小程序云开发之新手环境配置

2019/05/16 Javascript

JavaScript数组及常见操作方法小结

2019/11/13 Javascript

JS实现滑动导航效果

2020/01/14 Javascript

python文件读写并使用mysql批量插入示例分享(python操作mysql)

2014/02/17 Python

Pandas中把dataframe转成array的方法

2018/04/13 Python

python3+PyQt5 使用三种不同的简便项窗口部件显示数据的方法

2019/06/17 Python

python高级特性简介

2020/08/13 Python

Nanushka官网：匈牙利服装品牌

2019/08/14 全球购物

介绍一下Linux中的链接

2016/06/05 面试题

MYSQL相比于其他数据库有哪些特点

2013/07/19 面试题

最新的咖啡店创业计划书

2013/12/30 职场文书

检察官就职演讲稿

2014/01/13 职场文书

最新优秀教师个人先进事迹材料

2014/05/06 职场文书

个人担保书范文

2014/05/20 职场文书

参赛口号

2014/06/16 职场文书

乡镇组织委员个人整改措施

2014/09/16 职场文书

五一劳动节慰问信

2015/02/14 职场文书

2015年清明节网上祭英烈活动总结

2015/03/26 职场文书

医德医风学习心得体会

2016/01/25 职场文书

uniapp 微信小程序自定义tabBar 导航

2022/04/22 Javascript