node.js 抓取代理ip实例代码


Posted in Javascript onApril 30, 2017

node.js实现抓取代理ip

主要文件:index.js

/*
* 支持:node.js v7.9.0
*/
const cheerio=require('cheerio');
const fetch =require('node-fetch');
const Promise=require('bluebird');
let mongoose=require('mongoose');

Promise.promisifyAll(mongoose);
let Schema=mongoose.Schema;
mongoose.connect('mongodb://localhost:27017/ipproxypool');
let IPpool=new Schema({
  ip:{type:String,unique:true}
})
let Ipproxy=mongoose.model('IP',IPpool);

function fetchUrl(url){
  fetch(url,{
    method:'get',
    headers:{
    }
  })
  .then(res=>res.text())
  .then(body=>{
    let $=cheerio.load(body);
    let length=$('#list table tbody').find('tr').length;
    for (let i=0;i<length;i++){
    let ipaddress= $('#list table tbody').find('tr').eq(i).find('td').eq(0).text() ;
    let port = $('#list table tbody').find('tr').eq(i).find('td').eq(1).text();
    console.log(`IP:${ipaddress}:${port}`);
    let ip=`${ipaddress}:${port}`
    let ippool=new Ipproxy({
      ip:ip
    })
    ippool.save();
    }
  })
}

var sleep = function (time) {
  return new Promise(function (resolve, reject) {
    setTimeout(function () {
      resolve('ok');
    }, time);
  })
};
const pageNumber=10;
var start = async function(){
  for(let j=1;j<pageNumber;j++){
     console.log(`当前是第${j}次等待..`);
    fetchUrl(`http://www.kuaidaili.com/free/inha/${j}/`);
    await sleep(1500);
  }
}
start();

包支持 : package.json

{
 "name": "demo-4-ipproxypool",
 "version": "1.0.0",
 "description": "",
 "main": "index.js",
 "scripts": {
  "test": "echo \"Error: no test specified\" && exit 1"
 },
 "author": "false-l",
 "license": "",
 "devDependencies": {
  "babel-preset-es2015": "^6.24.1",
  "babel-preset-react": "^6.24.1",
  "babel-preset-stage-3": "^6.24.1"
 },
 "dependencies": {
  "babel-core": "^6.24.1",
  "bluebird": "^3.5.0",
  "cheerio": "^0.22.0",
  "koa": "^2.2.0",
  "koa-router": "^7.1.1",
  "mongoose": "^4.9.6",
  "node-fetch": "^1.6.3"
 }
}

本地需要安装mongodb数据库,用于存储抓取到的ip,目前还未实现ip验证。写这个主要是处于好奇。

上面的代码就可以实现抓取ip代理网站的ip并存到mongodb数据库中。

下面在放出一个基于koa2的api接口的简易服务器实现

server

const Promise=require('bluebird');
let mongoose=require('mongoose');
const koa=require('koa');
const app=new koa();
var router = require('koa-router')();
Promise.promisifyAll(mongoose);
let Schema=mongoose.Schema;
mongoose.connect('mongodb://localhost:27017/ipproxypool');
let IPpool=new Schema({
  ip:{type:String,unique:true}
})
let Ipproxy=mongoose.model('IP',IPpool);

app.use(async (ctx, next) => {
 await next();
 var data=await Ipproxy.find({},function(err,ips){
  var ipmap=[];
   ips.forEach(function(ip){
     ipmap[ip._id]=ip;
     //console.log(ip)
   });
 })
 var map=data.map(ip=>ip.ip);
 ctx.response.type = 'text/json';
 ctx.response.body = map;
});
app.listen(3000);
console.log('server listen:3000')

至于为什么既有promise又有async,是因为对异步语法还不是很熟,怎么会怎么写了。

使用方式:

 根据package.json

npm install   // 安装支持

node index.js  //获取代理 ip

node server.js  //运行简易ip接口

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Javascript 相关文章推荐
类似天猫商品详情随浏览器移动的示例代码
Feb 27 Javascript
js实现获取当前时间是本月第几周的方法
Aug 11 Javascript
jQuery Ajax 全局调用封装实例代码详解
Jun 02 Javascript
JavaScript结合HTML DOM实现联动菜单
Apr 05 Javascript
Angular中ng-bind和ng-model的区别实例详解
Apr 10 Javascript
浅析vue中的MVVM实现原理
Mar 04 Javascript
详解jquery和vue对比
Apr 16 jQuery
微信小程序如何获取用户头像和昵称
Sep 23 Javascript
使用konva和vue-konva库实现拖拽滑块验证功能
Apr 27 Javascript
JS绘图Flot应用图形绘制异常解决方案
Oct 16 Javascript
vue二选一tab栏切换新做法实现
Jan 19 Vue.js
JS原生实现轮播图的几种方法
Mar 23 Javascript
socket.io学习教程之深入学习篇(三)
Apr 29 #Javascript
socket.io学习教程之基本应用(二)
Apr 29 #Javascript
socket.io学习教程之基础介绍(一)
Apr 29 #Javascript
Vue.js实现一个SPA登录页面的过程【推荐】
Apr 29 #Javascript
Vue.js在使用中的一些注意知识点
Apr 29 #Javascript
jQuery实现按比例缩放图片的方法
Apr 29 #jQuery
Vue开发中整合axios的文件整理
Apr 29 #Javascript
You might like
PHP处理postfix邮件内容的方法
2015/06/16 PHP
浅谈PHP正则中的捕获组与非捕获组
2016/07/18 PHP
php类的自动加载操作实例详解
2016/09/28 PHP
php JWT在web端中的使用方法教程
2018/09/06 PHP
php 使用ActiveMQ发送消息,与处理消息操作示例
2020/02/23 PHP
js宝典学习笔记(上)
2007/01/10 Javascript
javascript动画对象支持加速、减速、缓入、缓出的实现代码
2012/09/30 Javascript
jquery将一个表单序列化为一个对象的方法
2014/01/03 Javascript
js document.write()使用介绍
2014/02/21 Javascript
JS表格组件神器bootstrap table详解(强化版)
2016/05/26 Javascript
JS基于面向对象实现的拖拽功能示例
2016/12/20 Javascript
angular 动态组件类型详解(四种组件类型)
2017/02/22 Javascript
js使用i18n实现页面国际化的方法
2017/05/09 Javascript
bootstrap的工具提示实例代码
2017/05/17 Javascript
jquery中done和then的区别(详解)
2017/12/19 jQuery
解决低版本的浏览器不支持es6的import问题
2018/03/09 Javascript
如何手动实现es5中的bind方法详解
2018/12/07 Javascript
php结合js实现多条件组合查询
2019/05/28 Javascript
vue+element 模态框表格形式的可编辑表单实现
2019/06/07 Javascript
Element Carousel 走马灯的具体实现
2020/07/26 Javascript
Python遍历目录的4种方法实例介绍
2015/04/13 Python
python下paramiko模块实现ssh连接登录Linux服务器
2015/06/03 Python
python实现猜单词小游戏
2020/05/22 Python
Python操作SQLite数据库过程解析
2019/09/02 Python
Python3 翻转二叉树的实现
2019/09/30 Python
python Django 反向访问器的外键冲突解决
2020/05/20 Python
Grow Gorgeous美国官网:只要八天,体验唤醒毛囊后新生的茂密秀发
2018/06/04 全球购物
荷兰领先的百货商店:De Bijenkorf
2018/10/17 全球购物
一份报关员的职业规划范文
2014/01/08 职场文书
银行存款证明样本
2014/01/17 职场文书
电气个人求职信范文
2014/02/04 职场文书
电子信息工程专业推荐信
2014/02/14 职场文书
中专生自荐信
2014/06/25 职场文书
慈善献爱心倡议书
2015/04/27 职场文书
小学生红领巾广播稿
2015/08/19 职场文书
python 实现两个变量值进行交换的n种操作
2021/06/02 Python