详解50行代码,Node爬虫练手项目


Posted in Javascript onApril 22, 2019

First

项目地址:Crawler-for-Github-Trending

项目中基本每一句代码都写有注释(因为就这么几行?),适合对Node爬虫感兴趣的同学入入门。

Introduction

50 lines, minimalist node crawler for Trending.

一个50行的node爬虫,一个简单的 axios, express, cheerio 体验项目。

Usage

首先保证电脑已存在node环境,然后

1.拉取本项目

git clone https://github.com/ZY2071/Crawler-for-Github-Trending.git
cd Crawler-for-Github-Trending
npm i
node index.js

2.或者下载本项目压缩包,解压

cd Crawler-for-Github-Trending-master // 进入项目文件夹
npm i
node index.js

Examples

当启动项目后,可以看到控制台输出

Listening on port 3000!

 此时打开浏览器,进入本地服务 http://localhost:3000/daily

http://localhost:3000/time-language // time表示周期,language代表语言  例如:
http://localhost:3000/daily // 代表今日 可选参数:weekly,monthly
http://localhost:3000/daily-JavaScript// 代表今日的java分类 可选参数:任意语言

 稍微等待即可看到爬取完毕的返回数据:

[
 {
 "title": "lib-pku / libpku",
 "links": "https://github.com/lib-pku/libpku",
 "description": "贵校课程资料民间整理",
 "language": "JavaScript",
 "stars": "14,297",
 "forks": "4,360",
 "info": "3,121 stars this week"
 },
 {
 "title": "SqueezerIO / squeezer",
 "links": "https://github.com/SqueezerIO/squeezer",
 "description": "Squeezer Framework - Build serverless dApps",
 "language": "JavaScript",
 "stars": "3,212",
 "forks": "80",
 "info": "2,807 stars this week"
 },
 ...
]

More

本项目仅供爬取体验,每次访问都会实时爬取数据,所以数据返回速度会比较慢,实际操作应该是定时爬取数据然后将数据存进数据库,数据从数据库返回从而提高数据返回效率。

但项目很基础,可以作为以上各个node模块最基础的练手使用,希望可以帮到大家 ?

Javascript 相关文章推荐
颜色选择器 Color Picker,IE,Firefox,Opera,Safar
Nov 25 Javascript
TBCompressor js代码压缩
Jan 05 Javascript
Javascript算符的优先级介绍
Mar 20 Javascript
基于jQuery中对数组进行操作的方法
Apr 16 Javascript
js函数返回多个返回值的示例代码
Nov 05 Javascript
jquery实现效果比较好的table选中行颜色
Mar 25 Javascript
AngularJS学习笔记之ng-options指令
Jun 16 Javascript
JS中的数组方法笔记整理
Jul 26 Javascript
Javascript学习之谈谈JS的全局变量跟局部变量(推荐)
Aug 28 Javascript
JS实现css hover操作的方法示例
Apr 07 Javascript
JS装饰器函数用法总结
Apr 21 Javascript
Node.js对MongoDB进行增删改查操作的实例代码
Apr 18 Javascript
Vue匿名插槽与作用域插槽的合并和覆盖行为
Apr 22 #Javascript
详解Vue 匿名、具名和作用域插槽的使用方法
Apr 22 #Javascript
详解Node.js一行命令上传本地文件到服务器
Apr 22 #Javascript
使用 vue 实例更好的监听事件及vue实例的方法
Apr 22 #Javascript
Angular中使用ng-zorro图标库部分图标不能正常显示问题
Apr 22 #Javascript
关于vue-cli 3配置打包优化要点(推荐)
Apr 22 #Javascript
说说如何利用 Node.js 代理解决跨域问题
Apr 22 #Javascript
You might like
ninety plus是什么?ninety plus咖啡好吗?
2021/03/04 新手入门
ThinkPHP使用Smarty第三方插件方法小结
2016/03/19 PHP
php中html_entity_decode实现HTML实体转义
2018/06/13 PHP
PHP实现的多维数组去重操作示例
2018/07/21 PHP
静态的动态续篇之来点XML
2006/12/23 Javascript
in.js 一个轻量级的JavaScript颗粒化模块加载和依赖关系管理解决方案
2011/07/26 Javascript
Javascript变量作用域详解
2013/12/06 Javascript
JavaScript中的数值范围介绍
2014/12/29 Javascript
JavaScript截取、切割字符串的技巧
2016/01/07 Javascript
AngularJs bootstrap搭载前台框架——基础页面
2016/09/01 Javascript
解析微信JS-SDK配置授权,实现分享接口
2016/12/09 Javascript
ES6中class类用法实例浅析
2017/04/06 Javascript
详解vue-router 2.0 常用基础知识点之导航钩子
2017/05/10 Javascript
JS实现左边列表移到到右边列表功能
2018/03/28 Javascript
详解通过源码解析Node.js中cluster模块的主要功能实现
2018/05/16 Javascript
vue中如何实现pdf文件预览的方法
2018/07/12 Javascript
微信小程序自定义键盘 内部虚拟支付
2018/12/20 Javascript
layui 选择列表,打勾,点击确定返回数据的例子
2019/09/02 Javascript
Vue中多元素过渡特效的解决方案
2020/02/05 Javascript
[00:08]DOTA2勇士令状等级奖励“天外飞星”
2019/05/24 DOTA
python获取命令行输入参数列表的实例代码
2018/06/23 Python
Win10下python 2.7.13 安装配置方法图文教程
2018/09/18 Python
Python实现将Excel转换成为image的方法
2018/10/23 Python
python使用参数对嵌套字典进行取值的方法
2019/04/26 Python
对numpy下的轴交换transpose和swapaxes的示例解读
2019/06/26 Python
pytorch 中forward 的用法与解释说明
2021/02/26 Python
日本订房网站,预订日本星级酒店/温泉旅馆:Relux(支持中文)
2020/01/03 全球购物
平面设计自荐信
2013/10/07 职场文书
文史专业毕业生自荐信
2013/11/17 职场文书
工程业务员岗位职责
2013/12/31 职场文书
事业单位请假制度
2014/01/13 职场文书
文体活动总结范文
2014/05/05 职场文书
寒假社会实践个人总结
2015/03/06 职场文书
2015年高校就业工作总结
2015/05/04 职场文书
起诉书范文
2015/05/20 职场文书
2016党员干部廉政准则学习心得体会
2016/01/20 职场文书