详解50行代码,Node爬虫练手项目


Posted in Javascript onApril 22, 2019

First

项目地址:Crawler-for-Github-Trending

项目中基本每一句代码都写有注释(因为就这么几行?),适合对Node爬虫感兴趣的同学入入门。

Introduction

50 lines, minimalist node crawler for Trending.

一个50行的node爬虫,一个简单的 axios, express, cheerio 体验项目。

Usage

首先保证电脑已存在node环境,然后

1.拉取本项目

git clone https://github.com/ZY2071/Crawler-for-Github-Trending.git
cd Crawler-for-Github-Trending
npm i
node index.js

2.或者下载本项目压缩包,解压

cd Crawler-for-Github-Trending-master // 进入项目文件夹
npm i
node index.js

Examples

当启动项目后,可以看到控制台输出

Listening on port 3000!

 此时打开浏览器,进入本地服务 http://localhost:3000/daily

http://localhost:3000/time-language // time表示周期,language代表语言  例如:
http://localhost:3000/daily // 代表今日 可选参数:weekly,monthly
http://localhost:3000/daily-JavaScript// 代表今日的java分类 可选参数:任意语言

 稍微等待即可看到爬取完毕的返回数据:

[
 {
 "title": "lib-pku / libpku",
 "links": "https://github.com/lib-pku/libpku",
 "description": "贵校课程资料民间整理",
 "language": "JavaScript",
 "stars": "14,297",
 "forks": "4,360",
 "info": "3,121 stars this week"
 },
 {
 "title": "SqueezerIO / squeezer",
 "links": "https://github.com/SqueezerIO/squeezer",
 "description": "Squeezer Framework - Build serverless dApps",
 "language": "JavaScript",
 "stars": "3,212",
 "forks": "80",
 "info": "2,807 stars this week"
 },
 ...
]

More

本项目仅供爬取体验,每次访问都会实时爬取数据,所以数据返回速度会比较慢,实际操作应该是定时爬取数据然后将数据存进数据库,数据从数据库返回从而提高数据返回效率。

但项目很基础,可以作为以上各个node模块最基础的练手使用,希望可以帮到大家 ?

Javascript 相关文章推荐
jquery 常用操作整理 基础入门篇
Oct 14 Javascript
jQuery对象[0]是什么含义?
Jul 31 Javascript
javascript中的关于类型转换的性能优化
Dec 14 Javascript
使用滤镜设置透明导致 IE 6/7/8/9 解析异常的解决方法
Apr 07 Javascript
使用js 设置url参数
Jul 08 Javascript
jquery中push()的用法(数组添加元素)
Nov 25 Javascript
纯JS实现旋转图片3D展示效果
Apr 12 Javascript
js创建对象几种方式的优缺点对比
Sep 28 Javascript
JavaScript 上传文件(psd,压缩包等),图片,视频的实现方法
Jun 19 Javascript
js表单序列化判断空值的实例
Sep 22 Javascript
vue中使用element-ui进行表单验证的实例代码
Jun 22 Javascript
JSX在render函数中的应用详解
Sep 04 Javascript
Vue匿名插槽与作用域插槽的合并和覆盖行为
Apr 22 #Javascript
详解Vue 匿名、具名和作用域插槽的使用方法
Apr 22 #Javascript
详解Node.js一行命令上传本地文件到服务器
Apr 22 #Javascript
使用 vue 实例更好的监听事件及vue实例的方法
Apr 22 #Javascript
Angular中使用ng-zorro图标库部分图标不能正常显示问题
Apr 22 #Javascript
关于vue-cli 3配置打包优化要点(推荐)
Apr 22 #Javascript
说说如何利用 Node.js 代理解决跨域问题
Apr 22 #Javascript
You might like
2020最新CPU的性能排名
2020/04/02 数码科技
基于文本的访客签到簿
2006/10/09 PHP
解析php中array_merge与array+array的区别
2013/06/21 PHP
php日历制作代码分享
2014/01/20 PHP
Yii2框架使用计划任务的方法
2016/05/25 PHP
php 开发中加密的几种方法总结
2017/03/22 PHP
js调试工具 Javascript Debug Toolkit 2.0.0版本发布
2008/12/02 Javascript
jquery新的绑定事件机制on方法的使用方法
2014/04/15 Javascript
Javascript 完美运动框架(逐行分析代码,让你轻松了运动的原理)
2015/01/23 Javascript
javascript上下方向键控制表格行选中并高亮显示的方法
2015/02/13 Javascript
JavaScript常用脚本汇总(二)
2015/03/04 Javascript
深入浅出分析javaScript中this用法
2015/05/09 Javascript
手机端点击图片放大特效PhotoSwipe.js插件实现
2016/08/24 Javascript
Vue.js每天必学之过滤器与自定义过滤器
2016/09/07 Javascript
纯JavaScript手写图片轮播代码
2016/10/20 Javascript
详解webpack+gulp实现自动构建部署
2017/06/29 Javascript
Vue中的Props(不可变状态)
2018/09/29 Javascript
在Python中操作文件之read()方法的使用教程
2015/05/24 Python
在Django框架中伪造捕捉到的URLconf值的方法
2015/07/18 Python
Python实现二叉搜索树
2016/02/03 Python
Python利用带权重随机数解决抽奖和游戏爆装备问题
2016/06/16 Python
Python将多个excel表格合并为一个表格
2021/02/22 Python
Pyqt实现无边框窗口拖动以及窗口大小改变
2018/04/19 Python
sklearn-SVC实现与类参数详解
2019/12/10 Python
英国床和浴室商场:Bed & Bath Emporium
2018/05/20 全球购物
英国在线女鞋目的地:SIMMI
2018/12/27 全球购物
总经理职责范文
2013/11/08 职场文书
初中女生自我鉴定
2013/12/19 职场文书
仓库管理计划书
2014/05/04 职场文书
2014各大专业毕业生自我评价
2014/09/17 职场文书
学校党的群众路线教育实践活动制度建设计划
2014/11/03 职场文书
2015年“世界无车日”活动方案
2015/05/06 职场文书
《扇形统计图》教学反思
2016/02/17 职场文书
五年级作文之劳动作文
2019/11/12 职场文书
PHP实现rar解压读取扩展包小结
2021/06/03 PHP
Golang 实现WebSockets
2022/04/24 Golang