node.js正则表达式获取网页中所有链接的代码实例


Posted in Javascript onJune 03, 2014

实现代码

var http = require('http');
//定义函数
var getAHref = function(htmlstr){
    var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;
    var arr = [];
    while(tem=reg.exec(htmlstr)){
        arr.push(tem[2]);
    }
    return arr;
}

var qHref = "http://xxx";//设置被查询的目标网址
    var req = http.get(qHref, function(res) {
    var pageData = "";
    res.setEncoding('utf8');
    res.on('error', function (errget) {
           //出错处理
    });
    res.on('data', function (chunk) {
           pageData += chunk;
    });
    res.on('end', function(){
          //console.dir(pageData);
          var content = pageData;//获取到网页内容
          var hrefs=getAHref(content);//获取链接
    });
});
Javascript 相关文章推荐
基于jquery的大众点评,分类导航实现代码
Aug 23 Javascript
40款非常棒的jQuery 插件和制作教程(系列二)
Nov 02 Javascript
ajax页面无刷新 IE下遭遇Ajax缓存导致数据不更新的问题
Dec 11 Javascript
innerHTML属性,outerHTML属性,textContent属性,innerText属性区别详解
Mar 13 Javascript
JS控制表单提交的方法
Jul 09 Javascript
基于jQuery实现搜索关键字自动匹配功能
Mar 26 Javascript
Bootstrap Paginator分页插件与ajax相结合实现动态无刷新分页效果
May 27 Javascript
EasyUI加载完Html内容样式渲染完成后显示
Jul 25 Javascript
.net MVC+Bootstrap下使用localResizeIMG上传图片
Apr 21 Javascript
详解如何给React-Router添加路由页面切换时的过渡动画
Apr 25 Javascript
JavaScript中AOP的实现与应用
May 06 Javascript
深入浅析vue-cli@3.0 使用及配置说明
May 08 Javascript
jquery处理json数据实例分析
Jun 03 #Javascript
js 获取浏览器版本以此来调整CSS的样式
Jun 03 #Javascript
jQuery绑定事件不执行但alert后可以正常执行
Jun 03 #Javascript
javascript圆盘抽奖程序实现原理和完整代码例子
Jun 03 #Javascript
jQuery多项选项卡的实现思路附样式及代码
Jun 03 #Javascript
jquery动态改变form属性提交表单
Jun 03 #Javascript
javascript判断是手机还是电脑访问网页的简单实例分享
Jun 03 #Javascript
You might like
简单解决新浪SAE无法上传文件的问题
2015/05/13 PHP
关于php支持的协议与封装协议总结(推荐)
2017/11/17 PHP
浏览器无法运行JAVA脚本的解决方法
2008/01/09 Javascript
jquery 最简单的属性菜单
2009/10/08 Javascript
js Math 对象的方法
2013/09/01 Javascript
浅析JavaScript事件和方法
2015/02/28 Javascript
jQuery实现的淡入淡出二级菜单效果代码
2015/09/15 Javascript
JS封装cookie操作函数实例(设置、读取、删除)
2015/11/17 Javascript
模仿password输入框的实现代码
2016/06/07 Javascript
Angular实现购物车计算示例代码
2017/02/21 Javascript
JS关于刷新页面的相关总结
2018/05/09 Javascript
vue移动端轻量级的轮播组件实现代码
2018/07/12 Javascript
Vue axios全局拦截 get请求、post请求、配置请求的实例代码
2018/11/28 Javascript
JavaScript数据结构之栈实例用法
2019/01/18 Javascript
JS学习笔记之数组去重实现方法小结
2019/05/29 Javascript
小程序登录之支付宝授权的实现示例
2019/12/13 Javascript
antd Form组件方法getFieldsValue获取自定义组件的值操作
2020/10/29 Javascript
python通过wxPython打开一个音频文件并播放的方法
2015/03/25 Python
Python及Django框架生成二维码的方法分析
2018/01/31 Python
用python实现将数组元素按从小到大的顺序排列方法
2018/07/02 Python
django的ORM模型的实现原理
2019/03/04 Python
​如何愉快地迁移到 Python 3
2019/04/28 Python
Django框架验证码用法实例分析
2019/05/10 Python
解决Numpy中sum函数求和结果维度的问题
2019/12/06 Python
使用pyqt5 tablewidget 单元格设置正则表达式
2019/12/13 Python
Python3利用scapy局域网实现自动多线程arp扫描功能
2021/01/21 Python
CSS3 实现的缩略图悬停效果
2020/12/09 HTML / CSS
介绍一下XMLHttpRequest对象
2012/02/12 面试题
计算机专业应届毕业生自荐信
2013/09/26 职场文书
董事长秘书工作职责
2014/06/10 职场文书
小学安全汇报材料
2014/08/14 职场文书
先进教育工作者事迹材料
2014/12/23 职场文书
2015年禁毒工作总结
2015/04/30 职场文书
主持稿开场白
2015/06/01 职场文书
2016大学生暑期三下乡心得体会
2016/01/23 职场文书
一起来看看Vue的核心原理剖析
2022/03/24 Vue.js