编程 Javascript

使用node.JS中的url模块解析URL信息

Posted in Javascript onFebruary 06, 2020

在HTTP部分，详细介绍了URL的相关知识。而nodejs中的url模块提供了一些实用函数，用于URL处理与解析。

解析URL

解析 URL 对象有以下内容，依赖于他们是否在 URL 字符串里存在。任何不在 URL 字符串里的部分，都不会出现在解析对象里

'http://user:pass@host.com:8080/p/a/t/h?query=string#hash'

┌─────────────────────────────────────────────────────────────────────────────┐

│ href │

├──────────┬┬───────────┬─────────────────┬───────────────────────────┬───────┤

│ protocol ││ auth │ host │ path │ hash │

│ ││ ├──────────┬──────┼──────────┬────────────────┤ │

│ ││ │ hostname │ port │ pathname │ search │ │

│ ││ │ │ │ ├─┬──────────────┤ │

│ ││ │ │ │ │ │ query │ │

" http: // user:pass @ host.com : 8080 /p/a/t/h ? query=string #hash "

│ ││ │ │ │ │ │ │ │

└──────────┴┴───────────┴──────────┴──────┴──────────┴─┴──────────────┴───────┘

href: 准备解析的完整的 URL，包含协议和主机（小写）

'http://user:pass@host.com:8080/p/a/t/h?query=string#hash'

protocol: 请求协议，小写

'http:'

slashes: 协议要求的斜杠（冒号后）

true 或 false

host: 完整的 URL 小写主机部分，包含端口信息

'host.com:8080'

auth: url 中的验证信息

'user:pass'

hostname: 域名中的小写主机名

'host.com'

port: 主机的端口号

'8080'

pathname: URL 中的路径部分，在主机名后，查询字符前，包含第一个斜杠

'/p/a/t/h'

search: URL 中的查询字符串，包含开头的问号

'?query=string'

path: pathname 和 search 连在一起

'/p/a/t/h?query=string'

query: 查询字符串中得参数部分，或者使用 querystring.parse() 解析后返回的对象

'query=string' or {'query':'string'}

hash: URL 的 “#” 后面部分（包括 # 符号）

'#hash'

URL方法

URL模块包含分析和解析 URL 的工具。调用 require('url') 来访问模块

var url = require('url');
/*
{ parse: [Function: urlParse],
 resolve: [Function: urlResolve],
 resolveObject: [Function: urlResolveObject],
 format: [Function: urlFormat],
 Url: [Function: Url] }
 */
console.log(url);
url.parse(urlStr[, parseQueryString][, slashesDenoteHost])

输入 URL 字符串，返回一个对象

第二个参数parseQueryString（默认为false），如为false，则urlObject.query为未解析的字符串，比如author=%E5%B0%8F%E7%81%AB%E6%9F%B4，且对应的值不会decode；如果parseQueryString为true，则urlObject.query为object，比如{ author: '小火柴' }，且值会被decode

第三个参数slashesDenoteHos（默认为false），如果为true，可以正确解析不带协议头的URL，类似//foo/bar里的foo就会被认为是hostname；如果为false，则foo被认为是pathname的一部分

var url = require('url');
var str = 'http://user:pass@host.com:8080/p/a/t/h?author=%E5%B0%8F%E7%81%AB%E6%9F%B4#hash';
/*
Url {
 protocol: 'http:',
 slashes: true,
 auth: 'user:pass',
 host: 'host.com:8080',
 port: '8080',
 hostname: 'host.com',
 hash: '#hash',
 search: '?author=%E5%B0%8F%E7%81%AB%E6%9F%B4',
 query: 'author=%E5%B0%8F%E7%81%AB%E6%9F%B4',
 pathname: '/p/a/t/h',
 path: '/p/a/t/h?author=%E5%B0%8F%E7%81%AB%E6%9F%B4',
 href: 'http://user:pass@host.com:8080/p/a/t/h?author=%E5%B0%8F%E7%81%AB%E6%9F%B4#hash' }
 */
console.log(url.parse(str));

var url = require('url');
var str = 'http://user:pass@host.com:8080/p/a/t/h?author=%E5%B0%8F%E7%81%AB%E6%9F%B4#hash';
/*
Url {
 protocol: 'http:',
 slashes: true,
 auth: 'user:pass',
 host: 'host.com:8080',
 port: '8080',
 hostname: 'host.com',
 hash: '#hash',
 search: '?author=%E5%B0%8F%E7%81%AB%E6%9F%B4',
 query: { author: '小火柴' },
 pathname: '/p/a/t/h',
 path: '/p/a/t/h?author=%E5%B0%8F%E7%81%AB%E6%9F%B4',
 href: 'http://user:pass@host.com:8080/p/a/t/h?author=%E5%B0%8F%E7%81%AB%E6%9F%B4#hash' }
 */
console.log(url.parse(str,true));

var url = require('url');
var str = '//foo/bar';
var result1 = url.parse(str,true);
var result2 = url.parse(str,true,true);
console.log(result1.path);//'//foo/bar'
console.log(result1.pathname);//'//foo/bar'
console.log(result1.hostname);//null
console.log(result2.path);//'/bar'
console.log(result2.pathname);//'/bar'
console.log(result2.hostname);//'foo'

url.format(urlObject)

url.parse(str)的反向操作，输入一个解析过的 URL 对象，返回格式化过的字符串

urlObject包含了很多字段，比如protocol、slashes、protocol等，且不一定需要全部传，所以有一套解析逻辑

格式化的工作流程如下

href 会被忽略

protocol 无论是否有末尾的 : (冒号)，会同样的处理

http, https, ftp, gopher, file 协议会被添加后缀://

mailto, xmpp, aim, sftp, foo, 等协议添加后缀:

slashes 如果协议需要 ://，设置为 true

仅需对之前列出的没有斜杠的协议，比如议 mongodb://localhost:8000/

auth 如果出现将会使用.

hostname 仅在缺少 host 时使用

port 仅在缺少 host 时使用

host 用来替换 hostname 和 port

pathname 无论结尾是否有 / 将会同样处理

search 将会替代 query属性

无论前面是否有 / 将会同样处理

query (对象; 参见 querystring) 如果没有 search,将会使用

hash 无论前面是否有#，都会同样处理

var url = require('url');
var obj = {
 protocol: 'http:',
 auth: 'user:pass',
 host: 'host.com:8080',
 hash: '#hash',
 query: { author: '小火柴' }
}
//http://user:pass@host.com:8080?author=%E5%B0%8F%E7%81%AB%E6%9F%B4#hash
console.log(url.format(obj));

url.resolve(from, to)

url.resolve()方法以一种浏览器解析超链接的方式把一个目标URL解析成相对于一个基础URL，参数如下

from <String> 解析时相对的基本 URL。

to <String> 要解析的超链接 URL。

var url = require('url');
console.log(url.resolve('/one/two/three', 'four'));     // '/one/two/four'
console.log(url.resolve('http://example.com/', '/one'));  // 'http://example.com/one'
console.log(url.resolve('http://example.com/one', '/two')); // 'http://example.com/two'

更多关于node.JS中url模块的使用方法大家可参考下面的相关链接

使用node.JS中的url模块解析URL信息

- Author -

小火柴的蓝色理想

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Javascript 相关文章推荐

jQuery Flash/MP3/Video多媒体插件

Jan 18 Javascript

jquery插件制作自增长输入框实现代码

Aug 17 jQuery

jQuery使用动态渲染表单功能完成ajax文件下载

Jan 15 Javascript

js 动态修改css文件的方法

Aug 05 Javascript

JS学习之表格的排序简单实例

May 16 Javascript

自定义vue全局组件use使用、vuex的使用详解

Jun 14 Javascript

浅谈webpack组织模块的原理

Mar 10 Javascript

微信小程序实现下拉菜单切换效果

Mar 30 Javascript

JavaScript的级联函数用法简单示例【链式调用】

Mar 26 Javascript

基于Angular 8和Bootstrap 4实现动态主题切换的示例代码

Feb 11 Javascript

微信小程序反编译的实现

Dec 10 Javascript

vue路由实现登录拦截

Mar 24 Vue.js

Node.JS获取GET,POST数据之queryString模块使用方法详解

Feb 06 #Javascript

node.JS事件机制与events事件模块的使用方法详解

Feb 06 #Javascript

如何通过javaScript去除字符串两端的空白字符

Feb 06 #Javascript

ckeditor一键排版功能实现方法分析

Feb 06 #Javascript

JavaScript如何判断input数据类型

Feb 06 #Javascript

如何使用Jquery动态生成二级选项列表

Feb 06 #jQuery

CKEditor扩展插件：自动排版功能autoformat插件实现方法详解

Feb 06 #Javascript

You might like

php 方便水印和缩略图的图形类

2009/05/21 PHP

PHP学习变量使用总结

2011/03/24 PHP

PHP读取txt文件的内容并赋值给数组的代码

2011/11/03 PHP

PHP生成二维码与识别二维码的方法详解【附源码下载】

2019/03/07 PHP

javascript实现的在当前窗口中漂浮框的代码

2010/03/15 Javascript

用Jquery选择器计算table中的某一列某一行的合计

2014/08/13 Javascript

jquery实现简单的二级导航下拉菜单效果

2015/09/07 Javascript

AngularJS内建服务$location及其功能详解

2016/07/01 Javascript

JQuery EasyUI学习教程之datagrid 添加、修改、删除操作

2016/07/09 Javascript

js制作网站首页图片轮播特效代码

2016/08/30 Javascript

BootStrap表单控件之文本域textarea

2017/05/23 Javascript

webpack教程之webpack.config.js配置文件

2017/07/05 Javascript

深入理解Node.js中通用基础设计模式

2017/09/19 Javascript

JavaScript实现仿Clock ISO时钟

2018/06/29 Javascript

jQuery使用each遍历循环的方法

2018/09/19 jQuery

js回到页面指定位置的三种方式

2020/12/17 Javascript

Python中的类与对象之描述符详解

2015/03/27 Python

在Python的Flask框架中实现全文搜索功能

2015/04/20 Python

对比Python中__getattr__和 __getattribute__获取属性的用法

2016/06/21 Python

Collatz 序列、逗号代码、字符图网格实例

2017/06/22 Python

Python 实现字符串中指定位置插入一个字符

2018/05/02 Python

pytorch + visdom 处理简单分类问题的示例

2018/06/04 Python

python脚本实现验证码识别

2018/06/07 Python

python读取文本绘制动态速度曲线

2018/06/21 Python

Python遍历文件夹处理json文件的方法

2019/01/22 Python

树莓派极简安装OpenCv的方法步骤

2019/10/10 Python

通过python实现windows桌面截图代码实例

2020/01/17 Python

python操作链表的示例代码

2020/09/27 Python

python中pop()函数的语法与实例

2020/12/01 Python

CSS3美化表单控件全集

2016/06/29 HTML / CSS

详解html5 shiv.js和respond.min.js

2018/01/24 HTML / CSS

SHEIN香港：价格实惠的女性时尚服装

2018/08/14 全球购物

法定代表人证明书

2014/11/28 职场文书

2015年大学生工作总结

2015/04/21 职场文书

Pygame如何使用精灵和碰撞检测

2021/11/17 Python

css中有哪些方式可以隐藏页面元素及区别

2022/06/16 HTML / CSS