HTA版JSMin(省略修饰语若干)基于javascript语言编写


Posted in Javascript onDecember 24, 2009

以前我使用JSMin的时候,都是从http://fmarcia.info/jsmin/这里打开执行页面,然后把自己的代码粘贴过去,再把减肥后的代码复制回文本编辑工具、保存。

久而久之,我发现这样实在是太麻烦了!既然我们是程序员,为何不自己动手把事情变得简单一点呢?

因此我开始了对JSMin进行“友好化”的工作。

而在进行“友好化”工作的过程中,“不出意料”地遇到了一些意想不到的问题,马上我就讲遇到的是哪些问题、最后怎样解决。

不过由于是在一切问题都解决之后才想起来写文的,所以很抱歉,这次是“无图无真相”。

在开始进行讲解之前,我先说明一下这次问题所涉及到的一些技术知识——如果你具有Windows脚本宿主的编程经验,那么这部分你可以跳过;如果你具有ASP的经验,那么这部分可能有一些内容你已经知道了。

Windows Script Host(WSH)即Windows脚本宿主,表现为一些可执行文件(wscript.exe和cscript.exe),它们的功能是在不受Internet安全策略限制的情况下执行用JScript或VBScript编写的任务文件,从而进行一些系统管理工作。值得注意的是,默认情况下Windows中以.js为扩展名的文件都被认为是WSH文件,如果你尝试双击一个.js文件,你可能会发现一些错误提示,或者被杀毒软件拦截。
HTML Application简写为HTA,顾名思义,是“HTML应用程序”——它和Windows脚本宿主一样在相当宽松的安全条件下执行脚本,和Windows脚本宿主不同的地方是HTML应用程序往往具有较好的图形界面。本质上说一个HTA文件其实就是使用了特殊扩展名的HTM文件,如果你不想在制作界面上花费太多的精力,而又正好同时具有HTML和WSH经验,那么使用HTML Application来解决问题是一个相当不错的选择。需要注意的是HTML Application也常被认为是WPF技术的前身,如果你的目标使用环境具有WPF支持(即.NET框架3.0+),那么使用WPF可能更加适合。HTA文件因为易于创作而一度被用于木马下载器,时至今日可能仍有一些杀毒软件粗暴地将HTA文件判断为木马下载器。就像.exe这样的二进制可执行文件一样,一个HTA文件是否有害是由自身设计决定的,而不是被文件类型先天决定。
FileSystemObject,简称FSO,是Windows脚本技术中为了方便脚本进行文件系统操作而提供的组件对象,在ASP编程中也很常见。
WshShell,是WSH运行环境为了方便脚本操作Shell相关物件而提供的组件对象,很多WSH程序都使用了这一对象。
ADODB.Stream,有的时候也被称作“ADO Stream”,是ADO中为了方便操作二进制数据流而提供的组件对象,但也经常被用在数据库以外的地方,例如文件操作。

“只要在文件图标上点点鼠标就可以”这样的功能特性被称作“外壳关联”之类的东西,很多时候大家对外壳关联的认知是“关联到鼠标双击”什么的。但稍微留心一点的人都会发现在点击鼠标右键弹出的快捷选单中,除了默认的指令以外,还有一些其它的像是“编辑”、“打印”之类的指令。

而我们这一次要做的,就是为.js文件增加一个“Minimize”指令,当我们点击这个指令的时候就会启动JSMin给我们的ECMAScript代码减肥。

就在这里,我遇到了第一个问题:

我编写了一个.js文件(实际上是一个WSH任务文件),用它来实现“自动化”地“安装”。

在Windows中为.js文件增添文件关联,需要在HKCR\.js这个注册表项的“默认”值所对应的“JSFile”——HKCR\JSFile项之下的Shell项添加子项,以及从属的名为Command的子项。

在HKCR\JSFile\Shell下面添加了Minimize项并为Command子项设置了“我的hta文件路径 "%1"”值以后,我发现使用这个Minimize指令后会产生一个“不是合法的可执行文件”这样的错误,而如果在前面添加了start指令,又出现了“打开方式”对话框……

看起来在Shell项下面这么投机取巧好像是不行,所以我只好先读取htafile的文件类型设置,然后将它设置到刚才新增加的Minimize指令中,.js文件中是这样写的:

view sourceprint?1 var asocCommand = wshShell.RegRead("HKEY_CLASSES_ROOT\\htafile\\Shell\\Open\\Command\\").replace("%1", instPath + "\\" + appExec).replace("%*", '"%1"');

外壳关联的问题刚解决,紧接着就是命令行参数的解析问题:

最初我打算用WSH任务文件作为这个小工具的载体,但马上我发现默认情况下WSH文件缺乏UI支持——VBScript中的InputBox和HTML中的prompt在用JScript编写的WSH任务文件中是不存在的,如果坚持使用WSH就只能通过Windows控制台来获得用户输入。而如果通过控制台来获得用户输入的话,这个工具的标准使用流程就变成了“鼠标点击文件图标——快捷选单——Minimize——键盘输入一个字符”,在一系列鼠标操作(当然,用键盘操作也是可能的)之后突然改用键盘,这好像不太对劲。

因此,我选择了使用HTA这种可以提供丰富界面的文件类型来作为实现这个工具的途径。

而选择了HTA,也就意味着同样要失去WSH“不外传”的一些特性,例如缺少了用于解析命令行参数的“Arguments”对象。

而在我的构思中,应该是可以通过-level参数指定JSMin的代码缩减等级、通过-silent参数来关闭提示信息的。如果不能从命令行中解读出这些参数,这些功能就没有办法实现。

因此我编写了两个函数:

//========//======== 
// parse command-line info 
// 在HTA环境中从命令行中解读出被执行的HTA的实际路径和附加的参数 
// 此部分代码由NanaLich原创,您可以不经书面许可在任何情况下直接使用。您不应擅自声称您或您的所属机构创作了这些代码,也不应该擅自以NanaLich的名义发布修改版本。 
//========//======== 
function namedOrNot(args) { 
var named = {}, not = [], c; 
for(var i = 0; i < args.length; i++) { 
c = args[i]; 
switch(c.charAt(0)) { 
case "-": 
case "/": 
c = c.substring(1); 
if(c.indexOf("=") > 0) { 
c = c.split("="); 
named[c.shift()] = c.join("="); 
} else if(c.indexOf(":") > 0) { 
c = c.split(":"); 
named[c.shift()] = c.join(":"); 
} else { 
// 不能确定一个命名参数是不是也接受附加参数,这是个未解难题 
//i++; 
named[c] = args[i + 1]; 
} 
break; 
default: 
not.push(c); 
break; 
} 
} 
args.named = named; 
args.unnamed = not; 
} 
function parseArgs(str) { 
var a = [], q = false, c = "", $ = ""; 
function mit() { 
if(c) 
a.push(c); 
} 
for(var i = 0; i < str.length; i++) { 
$ = str.charAt(i); 
if($ == '"') { 
q = !q; 
} else { 
if($ == " " && !q) { 
mit(); 
c = ""; 
} else { 
c += $; 
} 
} 
} 
mit(); 
namedOrNot(a); 
return a; 
} 
//========//========

这样,只要将HTA:Application对象的commandLine属性传入这个函数,就可以获得解析之后的命名和不命名参数了。

解决了命令行参数的问题之后,接下来就是文件的编码问题。

在我们实际的Web开发过程中,我们可能因为各种各样的原因使用“非Unicode区域编码”和“Unicode(UTF-16)编码”以外的其它编码格式,例如“Unicode(UTF-16) Big Endian”和“UTF-8”这两种编码方式。

如果我们通过既有的文本编辑工具来复制、粘贴代码,我们只要在保存文件的时候选择编码类型就可以了;但现在我们正在设计一种免去“打开——复制——粘贴——复制——粘贴——保存”这样繁琐的操作步骤的工具,我们就需要在这个工具中设计自动适应编码类型的功能。

很遗憾,在我的测试中FSO和ADODB.Stream都不具备自动识别文本编码的能力,必须另想其它办法——幸好,在HTA中VBScript也是默认支持的,VBScript虽然没有直接对字节组进行操作的功能,但在VBScript中把字节组当作字符串来进行操作仍然可以在一定程度上满足我们的要求。

因此,我编写了下面这个函数:

  Function vbDetectFileEncoding(fn) 
    Dim Stream, B3 
    Set Stream = CreateObject("ADODB.Stream") 
    Stream.Type = 1 
    Call Stream.Open() 
    Call Stream.LoadFromFile(fn) 
    B3 = CStr(Stream.Read(3)) 
    
    Call Stream.Close() 
    Set Stream = Nothing 
    
    Dim L1 
    L1 = Left(B3, 1) 
    If (L1 = ChrW(&hFEFF)) Then 
      vbDetectFileEncoding = "unicode" 
      Exit Function 
    Elseif (L1 = ChrW(&hFFFE)) Then 
      vbDetectFileEncoding = "unicodeFEFF" 
      Exit Function 
    Elseif B3 = (ChrB(&hEF) & ChrB(&hBB) & ChrB(&hBF)) Then 
      vbDetectFileEncoding = "utf-8" 
      Exit Function 
    End If 
    
    
    vbDetectFileEncoding = defEncoding 
  End Function

这个函数根据一个文本文件中可能存在的BOM来推断文件所采用的编码方式。

这里需要注意的一点是:

ADODB.Stream的相关文档中写道Allowed values are typical strings passed over the interface as Internet character set names (for example, "iso-8859-1", "Windows-1252", and so on). For a list of the character set names that are known by a system, see the subkeys of HKEY_CLASSES_ROOT\MIME\Database\Charset in the Windows Registry.,而注册表中和“Unicode Big Endian”(Encoding 1201)相对应的项目是“unicodeFFFE”,从这些信息上推断在ADO Stream中使用“Unicode Big Endian”编码时应该指定Charset属性为“unicodeFFFE”;

这里有一个容易混淆的实施是:BOM字符的Unicode编号是U+FEFF,而“一般的”“Unicode编码”实为“Unicode Little Endian”——BOM字符会被写成“FF FE”这样两个字节,而在“Unicode Big Endian”中才会被写成“FE FF”。

那么到这里,问题就出现了——如果和“unicodeFFFE”正相反的是“unicodeFEFF”的话,我们可以理解这里面的“FEFF”是BOM字符的Unicode编号;但与此同时代表“Unicode Big Endian”的“unicodeFFFE”中的“FFFE”具有什么含义呢?显然这不可能是“一个Unicode编号为U+FFFE的字符”的意思。

而在实践中,我发现无论为Charset属性设置“unicode”还是“unicodeFFFE”,输出的文件都是采用“Unicode (Little Endian)”编码的,这显然和文档所表达的意思不符。

当我再进一步作出尝试的时候,却发现如果希望输出“Unicode Big Endian”编码的文件,Charset属性应该设置为“unicodeFEFF”——我们很容易发现,“FEFF”正好符合BOM字符在文件中的字节顺序;我们同样可以发现为Charset属性设置“unicodeFXFX”时其实就相当于“用FXFX这样的字节顺序来进行编码”的意思,是享受特殊对待的,并不完全符合注册表中所写的样子。

到现在为止,小工具已经可以读写“Unicode”、“Unicode Big Endian”、“UTF-8”和“非Unicode区域编码”这些编码方式的文件了,只是我仍然没想明白为什么文档和注册表中会写着有误或者完全无用的信息……

上面这些问题被一一解决以后,好像就再也没有什么值得研究的问题了。

但是在使用JSMin的过程中,却发现了另一个问题:

有些人(比方说我)主要使用Windows工作,Windows中文本文件的默认行分隔符号是CR LF对。

而JSMin会把所有的CR都替换成LF,这样的话CR LF对就变成了两个LF的“LF LF”对了。

按照JSMin本来的设计,控制字符LF通常都是要被缩减掉的,因此两个连续的LF也不是什么问题;但jsmin.js有一个新增的功能是保留具有一定特征(/*! ... */)的“重要注释”,而如果在这种“重要注释”中存在CR LF对的话,最终会变成无法去除的两个LF控制字符,这可不好。

为了解决这个问题,我对jsmin.js稍微作了一些修改……不过因为JSMin有点超出我的理解能力,我也只能把CR变成空格,不过好在这样做在Windows中也有一些好处(在大部分的Windows版本中,单独的LF控制字符在“记事本”程序中几乎无法观察到,用它分隔的两行文本看起来也像是粘在了一起),就这么凑合用吧……这部分修改我就不单独列出来了。

本文中所提到的一切代码,都可以在这个压缩包中找到。

压缩包内包含三个文件:install.js是注册文件关联的“安装”脚本、jsmin.hta是使用“Minimize”指令时实际运行的“应用程序”、jsmin.js则是我修改以后的jsmin.js。

将三个文件解压至同一个文件夹之后,双击install.js即可安装本工具。如果您重新安装了操作系统,您可能会发现工具仍然遗留在您的个人文件夹中;只要您双击个人文件夹中遗留下来的install.js,您就又可以使用本工具了。

注意:自Windows XP起,较新版本的Windows会为从网络上下载而来的文件设置一个标志,这个标志可能会让HTA文件不能正常执行,如果你在使用的时候碰到了这样的问题,请点击文件属性对话框中的“解除锁定”按钮以去除这个标志。

更新:修改了install.js。现在在64位Windows 7上也可以正确安装了;安装以后也不用手动“解除锁定”了。

秘密在这里:

var appsPath = wshShell.ExpandEnvironmentStrings(wshShell.RegRead(regUSF + "Personal")) + "\\Scriptlet"; 
  
try{ 
fso.OpenTextFile(instPath + "\\" + appExec + ":Zone.Identifier", 1).Close(); 
fso.OpenTextFile(instPath + "\\" + appExec + ":Zone.Identifier", 2).Close(); 
}catch(ex){ }

文件打包下载 文件附一个改名的jse.方便经常开发js的朋友,以免混淆。
因为好多朋友是用的win2003开发,.js文件使用普通文本打开的,不可能以后用js都让运行吧,直接改成install.jse即可运行了,呵呵。
感谢作者发布这么好的东西。作者的blog地址
http://www.cnblogs.com/NanaLich
Javascript 相关文章推荐
共享自己写一个框架DreamScript
Jan 20 Javascript
基于JQuery实现鼠标点击文本框显示隐藏提示文本
Feb 23 Javascript
javaScript 动态访问JSon元素示例代码
Aug 30 Javascript
JavaScript将数据转换成整数的方法
Jan 04 Javascript
js显示文本框提示文字的方法
May 07 Javascript
jquery 删除节点 添加节点 找兄弟节点的简单实现
Dec 07 Javascript
jQuery实现字符串全部替换的方法
Dec 12 Javascript
详解js的延迟对象、跨域、模板引擎、弹出层、AJAX【附实例下载】
Dec 19 Javascript
温故知新——JavaScript中的字符串连接问题最全总结(推荐)
Aug 21 Javascript
vue实现简单loading进度条
Jun 06 Javascript
微信小程序之多列表的显示和隐藏功能【附源码】
Aug 06 Javascript
mpvue微信小程序多列选择器用法之省份城市选择的实现
Mar 07 Javascript
javascript下arguments,caller,callee,call,apply示例及理解
Dec 24 #Javascript
关于Aptana Studio生成自动备份文件的解决办法
Dec 23 #Javascript
window.js 主要包含了页面的一些操作
Dec 23 #Javascript
js 效率组装字符串 StringBuffer
Dec 23 #Javascript
jquery 表单取值常用代码
Dec 22 #Javascript
JavaScript是否可实现多线程  深入理解JavaScript定时机制
Dec 22 #Javascript
JavaScript 图片预览效果 推荐
Dec 22 #Javascript
You might like
memcache一致性hash的php实现方法
2015/03/05 PHP
PHP简单生成缩略图相册的方法
2015/07/29 PHP
prototype 1.5 &amp; scriptaculous 1.6.1 学习笔记
2006/09/07 Javascript
javascript数组组合成字符串的脚本
2021/01/06 Javascript
JavaScript 创建对象和构造类实现代码
2009/07/30 Javascript
javascript parseInt与Number函数的区别
2010/01/21 Javascript
JQUERY dialog的用法详细解析
2013/12/19 Javascript
深入理解javascript构造函数和原型对象
2014/09/23 Javascript
用JavaScript判断CSS浏览器类型前缀的两种方法
2015/10/08 Javascript
Winform客户端向web地址传参接收参数的方法
2016/05/17 Javascript
微信小程序 教程之WXML
2016/10/18 Javascript
浅谈jquery页面初始化的4种方式
2016/11/27 Javascript
jQuery实现判断控件是否显示的方法
2017/01/11 Javascript
使用jQuery的load方法设计动态加载及解决被加载页面js失效问题
2017/03/01 Javascript
jQuery插件HighCharts实现2D柱状图、折线图的组合多轴图效果示例【附demo源码下载】
2017/03/09 Javascript
js时间查询插件使用详解
2017/04/07 Javascript
微信小程序之页面跳转和参数传递的实现
2017/09/29 Javascript
vue中如何实现后台管理系统的权限控制的方法示例
2018/09/19 Javascript
详解关于Vue单元测试的几个坑
2020/04/26 Javascript
基于jsbarcode 生成条形码并将生成的条码保存至本地+源码
2020/04/27 Javascript
[08:47]DOTA2每周TOP10 精彩击杀集锦vol.6
2014/06/25 DOTA
Python 实现链表实例代码
2017/04/07 Python
用tensorflow实现弹性网络回归算法
2018/01/09 Python
Python+matplotlib实现填充螺旋实例
2018/01/15 Python
python使用tensorflow保存、加载和使用模型的方法
2018/01/31 Python
Python中列表与元组的乘法操作示例
2018/02/10 Python
对Python的zip函数妙用,旋转矩阵详解
2018/12/13 Python
python调用HEG工具批量处理MODIS数据的方法及注意事项
2020/02/18 Python
python实现微信打飞机游戏
2020/03/24 Python
Pycharm安装并配置jupyter notebook的实现
2020/05/18 Python
Python flask框架如何显示图像到web页面
2020/06/03 Python
Python实现一个论文下载器的过程
2021/01/18 Python
html5清空画布方法(三种)
2017/10/16 HTML / CSS
雷峰塔导游词
2015/02/09 职场文书
四年级作文之说明文作文
2019/10/14 职场文书
Python文件的操作示例的详细讲解
2021/04/08 Python