Posted in Javascript onJuly 02, 2014
今天的项目中遇到需要用javascript的escape编码汉字再用unescape解码的情况,测试代码段的时候出现了乱码的情况。
具体情况如下:
首先,用EditPlus打开测试页面test.html,编辑如下html代码:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <title>unescape测试</title> </head> <body> <script> var teststr=escape("三水点靠木"); document.write(teststr); </script> </body> </html>
页面打印输出:
%uFFFD%u0171%uFFFD%u05AE%uFFFD%uFFFD
此时可以看出情况不对,单从汉字对应的字符数量上来说已经不对了!
再使用如下代码测试unescape解码后的汉字:
var relstr=unescape("%uFFFD%u0171%uFFFD%u05AE%uFFFD%uFFFD"); document.write(relstr);
出现了乱码:�ű�֮��
解决方法:
用Dreamweaver打开test.html文件,发现了问题所在!
原先的那段
var teststr=escape("三水点靠木");
变成了
var teststr=escape("ű֮");
可见是编辑器的初始编码造成的!
在Dreamweaver中将汉字改回来,重新运行test.html,得到了对应的编码:
%u811A%u672C%u4E4B%u5BB6
此时再用unescape解码:
var relstr=unescape("%u811A%u672C%u4E4B%u5BB6"); document.write(relstr);
就得到了原先正确的汉字:三水点靠木!
escape编码与unescape解码汉字出现乱码的解决方法
- Author -
shichen2014声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
Reply on: @reply_date@
@reply_contents@