php压缩HTML函数轻松实现压缩html/js/Css及注意事项


Posted in PHP onJanuary 27, 2013

压缩HTML的起因
如何提高网页加载速度 ,需要怎么对html页面优化相信是每个拟提高建站技术站长曾想到的问题,其实网页优化的方法还是很多。

有童鞋询问higrid如何 压缩HTML,也就是说能不能 把所有的html、js、Css在运行前都压缩成一行,清除注释标记、换行符、空格、制表符等。这样一个直接的好处是 减小html页面体积来提高前端加载速度。很多人认为启动gzip,但一般启动gzip都比较少对html启动gzip压缩,因为现在的html都是动态的,不会使用浏览器缓存,而启用gzip的话每次请求都需要压缩,会比较消耗服务器资源,对js,css启动gzip比较好是因为js,css都会使用缓存。而大家也用了很多软件过滤一下压缩,也有 在线js/css/html压缩工具,higrid觉得也很麻烦,可读性很差。higrid认为如果将压缩功能做成一个函数的话,这样开发者看到的是未压缩的状态,但访客访问时,服务端的程序将 html页面进行压缩,清除注释标记、换行符、空格、制表符等 来达到 减小了html体积的目的。 如果您经常访问higrid.net, 右键查看一下 html源代码 ,会看到本篇 html源代码经过了压缩处理。包括higrid.net 提供的免费内容管理系统 ,输出的都是压缩html,去掉了空白、换行符、制表符。但higrid.net 上面也有一些例外,就是higrid.net 主要推荐 在线表格 、在线图形 ,包括 jquery这些演示 ,为了方便访客,就没有启动压缩。

因此,higrid个人觉得 压缩html 的最大好处就是一本万利,只要写好了一次函数,以后在需要运用的时候调用一下就可以了,所有程序都可以使用,不会增加任何额外的开发工作。今天higrid就给大家分享几个个人觉得好用的函数,请大家不妨试试看,相信大家会喜欢。

采用php来压缩HTML
由于higrid对 php 比较感兴趣,所以使用 php来压缩HTML,当然使用其他语言也差不多,例如使用 asp来压缩HTML,道理应该一样的。

higrid将 压缩html的功能用php写成一个函数 ,其实网上这样的 php压缩函数 也很多,不信你可以百度或者谷歌,但多数不是很好用,特别在 压缩js 或 压缩CSS 的时候,主要原因是一些 压缩注释 等方面不同导致出现问题。 先看这个函数:

/** 
* 压缩html : 清除换行符,清除制表符,去掉注释标记 
* @param $string 
* @return压缩后的$string 
* */ 
function compress_html($string){ 
$string=str_replace("\r\n",'',$string);//清除换行符 
$string=str_replace("\n",'',$string);//清除换行符 
$string=str_replace("\t",'',$string);//清除制表符 
$pattern=array( 
"/> *([^ ]*) *</",//去掉注释标记 
"/[\s]+/", 
"/<!--[^!]*-->/", 
"/\" /", 
"/ \"/", 
"'/\*[^*]*\*/'" 
); 
$replace=array ( 
">\\1<", 
" ", 
"", 
"\"", 
"\"", 
"" 
); 
return preg_replace($pattern, $replace, $string); 
}

php来压缩HTML注意事项
php来压缩HTM 实现的方式主要是用正则表达式去查找,替换。在html压缩的时候,主要要注意下面几点:

1.HTML 文档中,多个空白字符等价为一个空白字符。也就是说换行等空白字符的删除是不安全的,有可能导致部分元素的样式产生差异。
2.html中有一个pre, 表示 preformatted text. 里面的任何空白,都不能被删除,因此pre,textarea 标签里面的内容格式需要保留,不能压缩。
3.HTML 中有可能有 IE 条件注释。这些条件注释是文档逻辑的一部分,不能被删除。因此去掉html注释的时候,有些注释是不能去掉的,比如:
4.压缩嵌入式js中的注释要注意,因为可能注释符号会出现在字符串中,比如: var url = "http://www.higrid.net"; // 前面的//不是注释
5.对于动态页面来说,HTML 的压缩有可能还会增加服务器的 CPU 负担,得不偿失

higrid使用的php压缩html函数代码
由于注释对代码有作用,higrid使用的php压缩html函数代码 没有去掉注释,直接上代码。

function higrid_compress_html($higrid_uncompress_html_source ) 
{ 
$chunks = preg_split( '/(<pre.*?\/pre>)/ms', $higrid_uncompress_html_source, -1, PREG_SPLIT_DELIM_CAPTURE ); 
$higrid_uncompress_html_source = '';//[higrid.net]修改压缩html : 清除换行符,清除制表符,去掉注释标记 
foreach ( $chunks as $c ) 
{ 
if ( strpos( $c, '<pre' ) !== 0 ) 
{ 
//[higrid.net] remove new lines & tabs 
$c = preg_replace( '/[\\n\\r\\t]+/', ' ', $c ); 
// [higrid.net] remove extra whitespace 
$c = preg_replace( '/\\s{2,}/', ' ', $c ); 
// [higrid.net] remove inter-tag whitespace 
$c = preg_replace( '/>\\s</', '><', $c ); 
// [higrid.net] remove CSS & JS comments 
$c = preg_replace( '/\\/\\*.*?\\*\\//i', '', $c ); 
} 
$higrid_uncompress_html_source .= $c; 
} 
return $higrid_uncompress_html_source; 
}

php压缩html函数代码总结
有些童鞋不 推荐压缩html , 主要原因除了上面所说的 php来压缩HTML注意事项 外,通过 gzip 压缩已经能达到很好的效果。另外,因为产生影响HTML的角色太多(静态,动态,前端动态),也没什么量化指标,所以很难控制压缩成什么样(代码写成什么程度)。代码更需要考虑执行效率,而不是传输效率。对于动态页面来说,HTML 的压缩有可能还会增加服务器的 CPU 负担,得不偿失。Google的压缩网页 是因为早期他希望首页文本尽可能控制在一个或两个包内,而且他的首页太重要了,流量也很离谱。压缩一个字节,总流量一算都是个不小的数字,自然也就是必要之举了。进一步的压缩存在问题,除非能像 Google 一样充分测试(Google 也仅压缩了少部分核心服务的页面),否则不推荐对 HTML 进行压缩处理。

但使用higrid.net 的 php压缩html函数 代码,能很好的解决这个问题。好了,还不快试试。

PHP 相关文章推荐
不用数据库的多用户文件自由上传投票系统(3)
Oct 09 PHP
提高PHP编程效率的53个要点(经验小结)
Sep 04 PHP
新手学习PHP的一些基础知识分享
Jul 27 PHP
php文件上传的例子及参数详解
Dec 12 PHP
php使用curl存储cookie的示例
Mar 31 PHP
php获取一个变量的名字的方法
Sep 05 PHP
PHP中实现接收多个name相同但Value不相同表单数据实例
Feb 03 PHP
php根据指定位置和长度获得子字符串的方法
Mar 17 PHP
php解析base64数据生成图片的方法
Dec 06 PHP
php+mysql+jquery实现简易的检索自动补全提示功能
Apr 15 PHP
php面试中关于面向对象的相关问题
Feb 13 PHP
PHP常量define和const的区别详解
May 18 PHP
用php来改写404错误页让你的页面更友好
Jan 24 #PHP
php对大文件进行读取操作的实现代码
Jan 23 #PHP
php删除与复制文件夹及其文件夹下所有文件的实现代码
Jan 23 #PHP
php删除文件夹及其文件夹下所有文件的函数代码
Jan 23 #PHP
php定时删除文件夹下文件(清理缓存文件)
Jan 23 #PHP
PHP关联数组的10个操作技巧
Jan 21 #PHP
用PHP即时捕捉PHP中的错误并发送email通知的实现代码
Jan 19 #PHP
You might like
PHP基础学习之流程控制的实现分析
2013/04/28 PHP
从零开始学YII2框架(一)通过Composer安装Yii2框架
2014/08/20 PHP
PHP 实现类似js中alert() 提示框
2015/03/18 PHP
php实现的操作excel类详解
2016/01/15 PHP
php微信开发之关键词回复功能
2018/06/13 PHP
原型方法的不同写法居然会影响调试的解决方法
2007/03/08 Javascript
关于__defineGetter__ 和__defineSetter__的说明
2007/05/12 Javascript
Javascript 遍历对象中的子对象
2009/07/03 Javascript
IE8 下的Js错误HTML Parsing Error...
2009/08/14 Javascript
js 中 document.createEvent的用法
2010/08/29 Javascript
解读JavaScript代码 var ie = !-[1,] 最短的IE判定代码
2011/05/28 Javascript
2014 HTML5/CSS3热门动画特效TOP10
2014/12/07 Javascript
jQuery使用removeClass方法删除元素指定Class的方法
2015/03/26 Javascript
javascript 动态修改css样式方法汇总(四种方法)
2015/08/27 Javascript
IE8下jQuery改变png图片透明度时出现的黑边
2015/08/30 Javascript
基于angular中的重要指令详解($eval,$parse和$compile)
2016/10/21 Javascript
vue.js+Echarts开发图表放大缩小功能实例
2017/06/09 Javascript
前端必备插件之纯原生JS的瀑布流插件Macy.js
2017/11/22 Javascript
javaScript日期工具类DateUtils详解
2017/12/08 Javascript
关于vue面试题汇总
2018/03/20 Javascript
layui原生表单验证的实例
2019/09/09 Javascript
vue中的v-model原理,与组件自定义v-model详解
2020/08/04 Javascript
基于JavaScript实现大文件上传后端代码实例
2020/08/18 Javascript
对python中使用requests模块参数编码的不同处理方法
2018/05/18 Python
使用python实现kNN分类算法
2019/10/16 Python
解决pycharm中opencv-python导入cv2后无法自动补全的问题(不用作任何文件上的修改)
2020/03/05 Python
使用python批量转换文件编码为UTF-8的实现
2020/04/03 Python
工程造价专业大专生求职信
2013/10/06 职场文书
就业协议书怎么填
2014/04/11 职场文书
社区两委对照检查材料
2014/08/23 职场文书
企业承诺书格式范文
2015/04/28 职场文书
2016年社区文体活动总结
2016/04/06 职场文书
python爬不同图片分别保存在不同文件夹中的实现
2021/04/02 Python
MySQL性能压力基准测试工具sysbench的使用简介
2021/04/21 MySQL
python实现MD5进行文件去重的示例代码
2021/07/09 Python
SONY600GR,国产收音机厂商永远的痛
2022/04/05 无线电