PHP将HTML转换成文本的实现代码


Posted in PHP onJanuary 21, 2015

核心代码:

<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
         "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>
PHP 相关文章推荐
菜鸟学PHP之Smarty入门
Jan 04 PHP
php include,include_once,require,require_once
Sep 05 PHP
PHP 变量类型的强制转换
Oct 23 PHP
PHP中使用gettext来支持多语言的方法
May 02 PHP
php版本的cron定时任务执行器使用实例
Aug 19 PHP
PHP实现服务器状态监控的方法
Dec 09 PHP
PHP实现过滤掉非汉字字符只保留中文字符
Jun 04 PHP
php微信浏览器分享设置以及回调详解
Aug 01 PHP
php实现登陆模块功能示例
Oct 20 PHP
PHP-FPM和Nginx的通信机制详解
Feb 01 PHP
php解析非标准json、非规范json的方式实例
Dec 10 PHP
详解PHP用mb_string处理windows中文字符
May 26 PHP
php使用Cookie控制访问授权的方法
Jan 21 #PHP
PHP+MySQL修改记录的方法
Jan 21 #PHP
PHP+MySQL删除操作实例
Jan 21 #PHP
PHP+MySQL插入操作实例
Jan 21 #PHP
php+mysql数据库查询实例
Jan 21 #PHP
php使用Cookie实现和用户会话的方法
Jan 21 #PHP
php实现遍历目录并删除指定文件中指定内容
Jan 21 #PHP
You might like
乐信RP2100的电路分析和打磨
2021/03/02 无线电
兼容PHP5的PHP目录管理函数库
2008/07/10 PHP
PHPStrom中实用的功能和快捷键大全
2015/09/23 PHP
php+mysql+jquery实现日历签到功能
2017/02/27 PHP
php面向对象的用户登录身份验证
2017/06/08 PHP
jQuery Dialog 弹出层对话框插件
2010/08/09 Javascript
IE6/7/8/9不支持exec的简写方式
2011/05/25 Javascript
轻松创建nodejs服务器(9):实现非阻塞操作
2014/12/18 NodeJs
深入理解JavaScript系列(34):设计模式之命令模式详解
2015/03/03 Javascript
JavaScript创建闭包的两种方式的优劣与区别分析
2015/06/22 Javascript
AngularJS 基础ng-class-even指令用法
2016/08/01 Javascript
将html页面保存成图片,图片写入pdf的实现方法(推荐)
2016/09/17 Javascript
js自制图片放大镜功能
2017/01/24 Javascript
ie下js不执行的几种可能
2017/02/28 Javascript
解决VUEX刷新的时候出现数据消失
2017/07/03 Javascript
原生JS实现小小的音乐播放器
2017/10/16 Javascript
利用canvas中toDataURL()将图片转为dataURL(base64)的方法详解
2017/11/20 Javascript
Angular4 Select选择改变事件的方法
2018/10/09 Javascript
写gulp遇到的ES6问题详解
2018/12/03 Javascript
微信小程序五子棋游戏AI实现方法【附demo源码下载】
2019/02/20 Javascript
node.js中module模块的功能理解与用法实例分析
2020/02/14 Javascript
swiper实现导航滚动效果
2020/12/13 Javascript
python读写ini文件示例(python读写文件)
2014/03/25 Python
Python2.x中str与unicode相关问题的解决方法
2015/03/30 Python
Python元组拆包和具名元组解析实例详解
2018/03/26 Python
Python os.rename() 重命名目录和文件的示例
2018/10/25 Python
pandas.dataframe按行索引表达式选取方法
2018/10/30 Python
Pycharm快捷键配置详细整理
2020/10/13 Python
最新PyCharm从安装到PyCharm永久激活再到PyCharm官方中文汉化详细教程
2020/11/17 Python
HUGO BOSS美国官方网上商店:世界知名奢侈品牌
2017/08/04 全球购物
Microsoft Advertising美国:微软搜索广告
2019/05/01 全球购物
Ruby如何定义一个类
2012/10/08 面试题
创建绿色学校先进个人材料
2014/08/20 职场文书
活动总结范文
2014/08/30 职场文书
家长会主持词开场白
2015/05/29 职场文书
python3美化表格数据输出结果的实现代码
2021/04/14 Python