PHP将HTML转换成文本的实现代码


Posted in PHP onJanuary 21, 2015

核心代码:

<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
         "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>
PHP 相关文章推荐
PHP中对数据库操作的封装
Oct 09 PHP
PHP计数器的实现代码
Jun 08 PHP
解析wamp5下虚拟机配置文档
Jun 27 PHP
微信营销平台系统?刮刮乐的开发
Jun 10 PHP
PHP中返回引用类型的方法
Apr 03 PHP
php从数据库查询结果生成树形列表的方法
Apr 17 PHP
PHP翻页跳转功能实现方法
Nov 30 PHP
CI框架的安全性分析
May 18 PHP
Thinkphp5行为使用方法汇总
Dec 21 PHP
PHP使用PhpSpreadsheet操作Excel实例详解
Mar 26 PHP
Laravel相关的一些故障解决
Aug 19 PHP
PHP7 list() 函数修改
Mar 09 PHP
php使用Cookie控制访问授权的方法
Jan 21 #PHP
PHP+MySQL修改记录的方法
Jan 21 #PHP
PHP+MySQL删除操作实例
Jan 21 #PHP
PHP+MySQL插入操作实例
Jan 21 #PHP
php+mysql数据库查询实例
Jan 21 #PHP
php使用Cookie实现和用户会话的方法
Jan 21 #PHP
php实现遍历目录并删除指定文件中指定内容
Jan 21 #PHP
You might like
德劲1107的电路分析与打磨
2021/03/02 无线电
PHP常用的文件操作函数经典收藏
2013/04/02 PHP
thinkphp获取栏目和文章当前位置的方法
2014/10/29 PHP
php+mysqli批量查询多张表数据的方法
2015/01/29 PHP
PHP mysqli事务操作常用方法分析
2017/07/22 PHP
PHP读取并输出XML文件数据的简单实现方法
2017/12/22 PHP
jQuery 前的按键判断代码
2010/03/19 Javascript
使用js检测浏览器的实现代码
2013/05/14 Javascript
改变隐藏的input中value值的方法
2014/03/19 Javascript
javascript中关于&amp;&amp; 和 || 表达式的小技巧分享
2015/04/10 Javascript
js实现简单折叠、展开菜单的方法
2015/08/28 Javascript
常见的javascript跨域通信方法
2015/12/31 Javascript
Javascript点击按钮随机改变数字与其颜色
2016/09/01 Javascript
angular实现form验证实例代码
2017/01/17 Javascript
vuejs2.0子组件改变父组件的数据实例
2017/05/10 Javascript
vue todo-list组件发布到npm上的方法
2018/04/04 Javascript
Vue中div contenteditable 的光标定位方法
2018/08/25 Javascript
vue通过cookie获取用户登录信息的思路详解
2018/10/30 Javascript
vue-cli在 history模式下的配置详解
2019/11/26 Javascript
微信小程序实现简单的select下拉框
2020/11/23 Javascript
[01:06]DOTA2亚洲邀请赛专属珍藏-荧煌之礼
2017/03/24 DOTA
Python下载懒人图库JavaScript特效
2015/05/28 Python
Python学习笔记之解析json的方法分析
2017/04/21 Python
Python从ZabbixAPI获取信息及实现Zabbix-API 监控的方法
2018/09/17 Python
Python利用itchat库向好友或者公众号发消息的实例
2019/02/21 Python
pycharm 安装JPype的教程
2019/08/08 Python
python中时间转换datetime和pd.to_datetime详析
2019/08/11 Python
在keras下实现多个模型的融合方式
2020/05/23 Python
深入理解Python 多线程
2020/06/16 Python
卫生标语大全
2014/06/21 职场文书
小学教师教育随笔
2015/08/14 职场文书
责任书格式
2019/04/18 职场文书
SQLServer 日期函数大全(小结)
2021/04/08 SQL Server
详解SpringBoot异常处理流程及原理
2021/06/21 Java/Android
Mongodb 迁移数据块的流程介绍分析
2022/04/18 MongoDB
Win11使用CAD卡顿或者致命错误怎么办?Win11无法正常使用CAD的解决方法
2022/07/23 数码科技