PHP将HTML转换成文本的实现代码


Posted in PHP onJanuary 21, 2015

核心代码:

<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
         "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>
PHP 相关文章推荐
Dedecms常用函数解析
Feb 01 PHP
用PHP实现浏览器点击下载TXT文档的方法详解
Jun 02 PHP
linux命令之调试工具strace的深入分析
Jun 03 PHP
php加速器eAccelerator的配置参数、API详解
May 05 PHP
thinkphp循环结构用法实例
Nov 24 PHP
Yii2主题(Theme)用法详解
Jul 23 PHP
使用PHP连接多种数据库的实现代码(mysql,access,sqlserver,Oracle)
Dec 21 PHP
PHP实现随机生成水印图片功能
Mar 22 PHP
Eclipse PHPEclipse 配置的具体步骤
Aug 08 PHP
PHP数据库操作四:mongodb用法分析
Aug 16 PHP
thinkPHP框架实现的简单计算器示例
Dec 07 PHP
PHP中16个高危函数整理
Sep 19 PHP
php使用Cookie控制访问授权的方法
Jan 21 #PHP
PHP+MySQL修改记录的方法
Jan 21 #PHP
PHP+MySQL删除操作实例
Jan 21 #PHP
PHP+MySQL插入操作实例
Jan 21 #PHP
php+mysql数据库查询实例
Jan 21 #PHP
php使用Cookie实现和用户会话的方法
Jan 21 #PHP
php实现遍历目录并删除指定文件中指定内容
Jan 21 #PHP
You might like
山进SANGEAN ATS-909X电路分析
2021/03/02 无线电
PHP 高手之路(三)
2006/10/09 PHP
php 上传功能实例代码
2010/04/13 PHP
PHP中使用mktime获取时间戳的一个黑色幽默分析
2012/05/31 PHP
支持中文和其他编码的php截取字符串函数分享(截取中文字符串)
2014/03/13 PHP
php实现ip白名单黑名单功能
2015/03/12 PHP
ThinkPHP实现图片上传操作的方法详解
2017/05/08 PHP
PHP分页显示的方法分析【附PHP通用分页类】
2018/05/10 PHP
jquery.combobox中文api和例子,修复了上面的小bug
2011/03/28 Javascript
用jQuery模拟页面加载进度条的实现代码
2011/12/19 Javascript
Javascript学习笔记之相等符号与严格相等符号
2014/11/23 Javascript
jQuery实现tab选项卡效果的方法
2015/07/08 Javascript
Jquery插件easyUi实现表单验证示例
2015/12/15 Javascript
原生js和jquery分别实现横向导航菜单效果
2016/05/13 Javascript
AngularJS使用ng-repeat指令实现下拉框
2016/08/23 Javascript
nodejs制作爬虫实现批量下载图片
2017/05/19 NodeJs
Vue实现点击按钮复制文本内容的例子
2019/11/09 Javascript
JS实现移动端双指缩放和旋转方法
2019/12/13 Javascript
Python的Flask框架与数据库连接的教程
2015/04/20 Python
python daemon守护进程实现
2016/08/27 Python
python写入已存在的excel数据实例
2018/05/03 Python
pycharm下查看python的变量类型和变量内容的方法
2018/06/26 Python
解决python 自动安装缺少模块的问题
2018/10/22 Python
linux mint中搜狗输入法导致pycharm卡死的问题
2020/10/28 Python
python爬虫基础之urllib的使用
2020/12/31 Python
pycharm 的Structure界面设置操作
2021/02/05 Python
webapp字号大小跟随系统字号大小缩放的示例代码
2018/12/26 HTML / CSS
西班牙最大的在线滑板和街头服饰商店:Fillow.net
2019/04/15 全球购物
初中三好学生事迹材料
2014/01/13 职场文书
创建青年文明号材料
2014/05/09 职场文书
趣味运动会策划方案
2014/06/02 职场文书
岗位说明书标准范本
2014/07/30 职场文书
党性锻炼的心得体会
2014/09/03 职场文书
节约用电通知
2015/04/25 职场文书
关于k8s环境部署mysql主从的问题
2022/03/13 MySQL
Windows7下FTP搭建图文教程
2022/08/05 Servers