PHP将HTML转换成文本的实现代码


Posted in PHP onJanuary 21, 2015

核心代码:

<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
         "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>
PHP 相关文章推荐
PHP个人网站架设连环讲(二)
Oct 09 PHP
PHP form 表单传参明细研究
Jul 17 PHP
PHP+Ajax异步通讯实现用户名邮箱验证是否已注册( 2种方法实现)
Dec 28 PHP
PHP 二维数组根据某个字段排序的具体实现
Jun 03 PHP
PHP使用json_encode函数时不转义中文的解决方法
Nov 12 PHP
thinkphp模板用法和内容输出实例
Nov 28 PHP
php内存缓存实现方法
Jan 24 PHP
PHPStorm+XDebug进行调试图文教程
Jun 13 PHP
PHP设置images目录不充许http访问的方法
Nov 01 PHP
php json_encode与json_decode详解及实例
Dec 13 PHP
PHP数组遍历的几种常见方式总结
Feb 15 PHP
Laravel框架文件上传功能实现方法示例
Apr 16 PHP
php使用Cookie控制访问授权的方法
Jan 21 #PHP
PHP+MySQL修改记录的方法
Jan 21 #PHP
PHP+MySQL删除操作实例
Jan 21 #PHP
PHP+MySQL插入操作实例
Jan 21 #PHP
php+mysql数据库查询实例
Jan 21 #PHP
php使用Cookie实现和用户会话的方法
Jan 21 #PHP
php实现遍历目录并删除指定文件中指定内容
Jan 21 #PHP
You might like
综合图片计数器
2006/10/09 PHP
PHP中运用jQuery的Ajax跨域调用实现代码
2012/02/21 PHP
WordPress中转义HTML与过滤链接的相关PHP函数使用解析
2015/12/22 PHP
编写PHP脚本清除WordPress头部冗余代码的方法讲解
2016/03/01 PHP
PHP实现字符串翻转功能的方法【递归与循环算法】
2017/11/03 PHP
PHP中创建和编辑Excel表格的方法
2018/09/13 PHP
关于递归运算的顺序测试代码
2011/11/30 Javascript
Yii-自定义删除确认弹框(zyd)jquery实现代码
2013/03/04 Javascript
使用JavaScript获取地址栏参数的方法
2014/12/19 Javascript
Vue.js每天必学之组件与组件间的通信
2016/09/08 Javascript
nodejs基础知识
2017/02/03 NodeJs
ES6学习之变量的解构赋值
2017/02/12 Javascript
ECMAScript6--解构
2017/03/30 Javascript
Angular4开发解决跨域问题详解
2017/08/28 Javascript
Angular4编程之表单响应功能示例
2017/12/13 Javascript
JavaScript中click和onclick本质区别与用法分析
2018/06/07 Javascript
mpvue微信小程序多列选择器用法之省份城市选择的实现
2019/03/07 Javascript
小程序Scroll-view上拉滚动刷新数据
2020/06/21 Javascript
解决vue-router 切换tab标签关闭时缓存问题
2020/07/22 Javascript
Python基于回溯法子集树模板解决马踏棋盘问题示例
2017/09/11 Python
Python爬取附近餐馆信息代码示例
2017/12/09 Python
pandas实现将dataframe满足某一条件的值选出
2019/06/12 Python
python实现从wind导入数据
2019/12/03 Python
Django模板之基本的 for 循环 和 List内容的显示方式
2020/03/31 Python
html5与css3小应用
2013/04/03 HTML / CSS
canvas像素点操作之视频绿幕抠图
2018/09/11 HTML / CSS
光荣入党自我鉴定
2014/01/22 职场文书
《哪吒闹海》教学反思
2014/02/28 职场文书
申报优秀教师材料
2014/12/16 职场文书
个人年终总结开头
2015/03/06 职场文书
2015年车间管理工作总结
2015/07/23 职场文书
教师研修随笔感言
2015/11/18 职场文书
Python OpenCV实现传统图片格式与base64转换
2021/06/13 Python
redis requires ruby version2.2.2的解决方案
2021/07/15 Redis
mapstruct的用法之qualifiedByName示例详解
2022/04/06 Java/Android
一行Python命令实现批量加水印
2022/04/07 Python