PHP中显示格式化的用户输入


Posted in PHP onOctober 09, 2006

你可以在这个页面下载这个文档附带的文件,也可以在文件下载中的字符处理中下载这个文档描述如何安全显示的有格式的用户输入。我们将讨论没有经过过滤的输出的危险,给出一个安全的显示格式化输出的方法。

没有过滤输出的危险

如果你仅仅获得用户的输入然后显示它,你可能会破坏你的输出页面,如一些人能恶意地在他们提交的输入框中嵌入javascript脚本:

This is my comment.
<script language="javascript:
alert('Do something bad here!')">.

这样,即使用户不是恶意的,也会破坏你的一些HTML的语句,如一个表格突然中断,或是页面显示不完整。

只显示无格式的文本

这是一个最简单的解决方案,你只是将用户提交的信息显示为无格式的文本。使用htmlspecialchars()函数,将转化全部的字符为HTML的编码。

如<b>将转变为<b>,这可以保证不会有意想不到的HTML标记在不适当的时候输出。
这是一个好的解决方案,如果你的用户只关注没有格式的文本内容。但是,如果你给出一些可以格式化的能力,它将更好一些。
Formatting with Custom Markup Tags
用户自己的标记作格式化

你可以提供特殊的标记给用户使用,例如,你可以允许使用[b]...[/b]加重显示,[i]...[/i]斜体显示,这样做简单的查找替换操作就可以了: $output = str_replace("[b]", "<b>", $output);
$output = str_replace("[i]", "<i>", $output);

再作的好一点,我们可以允许用户键入一些链接。例如,用户将允许输入[link="url"]...[/link],我们将转换为<a href="">...</a>语句

这时,我们不能使用一个简单的查找替换,应该使用正则表达式进行替换:
$output = ereg_replace('\[link="([[:graph:]]+)"\]', '<a href="\\1">', $output);

ereg_replace()的执行就是:
查找出现[link="..."]的字符串,使用<a href="..."> 替换它
[[:graph:]]的含义是任何非空字符,有关正则表达式请看相关的文章。

在outputlib.php的format_output()函数提供这些标记的转换,总体上的原则是:
调用htmlspecialchars()将HTML标记转换成特殊编码,将不该显示的HTML标记过滤掉,
然后,将一系列我们自定义的标记转换相应的HTML标记。
请参看下面的源代码:
<?php

function format_output($output) {
/****************************************************************************
* Takes a raw string ($output) and formats it for output using a special
* stripped down markup that is similar to HTML
****************************************************************************/

$output = htmlspecialchars(stripslashes($output));

/* new paragraph */
$output = str_replace('[p]', '<p>', $output);

/* bold */
$output = str_replace('[b]', '<b>', $output);
$output = str_replace('[/b]', '</b>', $output);

/* italics */
$output = str_replace('[i]', '<i>', $output);
$output = str_replace('[/i]', '</i>', $output);

/* preformatted */
$output = str_replace('[pre]', '<pre>', $output);
$output = str_replace('[/pre]', '</pre>', $output);

/* indented blocks (blockquote) */
$output = str_replace('[indent]', '<blockquote>', $output);
$output = str_replace('[/indent]', '</blockquote>', $output);

/* anchors */
$output = ereg_replace('\[anchor="([[:graph:]]+)"\]', '<a name="\\1"></a>', $output);

/* links, note we try to prevent javascript in links */
$output = str_replace('[link="javascript', '[link=" javascript', $output);
$output = ereg_replace('\[link="([[:graph:]]+)"\]', '<a href="\\1">', $output);
$output = str_replace('[/link]', '</a>', $output);

return nl2br($output);
}

?>

一些注意的地方:

记住替换自定义标记生成HTML标记字符串是在调用htmlspecialchars()函数之后,而不是在这个调用之前,否则你的艰苦的工作在调用htmlspecialchars()后将付之东流。

在经过转换之后,查找HTML代码将是替换过的,如双引号"将成为"

nl2br()函数将回车换行符转换为<br>标记,也要在htmlspecialchars()之后。

当转换[links=""] 到 <a href="">, 你必须确认提交者不会插入javascript脚本,一个简单的方法去更改[link="javascript 到 [link=" javascript, 这种方式将不替换,只是将原本的代码显示出来。

outputlib.php
在浏览器中调用test.php,可以看到format_output() 的使用情况

正常的HTML标记不能被使用,用下列的特殊标记替换它:

- this is [b]bold[/b]
- this is [i]italics[/i]
- this is [link="http://www.phpbuilder.com"]a link[/link]
- this is [anchor="test"]an anchor, and a [link="#test"]link[/link] to the anchor

[p]段落
[pre]预先格式化[/pre]
[indent]交错文本[/indent]

这些只是很少的标记,当然,你可以根据你的需求随意加入更多的标记

Conclusion
结论

这个讨论提供安全显示用户输入的方法,可以使用在下列程序中

留言板
用户建议
系统公告
BBS系统

PHP 相关文章推荐
substr()函数中文版
Oct 09 PHP
如何使用Strace调试工具
Jun 03 PHP
Drupal7中常用的数据库操作实例
Mar 02 PHP
ThinkPHP的I方法使用详解
Jun 18 PHP
ThinkPHP无限级分类原理实现留言与回复功能实例
Oct 31 PHP
PHP的Socket通信之UDP通信实例
Jul 02 PHP
php中实现字符串翻转的方法
Feb 22 PHP
详解PHP防止盗链防止迅雷下载的方法
Apr 26 PHP
PHP实现的迪科斯彻(Dijkstra)最短路径算法实例
Sep 16 PHP
PHP实现使用DOM将XML数据存入数组的方法示例
Sep 27 PHP
php中如何执行linux命令详解
Nov 06 PHP
PHPExcel实现的读取多工作表操作示例
Apr 14 PHP
提升PHP执行速度全攻略(下)
Oct 09 #PHP
PHP的面向对象编程
Oct 09 #PHP
PHP文本数据库的搜索方法
Oct 09 #PHP
PHP:风雨欲来 路在何方?
Oct 09 #PHP
用Socket发送电子邮件(利用需要验证的SMTP服务器)
Oct 09 #PHP
用PHP实现登陆验证码(类似条行码状)
Oct 09 #PHP
用PHP创建PDF中文文档
Oct 09 #PHP
You might like
php分享朋友圈的实现代码
2019/02/18 PHP
JQuery 1.4 中的Ajax问题
2010/01/23 Javascript
JS字符串函数扩展代码
2011/09/13 Javascript
js querySelector和getElementById通过id获取元素的区别
2012/04/20 Javascript
javascipt基础内容--需要注意的细节
2013/04/10 Javascript
js 获取浏览器版本以此来调整CSS的样式
2014/06/03 Javascript
JS实现简单路由器功能的方法
2015/05/27 Javascript
angularjs实现文字上下无缝滚动特效代码
2016/09/04 Javascript
微信小程序 action-sheet 反馈上拉菜单简单实例
2017/05/11 Javascript
jquery.validate表单验证插件使用详解
2017/06/21 jQuery
Angularjs在360兼容模式下取数据缓存问题的解决办法
2017/06/22 Javascript
利用Vue.js实现求职在线之职位查询功能
2017/07/03 Javascript
Vuejs 页面的区域化与组件封装的实现
2017/09/11 Javascript
vue-router 权限控制的示例代码
2017/09/21 Javascript
基于input动态模糊查询的实现方法
2017/12/12 Javascript
手动用webpack搭建第一个ReactApp的示例
2018/04/11 Javascript
jQuery实现获取选中复选框的值实例详解
2018/06/28 jQuery
如何安装控制器JavaScript生成插件详解
2018/10/21 Javascript
从零开始在NPM上发布一个Vue组件的方法步骤
2018/12/20 Javascript
jQuery鼠标滑过横向时间轴样式(代码详解)
2019/11/01 jQuery
Django中实现一个高性能计数器(Counter)实例
2014/07/09 Python
解析Python中的生成器及其与迭代器的差异
2016/06/20 Python
python脚本实现数据导出excel格式的简单方法(推荐)
2016/12/30 Python
Python竟能画这么漂亮的花,帅呆了(代码分享)
2017/11/15 Python
Python队列RabbitMQ 使用方法实例记录
2019/08/05 Python
python并发编程多进程 模拟抢票实现过程
2019/08/20 Python
解决Django连接db遇到的问题
2019/08/29 Python
Links of London官方网站:英国标志性的珠宝品牌
2017/04/09 全球购物
英国在线购买轮胎、预订汽车、汽车维修和装配网站:Protyre
2020/04/12 全球购物
网络工程专业大学生求职信
2014/10/01 职场文书
认真学习保证书
2015/02/26 职场文书
水浒传读书笔记
2015/06/25 职场文书
浅谈Python列表嵌套字典转化的问题
2021/04/07 Python
九大龙王魂骨,山龙王留下躯干骨,榜首死的最憋屈(被捏碎)
2022/03/18 国漫
Node.js实现爬取网站图片的示例代码
2022/04/04 NodeJs
Python Flask实现进度条
2022/05/11 Python