PHP中显示格式化的用户输入


Posted in PHP onOctober 09, 2006

你可以在这个页面下载这个文档附带的文件,也可以在文件下载中的字符处理中下载这个文档描述如何安全显示的有格式的用户输入。我们将讨论没有经过过滤的输出的危险,给出一个安全的显示格式化输出的方法。

没有过滤输出的危险

如果你仅仅获得用户的输入然后显示它,你可能会破坏你的输出页面,如一些人能恶意地在他们提交的输入框中嵌入javascript脚本:

This is my comment.
<script language="javascript:
alert('Do something bad here!')">.

这样,即使用户不是恶意的,也会破坏你的一些HTML的语句,如一个表格突然中断,或是页面显示不完整。

只显示无格式的文本

这是一个最简单的解决方案,你只是将用户提交的信息显示为无格式的文本。使用htmlspecialchars()函数,将转化全部的字符为HTML的编码。

如<b>将转变为<b>,这可以保证不会有意想不到的HTML标记在不适当的时候输出。
这是一个好的解决方案,如果你的用户只关注没有格式的文本内容。但是,如果你给出一些可以格式化的能力,它将更好一些。
Formatting with Custom Markup Tags
用户自己的标记作格式化

你可以提供特殊的标记给用户使用,例如,你可以允许使用[b]...[/b]加重显示,[i]...[/i]斜体显示,这样做简单的查找替换操作就可以了: $output = str_replace("[b]", "<b>", $output);
$output = str_replace("[i]", "<i>", $output);

再作的好一点,我们可以允许用户键入一些链接。例如,用户将允许输入[link="url"]...[/link],我们将转换为<a href="">...</a>语句

这时,我们不能使用一个简单的查找替换,应该使用正则表达式进行替换:
$output = ereg_replace('\[link="([[:graph:]]+)"\]', '<a href="\\1">', $output);

ereg_replace()的执行就是:
查找出现[link="..."]的字符串,使用<a href="..."> 替换它
[[:graph:]]的含义是任何非空字符,有关正则表达式请看相关的文章。

在outputlib.php的format_output()函数提供这些标记的转换,总体上的原则是:
调用htmlspecialchars()将HTML标记转换成特殊编码,将不该显示的HTML标记过滤掉,
然后,将一系列我们自定义的标记转换相应的HTML标记。
请参看下面的源代码:
<?php

function format_output($output) {
/****************************************************************************
* Takes a raw string ($output) and formats it for output using a special
* stripped down markup that is similar to HTML
****************************************************************************/

$output = htmlspecialchars(stripslashes($output));

/* new paragraph */
$output = str_replace('[p]', '<p>', $output);

/* bold */
$output = str_replace('[b]', '<b>', $output);
$output = str_replace('[/b]', '</b>', $output);

/* italics */
$output = str_replace('[i]', '<i>', $output);
$output = str_replace('[/i]', '</i>', $output);

/* preformatted */
$output = str_replace('[pre]', '<pre>', $output);
$output = str_replace('[/pre]', '</pre>', $output);

/* indented blocks (blockquote) */
$output = str_replace('[indent]', '<blockquote>', $output);
$output = str_replace('[/indent]', '</blockquote>', $output);

/* anchors */
$output = ereg_replace('\[anchor="([[:graph:]]+)"\]', '<a name="\\1"></a>', $output);

/* links, note we try to prevent javascript in links */
$output = str_replace('[link="javascript', '[link=" javascript', $output);
$output = ereg_replace('\[link="([[:graph:]]+)"\]', '<a href="\\1">', $output);
$output = str_replace('[/link]', '</a>', $output);

return nl2br($output);
}

?>

一些注意的地方:

记住替换自定义标记生成HTML标记字符串是在调用htmlspecialchars()函数之后,而不是在这个调用之前,否则你的艰苦的工作在调用htmlspecialchars()后将付之东流。

在经过转换之后,查找HTML代码将是替换过的,如双引号"将成为"

nl2br()函数将回车换行符转换为<br>标记,也要在htmlspecialchars()之后。

当转换[links=""] 到 <a href="">, 你必须确认提交者不会插入javascript脚本,一个简单的方法去更改[link="javascript 到 [link=" javascript, 这种方式将不替换,只是将原本的代码显示出来。

outputlib.php
在浏览器中调用test.php,可以看到format_output() 的使用情况

正常的HTML标记不能被使用,用下列的特殊标记替换它:

- this is [b]bold[/b]
- this is [i]italics[/i]
- this is [link="http://www.phpbuilder.com"]a link[/link]
- this is [anchor="test"]an anchor, and a [link="#test"]link[/link] to the anchor

[p]段落
[pre]预先格式化[/pre]
[indent]交错文本[/indent]

这些只是很少的标记,当然,你可以根据你的需求随意加入更多的标记

Conclusion
结论

这个讨论提供安全显示用户输入的方法,可以使用在下列程序中

留言板
用户建议
系统公告
BBS系统

PHP 相关文章推荐
一个ORACLE分页程序,挺实用的.
Oct 09 PHP
PHP 处理图片的类实现代码
Oct 23 PHP
php中几种常见安全设置详解
Apr 06 PHP
采集邮箱的php代码(抓取网页中的邮箱地址)
Jul 17 PHP
php检测文件编码的方法示例
Apr 25 PHP
PHP开源开发框架ZendFramework使用中常见问题说明及解决方案
Jun 12 PHP
PHP生成器简单实例
May 13 PHP
php项目中百度 UEditor 简单安装调试和调用
Jul 15 PHP
PHP安装GeoIP扩展根据IP获取地理位置及计算距离的方法
Jul 01 PHP
THINKPHP截取中文字符串函数实例代码
Mar 20 PHP
php 读写json文件及修改json的方法
Mar 07 PHP
php7 参数、整形及字符串处理机制修改实例分析
May 25 PHP
提升PHP执行速度全攻略(下)
Oct 09 #PHP
PHP的面向对象编程
Oct 09 #PHP
PHP文本数据库的搜索方法
Oct 09 #PHP
PHP:风雨欲来 路在何方?
Oct 09 #PHP
用Socket发送电子邮件(利用需要验证的SMTP服务器)
Oct 09 #PHP
用PHP实现登陆验证码(类似条行码状)
Oct 09 #PHP
用PHP创建PDF中文文档
Oct 09 #PHP
You might like
PHP中使用php5-ffmpeg撷取视频图片实例
2015/01/07 PHP
图片格式的JavaScript和CSS速查手册
2007/08/20 Javascript
javascript form 验证函数 弹出对话框形式
2009/06/23 Javascript
情人节专属 纯js脚本1k大小的3D玫瑰效果
2012/02/11 Javascript
Javascript中常见的校验如域名、手机、邮箱等等
2014/01/02 Javascript
借助JavaScript脚本判断浏览器Flash Player信息的方法
2014/07/09 Javascript
JavaScript DOM元素尺寸和位置
2015/04/13 Javascript
jquery mobile 移动web(5)
2015/12/20 Javascript
一步步教大家编写酷炫的导航栏js+css实现
2016/03/14 Javascript
Angular2平滑升级到Angular4的步骤详解
2017/03/29 Javascript
xmlplus组件设计系列之图标(ICON)(1)
2017/05/05 Javascript
javascript帧动画(实例讲解)
2017/09/02 Javascript
js 判断当前时间是否处于某个一个时间段内
2019/09/19 Javascript
小程序实现录音上传功能
2019/11/22 Javascript
小程序实现列表展开收起效果
2020/07/29 Javascript
通过滑动翻页效果实现和移动端click事件问题
2021/01/26 Javascript
python计算圆周长、面积、球体体积并画出圆
2014/04/08 Python
python实现简单中文词频统计示例
2017/11/08 Python
Python实现在tkinter中使用matplotlib绘制图形的方法示例
2018/01/18 Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
2018/12/11 Python
妙用itchat! python实现久坐提醒功能
2019/11/25 Python
如何将anaconda安装配置的mmdetection环境离线拷贝到另一台电脑
2020/10/15 Python
python实现控制台输出颜色
2021/03/02 Python
CSS3轻松实现清新 Loading 效果的简单实例
2016/06/06 HTML / CSS
应用艺术毕业生的自我评价
2013/12/04 职场文书
商务英语应届生自我鉴定
2013/12/08 职场文书
职业生涯规划书基本格式
2014/01/06 职场文书
副乡长民主生活会个人对照检查材料思想汇报
2014/10/01 职场文书
期中考试复习计划
2015/01/19 职场文书
幼儿园重阳节活动总结
2015/05/05 职场文书
盲山观后感
2015/06/11 职场文书
2016年元旦主持词
2015/07/06 职场文书
tensorflow学习笔记之tfrecord文件的生成与读取
2021/03/31 Python
Python Django框架介绍之模板标签及模板的继承
2021/05/27 Python
MySQL数据库⾼可⽤HA实现小结
2022/01/22 MySQL
JS前端可扩展的低代码UI框架Sunmao使用详解
2022/07/23 Javascript