自动把纯文本转换成Web页面的php代码


Posted in PHP onAugust 27, 2009

首先让我们来看一个我朋友希望转换的纯文本文件的例子:
以下为引用的内容:

Green for Mars! 

John R. Doe 

The idea of little green men from Mars, long a staple of science fiction, may soon turn out to be less fantasy and more fact. 

Recent samples sent by the latest Mars exploration team indicate a high presence of chlorophyll in the atmosphere. Chlorophyll, you will recall, is what makes plants green. It's quite likely, therefore, that organisms on Mars will have, through continued exposure to the green stuff, developed a greenish tinge on their outer exoskeleton. 

An interview with Dr. Rushel Bunter, the head of ASDA's Mars Colonization Project blah blah... 

What does this mean for you? Well, it means blah blahblah... 

Track follow-ups to this story online at http://www.mars-connect.dom/. To see pictures of the latest samples, log on to http://www.asdamcp.dom/galleries/220/

相当标准的文本:它有一个标题、一个署名和很多段的文字。把这篇文档转换成为HTML真正需要做的是使用HTML的分行和分段标记把原文的布局保留在Web页面上。特殊的标点符号需要被转换成为对应的HTML符号,超链接需要变得可以点击。
下面的PHP代码(列表A)就会完成上面所有的任务:
列表A
让我们来看看它是如何工作的:
<?php 
// set source file name and path 
$source = "toi200686.txt"; 
// read raw text as array 
$raw = file($source) or die("Cannot read file"); 
// retrieve first and second lines (title and author) 
$slug = array_shift($raw); 
$byline = array_shift($raw); 
// join remaining data into string 
$data = join('', $raw); 
// replace special characters with HTML entities 
// replace line breaks with <br /> 
$html = nl2br(htmlspecialchars($data)); 
// replace multiple spaces with single spaces 
$html = preg_replace('/ss+/', ' ', $html); 
// replace URLs with <a href...> elements 
$html = preg_replace('/s(w+://)(S+)/', ' <a href="" target="_blank"></a>', $html); 
// start building output page 
// add page header 
$output =<<< HEADER 
<html> 
<head> 
<style> 
.slug {font-size: 15pt; font-weight: bold} 
.byline { font-style: italic } 
</style> 
</head> 
<body> 
HEADER; 
// add page content 
$output .= "<div class='slug'>$slug</div>"; 
$output .= "<div class='byline'>By $byline</div><p />"; 
$output .= "<div>$html</div>"; 
// add page footer 
$output .=<<< FOOTER 
</body> 
</html> 
FOOTER; 
// display in browser 
echo $output; 
// AND/OR 
// write output to a new .html file 
file_put_contents(basename($source, substr($source, strpos($source, '.'))) . ".html", $output) or die("Cannot write file"); 
?>

第一步是把纯ASCII文件读取到一个PHP数组里。这通过file()函数很容易就可以完成,这个函数会把文件的每一行都转换成为一个用数字索引的数组中的元素。
然后,标题和作者行(我假设这两个都是文件的前两行)都通过array_shift()函数从数组里提取出来,放到单独的变量里。数组剩下的成员然后被连接成一个字符串。这个字符串现在就包括了整篇文章的正文。
文章正文里像“'”、“<”和“>”这样的特殊符号通过htmlspecialchars()函数被转换成相应的HTML符号。为了保留文章的原始格式,分行和分段通过nl2br()函数被转换成HTML的
元素。文章中间多个空格通过简单的字符串替换被压缩成为一个空格。
文章正文里的URL用正则表达式来检测,两边是元素。当页面在Web浏览器里显示的时候,它会把URL转换成为可点击的超链接。
然后用标准的HTML规则创建输出的HTML页面。文章的标题、作者和正文都用CSS样式规则格式化。尽管这段脚本没有这样做,但是你可以在这个地方自定义最终页面的外观,你可以向模板添加图形元素、颜色或者其他眩目的内容。
一旦HTML页面构建完成,它就可以被送到浏览器或者用file_put_contents()保存为静态文件。要注意的是,在保存的时候,原来的文件名会被分解,一个新的文件名(叫做filename.html)会为新创建的Web页面创建。你然后就可以把这个Web页面发布到Web服务器上、保存到光盘上或者对它进行进一步编辑。
注意:在使用这个脚本创建和保存HTML文件到磁盘的时候,你要确保这个脚本对文件保存的目录有写权限。
正如你看到的,假如你有标准格式的ASCII纯文本数据文件,你可以相当迅速用PHP把它转换成为可使用的Web页面。如果你已经有了一个Web网站,并计划把新的Web页面加入进来,那么调试页面生成器所使用的模板,使之适应原有Web网站的外观是相当容易的
PHP 相关文章推荐
Php做的端口嗅探器--可以指定网站和端口
Oct 09 PHP
IIS安装Apache伪静态插件的具体操作图文
Jul 01 PHP
php中调用其他系统http接口的方法说明
Feb 28 PHP
Yii使用ajax验证显示错误messagebox的解决方法
Dec 03 PHP
php实现面包屑导航例子分享
Dec 19 PHP
ThinkPHP模板Volist标签嵌套循环输出多维数组的方法
Mar 23 PHP
php实现将HTML页面转换成word并且保存的方法
Oct 14 PHP
PHP批量获取网页中所有固定种子链接的方法
Nov 18 PHP
thinkPHP中_initialize方法实例分析
Dec 05 PHP
PHP PDOStatement::closeCursor讲解
Jan 30 PHP
laravel高级的Join语法详解以及使用Join多个条件
Oct 16 PHP
php 原生分页
Apr 01 PHP
PHP高级OOP技术演示
Aug 27 #PHP
php 获取可变函数参数的函数
Aug 26 #PHP
php download.php实现代码 跳转到下载文件(response.redirect)
Aug 26 #PHP
php 文件夹删除、php清除缓存程序
Aug 25 #PHP
php 正则匹配函数体
Aug 25 #PHP
PHP has encountered an Access Violation at 7C94BD02解决方法
Aug 24 #PHP
PHP 替换模板变量实现步骤
Aug 24 #PHP
You might like
受疫情影响 动画《Re从零开始的异世界生活》第二季延期至7月
2020/03/10 日漫
php图片添加水印例子
2016/07/20 PHP
原生javascript兼容性测试实例
2013/07/01 Javascript
jQuery.parseJSON(json)将JSON字符串转换成js对象
2014/07/27 Javascript
javascript实现checkBox的全选,反选与赋值
2015/03/12 Javascript
angularjs客户端实现压缩图片文件并上传实例
2015/07/06 Javascript
简单谈谈javascript中的变量、作用域和内存问题
2015/08/30 Javascript
JQuery日期插件datepicker的使用方法
2016/03/03 Javascript
BootStrap中Datetimepicker和uploadify插件应用实例小结
2016/05/26 Javascript
jQuery弹出遮罩层效果完整示例
2016/09/13 Javascript
javascript的几种写法总结
2016/09/30 Javascript
纯JS打造网页中checkbox和radio的美化效果
2016/10/13 Javascript
JavaScript实现选中文字提示新浪微博分享效果
2017/06/15 Javascript
JavaScript中最常用的10种代码简写技巧总结
2017/06/28 Javascript
JavaScript复制内容到剪贴板的两种常用方法
2018/02/27 Javascript
Vue动态组件和异步组件原理详解
2019/05/06 Javascript
Vue 自定义标签的src属性不能使用相对路径的解决
2019/09/17 Javascript
JavaScript检测浏览器是否支持CSS变量代码实例
2020/04/03 Javascript
Vue + Node.js + MongoDB图片上传组件实现图片预览和删除功能详解
2020/04/29 Javascript
解决antd datepicker 获取时间默认少8个小时的问题
2020/10/29 Javascript
对于Python编程中一些重用与缩减的建议
2015/04/14 Python
python  Django中的apps.py的目的是什么
2018/10/15 Python
Pandas中Series和DataFrame的索引实现
2019/06/27 Python
python的sys.path模块路径添加方式
2020/03/09 Python
Python configparser模块操作代码实例
2020/06/08 Python
Python+Xlwings 删除Excel的行和列
2020/12/19 Python
AE美国鹰日本官方网站: American Eagle Outfitters
2016/12/10 全球购物
Urban Decay官方网站:美国化妆品品牌
2020/06/04 全球购物
软件测试企业面试试卷
2016/07/13 面试题
销售代表求职自荐信
2013/10/01 职场文书
关于礼仪的演讲稿
2014/01/04 职场文书
一次性工伤赔偿协议书范本
2014/11/25 职场文书
《水浒传》读后感3篇(范文)
2019/09/19 职场文书
启迪人心的励志语录:脾气永远不要大于本事
2020/01/02 职场文书
MySQL 使用SQL语句修改表名的实现
2021/04/07 MySQL
详细聊聊MySQL中慢SQL优化的方向
2021/08/30 MySQL