Search Engine Friendly的URL设计


Posted in PHP onOctober 09, 2006

Search Engine Friendly的URL设计 版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
http://www.chedong.com/tech/google_url.html 关键词:"url rewrite" mod_rewrite isapirewrite path_info "search engine friendly"
内容摘要:
此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。在Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小), 链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和按月归档的文档很容被搜的到),因此很多关于面向搜索引擎 URL设计优化(URI Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式:
比如可以将:
http://www.chedong.com/phpMan.php?mode=man¶meter=ls
变成:
http://www.chedong.com/phpMan.php/man/ls
实现方式主要有2种:
基于url rewrite 基于path_info 把URI地址用作参数传递:URL REWRITE
最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换:
这样几乎可以不修改程序的实现将 news.asp?id=234 这样的链接映射成 news/234.html,从外面看上去和静态链接一样。Apache服务器上有一个模块(非缺省):mod_rewrite:URL REWRITE功能之强大足够写上一本书。
当我需要将将news.asp?id=234的映射成news/234.html时,只需设置:
RewriteRule /news/(\d+)\.html /news\.asp\?id=$1 [N,I]
这样就把 /news/234.html 这样的请求映射成了 /news.asp?id=234
当有对/news/234.html的请求时:web服务器会把实际请求转发给/news.asp?id=234
而在IIS也有相应的REWRITE模块:比如ISAPI REWRITE和IIS REWRITE,语法都是基于正则表达式,因此配置几乎和apache的mod_rewrite是相同的: 比对于某一个简单应用可以是:
RewriteRule /news/(\d+)\.html /news/news\.php\?id=$1 [N,I]
这样就把 http://www.chedong.com/news/234.html 映射到了 http://www.chedong.com/news/news.php?id=234

一个更通用的能够将所有的动态页面进行参数映射的表达式是:
把 http://www.myhost.com/foo.php?a=A&b=B&c=C
表现成 http://www.myhost.com/foo.php/a/A/b/B/c/C。
RewriteRule (.*?\.php)(\?[^/]*)?/([^/]*)/([^/]*)(.+?)? $1(?2$2&:\?)$3=$4?5$5: [N,I]
通过URL REWRITE还有一个好处就是隐藏后台实现,这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,更本感受不到后台应用的变化。 比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用mod_rewrite甚至可以把请求转发到其他后台服务器上。
基于PATH_INFO的URL美化 Url美化的另外一个方式就是基于PATH_INFO:
PATH_INFO是一个CGI 1.1的标准,经常发现很多跟在CGI后面的"/value_1/value_2"就是PATH_INFO参数:
比如http://www.chedong.com/phpMan.php/man/ls,中:$PATH_INFO = "/man/ls"
PATH_INFO是CGI标准,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
注意:/myapp/servlet/Hello/foo的 getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()将返回的 /hello.jsp,从这里你也可以知道jsp其实就是一个Servlet的PATH_INFO参数。ASP不支持PATH_INFO,

PHP中基于PATH_INFO的参数解析的例子如下:
//注意:参数按"/"分割,第一个参数是空的:从/param1/param2中解析出$param1 $param2这2个参数
if ( isset($_SERVER["PATH_INFO"]) ) {
    list($nothing, $param1, $param2) = explode('/', $_SERVER["PATH_INFO"]);
}

如何隐蔽应用:例如 .php,的扩展名:
在APACHE中这样配置:
<FilesMatch "^app_name$">
    ForceType application/x-httpd-php
</FilesMatch>

如何更像静态页面:app_name/my/app.html
解析的PATH_INFO参数的时候,把最后一个参数的最后5个字符“.html”截断即可。
注意:APACHE2中缺省是不允许PATH_INFO的,需要设置AcceptPathInfo on

特别是针对使用虚拟主机用户,无权安装和配置mod_rewrite的时候,PATH_INFO往往就成了唯一的选择。

OK,这样以后看见类似于http://www.example.com/article/234这样的网页你就知道可能是 article/show.php?id=234这个php程序生成的动态网页,很多站点表面看上去可能有很多静态目录,其实很有可能都是使用1,2个程序实现的内容发布。比如很多WIKIWIKI系统都使用了这个机制:整个系统就一个简单的wiki程序,而看上去的目录其实都是这个应用拿后面的地址作为参数的查询结果。

利用基于MOD_REWRITE/PATH_INFO + CACHE服务器的解决方案对原有的动态发布系统进行改造,也可以大大降低旧有系统升级到新的内容管理系统的成本。并且方便了搜索引擎收录入索引。 附:如何在IIS上利用PHP支持PATH_INFOPHP的ISAPI模式安装备忘:只试成 php-4.2.3-Win32

解包目录
========
php-4.2.3-Win32.zip c:\php

PHP.INI初始化文件
=================
复制:c:\php\php.ini-dist 到 c:\winnt\php.ini

配置文件关联
============
按照install.txt中的说明配置文件关联

运行库文件
==========
复制 c:\php\php4ts.dll 到 c:\winnt\system32\php4ts.dll

这样运行后:会发现php把PATH_INFO映射到了物理路径上
Warning: Unknown(C:\CheDong\Downloads\ariadne\www\test.php\path): failed to create stream: No such file or directory in Unknown on line 0

Warning: Unknown(): Failed opening 'C:\CheDong\Downloads\ariadne\www\test.php\path' for inclusion (include_path='.;c:\php4\pear') in Unknown on line 0

安装ariadne的PATCH
==================
停止IIS服务
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆盖原有的c:\php\sapi\php4isapi.dll

注:
ariadne是一个基于PATH_INFO的内容发布系统,
PHP 4.3.2 RC2中CGI模式的PATH_INFO已经修正,照常安装即可。
参考资料:
URL Rewrite文档:
http://www.isapirewrite.com/docs/
http://httpd.apache.org/docs/mod/mod_rewrite.html
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html
搜索引擎友好的URL设计
http://www.sitepoint.com/article/485
说不定这个URL原来就是articel.php?id=485
一个基于PATH_INFO的开源内容管理系统
http://typo3.com/
Google没有索引什么?
http://www.microdocs-news.info/newsGoogle/2003/05/10.html
Google的PageRank说明:
http://pr.efactory.de/

PHP 相关文章推荐
PHP如何透过ODBC来存取数据库
Oct 09 PHP
PHP类继承 extends使用介绍
Jan 14 PHP
php自定义urlencode,urldecode函数实例
Mar 24 PHP
php中smarty变量修饰用法实例分析
Jun 11 PHP
Symfony2 session用法实例分析
Feb 04 PHP
Zend Framework实现具有基本功能的留言本(附demo源码下载)
Mar 22 PHP
微信公众号判断用户是否已关注php代码解析
Jun 24 PHP
PHP版微信第三方实现一键登录及获取用户信息的方法
Oct 14 PHP
PHP笛卡尔积实现算法示例
Jul 30 PHP
PDO::getAvailableDrivers讲解
Jan 28 PHP
php高性能日志系统 seaslog 的安装与使用方法分析
Feb 29 PHP
Centos7安装swoole扩展操作示例
Mar 26 PHP
PHPlet在Windows下的安装
Oct 09 #PHP
一棵php的类树(支持无限分类)
Oct 09 #PHP
基于PHP+MySQL的聊天室设计
Oct 09 #PHP
Win9x/ME下Apache+PHP安装配置
Oct 09 #PHP
关于PHP中的Class的几点个人看法
Oct 09 #PHP
PHP自动生成月历代码
Oct 09 #PHP
十天学会php(3)
Oct 09 #PHP
You might like
上海牌131型七灯四波段四喇叭一级收音机
2021/03/02 无线电
PHP 选项及相关信息函数库
2006/12/04 PHP
PHP5与MySQL数据库操作常用代码 收集
2010/03/21 PHP
关于php mvc开发模式的感想
2011/06/28 PHP
php笔记之:文章中图片处理的使用
2013/04/26 PHP
php foreach如何跳出两层循环(详解)
2016/11/05 PHP
php将html转为图片的实现方法
2017/05/19 PHP
分享一个用Mootools写的鼠标滑过进度条改变进度值的实现代码
2011/12/12 Javascript
JavaScript异步调用定时方法并停止该方法实现代码
2012/03/16 Javascript
Javascript 遮罩层和加载效果代码
2013/08/01 Javascript
深入理解JavaScript中Ajax
2016/08/02 Javascript
详解js中Json的语法与格式
2016/11/22 Javascript
jQuery事件blur()方法的使用实例讲解
2019/03/30 jQuery
浅谈redux, koa, express 中间件实现对比解析
2019/05/23 Javascript
vue里的data要用return返回的原因浅析
2019/05/28 Javascript
NodeJs 实现简单WebSocket即时通讯的示例代码
2019/08/05 NodeJs
vue点击按钮动态创建与删除组件功能
2019/12/29 Javascript
[09:13]2014DOTA2国际邀请赛 中国区预选赛coser表演
2014/05/23 DOTA
Python多进程通信Queue、Pipe、Value、Array实例
2014/11/21 Python
浅析Python中signal包的使用
2015/11/13 Python
python数据预处理之将类别数据转换为数值的方法
2017/07/05 Python
Python运维之获取系统CPU信息的实现方法
2018/06/11 Python
浅谈Python采集网页时正则表达式匹配换行符的问题
2018/12/20 Python
django使用haystack调用Elasticsearch实现索引搜索
2019/07/24 Python
多个python文件调用logging模块报错误
2020/02/12 Python
python正则表达式re.match()匹配多个字符方法的实现
2021/01/27 Python
python3.9和pycharm的安装教程并创建简单项目的步骤
2021/02/03 Python
pycharm 实现调试窗口恢复
2021/02/05 Python
详解如何使用rem或viewport进行移动端适配
2020/08/14 HTML / CSS
Homestay中文官网:全球寄宿家庭
2018/10/18 全球购物
本科毕业生求职信
2014/06/15 职场文书
多媒体教室标语
2014/06/26 职场文书
校本研修个人总结
2015/02/28 职场文书
学生会部长竞选稿
2015/11/19 职场文书
2019最新版火锅店的创业计划书 !
2019/07/12 职场文书
Linux在两个服务器直接传文件的操作方法
2022/08/05 Servers