php生成百度sitemap站点地图类函数实例


Posted in PHP onOctober 17, 2014

本文实例讲述了php生成百度sitemap站点地图类函数的方法,分享给大家供大家参考。具体实现方法如下:

问题概述:

公司网站是问答百科的网站、seo工程师提出需求说根据网站的问题来生成xml文件。每个xml文件包含5000条setmap格式数据。现在线上网站大约有70w条问题,所以说基本生成140个xml文件。还有一个索引文件。比如文件的名称以数字开头的。索引文件包含的内容就是每个xml文件的路径还有名称。
为什么要每个文件存储5000条数据呢,因为这是mysql的一个界限值、如果每次取多了以后可能会对线上用户访问造成影响,或者速度变慢。每个文件存储5000条数据,但是mysql selsect的时候不能每次取5000条、现在写的是每次取1000条。那这样逻辑就有点复杂。

实现方法:

首先取出1000条数据(可以灵活些成活的,方便以后修改),然后循环生成xml格式文件。file_puts_contens写入文件。然后再把生成的xml文件名称、取出问题的最小id、取出问题的最大id、取出问题的条数写出一个索引查询的txt文件当中,格式大概是这个样子的。
0,3146886,3145887,1000
发现最后面的条数是1000了吗、第一次select取出1000条数据、然后写入0.xml文件当中。把取出的xml文件名称、最小id、最大id、条数写入到索引查询txt中。第一次写入了1000条数据到0.xml、生成条数为1000。第二次查询的时候select语句会成为。 where id > 取出的最大id(当前mysql为正序查询、如果为倒序、改成小于) limit 1000 这样的话又取出1000、然后修改索引查询txt的最小id、最大id、生成条数加到2000。以此类推等生成条数到了5000的时候再另起一行写入索引文件、类似这样
0,3146886,3145887,5000
1,3148886,3147887,1000
这样写的话就减轻了服务器的压力。
下面贴出实现代码(风格有点乱):

具体功能代码如下:

<?php

/*

 * SiteMap接口类

 */

 

class SitemapAction extends Action{

private static $baseURL = ''; //URL地址

private static $askMobileUrl = 'http://m.xxx.cn/ask/'; //问答移动版地址

private static $askPcUrl = "http://www.xxx.cn/ask/";   //问答pc地址

private static $askZonePcUrl = "http://www.xxx.cn/ask/jingxuan/"; //问答精选Pc链接

private static $askZoneMobileUrl = "http://m.xxx.cn/ask/jx/"; //问答精选移动版链接

        //问答setmaps

public function askSetMap(){

header('Content-type:text/html;charset=utf-8');

//获取问题列表

$maxid = 0;    //索引文件最大id

$minid = 0;    //索引文件最小id

$psize = 1000; //数据库每次取数量

$maxXml = 5000; //xml写入记录数量

$where = array();

//读取索引文件

$index = APP_PATH.'setmapxml/Index.txt';

//关联setmaps路径

$askXml = "../siteditu/ask/ask.xml";

if(!file_exists($index)){

$fp=fopen("$index", "w+");

if ( !is_writable($index) ){

die("文件:" .$index. "不可写,请检查!");

}

fclose($fp);

}else{

//index.txt文件说明 0:xml文件名称(从1开始)、1:文件最大id、2:文件最小id、3:文件当前记录数

$fp = file($index);

$string = $fp[count($fp)-1];//显示最后一行

$arr = explode(',', $string);

}

//索引文件数量是否小于$maxXml

//如果为第一次运行

if(!$arr[1]){

$bs=1;

$filename=0;

}else{

if($arr && $arr[3]<$maxXml){

$filename = $arr[0];

$psize = $maxXml-$arr[3]>$psize?$psize:($maxXml-$arr[3]);

$bs = 0;

}else{

$filename = $arr[0]+1;

$bs=1;

}

}

$maxid = empty($arr[1])?0:$arr[1];

$minid = empty($arr[2])?0:$arr[2];

echo "文件名称:".$filename.".xml"."<br/ >";

echo "最大id:".$maxid."<br />";

echo "最小id:".$minid."<br />";

echo "xml写入最大记录:".$maxXml."<br />";

echo "数据库每次读取数量:".$psize."<br />";

$list = self::$questionObj->getQuestionSetMap($where,$maxid,$psize);

if(count($list)<=0){

echo 1;exit;

}

$record = $arr[3]+count($list); //索引文件写入记录数

$indexArr = array('filename'=>$filename,'maxid'=>$maxid,'minid'=>$minid,'maxXml'=>$record);

$start = '<?xml version="1.0" encoding="UTF-8" ?> '.chr(10);

$start.="<urlset xmlns=\"http://www.sitemaps.org/schemas/sitemap/0.9\" xmlns:mobile=\"http://www.baidu.com/schemas/sitemap-mobile/1/\">".chr(10);

                                $start.="</urlset>";

foreach($list as $k=>$qinfo){

if($k==0)

$indexArr['minid']=$qinfo['id'];

$qinfo['lastmod'] = substr($qinfo['lasttime'],0,10);

$qinfo['mobielurl'] = self::$askMobileUrl.$qinfo['id'].'.html'; //移动版链接

$qinfo['pcurl'] = self::$askPcUrl.$qinfo['id'].'-p1.html'; //pc版链接

$xml.=$this->askMapMobileUrl($qinfo); //移动版

$xml.=$this->askMapPcUrl($qinfo);     //pc版

}

$maxid = end($list);

$indexArr['maxid'] = $maxid['id'];

//更新索引文件

if($bs==0){

//更新最后一行

$txt = file($index);

$txt[count($txt)-1] = $indexArr[filename].','.$indexArr[maxid].','.$indexArr['minid'].','.$indexArr['maxXml']."\r\n";

$str = join($txt);

if (is_writable($index)) {

if (!$handle = fopen($index, 'w')) {

echo "不能打开文件 $index";exit;

exit;

}

if (fwrite($handle, $str) === FALSE) {

echo "不能写入到文件 $index";exit;

exit;

}

echo "成功地写入文件$index";

fclose($handle);

} else {

echo "文件 $index 不可写";exit;

}

fclose($index);

}elseif($bs==1){

//新加入一行

$fp = fopen($index,'a');

$num = count($list);

$string = $indexArr[filename].','.$indexArr[maxid].','.$indexArr['minid'].','.$num."\r\n";

if(fwrite($fp,$string)===false){

echo "追加新行失败。。。";exit;

}else{

echo "追加成功<br />";

//更新sitemap索引文件

$xmlData="<?xml version=\"1.0\"  encoding=\"UTF-8\" ?>".chr(10);

$xmlData.="<sitemapindex>".chr(10);

$xmlData.="</sitemapindex>";

if(!file_exists($askXml))

file_put_contents($askXml,$xmlData);

$fileList = file($askXml);

$fileCount = count($fileList);

$setmapxml = "http://www.xxx.cn/ask/setmapxml/{$filename}.xml";//正常问题链接

$txt = $this->setMapIndex($setmapxml);

$fileList[$fileCount-1]=$txt."</sitemapindex>";

$newContent = '';

foreach($fileList as $v){

$newContent.= $v;

}

if(!file_put_contents($askXml,$newContent)) exit('无法写入数据');

echo '已经写入文档' . $askXml;

}

fclose($fp);

}

$filename =  APP_PATH.'setmapxml/'.$filename.'.xml';

                //更新到xml文件中,增加结尾

                if(!file_exists($filename))

                        file_put_contents($filename,$start);

                $xmlList = file($filename);

                $xmlCount = count($fileList);

                $xmlList[$xmlCount-1]=$xml."</urlset>";

                $newXml = '';

foreach($xmlList as $v){

$newXml.= $v;

}

if(!file_put_contents($filename, $newXml))exit("写入数据错误");

                else

                    echo "写入数据成功<br />";

}

//问答移动版xml

private function askMapMobileUrl($data){

$xml = '';

if(is_array($data)&&!empty($data)){

$xml .="<url>".chr(10);

if($data['id'])

$xml.='<loc>'.$data['mobielurl'].'</loc>'.chr(10);//移动版链接

$xml.="<mobile:mobile type=\"mobile\"/>".chr(10);

if($data['lastmod'])

$xml.='<lastmod>'.$data['lastmod'].'</lastmod>'.chr(10);

$xml.='<changefreq>daily</changefreq>'.chr(10);

$xml.='<priority>0.8</priority>'.chr(10);   

$xml.="</url>".chr(10);

return $xml;

}

}

//问答pc版xml

private function askMapPcUrl($data){

$xml = '';

if(is_array($data)&&!empty($data)){

$xml.='<url>'.chr(10);

if($data['id'])

$xml.='<loc>'.$data['pcurl'].'</loc>'.chr(10);//pc版链接

if($data['lastmod'])

$xml.='<lastmod>'.$data['lastmod'].'</lastmod>'.chr(10);

$xml.='<changefreq>daily</changefreq>'.chr(10);

$xml.='<priority>0.8</priority>'.chr(10);

$xml.='</url>'.chr(10);

return $xml;

}

}

//setmaps索引文件

private function setMapIndex($filename){

$xml = '';

$xml.="<sitemap>".chr(10);

$xml.="<loc>{$filename}</loc>".chr(10);

$xml.="<lastmod>".date("Y-m-d",time())."</lastmod>".chr(10);

$xml.="</sitemap>".chr(10);

return $xml;

}

}

?>

 
xml索引文件格式如下:
<?xml version="1.0"  encoding="UTF-8" ?>

<sitemapindex>

<sitemap>

<loc>http://www.xxx.cn/ask/setmapxml/0.xml</loc>

<lastmod>2014-05-12</lastmod>

</sitemap>

<sitemap>

<loc>http://www.xxx.cn/ask/setmapxml/1.xml</loc>

<lastmod>2014-05-12</lastmod>

</sitemap>

</sitemapindex>

 
xml文件格式(每个文件需要存储5000条、现展示1条例子)
<?xml version="1.0" encoding="UTF-8" ?> 

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">

<url>

<loc>http://m.xxx.cn/ask/7460.html</loc>

<mobile:mobile type="mobile"/>

<lastmod>2013-01-11</lastmod>

<changefreq>daily</changefreq>

<priority>0.8</priority>

</url>

<url>

</urlset>

 
至于sql代码主要就是一个select语句,这里就不贴出来了。

希望本文所述对大家的php程序设计有所帮助。

PHP 相关文章推荐
PHP5新特性: 更加面向对象化的PHP
Nov 18 PHP
PHP函数分享之curl方式取得数据、模拟登陆、POST数据
Jun 04 PHP
ThinkPHP采用GET方式获取中文参数查询无结果的解决方法
Jun 26 PHP
Smarty中常用变量操作符汇总
Oct 27 PHP
laravel 4安装及入门图文教程
Oct 29 PHP
php中HTTP_REFERER函数用法实例
Nov 21 PHP
基于GD2图形库的PHP生成图片缩略图类代码分享
Feb 08 PHP
PHP连接MSSQL方法汇总
Feb 05 PHP
Windows 下安装 swoole 图文教程(php)
Jun 05 PHP
PHP 7安装调试工具Xdebug扩展的方法教程
Jun 17 PHP
动态表单验证的操作方法和TP框架里面的ajax表单验证
Jul 19 PHP
PHP CURL使用详解
Mar 21 PHP
php+mysql实现数据库随机重排实例
Oct 17 #PHP
php中spl_autoload详解
Oct 17 #PHP
php中__destruct与register_shutdown_function执行的先后顺序问题
Oct 17 #PHP
PHP图片自动裁切应付不同尺寸的显示
Oct 16 #PHP
PHP 抽象方法与抽象类abstract关键字介绍及应用
Oct 16 #PHP
php开启与关闭错误提示适用于没有修改php.ini的权限
Oct 16 #PHP
php实现扫描二维码根据浏览器类型访问不同下载地址
Oct 15 #PHP
You might like
PHP 长文章分页函数 带使用方法,不会分割段落,翻页在底部
2009/10/22 PHP
laravel按天、按小时,查询数据的实例
2019/10/09 PHP
TP5框架model常见操作示例小结【增删改查、聚合、时间戳、软删除等】
2020/04/05 PHP
Yii框架应用组件用法实例分析
2020/05/15 PHP
两种方法实现文本框输入内容提示消失
2013/03/17 Javascript
简约JS日历控件 实例代码
2013/07/12 Javascript
禁止拷贝网页内容的js代码
2014/01/22 Javascript
使用typeof判断function是否存在于上下文
2014/08/14 Javascript
jqGrid表格应用之新增与删除数据附源码下载
2015/12/02 Javascript
详解jquery事件delegate()的使用方法
2016/01/25 Javascript
JavaScript驾驭网页-DOM
2016/03/24 Javascript
jQuery判断元素是否显示 是否隐藏的简单实现代码
2016/05/19 Javascript
AngularJS实现星星等级评分功能
2016/09/24 Javascript
微信小程序多张图片上传功能
2017/06/07 Javascript
详解vue 配合vue-resource调用接口获取数据
2017/06/22 Javascript
vue-cli和v-charts实现可视化图表过程解析
2019/10/08 Javascript
微信小程序实现轨迹回放的示例代码
2019/12/13 Javascript
详解Vue的ref特性的使用
2020/01/24 Javascript
[04:10]DOTA2英雄梦之声_第11期_圣堂刺客
2014/06/21 DOTA
[34:47]完美世界DOTA2联赛PWL S2 Magma vs LBZS 第一场 11.18
2020/11/18 DOTA
python批量修改文件后缀示例代码分享
2013/12/24 Python
在Python中使用Neo4j数据库的教程
2015/04/16 Python
Python3.x版本中新的字符串格式化方法
2015/04/24 Python
Python实现股市信息下载的方法
2015/06/15 Python
python实现ping的方法
2015/07/06 Python
python求最大值,不使用内置函数的实现方法
2019/07/09 Python
Django serializer优化类视图的实现示例
2020/07/16 Python
关于Kotlin中SAM转换的那些事
2020/09/15 Python
The Athlete’s Foot新西兰:新西兰最大的运动鞋零售商
2019/12/23 全球购物
《从现在开始》教学反思
2014/04/15 职场文书
个人批评与自我批评发言稿
2014/09/28 职场文书
班子成员四风问题自我剖析材料
2014/09/29 职场文书
2014村党支部书记党建工作汇报材料
2014/11/02 职场文书
成事在人观后感
2015/06/16 职场文书
婚宴新娘致辞
2015/07/28 职场文书
《钢铁是怎样炼成的》高中读后感
2019/08/07 职场文书