编程 PHP

dede3.1分页文字采集过滤规则详说(图文教程)

Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本，通过简单的变通和改动，解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码：
范例分页区域代码：
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码：
分页区域取样(匹配)：

范例分页内容过滤规则：
分页内容过滤规则：
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览：
范例采集内容预览：

范例全代码(说明：此代码为在原基础上进行更改后的代码，原代码版本不同，直接导入后无效，因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用'，确实如此)：
输出结果：http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧：http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码，可导入试下：

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}

dede3.1分页文字采集过滤规则详说(图文教程)

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

PHP 相关文章推荐

php XPath对XML文件查找及修改实现代码

Jul 27 PHP

php使用GeoIP库实例

Jun 27 PHP

PHP中feof()函数实例测试

Aug 23 PHP

ThinkPHP模板中数组循环实例

Oct 30 PHP

PHP实现清除wordpress里恶意代码

Oct 21 PHP

WordPress中用于获取搜索表单的PHP函数使用解析

Jan 05 PHP

php实现的mysqldb读写分离操作类示例

Feb 07 PHP

PHP一个简单的无需刷新爬虫

Jan 05 PHP

微信JSSDK分享功能图文实例详解

Apr 08 PHP

Yii框架的路由配置方法分析

Sep 09 PHP

Laravel 类和接口注入相关的代码

Oct 15 PHP

tp5框架的增删改查操作示例

Oct 31 PHP

dedecms模版制作使用方法

Apr 03 #PHP

经典的PHPer为什么被认为是草根？

Apr 02 #PHP

在任意字符集下正常显示网页的方法二（续）

Apr 01 #PHP

在任意字符集下正常显示网页的方法一

Apr 01 #PHP

用PHP实现的生成静态HTML速度快类库

Mar 31 #PHP

解决dede生成静态页和动态页转换的一些问题，及火车采集入库生成动态的办法

Mar 29 #PHP

实现dedecms全站URL静态化改造的代码

Mar 29 #PHP