dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
我的论坛源代码(八)
Oct 09 PHP
php中使用Curl、socket、file_get_contents三种方法POST提交数据
Aug 12 PHP
php的慢速日志引起的Mysql错误问题分析
May 13 PHP
Yii Framework框架获取分类下面的所有子类方法
Jun 20 PHP
php上传图片之时间戳命名(保存路径)
Aug 15 PHP
PHP获取毫秒级时间戳的方法
Apr 15 PHP
php类常量用法实例分析
Jul 09 PHP
php 查找数组元素提高效率的方法详解
May 05 PHP
PHP 7.0新增加的特性介绍
Jun 08 PHP
php apache开启跨域模式过程详解
Jul 08 PHP
thinkPHP5框架路由常用知识点汇总
Sep 15 PHP
Thinkphp 框架扩展之Widget扩展实现方法分析
Apr 23 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
php更改目录及子目录下所有的文件后缀的代码
2010/09/24 PHP
PHP判断数组是否为空的常用方法(五种方法)
2017/02/08 PHP
基于php解决json_encode中文UNICODE转码问题
2020/11/10 PHP
JavaScript 学习笔记(四)
2009/12/31 Javascript
input 输入框内的输入事件详细分析
2010/03/17 Javascript
Firefox/Chrome/Safari的中可直接使用$/$$函数进行调试
2012/02/13 Javascript
Javascript中的String对象详谈
2014/03/03 Javascript
AngularJS过滤器详解及示例代码
2016/08/16 Javascript
全面解析标签页的切换方式
2016/08/21 Javascript
JS实现页面载入时随机显示图片效果
2016/09/07 Javascript
强大的 Angular 表单验证功能详细介绍
2017/05/23 Javascript
JavaScript实现一个空中避难的小游戏
2017/06/06 Javascript
AngularJS service之select下拉菜单效果
2017/07/28 Javascript
vue实现点击图片放大效果
2017/08/15 Javascript
vue+webpack实现异步组件加载的方法
2018/02/03 Javascript
小程序文字跑马灯效果
2018/12/28 Javascript
vue.js 2.0实现简单分页效果
2019/07/29 Javascript
解决vue无法侦听数组及对象属性的变化问题
2020/07/17 Javascript
[43:58]DOTA2-DPC中国联赛定级赛 LBZS vs SAG BO3第一场 1月8日
2021/03/11 DOTA
Python中的pprint折腾记
2015/01/21 Python
python画双y轴图像的示例代码
2019/07/07 Python
Python3 文章标题关键字提取的例子
2019/08/26 Python
python 多维高斯分布数据生成方式
2019/12/09 Python
python全局变量引用与修改过程解析
2020/01/07 Python
python词云库wordcloud的使用方法与实例详解
2020/02/17 Python
Python实现验证码识别
2020/06/15 Python
解决CSS3的opacity属性带来的层叠顺序问题
2016/05/09 HTML / CSS
日本面向世界,国际级的免税在线购物商城:DOKODEMO
2017/02/01 全球购物
党员学习群众路线教育实践活动对照检查材料
2014/09/23 职场文书
药店采购员岗位职责
2014/09/30 职场文书
小学运动会报道稿
2014/10/04 职场文书
如何撰写创业策划书
2019/06/27 职场文书
python中opencv实现图片文本倾斜校正
2021/06/11 Python
使用CSS实现一个搜索引擎的原理解析
2021/09/25 HTML / CSS
电脑无法安装Windows 11怎么办?无法安装Win11的解决方法
2021/11/21 数码科技
Javascript webpack动态import
2022/04/19 Javascript