dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
php XPath对XML文件查找及修改实现代码
Jul 27 PHP
php使用GeoIP库实例
Jun 27 PHP
PHP中feof()函数实例测试
Aug 23 PHP
ThinkPHP模板中数组循环实例
Oct 30 PHP
PHP实现清除wordpress里恶意代码
Oct 21 PHP
WordPress中用于获取搜索表单的PHP函数使用解析
Jan 05 PHP
php实现的mysqldb读写分离操作类示例
Feb 07 PHP
PHP一个简单的无需刷新爬虫
Jan 05 PHP
微信JSSDK分享功能图文实例详解
Apr 08 PHP
Yii框架的路由配置方法分析
Sep 09 PHP
Laravel 类和接口注入相关的代码
Oct 15 PHP
tp5框架的增删改查操作示例
Oct 31 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
phpinfo 系统查看参数函数代码
2009/06/05 PHP
一步一步学习PHP(4) php 函数 补充2
2010/02/15 PHP
php实现简单爬虫的开发
2016/03/28 PHP
jquery遍历input取得input的name
2009/04/27 Javascript
jQuery 技巧大全(新手入门篇)
2009/05/12 Javascript
基于jquery的textarea发布框限制文字字数输入(添加中文识别)
2012/02/16 Javascript
js 弹出框只弹一次(二次修改之后的)
2013/11/26 Javascript
JavaScript判断访问的来源是手机还是电脑,用的哪种浏览器
2013/12/12 Javascript
jquery delay()介绍及使用指南
2014/09/02 Javascript
JavaScript中变量声明有var和没var的区别示例介绍
2014/09/15 Javascript
js用Date对象的setDate()函数对日期进行加减操作
2014/09/18 Javascript
Jquery效果大全之制作电脑健康体检得分特效附源码下载
2015/11/02 Javascript
全面理解JavaScript中的闭包
2016/05/12 Javascript
微信小程序 表单Form实例详解(附源码)
2016/12/22 Javascript
详谈jQuery中的一些正则匹配表达式
2017/03/08 Javascript
vue.js的安装方法
2017/05/12 Javascript
js轮播图无缝滚动效果
2017/06/17 Javascript
jQuery接受后台传递的List的实例详解
2017/08/02 jQuery
JS滚轮控制图片缩放大小和拖动的实例代码
2018/11/20 Javascript
Nuxt.js实现一个SSR的前端博客的示例代码
2019/09/06 Javascript
React组件设计模式之组合组件应用实例分析
2020/04/29 Javascript
详解JavaScript中分解数字的三种方法
2021/01/05 Javascript
python私有属性和方法实例分析
2015/01/15 Python
将Python的Django框架与认证系统整合的方法
2015/07/24 Python
Django权限机制实现代码详解
2018/02/05 Python
matplotlib命令与格式之tick坐标轴日期格式(设置日期主副刻度)
2019/08/06 Python
基于keras输出中间层结果的2种实现方式
2020/01/24 Python
Python3和PyCharm安装与环境配置【图文教程】
2020/02/14 Python
浅谈keras中的目标函数和优化函数MSE用法
2020/06/10 Python
python语言中有算法吗
2020/06/16 Python
《蜗牛》教学反思
2014/02/18 职场文书
《雷鸣电闪波尔卡》教学反思
2014/02/23 职场文书
助人为乐好少年事迹材料
2014/08/18 职场文书
全国优秀教师事迹材料
2014/08/26 职场文书
2014年党员学习“三严三实”思想汇报
2014/09/15 职场文书
2014年教研员工作总结
2014/12/23 职场文书