dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
php采集速度探究总结(原创)
Apr 18 PHP
php socket方式提交的post详解
Jul 19 PHP
php变量范围介绍
Oct 15 PHP
PHP 解决session死锁的方法
Jun 20 PHP
PHP迭代器的内部执行过程详解
Nov 12 PHP
php使用百度ping服务代码实例
Jun 19 PHP
php文件上传你必须知道的几点
Oct 20 PHP
PHP中的随机性 你觉得自己幸运吗?
Jan 22 PHP
iis 7下安装laravel 5.4环境的方法教程
Jun 14 PHP
laravel自定义分页效果
Jul 23 PHP
PHP生成随机数的方法总结
Mar 01 PHP
php实现根据身份证获取精准年龄
Feb 26 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
Fine Uploader文件上传组件应用介绍
2013/01/06 PHP
教你如何解密 “ PHP 神盾解密工具 ”
2014/06/20 PHP
在Windows XP下安装Apache+MySQL+PHP环境
2015/02/22 PHP
PHP递归遍历多维数组实现无限分类的方法
2016/05/06 PHP
ThinkPHP框架实现的微信支付接口开发完整示例
2019/04/10 PHP
laravel使用Faker数据填充的实现方法
2019/04/12 PHP
phpwind放自动注册方法
2006/12/02 Javascript
学习YUI.Ext 第三天
2007/03/10 Javascript
dess中一个简单的多路委托的实现
2010/07/20 Javascript
javascript下拉框选项单击事件的例子分享
2015/03/04 Javascript
javascript密码强度校验代码(两种方法)
2015/08/10 Javascript
新手学习前端之js模仿淘宝主页网站
2016/10/31 Javascript
使用DeviceOne实现微信小程序功能
2016/12/29 Javascript
微信小程序 特效菜单抽屉效果实例代码
2017/01/11 Javascript
详解Vue2.X的路由管理记录之 钩子函数(切割流水线)
2017/05/02 Javascript
实例教学如何写vue插件
2017/11/30 Javascript
Koa2 之文件上传下载的示例代码
2018/03/29 Javascript
vue的列表交错过渡实现代码示例
2019/05/05 Javascript
微信小程序轮播图swiper代码详解
2020/12/01 Javascript
Python sys.argv用法实例
2015/05/28 Python
使用Python对SQLite数据库操作
2017/04/06 Python
用python实现刷点击率的示例代码
2019/02/21 Python
python字符串Intern机制详解
2019/07/01 Python
python实现银行管理系统
2019/10/25 Python
Canvas 帧动画吃苹果小游戏
2020/08/05 HTML / CSS
2014年三万活动总结
2014/04/26 职场文书
在校实习生求职信
2014/06/18 职场文书
2014教师研修学习体会
2014/07/08 职场文书
幼儿园迎国庆65周年活动策划方案
2014/09/16 职场文书
学校领导四风问题整改措施思想汇报
2014/10/09 职场文书
个人批评与自我批评材料
2014/10/17 职场文书
关于有小孩的离婚协议书
2014/10/26 职场文书
2014年建筑工程工作总结
2014/12/03 职场文书
经营场所使用证明
2015/06/19 职场文书
PHP新手指南
2021/04/01 PHP
Nginx文件已经存在全局反向代理问题排查记录
2022/07/15 Servers