dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
php中配置文件操作 如config.php文件的读取修改等操作
Jul 07 PHP
zf框架的校验器InArray使用示例
Mar 13 PHP
PHP中创建图像并绘制文字的例子
Nov 19 PHP
smarty模板引擎从配置文件中获取数据的方法
Jan 22 PHP
php检测url是否存在的方法
Apr 14 PHP
php比较两个字符串长度的方法
Jul 13 PHP
分享PHP函数实现数字与文字分页代码
Jul 28 PHP
如何使用php脚本给html中引用的js和css路径打上版本号
Nov 18 PHP
PHP编写RESTful接口的方法
Feb 21 PHP
php正则修正符用法实例详解
Dec 29 PHP
PHP数组基本用法与知识点总结
Jun 02 PHP
PHP安装扩展mcrypt以及相关依赖项深入讲解
Mar 04 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
收音机鉴频器对声音的影响和频偏分析
2021/03/02 无线电
Php图像处理类代码分享
2012/01/19 PHP
PHP实现WebService的简单示例和实现步骤
2015/03/27 PHP
PHP基于MySQL数据库实现对象持久层的方法
2015/06/17 PHP
php微信公众平台开发之获取用户基本信息
2015/08/17 PHP
深入了解PHP中的Array数组和foreach
2016/11/06 PHP
PHP二维数组实现去除重复项的方法【保留各个键值】
2017/12/21 PHP
cssQuery()的下载与使用方法
2007/01/12 Javascript
JavaScript 学习点滴记录
2009/04/24 Javascript
js png图片(有含有透明)在IE6中为什么不透明了
2010/02/07 Javascript
JavaScript中继承的一些示例方法与属性参考
2010/08/07 Javascript
jQuery lazyload 的重复加载错误以及修复方法
2010/11/19 Javascript
原生javascript模仿win8等待提示圆圈进度条
2014/04/24 Javascript
AngularJS基础 ng-keypress 指令简单示例
2016/08/02 Javascript
JavaScript数组去重由慢到快由繁到简(优化篇)
2016/08/26 Javascript
利用Javascript仿Excel的数据透视分析功能
2016/09/07 Javascript
D3.js封装文本实现自动换行和旋转平移等功能
2016/10/14 Javascript
JavaScript中日常收集常见的10种错误(推荐)
2017/01/08 Javascript
vue js秒转天数小时分钟秒的实例代码
2018/08/08 Javascript
vue ssr 实现方式(学习笔记)
2019/01/18 Javascript
layui表格 列自动适应大小失效的解决方法
2019/09/06 Javascript
Vue 实现显示/隐藏层的思路(加全局点击事件)
2019/12/31 Javascript
[55:56]NB vs Infamous 2019国际邀请赛淘汰赛 败者组 BO3 第二场 8.22
2019/09/05 DOTA
浅谈python中的实例方法、类方法和静态方法
2017/02/17 Python
Python图像处理库PIL的ImageFont模块使用介绍
2020/02/26 Python
Python + selenium + crontab实现每日定时自动打卡功能
2020/03/31 Python
django restframework serializer 增加自定义字段操作
2020/07/15 Python
Python改变对象的字符串显示的方法
2020/08/01 Python
Python调用ffmpeg开源视频处理库,批量处理视频
2020/11/16 Python
css3的focus-within选择器的使用
2020/05/11 HTML / CSS
巴西服装和鞋子购物网站:Marisa
2018/10/25 全球购物
六一儿童节活动策划方案
2014/01/27 职场文书
感恩节活动方案
2014/01/27 职场文书
心得体会格式及范文
2016/01/25 职场文书
2019请假条的基本格式及范文!
2019/07/05 职场文书
浅谈怎么给Python添加类型标注
2021/06/08 Python