dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
php入门小知识
Mar 24 PHP
php列出一个目录下的所有文件的代码
Oct 09 PHP
微信营销平台系统?刮刮乐的开发
Jun 10 PHP
php过滤表单提交的html等危险代码
Nov 03 PHP
PHP、Java des加密解密实例
Apr 27 PHP
详解PHP的Yii框架中扩展的安装与使用
Apr 01 PHP
php数组分页实现方法
Apr 30 PHP
php下载远程大文件(获取远程文件大小)的实例
Jun 17 PHP
浅析PHP中的闭包和匿名函数
Dec 25 PHP
php+jQuery ajax实现的实时刷新显示数据功能示例
Sep 12 PHP
php的instanceof和判断闭包Closure操作示例
Jan 26 PHP
PHP连接MySQL数据库操作代码实例解析
Jul 11 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
php设计模式 Adapter(适配器模式)
2011/06/26 PHP
PHP 防注入函数(格式化数据)
2011/08/08 PHP
浅析PHP递归函数返回值使用方法
2013/02/18 PHP
PHP封装的数据库保存session功能类
2016/07/11 PHP
PHP判断文件是否被引入的方法get_included_files用法示例
2016/11/29 PHP
php 使用expat方式解析xml文件操作示例
2019/11/26 PHP
Jquery中val()表单取值赋值的实例代码
2013/08/15 Javascript
Js实现手机发送验证码时按钮延迟操作
2014/06/20 Javascript
jQuery Validate表单验证插件 添加class属性形式的校验
2016/01/18 Javascript
Sea.JS知识总结
2016/05/05 Javascript
jquery 多个radio的click事件实例
2016/12/03 Javascript
jQuery实现加入收藏夹功能(主流浏览器兼职)
2016/12/24 Javascript
JavaScript之Date_动力节点Java学院整理
2017/06/28 Javascript
vuejs实现ready函数加载完之后执行某个函数的方法
2018/08/31 Javascript
解决vue热替换失效的根本原因
2018/09/19 Javascript
vue使用better-scroll实现下拉刷新、上拉加载
2018/11/23 Javascript
Vue.js组件高级特性实例详解
2018/12/24 Javascript
jquery操作checkbox的常用方法总结【附测试源码下载】
2019/06/10 jQuery
python学习数据结构实例代码
2015/05/11 Python
Django中传递参数到URLconf的视图函数中的方法
2015/07/18 Python
Python爬虫实例_利用百度地图API批量获取城市所有的POI点
2018/01/10 Python
解决django后台样式丢失,css资源加载失败的问题
2019/06/11 Python
pandas 空数据处理方法详解
2019/11/02 Python
python+OpenCV实现图像拼接
2020/03/05 Python
python GUI计算器的实现
2020/10/09 Python
ParcelABC西班牙:包裹运送和快递服务
2019/12/24 全球购物
优秀的教师个人的中文求职信
2013/09/21 职场文书
考核评语大全
2014/04/29 职场文书
优秀研究生主要事迹
2014/06/03 职场文书
网吧温馨提示
2015/07/17 职场文书
Django 如何实现文件上传下载
2021/04/08 Python
教你使用TensorFlow2识别验证码
2021/06/11 Python
解决ObjectMapper.convertValue() 遇到的一些问题
2021/06/30 Java/Android
Sleuth+logback 设置traceid 及自定义信息方式
2021/07/26 Java/Android
MySQL中order by的使用详情
2021/11/17 MySQL
MySQL实现字段分割一行转多行的示例代码
2022/07/07 MySQL