dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
通过ODBC连接的SQL SERVER实例
Oct 09 PHP
PHP mkdir()定义和用法
Jan 14 PHP
php 获取可变函数参数的函数
Aug 26 PHP
PHP中使用addslashes函数转义的安全性原理分析
Nov 03 PHP
smarty实现多级分类的方法
Dec 05 PHP
PHP异常处理Exception类
Dec 11 PHP
php提交过来的数据生成为txt文件
Apr 28 PHP
PHP图片添加水印功能示例小结
Oct 03 PHP
PHP载入图像imagecreatefrom_gif_jpeg_png系列函数用法分析
Nov 14 PHP
解决微信授权回调页面域名只能设置一个的问题
Dec 11 PHP
PHP编程实现微信企业向用户付款的方法示例
Jul 26 PHP
YII框架常用技巧总结
Apr 27 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
PHP令牌 Token改进版
2008/07/18 PHP
PHP IF ELSE简化/三元一次式的使用
2011/08/22 PHP
解析PHP将对象转换成数组的方法(兼容多维数组类型)
2013/06/21 PHP
Codeigniter实现多文件上传并创建多个缩略图
2014/06/12 PHP
基于CakePHP实现的简单博客系统实例
2015/06/28 PHP
浅谈php中fopen不能创建中文文件名文件的问题
2017/02/06 PHP
PHP+swoole+linux实现系统监控和性能优化操作示例
2019/04/15 PHP
更正确的asp冒泡排序
2007/05/24 Javascript
JAVASCRIPT实现的WEB页面跳转以及页面间传值方法
2010/05/13 Javascript
javascript函数定义的几种区别小结
2014/01/06 Javascript
使用Jquery获取带特殊符号的ID 标签的方法
2014/04/30 Javascript
jQuery中Ajax的load方法详解
2015/01/14 Javascript
Javascript核心读书有感之语句
2015/02/11 Javascript
一不小心就做错的JS闭包面试题
2015/11/25 Javascript
详解nodeJs文件系统(fs)与流(stream)
2018/01/24 NodeJs
解决vue页面刷新或者后退参数丢失的问题
2018/03/13 Javascript
JS动态插入脚本和插入引用外部链接脚本的方法
2018/05/21 Javascript
小程序云开发实战小结
2018/10/25 Javascript
vue进入页面时不在顶部,检测滚动返回顶部按钮问题及解决方法
2019/10/30 Javascript
[04:45]DOTA2上海特级锦标赛主赛事第四日RECAP
2016/03/06 DOTA
从Python的源码来解析Python下的freeblock
2015/05/11 Python
Python聊天室实例程序分享
2016/01/05 Python
请不要重复犯我在学习Python和Linux系统上的错误
2016/12/12 Python
numpy中索引和切片详解
2017/12/15 Python
python 使用建议与技巧分享(四)
2020/08/18 Python
CSS+jQuery实现的在线答题功能
2015/04/25 HTML / CSS
详解CSS3浏览器兼容
2016/12/14 HTML / CSS
戴森美国官网:Dyson美国
2016/09/11 全球购物
英国排名第一的最新设计师品牌手表独立零售商:TIC Watches
2016/09/24 全球购物
《七颗钻石》教学反思
2014/02/28 职场文书
销售员岗位职责
2014/06/09 职场文书
领导班子对照检查材料
2014/09/22 职场文书
教师党的群众路线教育实践活动学习心得体会
2014/10/30 职场文书
硕士学位论文评语
2014/12/31 职场文书
2016三八妇女节校园广播稿
2015/12/17 职场文书
mysql多表查询-笔记七
2021/04/05 MySQL