dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
我常用的几个类
Oct 09 PHP
文件系统基本操作类
Nov 23 PHP
落伍首发 php+mysql 采用ajax技术的 省 市 地 3级联动无刷新菜单 源码
Dec 16 PHP
Cannot modify header information错误解决方法
Oct 08 PHP
php中AES加密解密的例子小结
Feb 18 PHP
PHP中Fatal error session_start()错误解决步骤
Aug 05 PHP
字符串长度函数strlen和mb_strlen的区别示例介绍
Sep 09 PHP
PHP中require和include路径问题详解
Dec 25 PHP
php 批量查询搜狗sogou代码分享
May 17 PHP
PHP根据session与cookie用户登录状态操作类的代码
May 13 PHP
php正则修正符用法实例详解
Dec 29 PHP
PHP的图像处理实例小结【文字水印、图片水印、压缩图像等】
Dec 20 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
用PHP伪造referer突破网盘禁止外连的代码
2008/06/15 PHP
破解图片防盗链的代码(asp/php)测试通过
2010/07/02 PHP
Drupal7连接多个数据库及常见问题解决
2014/03/02 PHP
Firefox div高度自适应
2009/04/28 Javascript
jQuery 常见学习网站与参考书
2009/11/09 Javascript
jquery 1.4.2发布!主要是性能与API
2010/02/25 Javascript
利用百度地图JSAPI生成h7n9禽流感分布图实现代码
2013/04/15 Javascript
json数据处理技巧(字段带空格、增加字段、排序等等)
2013/06/14 Javascript
常用javascript表单验证汇总
2020/07/20 Javascript
jQuery深拷贝Json对象简单示例
2016/07/06 Javascript
AngularJS入门教程之过滤器详解
2016/08/19 Javascript
深究AngularJS中$sce的使用
2017/06/12 Javascript
JQ图片文件上传之前预览功能的简单实例(分享)
2017/11/12 Javascript
ztree加载完成后显示勾选节点的实现代码
2018/10/22 Javascript
js取小数点后两位四种方法
2019/01/18 Javascript
一文了解Vue中的nextTick
2019/05/06 Javascript
Vue-CLI 3 scp2自动部署项目至服务器的方法
2020/07/24 Javascript
[01:45]IMBATV TI4前线报道-选手到达
2014/07/07 DOTA
Python爬取Coursera课程资源的详细过程
2014/11/04 Python
详解Python中的装饰器、闭包和functools的教程
2015/04/02 Python
bpython 功能强大的Python shell
2016/02/16 Python
Python基于property实现类的特性操作示例
2018/06/15 Python
python pandas读取csv后,获取列标签的方法
2018/11/12 Python
python利用selenium进行浏览器爬虫
2019/04/25 Python
python 在某.py文件中调用其他.py内的函数的方法
2019/06/25 Python
python读取图片的方式,以及将图片以三维数组的形式输出方法
2019/07/03 Python
Tensorflow中的dropout的使用方法
2020/03/13 Python
python数据库操作mysql:pymysql、sqlalchemy常见用法详解
2020/03/30 Python
html5 移动端视频video的android兼容(去除播放控件、全屏)
2020/03/26 HTML / CSS
巴基斯坦电子产品购物网站:Home Shopping
2017/09/14 全球购物
应届大学生求职的自我评价
2013/11/17 职场文书
入党积极分子学习优秀共产党员先进事迹思想汇报
2014/09/13 职场文书
2014年小学工作总结
2014/11/26 职场文书
电力工程合作意向书
2015/05/11 职场文书
2019年警察入党转正申请书最新范文
2019/09/03 职场文书
Vue2.0搭建脚手架
2022/03/13 Vue.js