dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
生成ubuntu自动切换壁纸xml文件的php代码
Jul 17 PHP
zen cart新进商品的随机排序修改方法
Sep 10 PHP
PHP 使用MySQL管理Session的回调函数详解
Jun 21 PHP
PHP date()函数警告: It is not safe to rely on the system解决方法
Aug 20 PHP
php使用mysqli向数据库添加数据的方法
Mar 20 PHP
php如何控制用户对图片的访问 PHP禁止图片盗链
Mar 25 PHP
PHP程序员的技术成长规划
Mar 25 PHP
PHP用mysql_insert_id()函数获得刚插入数据或当前发布文章的ID
Nov 25 PHP
php异常处理捕获错误整理
Sep 23 PHP
PHP语言对接抖音快手小红书视频/图片去水印API接口源码
Aug 11 PHP
phpstudy隐藏index.php的方法
Sep 21 PHP
php png失真的原因及解决办法
Oct 24 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
php生成高清缩略图实例详解
2015/12/07 PHP
PHP实现路由映射到指定控制器
2016/08/13 PHP
PHP安装memcache扩展的步骤讲解
2019/02/14 PHP
php设计模式之抽象工厂模式分析【星际争霸游戏案例】
2020/01/23 PHP
到处都是jQuery选择器的年代 不了解它们的性能,行吗
2012/06/18 Javascript
javascript对select标签的控制(option选项/select)
2013/01/31 Javascript
禁用Enter键表单自动提交实现代码
2014/05/22 Javascript
JavaScript中跨域调用Flash的方法
2014/08/11 Javascript
js+css实现有立体感的按钮式文字竖排菜单效果
2015/09/01 Javascript
cocos2dx骨骼动画Armature源码剖析(三)
2015/09/08 Javascript
js仿小米官网图片轮播特效
2016/09/29 Javascript
微信小程序 小程序制作及动画(animation样式)详解
2017/01/06 Javascript
详解vue-cli 构建Vue项目遇到的坑
2017/08/30 Javascript
js时间戳与日期格式之间相互转换
2017/12/11 Javascript
vuejs 切换导航条高亮(路由菜单高亮)的方法示例
2018/05/29 Javascript
详解基于iview-ui的导航栏路径(面包屑)配置
2019/02/22 Javascript
vue中$refs, $emit, $on, $once, $off的使用详解
2019/05/26 Javascript
小程序使用wxs解决wxml保留2位小数问题
2019/12/13 Javascript
Vue跨域请求问题解决方案过程解析
2020/08/07 Javascript
在vue项目中引用Antv G2,以饼图为例讲解
2020/10/28 Javascript
vue中封装axios并实现api接口的统一管理
2020/12/25 Vue.js
Python二分查找详解
2015/09/13 Python
几种实用的pythonic语法实例代码
2018/02/24 Python
flask框架中勾子函数的使用详解
2018/08/01 Python
python数据爬下来保存的位置
2020/02/17 Python
Python 解析简单的XML数据
2020/07/24 Python
Python将list元素转存为CSV文件的实现
2020/11/16 Python
基于ccs3的timeline时间线实现方法
2020/04/30 HTML / CSS
Juice Beauty官网:有机美容产品,护肤与化妆品
2020/06/13 全球购物
语文教育专业应届生求职信
2013/11/23 职场文书
优秀村官事迹材料
2014/01/10 职场文书
父亲追悼会答谢词
2014/01/17 职场文书
大学生党员自我评价范文
2014/04/09 职场文书
团队会宣传标语
2014/10/09 职场文书
基层组织建设年活动总结
2015/05/09 职场文书
《游戏公平》教学反思
2016/02/20 职场文书