同时提取多条新闻中的文本一例


Posted in PHP onOctober 09, 2006

本文为一个提取一批新闻网页中的文本的小程序,它可以将各篇新闻的内容存为以该新闻标题为文件名的文本文件。如有更好的处理方法,请和我联系:
lwx3069@sina.com
   这里以人民网中的“今日要闻”下的新闻为例.
<?php
($url) ? "" : $url = "http://www.unn.com.cn/GB/channel2/3/11/index.html";        // 今日要闻
if(isset($url)&&$url!="")        {
   $str = implode("",file($url));
   $str_ary = explode("<ul>",$str);
   $str_ary = explode("<li>",trim($str_ary[1]));
   for ($i=0; $i<8; $i++)        {
      if (strlen(trim($str_ary[$i]))<3){
      continue;
      }
      echo "新闻".$i.":".$str_ary[$i];
      $str1=strstr("$str_ary[$i]",'<a href="/');
      $str2=strstr("$str_ary[$i]",'" target');
      $len1=strlen("$str1");
      $len2=strlen("$str2");
      $len=$len1-$len2;
      $url=substr("$str1",10,$len-10);
      if (strlen(trim($url))!=0) {
         $url = "http://www.unn.com.cn/".$url;
         define(CONTENTS_DIR,"./contents/");
         if(isset($url)&&$url!="")        {
            $str = implode("",file($url));
            $str1=explode('<div align="right">',$str);            //去掉文件没用的上半部分
            $str2 = explode('<h4 align="center">  </h4>',$str1[1]);
            //取出文件的下半部分,并去掉没用的下半部分,这时得到的都是有用的
            $str3=explode('</font><font size="+2"><b><font size="3">',$str2[0]);   //从整个有用部分取出文件标题和正文
            $str4=explode('</div>',$str2[0]);   //取出日期和时间
            $str5=explode('</font></b></font><font size="2">',$str3[1]);     //从标题和正文部分取出标题
            $title=str_replace("<br>","",$str5[0]);
            $str3=explode('<p><font size="2">',$str2[0]);          //从整个有用部分取出文件正文
            $str3[1]=str_replace('<br><br>    ',"\n"."

",$str3[1]);
            $str3[1]=str_replace(' ',"",$str3[1]);
            $str3=strip_tags($str3[1]);
            $pf=trim($title).".txt";
            $ppf=fopen(CONTENTS_DIR."$pf",'w');
            fputs($ppf,$title);
            fputs($ppf,"$str4[0]");
            fputs($ppf,$str3);
        }
     }
  }
}
?> 

PHP 相关文章推荐
PHP产生随机字符串函数
Dec 06 PHP
PHP中改变图片的尺寸大小的代码
Jul 17 PHP
php中使用parse_url()对网址进行解析的实现代码(parse_url详解)
Jan 03 PHP
基于php iconv函数的使用详解
Jun 09 PHP
基于PHP magic_quotes_gpc的使用方法详解
Jun 24 PHP
推荐一款PHP+jQuery制作的列表分页的功能模块
Oct 14 PHP
PHP面向对象精要总结
Nov 07 PHP
简单实现PHP留言板功能
Dec 21 PHP
PHP判断是手机端还是PC端 PHP判断是否是微信浏览器
Mar 15 PHP
PHP中使用jQuery+Ajax实现分页查询多功能操作(示例讲解)
Sep 17 PHP
ThinkPHP5.0 图片上传生成缩略图实例代码说明
Jun 20 PHP
PHP两个n位的二进制整数相加问题的解决
Aug 26 PHP
PHP+DBM的同学录程序(4)
Oct 09 #PHP
PHP+DBM的同学录程序(1)
Oct 09 #PHP
基于mysql的bbs设计(四)
Oct 09 #PHP
PHP+DBM的同学录程序(3)
Oct 09 #PHP
PHP+DBM的同学录程序(2)
Oct 09 #PHP
基于mysql的bbs设计(一)
Oct 09 #PHP
基于mysql的bbs设计(二)
Oct 09 #PHP
You might like
多文件上载系统完整版
2006/10/09 PHP
php二维数组排序方法(array_multisort usort)
2013/12/25 PHP
PHP中new static()与new self()的区别异同分析
2014/08/22 PHP
PHP中使用php5-ffmpeg撷取视频图片实例
2015/01/07 PHP
深入浅析PHP的session反序列化漏洞问题
2017/06/15 PHP
ExtJS 工具栏 分页事件参数
2010/03/05 Javascript
extjs之去除s.gif的影响
2010/12/25 Javascript
javascript:history.go()和History.back()的区别及应用
2012/11/25 Javascript
js判断子窗体是否关闭的方法
2015/08/11 Javascript
在React框架中实现一些AngularJS中ng指令的例子
2016/03/06 Javascript
jquery插件autocomplete用法示例
2016/07/01 Javascript
老生常谈Javascript中的原型和this指针
2016/10/09 Javascript
vue事件修饰符和按键修饰符用法总结
2017/07/25 Javascript
Vue+webpack项目配置便于维护的目录结构教程详解
2018/10/14 Javascript
提升node.js中使用redis的性能遇到的问题及解决方法
2018/10/30 Javascript
微信小程序五子棋游戏的悔棋实现方法【附demo源码下载】
2019/02/20 Javascript
Javascript之高级数组API的使用实例
2019/03/08 Javascript
WebGL学习教程之Three.js学习笔记(第一篇)
2019/04/25 Javascript
深入学习TypeScript 、React、 Redux和Ant-Design的最佳实践
2019/06/17 Javascript
js模拟F11页面全屏显示
2019/09/17 Javascript
javascript中导出与导入实现模块化管理教程
2020/12/03 Javascript
Python 字符串操作实现代码(截取/替换/查找/分割)
2013/06/08 Python
Python使用MD5加密算法对字符串进行加密操作示例
2018/03/30 Python
对pycharm代码整体左移和右移缩进快捷键的介绍
2018/07/16 Python
python判断数字是否是超级素数幂
2018/09/27 Python
python验证身份证信息实例代码
2019/05/06 Python
python实现微信自动回复及批量添加好友功能
2019/07/03 Python
如何基于Python实现数字类型转换
2020/02/07 Python
20世纪40年代连衣裙和复古服装:The Seamstress Of Bloomsbury
2018/07/24 全球购物
路政管理专业推荐信
2013/11/11 职场文书
上班上网检讨书
2014/01/29 职场文书
中文专业求职信
2014/06/20 职场文书
机械设备与数控技术专业求职信
2014/08/10 职场文书
2015年学校教育教学工作总结
2015/04/22 职场文书
教师纪律作风整顿心得体会
2016/01/23 职场文书
2019教师的学习计划
2019/06/25 职场文书