php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
提升PHP性能的21种方法介绍
Jun 25 PHP
php获得url参数中具有&amp;的值的方法
Mar 05 PHP
ThinkPHP后台首页index使用frameset时的注意事项分析
Aug 22 PHP
PHP反射机制用法实例
Aug 28 PHP
php随机生成数字字母组合的方法
Mar 18 PHP
PHP使用递归方式列出当前目录下所有文件的方法
Jun 02 PHP
android上传图片到PHP的过程详解
Aug 03 PHP
Zend Framework生成验证码并实现验证码验证功能(附demo源码下载)
Mar 22 PHP
php metaphone()函数的定义和用法
May 15 PHP
PHP实现基本留言板功能原理与步骤详解
Mar 26 PHP
PHP实现随机发放扑克牌
Apr 21 PHP
PHP7新增函数
Mar 09 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
10 个经典PHP函数
2013/10/17 PHP
PHP实现的简单日历类
2014/11/29 PHP
Yii2实现同时搜索多个字段的方法
2016/08/10 PHP
thinkPHP引入类的方法详解
2016/12/08 PHP
PHP微信分享开发详解
2017/01/14 PHP
利用 fsockopen() 函数开放端口扫描器的实例
2017/08/19 PHP
jquery调用wcf并展示出数据的方法
2011/07/07 Javascript
jQuery函数的等价原生函数代码示例
2013/05/27 Javascript
js 数值转换为3位逗号分隔的示例代码
2014/02/19 Javascript
jquery实现增加删除行的方法
2015/02/03 Javascript
javascript中函数作为参数调用的方法
2015/02/09 Javascript
javaScript 逻辑运算符使用技巧整理
2017/05/03 Javascript
Node.js连接mongodb实例代码
2017/06/06 Javascript
React-Native使用Mobx实现购物车功能
2017/09/14 Javascript
Vue中控制v-for循环次数的实现方法
2018/09/26 Javascript
浅谈Javascript中的对象和继承
2019/04/19 Javascript
vue-resource:jsonp请求百度搜索的接口示例
2019/11/09 Javascript
JsonServer安装及启动过程图解
2020/02/28 Javascript
浅谈Vue3 Composition API如何替换Vue Mixins
2020/04/29 Javascript
python数据结构之二叉树的遍历实例
2014/04/29 Python
浅谈Django REST Framework限速
2017/12/12 Python
使用Python实现租车计费系统的两种方法
2018/09/29 Python
python中报错&quot;json.decoder.JSONDecodeError: Expecting value:&quot;的解决
2019/04/29 Python
Python企业编码生成系统之系统主要函数设计详解
2019/07/26 Python
宝塔面板成功部署Django项目流程(图文)
2020/06/22 Python
python爬虫请求头设置代码
2020/07/28 Python
Python爬虫开发与项目实战
2020/12/16 Python
美国婚礼装饰和活动用品批发供应商:Event Decor Direct
2018/10/12 全球购物
关于建议书的格式范文
2014/05/20 职场文书
公司市场专员岗位职责
2014/06/29 职场文书
教师群众路线教育实践活动学习笔记
2014/11/05 职场文书
《小乌鸦爱妈妈》教学反思
2016/02/19 职场文书
Go缓冲channel和非缓冲channel的区别说明
2021/04/25 Golang
Oracle设置DB、监听和EM开机启动的方法
2021/04/25 Oracle
Python自动化爬取天眼查数据的实现
2021/06/15 Python
Python函数对象与闭包函数
2022/04/13 Python