php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
15种PHP Encoder的比较
Mar 06 PHP
dedecms中显示数字验证码的修改方法
Mar 21 PHP
Bo-Blog专用的给Windows服务器的IIS Rewrite程序
Aug 26 PHP
通过具体程序来理解PHP里面的抽象类
Jan 28 PHP
php 将字符串按大写字母分隔成字符串数组
Apr 30 PHP
php中操作memcached缓存进行增删改查数据的实现代码
Aug 15 PHP
PHP+swoole实现简单多人在线聊天群发
Jan 19 PHP
php pthreads多线程的安装与使用
Jan 19 PHP
详解thinkphp实现excel数据的导入导出(附完整案例)
Dec 29 PHP
PHP7基于curl实现的上传图片功能
May 11 PHP
PHP解析url并得到url参数方法总结
Oct 11 PHP
Laravel 手动开关 Eloquent 修改器的操作方法
Dec 30 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
php版小黄鸡simsimi聊天机器人接口分享
2014/01/26 PHP
百度地图API使用方法详解
2015/08/25 PHP
使用phpexcel类实现excel导入mysql数据库功能(实例代码)
2016/05/12 PHP
PHP简单实现循环链表功能示例
2017/11/10 PHP
php+mysql+ajax 局部刷新点赞/取消点赞功能(每个账号只点赞一次)
2020/07/24 PHP
推荐11款jQuery开发的复选框和单选框美化插件
2011/08/02 Javascript
JS基础之undefined与null的区别分析
2011/08/08 Javascript
js 遍历对象的属性的代码
2011/12/29 Javascript
jQuery找出网页上最高元素的方法
2015/03/20 Javascript
jQuery实现的仿select功能代码
2015/08/19 Javascript
Bootstrap每天必学之js插件
2015/11/30 Javascript
Javascript基于AJAX回调函数传递参数实例分析
2015/12/15 Javascript
JavaScript设计模式经典之工厂模式
2016/02/24 Javascript
jQuery实现复制到粘贴板功能
2017/02/11 Javascript
jQuery Jsonp跨域模拟搜索引擎
2017/06/17 jQuery
浅谈angular2 组件的生命周期钩子
2017/08/12 Javascript
vue不通过路由直接获取url中参数的方法示例
2017/08/24 Javascript
nodejs使用redis作为缓存介质实现的封装缓存类示例
2018/02/07 NodeJs
vue better scroll 无法滚动的解决方法
2018/06/07 Javascript
vue组件开发之slider组件使用详解
2020/08/21 Javascript
[03:22]DAC最前线(第二期)—DOTA2亚洲邀请赛主赛场周边及线路探访
2015/01/24 DOTA
[00:27]DOTA2战队VP、Secret贺新春
2018/02/11 DOTA
Python中基本的日期时间处理的学习教程
2015/10/16 Python
Python中property属性实例解析
2018/02/10 Python
python删除本地夹里重复文件的方法
2020/11/19 Python
python数据处理之如何选取csv文件中某几行的数据
2019/09/02 Python
基于Python绘制美观动态圆环图、饼图
2020/06/03 Python
python 实现批量图片识别并翻译
2020/11/02 Python
物流管理应届生求职信
2013/11/07 职场文书
三个儿子教学反思
2014/02/03 职场文书
工艺员岗位职责
2014/02/11 职场文书
社区居务公开实施方案
2014/03/27 职场文书
学校元旦晚会开场白
2014/12/14 职场文书
教师工作态度自我评价
2015/03/05 职场文书
关于运动会的广播稿
2015/08/19 职场文书
校运会班级霸气口号
2015/12/24 职场文书