php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
第四节 构造函数和析构函数 [4]
Oct 09 PHP
域名查询代码公布
Oct 09 PHP
我的论坛源代码(二)
Oct 09 PHP
用PHP实现将GB编码转换为UTF8
Nov 25 PHP
php站内搜索并高亮显示关键字的实现代码
Dec 29 PHP
PHP基于phpqrcode生成带LOGO图像的二维码实例
Jul 10 PHP
PHP使用token防止表单重复提交的方法
Apr 07 PHP
php英文单词统计器
Jun 23 PHP
iOS自定义提示弹出框实现类似UIAlertView的效果
Nov 16 PHP
PHP基于接口技术实现简单的多态应用完整实例
Apr 26 PHP
Laravel 手动开关 Eloquent 修改器的操作方法
Dec 30 PHP
phpmyadmin在宝塔面板里进不去的解决方案
Jul 06 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
[原创]php常用字符串输出方法分析(echo,print,printf及sprintf)
2016/07/09 PHP
PHP实现绘制二叉树图形显示功能详解【包括二叉搜索树、平衡树及红黑树】
2017/11/16 PHP
JavaScript 异步调用框架 (Part 4 - 链式调用)
2009/08/04 Javascript
javascript 禁用IE工具栏,导航栏等等实现代码
2013/04/01 Javascript
JavaScript实现动态添加,删除行的方法实例详解
2015/07/02 Javascript
JavaScript资源预加载组件和滑屏组件的使用推荐
2016/03/10 Javascript
前端微信支付js代码
2016/07/25 Javascript
js控制台输出的方法(详解)
2016/11/26 Javascript
jQuery与js实现颜色渐变的方法
2016/12/30 Javascript
three.js绘制地球、飞机与轨迹的效果示例
2017/02/28 Javascript
Javascript前端经典的面试题及答案
2017/03/14 Javascript
javascript 初学教程及五子棋小程序的简单实现
2017/07/04 Javascript
使用vue.js在页面内组件监听scroll事件的方法
2018/09/11 Javascript
JavaScript组合模式---引入案例分析
2020/05/23 Javascript
antd-DatePicker组件获取时间值,及相关设置方式
2020/10/27 Javascript
Python使用xlrd读取Excel格式文件的方法
2015/03/10 Python
python执行子进程实现进程间通信的方法
2015/06/02 Python
详解python 发送邮件实例代码
2016/12/22 Python
5款非常棒的Python工具
2018/01/05 Python
django启动uwsgi报错的解决方法
2018/04/08 Python
对python 命令的-u参数详解
2018/12/03 Python
python中利用numpy.array()实现俩个数值列表的对应相加方法
2019/08/26 Python
使用pytorch实现论文中的unet网络
2020/06/24 Python
意大利男装网店:Vrients
2019/05/02 全球购物
植树节活动总结
2014/04/30 职场文书
大学生标准自荐书
2014/06/15 职场文书
2014年客服工作总结范文
2014/11/13 职场文书
2015年八一建军节演讲稿
2015/03/19 职场文书
MySQL 角色(role)功能介绍
2021/04/24 MySQL
Python 中数组和数字相乘时的注意事项说明
2021/05/10 Python
JavaScript实现贪吃蛇游戏
2021/06/16 Javascript
使用GO语言实现Mysql数据库CURD的简单示例
2021/08/07 Golang
python 中的jieba分词库
2021/11/23 Python
Mysql分库分表之后主键处理的几种方法
2022/02/15 MySQL
css3带你实现3D转换效果
2022/02/24 HTML / CSS
Spring Data JPA框架持久化存储数据到数据库
2022/04/28 Java/Android