php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
php5 and xml示例
Nov 22 PHP
初品cakephp 入门基础
Feb 16 PHP
几个有用的php字符串过滤,转换函数代码
May 01 PHP
PHP仿盗链代码
Jun 03 PHP
解析php如何将日志写进syslog
Jun 28 PHP
利用PHP实现短域名互转
Jul 05 PHP
php中的PHP_EOL换行符详细解析
Oct 26 PHP
IIS 7.5 asp Session超时时间设置方法
Apr 17 PHP
一个非常实用的php文件上传类
Jul 04 PHP
PHP PDOStatement::setFetchMode讲解
Feb 03 PHP
Laravel框架查询构造器 CURD操作示例
Sep 04 PHP
PHP autoload使用方法及步骤详解
Sep 05 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
Laravel等框架模型关联的可用性浅析
2019/12/15 PHP
yii框架结合charjs统计上一年与当前年数据的方法示例
2020/04/04 PHP
Prototype使用指南之selector.js
2007/01/10 Javascript
javaScript parseInt字符转化为数字函数使用小结
2009/11/05 Javascript
Javascript 面向对象之重载
2010/05/04 Javascript
JavaScript 原型学习总结
2010/10/29 Javascript
js两行代码按指定格式输出日期时间
2011/10/21 Javascript
jQuery.validate 常用方法及需要注意的问题
2013/03/20 Javascript
js实现局部页面打印预览原理及示例代码
2014/07/03 Javascript
js确认删除对话框适用于a标签及submit
2014/07/10 Javascript
js正则表达式replace替换变量方法
2016/05/21 Javascript
谈谈Vue.js——vue-resource全攻略
2017/01/16 Javascript
微信小程序 天气预报开发实例代码源码
2017/01/20 Javascript
前端开发之CSS原理详解
2017/03/11 Javascript
浅谈使用mpvue开发小程序需要注意和了解的知识点
2018/05/23 Javascript
详解用Webpack与Babel配置ES6开发环境
2019/03/12 Javascript
jQuery子选择器与可见性选择器实例分析
2019/06/28 jQuery
五分钟搞懂Vuex实用知识(小结)
2019/08/12 Javascript
Python打印斐波拉契数列实例
2015/07/07 Python
Python运维之获取系统CPU信息的实现方法
2018/06/11 Python
windows中安装Python3.8.0的实现方法
2019/11/19 Python
Python第三方库的几种安装方式(小结)
2020/04/03 Python
Django 解决上传文件时,request.FILES为空的问题
2020/05/20 Python
canvas简单连线动画的实现代码
2020/02/04 HTML / CSS
Debenhams百货英国官方网站:Debenhams UK
2016/07/12 全球购物
巴西宠物店在线:Geração Pet
2017/05/31 全球购物
回门宴答谢词
2014/01/13 职场文书
开朗女孩的自我评价
2014/02/10 职场文书
马丁路德金演讲稿
2014/05/19 职场文书
球队口号
2014/06/18 职场文书
抗震救灾标语
2014/06/26 职场文书
小学生春游活动方案
2014/08/20 职场文书
初中班长竞选稿
2015/11/20 职场文书
2016春季运动会开幕词
2016/03/04 职场文书
用人单位的规章制度,怎样制定才是有效的?
2019/07/09 职场文书
《进击的巨人》新联动CM 兵长强势出击兽巨人
2022/04/05 日漫