php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
PHP游戏编程25个脚本代码
Feb 08 PHP
深入解析php之sphinx
May 15 PHP
PHP使用DES进行加密与解密的方法详解
Jun 06 PHP
php 批量替换html标签的实例代码
Nov 26 PHP
PHP中遇到BOM、编码导致json_decode函数无法解析问题
Jul 02 PHP
PHP浮点数精度问题汇总
May 13 PHP
PHP保存session到memcache服务器的方法
Jan 19 PHP
PHP检测链接是否存在的代码实例分享
May 06 PHP
php反射类ReflectionClass用法分析
May 12 PHP
PHP微信开发之模板消息回复
Jun 24 PHP
php+ajax登录跳转登录实现思路
Jul 31 PHP
PHP的JSON封装、转变及输出操作示例
Sep 27 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
PHP如何解决网站大流量与高并发的问题
2011/06/25 PHP
基于PHP Socket配置以及实例的详细介绍
2013/06/13 PHP
php生成zip文件类实例
2015/04/07 PHP
PHP+redis实现添加处理投票的方法
2015/11/14 PHP
PHP设计模式之注册树模式分析
2018/01/26 PHP
php用xpath解析html的代码实例讲解
2019/02/14 PHP
PHP goto语句用法实例
2019/08/06 PHP
jQuery UI-Draggable 参数集合
2010/01/10 Javascript
javascript检测浏览器flash版本的实现代码
2011/12/06 Javascript
使用jquery实现div的tab切换实例代码
2013/05/27 Javascript
jquery实现的Banner广告收缩效果代码
2015/09/02 Javascript
JS实现兼容各种浏览器的获取选择文本的方法【测试可用】
2016/06/21 Javascript
bmob js-sdk 在vue中的使用教程
2018/01/21 Javascript
Vue 项目中遇到的跨域问题及解决方法(后台php)
2018/03/28 Javascript
Vue二次封装axios为插件使用详解
2018/05/21 Javascript
原生JS实现逼真的图片3D旋转效果详解
2019/02/16 Javascript
解决vue+elementui项目打包后样式变化问题
2020/08/03 Javascript
[57:12]完美世界DOTA2联赛循环赛 Inki vs Matador BO2第一场 10.31
2020/11/02 DOTA
在Python程序中操作文件之flush()方法的使用教程
2015/05/24 Python
Python协程的用法和例子详解
2017/09/09 Python
完美解决在oj中Python的循环输入问题
2018/06/25 Python
详解pyenv下使用python matplotlib模块的问题解决
2018/11/29 Python
用python打印菱形的实操方法和代码
2019/06/25 Python
对python中的装包与解包实例详解
2019/08/24 Python
Python爬虫逆向分析某云音乐加密参数的实例分析
2020/12/04 Python
python音频处理的示例详解
2020/12/23 Python
详解Html5原生拖拽操作
2018/01/12 HTML / CSS
俄罗斯品牌服装和鞋子的在线商店:KUPIVIP
2019/10/27 全球购物
大学生职业生涯规划书模版
2013/12/30 职场文书
本科生的职业生涯规划范文
2014/01/09 职场文书
大学四年个人的自我评价
2014/02/26 职场文书
2014国庆节演讲稿:祖国在我心中(400字)
2014/09/25 职场文书
《我爱祖国》演讲稿1000字
2014/09/26 职场文书
2014年组织部工作总结
2014/11/14 职场文书
质量保证书
2015/01/17 职场文书
python 判断文件或文件夹是否存在
2022/03/18 Python