编程 PHP

php 信息采集程序代码

Posted in PHP onMarch 17, 2009

<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测，$c已经是内容页的数据流了，可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢，是因为我上面用了subsrt（）函数吗？还是什么问题？麻烦各位大侠指点迷津啊？

php 信息采集程序代码

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

PHP 相关文章推荐

PHP游戏编程25个脚本代码

Feb 08 PHP

深入解析php之sphinx

May 15 PHP

PHP使用DES进行加密与解密的方法详解

Jun 06 PHP

php 批量替换html标签的实例代码

Nov 26 PHP

PHP中遇到BOM、编码导致json_decode函数无法解析问题

Jul 02 PHP

PHP浮点数精度问题汇总

May 13 PHP

PHP保存session到memcache服务器的方法

Jan 19 PHP

PHP检测链接是否存在的代码实例分享

May 06 PHP

php反射类ReflectionClass用法分析

May 12 PHP

PHP微信开发之模板消息回复

Jun 24 PHP

php+ajax登录跳转登录实现思路

Jul 31 PHP

PHP的JSON封装、转变及输出操作示例

Sep 27 PHP

php cookie 登录验证示例代码

Mar 16 #PHP

php 删除cookie和浏览器重定向

Mar 16 #PHP

php cookis创建实现代码

Mar 16 #PHP

php session应用实例登录验证

Mar 16 #PHP

php session处理的定制

Mar 16 #PHP

php session 检测和注销

Mar 16 #PHP

php session 预定义数组

Mar 16 #PHP

You might like

PHP如何解决网站大流量与高并发的问题

2011/06/25 PHP

基于PHP Socket配置以及实例的详细介绍

2013/06/13 PHP

php生成zip文件类实例

2015/04/07 PHP

PHP+redis实现添加处理投票的方法

2015/11/14 PHP

PHP设计模式之注册树模式分析

2018/01/26 PHP

php用xpath解析html的代码实例讲解

2019/02/14 PHP

PHP goto语句用法实例

2019/08/06 PHP

jQuery UI-Draggable 参数集合

2010/01/10 Javascript

javascript检测浏览器flash版本的实现代码

2011/12/06 Javascript

使用jquery实现div的tab切换实例代码

2013/05/27 Javascript

jquery实现的Banner广告收缩效果代码

2015/09/02 Javascript

JS实现兼容各种浏览器的获取选择文本的方法【测试可用】

2016/06/21 Javascript

bmob js-sdk 在vue中的使用教程

2018/01/21 Javascript

Vue 项目中遇到的跨域问题及解决方法(后台php)

2018/03/28 Javascript

Vue二次封装axios为插件使用详解

2018/05/21 Javascript

原生JS实现逼真的图片3D旋转效果详解

2019/02/16 Javascript

解决vue+elementui项目打包后样式变化问题

2020/08/03 Javascript

[57:12]完美世界DOTA2联赛循环赛 Inki vs Matador BO2第一场 10.31

2020/11/02 DOTA

在Python程序中操作文件之flush()方法的使用教程

2015/05/24 Python

Python协程的用法和例子详解

2017/09/09 Python

完美解决在oj中Python的循环输入问题

2018/06/25 Python

详解pyenv下使用python matplotlib模块的问题解决

2018/11/29 Python

用python打印菱形的实操方法和代码

2019/06/25 Python

对python中的装包与解包实例详解

2019/08/24 Python

Python爬虫逆向分析某云音乐加密参数的实例分析

2020/12/04 Python

python音频处理的示例详解

2020/12/23 Python

详解Html5原生拖拽操作

2018/01/12 HTML / CSS

俄罗斯品牌服装和鞋子的在线商店：KUPIVIP

2019/10/27 全球购物

大学生职业生涯规划书模版

2013/12/30 职场文书

本科生的职业生涯规划范文

2014/01/09 职场文书

大学四年个人的自我评价

2014/02/26 职场文书

2014国庆节演讲稿：祖国在我心中（400字）

2014/09/25 职场文书

《我爱祖国》演讲稿1000字

2014/09/26 职场文书

2014年组织部工作总结

2014/11/14 职场文书

质量保证书

2015/01/17 职场文书

python 判断文件或文件夹是否存在

2022/03/18 Python