php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
第八节--访问方式
Nov 16 PHP
php 论坛采集程序 模拟登陆,抓取页面 实现代码
Jul 09 PHP
让PHP开发者事半功倍的十大技巧小结
Apr 20 PHP
memcached 和 mysql 主从环境下php开发代码详解
May 16 PHP
PHP文件上传原理简单分析
May 29 PHP
Mysql中分页查询的两个解决方法比较
May 02 PHP
PHP使用DES进行加密与解密的方法详解
Jun 06 PHP
php操作csv文件代码实例汇总
Sep 22 PHP
PHP使用ffmpeg给视频增加字幕显示的方法
Mar 12 PHP
php 遍历目录,生成目录下每个文件的md5值并写入到结果文件中
Dec 12 PHP
PHP实现一个限制实例化次数的类示例
Sep 16 PHP
redis+php实现微博(一)注册与登录功能详解
Sep 23 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
上海地方志办公室-上海电子仪表工业志
2021/03/04 无线电
PHP 开源框架22个简单简介
2009/08/24 PHP
php操作xml
2013/10/27 PHP
php自定义函数实现JS的escape的方法示例
2016/07/07 PHP
Yii2框架实现注册和登录教程
2016/09/30 PHP
PHP实现微信提现(企业付款到零钱)
2019/08/01 PHP
gearman中worker常驻后台,导致MySQL server has gone away的解决方法
2020/02/27 PHP
各种效果的jquery ui(接口)介绍
2008/09/17 Javascript
JQUERY dialog的用法详细解析
2013/12/19 Javascript
JavaScript引用类型和基本类型详解
2016/01/06 Javascript
谈谈JavaScript类型系统之Math
2016/01/06 Javascript
浅谈JavaScript中变量和函数声明的提升
2016/08/09 Javascript
详解javascript事件绑定使用方法
2016/10/20 Javascript
JavaScript中校验银行卡号的实现代码
2016/12/19 Javascript
详解Node.js access_token的获取、存储及更新
2017/06/20 Javascript
详谈JS中数组的迭代方法和归并方法
2017/08/11 Javascript
使用store来优化React组件的方法
2017/10/23 Javascript
详解vue 单页应用(spa)前端路由实现原理
2018/04/04 Javascript
React Router v4 入坑指南(小结)
2018/04/08 Javascript
浅谈redux以及react-redux简单实现
2018/08/28 Javascript
小程序自定义日历效果
2018/12/29 Javascript
[01:03]PWL开团时刻DAY6——别打我
2020/11/05 DOTA
qpython3 读取安卓lastpass Cookies
2016/06/19 Python
深入解析Python中的descriptor描述器的作用及用法
2016/06/27 Python
基于python socketserver框架全面解析
2017/09/21 Python
python调用自定义函数的实例操作
2019/06/26 Python
Python 画出来六维图
2019/07/26 Python
解决python gdal投影坐标系转换的问题
2020/01/17 Python
python 使用三引号时容易犯的小错误
2020/10/21 Python
美国派对用品及装饰品网上商店:Shindigz
2016/07/30 全球购物
写出程序把一个链表中的接点顺序倒排
2014/04/28 面试题
积极向上的团队口号
2014/06/06 职场文书
你会写报告?产品体验报告到底该怎么写?
2019/08/14 职场文书
创业计划书之外语培训班
2019/11/02 职场文书
vue响应式原理与双向数据的深入解析
2021/06/04 Vue.js
MyBatis在注解上使用动态SQL方式(@select使用if)
2022/07/07 Java/Android