新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
php读取html并截取字符串的简单代码
Nov 30 PHP
jQuery EasyUI API 中文文档 - DateBox日期框
Oct 15 PHP
php数组中删除元素的实现代码
Jun 22 PHP
Apache中php.ini的设置方法
Feb 28 PHP
PHP计数器的实现代码
Jun 08 PHP
浅析HTTP消息头网页缓存控制以及header常用指令介绍
Jun 28 PHP
PHP5.3与5.5废弃与过期函数整理汇总
Jul 10 PHP
PHP经典面试题之设计模式(经常遇到)
Oct 15 PHP
编写PHP脚本清除WordPress头部冗余代码的方法讲解
Mar 01 PHP
PHP获取访问页面HTTP状态码的实现代码
Nov 03 PHP
Laravel Validator自定义错误返回提示消息并在前端展示
May 09 PHP
php+laravel依赖注入知识点总结
Nov 04 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
kohana框架上传文件验证规则写法示例
2014/07/14 PHP
JS getStyle获取最终样式函数代码
2010/04/01 Javascript
javascript利用初始化数据装配模版的实现代码
2010/11/17 Javascript
js页面滚动时层智能浮动定位实现(jQuery/MooTools)
2011/08/23 Javascript
JavaScript中创建对象和继承示例解读
2014/02/12 Javascript
jquery选择checked在ie8普通模式下的问题
2014/02/12 Javascript
Jquery注册事件实现方法
2015/05/18 Javascript
JavaScript获取数组最小值和最大值的方法
2015/06/09 Javascript
javascript先序遍历DOM树的方法
2016/02/27 Javascript
基于vue.js快速搭建图书管理平台
2017/10/29 Javascript
javascript实现文件拖拽事件
2018/03/29 Javascript
nodejs高大上的部署方式(PM2)
2018/09/11 NodeJs
详解vue项目中调用百度地图API使用方法
2019/04/25 Javascript
Python实现生成简单的Makefile文件代码示例
2015/03/10 Python
Python3中的真除和Floor除法用法分析
2016/03/16 Python
python获取网页中所有图片并筛选指定分辨率的方法
2018/03/31 Python
在Python中分别打印列表中的每一个元素方法
2018/11/07 Python
Python实现的在特定目录下导入模块功能分析
2019/02/11 Python
Python检测数据类型的方法总结
2019/05/20 Python
python读csv文件时指定行为表头或无表头的方法
2019/06/26 Python
Python制作词云图代码实例
2019/09/09 Python
Python如何获取Win7,Win10系统缩放大小
2020/01/10 Python
python 解决pycharm运行py文件只有unittest选项的问题
2020/09/01 Python
css3让div随鼠标移动而抖动起来
2014/02/10 HTML / CSS
阿里云:Aliyun.com
2017/02/15 全球购物
女士时装鞋:Chinese Laundry
2018/08/29 全球购物
新西兰优惠网站:Treat Me
2019/07/04 全球购物
介绍一下SQL中union,intersect和minus
2012/04/05 面试题
高中毕业生自我鉴定范文
2013/09/26 职场文书
一年级班主任感言
2014/03/08 职场文书
2014年社区学雷锋活动总结
2014/03/09 职场文书
政风行风自查自纠报告
2014/10/21 职场文书
2015国庆66周年宣传语
2015/07/14 职场文书
2016年大学生党员承诺书
2016/03/24 职场文书
浅谈Redis的几个过期策略
2021/05/27 Redis
idea编译器vue缩进报错问题场景分析
2021/07/04 Vue.js