新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
php在线解压ZIP文件的方法
Dec 30 PHP
PHP中实现Bloom Filter算法
Mar 30 PHP
Laravel 5框架学习之表单
Apr 08 PHP
php 参数过滤、数据过滤详解
Oct 26 PHP
PHP+Ajax验证码验证用户登录
Jul 20 PHP
php利用header函数下载各种文件
Aug 24 PHP
PHP实现表单提交时去除斜杠的方法
Dec 26 PHP
php求数组全排列,元素所有组合的方法总结
Mar 14 PHP
使用PHP+MySql+Ajax+jQuery实现省市区三级联动功能示例
Sep 15 PHP
ThinkPHP5.1框架页面跳转及修改跳转页面模版示例
May 06 PHP
yii 框架实现按天,月,年,自定义时间段统计数据的方法分析
Apr 04 PHP
PHP扩展安装方法步骤解析
Nov 24 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
PHP中创建并处理图象
2006/10/09 PHP
如何分别全角和半角以避免乱码
2006/10/09 PHP
windows下zendframework项目环境搭建(通过命令行配置)
2012/12/06 PHP
php使用ob_start()实现图片存入变量的方法
2014/11/14 PHP
PHP Hash算法:Times33算法代码实例
2015/05/13 PHP
Laravel事件监听器用法实例分析
2019/03/12 PHP
Nigma vs Alliance BO5 第四场2.14
2021/03/10 DOTA
js 目录列举函数
2008/11/06 Javascript
详解js中构造流程图的核心技术JsPlumb(2)
2015/12/08 Javascript
angular框架实现全选与单选chekbox的自定义
2017/07/06 Javascript
详解angularjs popup-table 弹出框表格指令
2017/09/20 Javascript
Nodejs调用WebService的示例代码
2017/09/29 NodeJs
AngularJS实现注册表单验证功能
2017/10/16 Javascript
JS学习笔记之数组去重实现方法小结
2019/05/29 Javascript
javascript实现图片轮播代码
2019/07/09 Javascript
JS控制GIF图片的停止与显示
2019/10/24 Javascript
VUE DEMO之模拟登录个人中心页面之间数据传值实例
2019/10/31 Javascript
javascript设计模式 ? 外观模式原理与用法实例分析
2020/04/15 Javascript
js利用iframe实现选项卡效果
2020/08/09 Javascript
Vue单页面应用中实现Markdown渲染
2021/02/14 Vue.js
[56:14]Fnatic vs OG 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python合并字符串的3种方法
2015/05/21 Python
详解Python实现按任意键继续/退出的功能
2016/08/19 Python
Python实现的异步代理爬虫及代理池
2017/03/17 Python
Python描述符descriptor使用原理解析
2020/03/21 Python
python实现爱奇艺登陆密码RSA加密的方法示例详解
2020/05/27 Python
英国自行车商店:AW Cycles
2021/02/24 全球购物
幼儿园秋游活动方案
2014/01/21 职场文书
物流创业计划书
2014/02/01 职场文书
一年级学生期末评语
2014/04/21 职场文书
大学班级计划书
2014/04/29 职场文书
会计求职自荐信
2014/06/20 职场文书
婚礼父母答谢词
2015/01/04 职场文书
2015年秋学期教研工作总结
2015/10/14 职场文书
2016年大学生暑假爱心支教活动策划书
2015/11/26 职场文书
预防职务犯罪警示教育心得体会
2016/01/15 职场文书