新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
一个MYSQL操作类
Nov 16 PHP
建站常用13种PHP开源CMS比较
Aug 23 PHP
php 下载保存文件保存到本地的两种实现方法
Aug 12 PHP
php定时计划任务与fsockopen持续进程实例
May 23 PHP
jQuery向下滚动即时加载内容实现的瀑布流效果
Jan 07 PHP
PHP简单字符串过滤方法示例
Sep 04 PHP
thinkPHP多语言切换设置方法详解
Nov 11 PHP
PHP实现找出链表中环的入口节点
Jan 16 PHP
PHP SPL 被遗落的宝石【SPL应用浅析】
Apr 20 PHP
PHP实现多图上传和单图上传功能
May 17 PHP
CI框架(CodeIgniter)实现的导入、导出数据操作示例
May 24 PHP
Memcached介绍及php-memcache扩展安装
Apr 01 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
Optimizer与Debugger兼容性问题的解决方法
2008/12/01 PHP
完美实现GIF动画缩略图的php代码
2011/01/02 PHP
php UNIX时间戳用法详解
2017/02/16 PHP
yii2.0整合阿里云oss上传单个文件的示例
2017/09/19 PHP
ThinkPHP实现转换数据库查询结果数据到对应类型的方法
2017/11/16 PHP
laravel利用中间件防止未登录用户直接访问后台的方法
2019/09/30 PHP
javascript document.images实例
2008/05/27 Javascript
JavaScript Distilled 基础知识与函数
2010/04/07 Javascript
jquery中使用$(#form).submit()重写提交表单无效原因分析及解决
2013/03/25 Javascript
了解Javascript的模块化开发
2015/03/02 Javascript
详解JavaScript的while循环的使用
2015/06/03 Javascript
JavaScript实现99乘法表及隔行变色实例代码
2016/02/24 Javascript
前端jquery部分很精彩
2016/05/03 Javascript
Ionic快速安装教程
2016/06/03 Javascript
vue2.0开发实践总结之疑难篇
2016/12/07 Javascript
vue获取DOM元素并设置属性的两种实现方法
2017/09/30 Javascript
vue和webpack打包项目相对路径修改的方法
2018/06/15 Javascript
JavaScript类型相关的常用操作总结
2019/02/14 Javascript
解决vue初始化项目时,一直卡在Project description上的问题
2019/10/31 Javascript
JavaScript前端开发时数值运算的小技巧
2020/07/28 Javascript
VSCode插件安装完成后的配置(常用配置)
2020/08/24 Javascript
js+canvas实现转盘效果(两个版本)
2020/09/13 Javascript
python处理圆角图片、圆形图片的例子
2014/04/25 Python
python基于socket实现网络广播的方法
2015/04/29 Python
python框架中flask知识点总结
2018/08/17 Python
利用python提取wav文件的mfcc方法
2019/01/09 Python
python实现飞船大战
2020/04/24 Python
13个Pandas实用技巧,助你提高开发效率
2020/08/19 Python
如何使用amaze ui的分页样式封装一个通用的JS分页控件
2020/08/21 HTML / CSS
英国知名奢侈品包包品牌:Milli Millu
2016/12/22 全球购物
存储过程的优缺点是什么
2015/01/10 面试题
个人简历中的自我评价范例
2013/10/29 职场文书
2014年师德承诺书
2014/05/23 职场文书
校车司机安全责任书
2015/05/11 职场文书
退休职工欢送会致辞
2015/08/01 职场文书
深入解读Java三大集合之map list set的用法
2021/11/11 Java/Android