新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
PHP实现分页的一个示例
Oct 09 PHP
黑夜路人出的几道php笔试题
Aug 04 PHP
php自定义函数call_user_func和call_user_func_array详解
Jul 14 PHP
php urlencode()与urldecode()函数字符编码原理详解
Dec 06 PHP
关于php循环跳出的问题
Jul 01 PHP
PHP的foreach中使用引用时需要注意的一个问题和解决方法
May 29 PHP
Zend Framework教程之连接数据库并执行增删查的方法(附demo源码下载)
Mar 21 PHP
php pdo oracle中文乱码的快速解决方法
May 16 PHP
Zend Framework数据库操作方法实例总结
Dec 11 PHP
浅谈php中fopen不能创建中文文件名文件的问题
Feb 06 PHP
laravel5.0在linux下解决.htaccess无效和去除index.php的问题
Oct 16 PHP
PHP如何通过date() 函数格式化显示时间
Nov 13 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
main.php
2006/12/09 PHP
Javascript 布尔型分析
2008/12/22 Javascript
获取css样式表内样式的js函数currentStyle(IE),defaultView(FF)
2011/02/14 Javascript
Javacript实现颜色梯度变化和渐变的效果代码
2013/05/31 Javascript
基于javascript实现最简单选项卡切换
2017/02/01 Javascript
vue时间格式化实例代码
2017/06/13 Javascript
JS实现的贪吃蛇游戏案例详解
2019/05/01 Javascript
Vue Echarts实现可视化世界地图代码实例
2019/05/07 Javascript
关于Layui Table隐藏列问题
2019/09/16 Javascript
JavaScript实现简易聊天对话框(加滚动条)
2020/02/10 Javascript
python paramiko实现ssh远程访问的方法
2013/12/03 Python
Python使用tablib生成excel文件的简单实现方法
2016/03/16 Python
在Python中执行系统命令的方法示例详解
2017/09/14 Python
Python基于TCP实现会聊天的小机器人功能示例
2018/04/09 Python
TensorFlow数据输入的方法示例
2018/06/19 Python
Python爬虫之网页图片抓取的方法
2018/07/16 Python
Django contenttypes 框架详解(小结)
2018/08/13 Python
Python编程深度学习计算库之numpy
2018/12/28 Python
DRF跨域后端解决之django-cors-headers的使用
2019/01/27 Python
Python常用爬虫代码总结方便查询
2019/02/25 Python
Python爬虫 urllib2的使用方法详解
2019/09/23 Python
mac在matplotlib中显示中文的操作方法
2020/03/06 Python
python属于解释语言吗
2020/06/11 Python
Born鞋子官网:Born Shoes
2017/04/06 全球购物
中学生学习生活的自我评价
2013/10/26 职场文书
大型晚会策划方案
2014/02/06 职场文书
会计专业个人自我鉴定
2014/03/21 职场文书
4S店售后客服自我评价
2014/04/09 职场文书
六年级语文下册教学计划
2015/01/22 职场文书
2015年“七七卢沟桥事变”纪念活动总结
2015/03/24 职场文书
元旦联欢晚会主持词
2015/07/01 职场文书
三八妇女节致辞
2015/07/31 职场文书
redis客户端实现高可用读写分离的方式详解
2021/07/04 Redis
Python常遇到的错误和异常
2021/11/02 Python
mysql5.7的安装及Navicate长久免费使用的实现过程
2021/11/17 MySQL
Python实现归一化算法详情
2022/03/18 Python