新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
PHP读取XML值的代码(推荐)
Jan 01 PHP
php摘要生成函数(无乱码)
Feb 04 PHP
解析php DOMElement 操作xml 文档的实现代码
May 10 PHP
分享一个Laravel好用的Cache宏
Mar 02 PHP
php创建多级目录的方法
Mar 24 PHP
简单了解将WordPress中的工具栏移到底部的小技巧
Dec 31 PHP
Yii调试查看执行SQL语句的方法
Jul 15 PHP
php处理抢购类功能的高并发请求
Feb 08 PHP
使用PHP访问RabbitMQ消息队列的方法示例
Jun 06 PHP
PHP获取HTTP body内容的方法
Dec 31 PHP
Laravel 实现Controller向blade前台模板赋值的四种方式小结
Oct 22 PHP
PHP判断当前使用的是什么浏览器(推荐)
Oct 27 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
php中使用explode查找某个字符是否存在的方法
2011/07/12 PHP
PHP实现的比较完善的购物车类
2014/12/02 PHP
PHP Web木马扫描器代码分享
2015/09/06 PHP
PHP如何使用Memcached
2016/04/05 PHP
本地对象Array的原型扩展实现代码
2010/12/04 Javascript
Js中获取frames中的元素示例代码
2013/07/30 Javascript
javascript按位非运算符的使用方法
2013/11/14 Javascript
Array栈方法和队列方法的特点说明
2014/01/24 Javascript
JS使用JSON作为参数实例分析
2016/06/23 Javascript
使用JS中的exec()方法构造正则表达式验证
2016/08/01 Javascript
jQuery和JavaScript节点插入元素的方法对比
2016/11/18 Javascript
jQuery实现ToolTip元素定位显示功能示例
2016/11/23 Javascript
React快速入门教程
2017/01/17 Javascript
Angular实现的table表格排序功能完整示例
2017/12/22 Javascript
webpack下实现动态引入文件方法
2018/02/22 Javascript
Vue 封装防刷新考试倒计时组件的实现
2020/06/05 Javascript
Vue 监听元素前后变化值实例
2020/07/29 Javascript
python安装与使用redis的方法
2016/04/19 Python
Python解析命令行读取参数--argparse模块使用方法
2018/01/23 Python
transform python环境快速配置方法
2018/09/27 Python
新手如何发布Python项目开源包过程详解
2019/07/11 Python
Matlab使用Plot函数实现数据动态显示方法总结
2021/02/25 Python
详解如何用HTML5 Canvas API控制图片的缩放变换
2016/03/22 HTML / CSS
外贸业务员工作职责
2014/01/06 职场文书
金融管理专业毕业生求职信
2014/03/12 职场文书
春节联欢晚会主持词范文
2014/03/24 职场文书
经理任命书模板
2014/06/06 职场文书
学校督导评估方案
2014/06/10 职场文书
羽毛球比赛策划方案
2014/06/13 职场文书
2014公安机关纪律作风整顿思想汇报
2014/09/13 职场文书
小学音乐教师个人工作总结
2015/02/05 职场文书
硕士论文致谢范文
2015/05/14 职场文书
五年级作文之学校的四季
2019/12/05 职场文书
一文搞懂Golang 时间和日期相关函数
2021/12/06 Golang
Python如何用re模块实现简易tokenizer
2022/05/02 Python
JS前端可视化canvas动画原理及其推导实现
2022/08/05 Javascript