新浪新闻小偷


Posted in PHP onOctober 09, 2006

新浪新闻小偷 1.

<html>
<head>
<meta http-equiv="Refresh" content="60">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
<meta http-equiv="Content-Type" content="text/html"; charset="??????">
<title>新浪_新闻抓取程序</title>
</head>
<body>

<center><img src="pic.gif"></center>
<?
$host="127.0.0.1"; // MYSQL 主机名
$namesql="????"; // MYSQL 用户名
$passsql="????"; // MYSQL 密码
$lib="news"; // 数据库名
$table="news"; // 数据库表名
$filename="http://news.sina.com.cn/news1000/index.shtml"; // 抓取的新闻页
$keytop="新闻开始"; // 新闻开始关键词
$keybottom="新闻结束"; // 新闻结束关键词

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$fp=fopen($filename,"r",1);
$flag=0; $add=""; $found=0; $end=0; $i=0; $temp[4]="";
while(!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$word;
if($word=='<' and strlen($add)==1){ $flag=0; }
if($word=='<' and strlen($add)!=1){ $flag=1; $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1; } }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $found=0; $end=1; }
if(((strchr($add,'<')==True and strchr($add,'href')==True) or strchr($add,'<')==False) and $found==1){ $text[$i]=$add; $i++; }
if($word=='<' and $flag==1){ $add=$word; $flag=0; } else { $add=""; $flag=0; } }
fclose($fp);

for($i=1;$i<sizeof($text)-1;$i+=5){
$temp[1]=$text[$i+1]; $temp[2]=$text[$i+2]; $temp[3]=$text[$i+3]; $temp[4]=$text[$i+4];
$ins="select * from $table where TITLE='$temp[3]'";
$list=mysql_query($ins,$conn);
@$count=mysql_num_rows($list);
if($count==0){
$ins="insert into $table(TYPE,URL,TITLE,DATE) values ('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins,$conn); } }
mysql_close($conn);
?>

</body>
</html>

2.<?
$handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;
while(!feof($handle))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message");
}
if(ereg("新闻开始",$message,$result))
{
$sign = 1;
}
else if(ereg("新闻结束",$message,$result))
{
$sign = 0;
}
}
fclose($handle);
?>

PHP 相关文章推荐
第七节--类的静态成员
Nov 16 PHP
使用apache模块rewrite_module (转)
Feb 14 PHP
php5.3 废弃函数小结
May 16 PHP
php 验证码实例代码
Jun 01 PHP
php 带逗号千位符数字的处理方法
Jan 10 PHP
PHP在线生成二维码(google api)的实现代码详解
Jun 04 PHP
php读取图片内容并输出到浏览器的实现代码
Aug 08 PHP
thinkphp中html:list标签传递多个参数实例
Oct 30 PHP
PHP+jquery实时显示网站在线人数的方法
Jan 04 PHP
php 文件下载 出现下载文件内容乱码损坏的解决方法(推荐)
Nov 16 PHP
php基于session锁防止阻塞请求的方法分析
Aug 07 PHP
PHP简单实现正则匹配省市区的方法
Apr 13 PHP
如何使用PHP获取网络上文件
Oct 09 #PHP
用PHP动态创建Flash动画
Oct 09 #PHP
一个odbc连mssql分页的类
Oct 09 #PHP
拼音码表的生成
Oct 09 #PHP
用PHP和MySQL保存和输出图片
Oct 09 #PHP
PHP生成带有雪花背景的验证码
Oct 09 #PHP
一个可查询所有表的“通用”查询分页类
Oct 09 #PHP
You might like
简单的过滤字符串中的HTML标记
2006/12/25 PHP
解析Linux下Varnish缓存的配置优化
2013/06/20 PHP
PHP中的empty、isset、isnull的区别与使用实例
2019/03/22 PHP
jquery学习笔记二 实现可编辑的表格
2010/04/09 Javascript
jquery uploadify 在FF下无效的解决办法
2014/09/26 Javascript
JavaScript数组对象赋值用法实例
2015/08/04 Javascript
纯javascript实现图片延时加载方法
2015/08/21 Javascript
你一定会收藏的Nodejs代码片段
2016/02/04 NodeJs
javascript三种代码注释方法
2016/06/02 Javascript
js实现界面向原生界面发消息并跳转功能
2016/11/22 Javascript
JS实现仿百度文库评分功能
2017/01/12 Javascript
js实现textarea限制输入字数
2017/02/13 Javascript
微信小程序中多个页面传参通信的学习与实践
2017/05/05 Javascript
JS HTML图片显示Canvas 压缩功能
2017/07/21 Javascript
Angular2仿照微信UI实现9张图片上传和预览的示例代码
2017/10/19 Javascript
Vue实现购物车场景下的应用
2017/11/27 Javascript
浅谈用Webpack路径压缩图片上传尺寸获取的问题
2018/02/22 Javascript
jQuery实现炫丽的3d旋转星空效果
2018/07/04 jQuery
Vue自定义指令封装节流函数的方法示例
2018/07/09 Javascript
jQuery实现基本动画效果的方法详解
2018/09/06 jQuery
layui实现数据分页功能
2019/07/27 Javascript
Swiper实现导航栏滚动效果
2020/10/16 Javascript
[54:33]2018DOTA2亚洲邀请赛小组赛 A组加赛 Liquid vs Optic
2018/04/03 DOTA
[01:28]国服启动器接入蒸汽平台操作流程视频
2021/03/11 DOTA
Windows8下安装Python的BeautifulSoup
2015/01/22 Python
python输出指定月份日历的方法
2015/04/23 Python
Python利用带权重随机数解决抽奖和游戏爆装备问题
2016/06/16 Python
Java实现的执行python脚本工具类示例【使用jython.jar】
2018/03/29 Python
Python实现按中文排序的方法示例
2018/04/25 Python
Django + Uwsgi + Nginx 实现生产环境部署的方法
2018/06/20 Python
python 用下标截取字符串的实例
2018/12/25 Python
Python多项式回归的实现方法
2019/03/11 Python
Python函数装饰器原理与用法详解
2019/08/16 Python
这76道Java面试题及答案,祝你能成功通过面试
2016/04/16 面试题
《穷人》教学反思
2014/04/08 职场文书
中国梦口号
2014/06/13 职场文书