在php中使用sockets:从新闻组中获取文章


Posted in PHP onOctober 09, 2006

PHP能打开远程或本地主机上的Socket端口。本文是一个使用Socket的小例子:连接到一个Usenet新闻组服务器,同服务器对话,从新闻组中下载一些文章。

在php中打开一个socket
使用fsockopen()打开一个socket.这个函数在php3和php4种都可以使用。函数声明是这样的:

int fsockopen (string hostname, int port _
[, int errno [, string errstr [, double timeout]]])

 
这个函数将打开一个连接到主机hostname的port端口的TCP连接。hostname可以是一个有效的域名,或者是一个ip地址。对于udp连接,你必须指定协议:udp://hostname. 对于unix域,主机名使用到socket的路径,这种情况下,端口port必须置为0。可选的timeout参数用来设定等待打开一个socket的时间,单位为秒。

关于fsockopen()的更多信息,请参考:http://www.php.net/manual/function.fsockopen.php

网络新闻传输协议
   访问新闻组服务器需要通过称为NNTP(网络新闻传输协议)的协议来进行。这个协议在rfc977中有详细的细节,可以在http://www.w3.org/Protocols/rfc977/rfc977.html得到。这个文档分别描述了怎样连接到NNTP服务器,怎样同服务器对话,以及完成这些任务的不同命令。

连接
   连接到一个NNTP服务器需要知道它的主机名(或者是ip地址)和它侦听的端口。为了避免一个连接企图失败导致程序挂起,你应该使用timeout参数。
    <?php
      $cfgServer   = "your.news.host";
      $cfgPort     = 119;
      $cfgTimeOut  = 10;

      //open a socket
      if(!$cfgTimeOut)
         // without timeout
         $usenet_handle = fsockopen($cfgServer, $cfgPort);
      else
         // with timeout
         $usenet_handle = fsockopen($cfgServer, $cfgPort, &$errno, &$errstr, $cfgTimeOut);

      if(!$usenet_handle) {
          echo "Connection failed.\n";
          exit();
      }
      else {
          echo "Connected.\n";
          $tmp = fgets($usenet_handle, 1024);
      }

?>
与服务器对话

现在我们已经连接到了服务器,可以通过前面打开的socket同服务器对话了。比如说我们要从某个新闻组得到最近的10篇文章。RFC977指出,第一步要用GROUP命令选择正确的新闻组:
GROUP ggg
参数ggg是要选择的新闻组的名字(比如说是"net.news"),这是必需的。可用的新闻组的列表可以用LIST命令得到。选择新闻组的命令成功后,返回组中第一篇和最后一篇文章的文章编号,以及组中文章的数目。
   

下面是一个例子:
    chrome:~$ telnet my.news.host 119
    Trying aa.bb.cc.dd...
    Connected to my.news.host.
    Escape character is '^]'.
    200 my.news.host InterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok).
    GROUP alt.test
    211 232 222996 223235 alt.test
    quit
    205 .

    接收到命令 GROUP alt.test 后,服务器返回"211 232 222996 223235 alt.test". 211是RFC中定义的返回码,指示命令已成功执行。返回信息还指出,现在有232篇文章,最早的文章的编号是222996,最新的文章的编号是223235。我们看到,222996+232并不等于223235。丢失的7篇文章因为某种原因被从服务器删除了,可能是因为被它的合法作者取消了(这是可能的,而且很容易做到),或者因为是灌水文章而被删。
   

需要注意的事,有些服务器在选择新闻组之前可能要求身份认证,这取决于这是一个公共的或者是私用的服务器。也有可能服务器允许任何人读取文章,但发表文章需要身份验证。

    <?php

      //$cfgUser    = "xxxxxx";
      //$cfgPasswd  = "yyyyyy";
      $cfgNewsGroup = "alt.php";

      //identification required on private server
      if($cfgUser) {
          fputs($usenet_handle, "AUTHINFO USER ".$cfgUser."n");
          $tmp = fgets($usenet_handle, 1024);
          fputs($usenet_handle, "AUTHINFO PASS ".$cfgPasswd."n");
          $tmp = fgets($usenet_handle, 1024);

          //check error

          if($tmp != "281 Okrn") {
              echo "502 Authentication errorn";
              exit();
          }
  }

  //select newsgroup

  fput($usenet_handle, "GROUP ".$cfgNewsGroup."n");
  $tmp = fgets($usenet_handle, 1024);

  if($tmp == "480 Authentication required for commandrn") {
     echo $tmp;
     exit();
  }

  $info = split(" ", $tmp);
  $first= $info[2];
  $last = $info[3];

  printf("First : %sn", $first);
  printf("Last : %lastn", $last);

?>

 

PHP 相关文章推荐
PHP 进程锁定问题分析研究
Nov 24 PHP
PHP session有效期session.gc_maxlifetime
Apr 20 PHP
phpmyadmin config.inc.php配置示例
Aug 27 PHP
php全角字符转换为半角函数
Feb 07 PHP
Drupal7中常用的数据库操作实例
Mar 02 PHP
PHP CURL获取返回值的方法
May 04 PHP
你可能不知道PHP get_meta_tags()函数
May 12 PHP
PHP实现的json类实例
Jul 28 PHP
使用PHP实现生成HTML静态页面
Nov 18 PHP
thinkPHP模板中函数的使用方法示例
Nov 30 PHP
PHP常量define和const的区别详解
May 18 PHP
使用laravel根据用户类型来显示或隐藏字段
Oct 17 PHP
15个小时----从修改程序到自己些程序
Oct 09 #PHP
用PHP编程开发“虚拟域名”系统
Oct 09 #PHP
在Windows中安装Apache2和PHP4的权威指南
Oct 09 #PHP
自定义PHP分页函数
Oct 09 #PHP
用PHP实现WEB动态网页静态
Oct 09 #PHP
用libtemplate实现静态网页生成
Oct 09 #PHP
初探PHP5
Oct 09 #PHP
You might like
生成静态页面的PHP类
2006/11/25 PHP
jQuery EasyUI 中文API Button使用实例
2010/04/14 Javascript
js 纯数字不重复排列的另类方法
2010/07/17 Javascript
javascript forEach通用循环遍历方法
2010/10/11 Javascript
Jquery弹出窗口插件 LeanModal的使用方法
2012/03/10 Javascript
intro.js 页面引导简单用法 分享
2013/08/06 Javascript
JS实现同时搜索百度和必应的方法
2015/01/27 Javascript
javascript结合fileReader 实现上传图片
2015/01/30 Javascript
JavaScript实现点击按钮切换网页背景色的方法
2015/10/17 Javascript
JavaScript下的时间格式处理函数Date.prototype.format
2016/01/27 Javascript
CSS3 3D 技术手把手教你玩转
2016/09/02 Javascript
jquery获取input type=text中的值的各种方式(总结)
2016/12/02 Javascript
简单实现jQuery级联菜单
2017/01/09 Javascript
基于Marquee.js插件实现的跑马灯效果示例
2017/01/25 Javascript
javascript数据结构中栈的应用之符号平衡问题
2017/04/11 Javascript
微信小程序实战之登录页面制作(5)
2020/03/30 Javascript
使用重写url机制实现验证码换一张功能
2017/08/01 Javascript
[02:15]2014DOTA2国际邀请赛 赛后退役选手回顾
2014/08/01 DOTA
对python中raw_input()和input()的用法详解
2018/04/22 Python
Python实现删除时保留特定文件夹和文件的示例
2018/04/27 Python
Python利用Django如何写restful api接口详解
2018/06/08 Python
JavaScript中的模拟事件和自定义事件实例分析
2018/07/27 Python
Python datetime和unix时间戳之间相互转换的讲解
2019/04/01 Python
Django 多表关联 存储 使用方法详解 ManyToManyField save
2019/08/09 Python
给大家整理了19个pythonic的编程习惯(小结)
2019/09/25 Python
Python获取、格式化当前时间日期的方法
2020/02/10 Python
使用PyWeChatSpy自动回复微信拍一拍功能的实现代码
2020/07/02 Python
4款Python 类型检查工具,你选择哪个呢?
2020/10/30 Python
Python 实现PS滤镜中的径向模糊特效
2020/12/03 Python
Gweniss格温妮丝女包官网:英国纯手工制造潮流包包品牌
2018/02/07 全球购物
个人委托书怎么写
2014/04/04 职场文书
工伤劳动仲裁代理词
2015/05/25 职场文书
贫困证明怎么写
2015/06/16 职场文书
2016大学生就业指导课心得体会
2016/01/15 职场文书
导游词之唐山景点
2019/12/18 职场文书
node.js如何自定义实现一个EventEmitter
2021/07/16 Javascript