用Python进行TCP网络编程的教程


Posted in Python onApril 29, 2015

Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。
客户端

大多数连接都是可靠的TCP连接。创建TCP连接时,主动发起连接的叫客户端,被动响应连接的叫服务器。

举个例子,当我们在浏览器中访问新浪时,我们自己的计算机就是客户端,浏览器会主动向新浪的服务器发起连接。如果一切顺利,新浪的服务器接受了我们的连接,一个TCP连接就建立起来的,后面的通信就是发送网页内容了。

所以,我们要创建一个基于TCP连接的Socket,可以这样做:

# 导入socket库:
import socket
# 创建一个socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接:
s.connect(('www.sina.com.cn', 80))

创建Socket时,AF_INET指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6。SOCK_STREAM指定使用面向流的TCP协议,这样,一个Socket对象就创建成功,但是还没有建立连接。

客户端要主动发起TCP连接,必须知道服务器的IP地址和端口号。新浪网站的IP地址可以用域名www.sina.com.cn自动转换到IP地址,但是怎么知道新浪服务器的端口号呢?

答案是作为服务器,提供什么样的服务,端口号就必须固定下来。由于我们想要访问网页,因此新浪提供网页服务的服务器必须把端口号固定在80端口,因为80端口是Web服务的标准端口。其他服务都有对应的标准端口号,例如SMTP服务是25端口,FTP服务是21端口,等等。端口号小于1024的是Internet标准服务的端口,端口号大于1024的,可以任意使用。

因此,我们连接新浪服务器的代码如下:

s.connect(('www.sina.com.cn', 80))

注意参数是一个tuple,包含地址和端口号。

建立TCP连接后,我们就可以向新浪服务器发送请求,要求返回首页的内容:

# 发送数据:
s.send('GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')

TCP连接创建的是双向通道,双方都可以同时给对方发数据。但是谁先发谁后发,怎么协调,要根据具体的协议来决定。例如,HTTP协议规定客户端必须先发请求给服务器,服务器收到后才发数据给客户端。

发送的文本格式必须符合HTTP标准,如果格式没问题,接下来就可以接收新浪服务器返回的数据了:

# 接收数据:
buffer = []
while True:
  # 每次最多接收1k字节:
  d = s.recv(1024)
  if d:
    buffer.append(d)
  else:
    break
data = ''.join(buffer)

接收数据时,调用recv(max)方法,一次最多接收指定的字节数,因此,在一个while循环中反复接收,直到recv()返回空数据,表示接收完毕,退出循环。

当我们接收完数据后,调用close()方法关闭Socket,这样,一次完整的网络通信就结束了:

# 关闭连接:
s.close()

接收到的数据包括HTTP头和网页本身,我们只需要把HTTP头和网页分离一下,把HTTP头打印出来,网页内容保存到文件:

header, html = data.split('\r\n\r\n', 1)
print header
# 把接收的数据写入文件:
with open('sina.html', 'wb') as f:
  f.write(html)

现在,只需要在浏览器中打开这个sina.html文件,就可以看到新浪的首页了。
服务器

和客户端编程相比,服务器编程就要复杂一些。

服务器进程首先要绑定一个端口并监听来自其他客户端的连接。如果某个客户端连接过来了,服务器就与该客户端建立Socket连接,随后的通信就靠这个Socket连接了。

所以,服务器会打开固定端口(比如80)监听,每来一个客户端连接,就创建该Socket连接。由于服务器会有大量来自客户端的连接,所以,服务器要能够区分一个Socket连接是和哪个客户端绑定的。一个Socket依赖4项:服务器地址、服务器端口、客户端地址、客户端端口来唯一确定一个Socket。

但是服务器还需要同时响应多个客户端的请求,所以,每个连接都需要一个新的进程或者新的线程来处理,否则,服务器一次就只能服务一个客户端了。

我们来编写一个简单的服务器程序,它接收客户端连接,把客户端发过来的字符串加上Hello再发回去。

首先,创建一个基于IPv4和TCP协议的Socket:

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

然后,我们要绑定监听的地址和端口。服务器可能有多块网卡,可以绑定到某一块网卡的IP地址上,也可以用0.0.0.0绑定到所有的网络地址,还可以用127.0.0.1绑定到本机地址。127.0.0.1是一个特殊的IP地址,表示本机地址,如果绑定到这个地址,客户端必须同时在本机运行才能连接,也就是说,外部的计算机无法连接进来。

端口号需要预先指定。因为我们写的这个服务不是标准服务,所以用9999这个端口号。请注意,小于1024的端口号必须要有管理员权限才能绑定:

# 监听端口:
s.bind(('127.0.0.1', 9999))

紧接着,调用listen()方法开始监听端口,传入的参数指定等待连接的最大数量:

s.listen(5)
print 'Waiting for connection...'

接下来,服务器程序通过一个永久循环来接受来自客户端的连接,accept()会等待并返回一个客户端的连接:

while True:
  # 接受一个新连接:
  sock, addr = s.accept()
  # 创建新线程来处理TCP连接:
  t = threading.Thread(target=tcplink, args=(sock, addr))
  t.start()

每个连接都必须创建新线程(或进程)来处理,否则,单线程在处理连接的过程中,无法接受其他客户端的连接:

def tcplink(sock, addr):
  print 'Accept new connection from %s:%s...' % addr
  sock.send('Welcome!')
  while True:
    data = sock.recv(1024)
    time.sleep(1)
    if data == 'exit' or not data:
      break
    sock.send('Hello, %s!' % data)
  sock.close()
  print 'Connection from %s:%s closed.' % addr

连接建立后,服务器首先发一条欢迎消息,然后等待客户端数据,并加上Hello再发送给客户端。如果客户端发送了exit字符串,就直接关闭连接。

要测试这个服务器程序,我们还需要编写一个客户端程序:

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接:
s.connect(('127.0.0.1', 9999))
# 接收欢迎消息:
print s.recv(1024)
for data in ['Michael', 'Tracy', 'Sarah']:
  # 发送数据:
  s.send(data)
  print s.recv(1024)
s.send('exit')
s.close()

我们需要打开两个命令行窗口,一个运行服务器程序,另一个运行客户端程序,就可以看到效果了:

用Python进行TCP网络编程的教程

小结

用TCP协议进行Socket编程在Python中十分简单,对于客户端,要主动连接服务器的IP和指定端口,对于服务器,要首先监听指定端口,然后,对每一个新的连接,创建一个线程或进程来处理。通常,服务器程序会无限运行下去。

同一个端口,被一个Socket绑定了以后,就不能被别的Socket绑定了。

源码参考:https://github.com/michaelliao/learn-python/tree/master/socket

Python 相关文章推荐
python 运算符 供重载参考
Jun 11 Python
浅谈Python爬取网页的编码处理
Nov 04 Python
Django Admin 实现外键过滤的方法
Sep 29 Python
Python和Java进行DES加密和解密的实例
Jan 09 Python
Python运行不显示DOS窗口的解决方法
Oct 22 Python
pycharm 配置远程解释器的方法
Oct 28 Python
总结Python图形用户界面和游戏开发知识点
May 22 Python
利用pyshp包给shapefile文件添加字段的实例
Dec 06 Python
Python用5行代码实现批量抠图的示例代码
Apr 14 Python
Python同时处理多个异常的方法
Jul 28 Python
Python爬虫爬取有道实现翻译功能
Nov 27 Python
Selenium执行完毕未关闭chromedriver/geckodriver进程的解决办法(java版+python版)
Dec 07 Python
为Python程序添加图形化界面的教程
Apr 29 #Python
python执行get提交的方法
Apr 29 #Python
在Python中使用PIL模块处理图像的教程
Apr 29 #Python
python获得linux下所有挂载点(mount points)的方法
Apr 29 #Python
python创建和删除目录的方法
Apr 29 #Python
python访问系统环境变量的方法
Apr 29 #Python
python中迭代器(iterator)用法实例分析
Apr 29 #Python
You might like
咖啡与水的关系
2021/03/03 冲泡冲煮
php 阴历-农历-转换类代码
2012/01/16 PHP
ThinkPHP5框架缓存查询操作分析
2018/05/30 PHP
使用js声明数组,对象在jsp页面中(获得ajax得到json数据)
2013/11/05 Javascript
js中小数转换整数的方法
2014/01/26 Javascript
JavaScript对IE操作的经典代码(推荐)
2014/03/10 Javascript
JS实用技巧小结(屏蔽错误、div滚动条设置、背景图片位置等)
2016/06/16 Javascript
JS原型与原型链的深入理解
2017/02/15 Javascript
js实现简易垂直滚动条
2017/02/22 Javascript
JavaScript转换数据库DateTime字段类型方法
2017/06/27 Javascript
AngularJS自定义过滤器用法经典实例总结
2018/05/17 Javascript
使用vue开发移动端管理后台的注意事项
2019/03/07 Javascript
详解微信小程序的不同函数调用的几种方法
2019/05/08 Javascript
JS学习笔记之闭包小案例分析
2019/05/29 Javascript
在Python中使用cookielib和urllib2配合PyQuery抓取网页信息
2015/04/25 Python
python实现微信远程控制电脑
2018/02/22 Python
python 创建一个空dataframe 然后添加行数据的实例
2018/06/07 Python
pandas.dataframe按行索引表达式选取方法
2018/10/30 Python
python+openCV调用摄像头拍摄和处理图片的实现
2019/08/06 Python
Python pandas.DataFrame 找出有空值的行
2019/09/09 Python
浅谈selenium如何应对网页内容需要鼠标滚动加载的问题
2020/03/14 Python
基于django 的orm中非主键自增的实现方式
2020/05/18 Python
PatPat阿根廷:妈妈们的购物平台
2019/05/30 全球购物
预订旅游活动、景点和旅游:GetYourGuide
2019/09/29 全球购物
培训专员岗位职责
2014/02/26 职场文书
热爱祖国演讲稿
2014/05/04 职场文书
关于运动会的口号
2014/06/07 职场文书
父亲节活动策划方案
2014/08/24 职场文书
2014党员民主评议个人总结
2014/09/10 职场文书
六查六看自查报告
2014/10/14 职场文书
2014年底工作总结
2014/12/15 职场文书
明星邀请函
2015/02/02 职场文书
首次购房证明
2015/06/19 职场文书
劳务派遣管理制度(样本)
2019/08/23 职场文书
面试被问select......for update会锁表还是锁行
2021/11/11 MySQL
Golang使用Panic与Recover进行错误捕获
2022/03/22 Golang