网络#
套接字#
Python 提供了两个级别访问的网络服务。:
低级别的网络服务支持基本的 Socket,它提供了标准的 BSD Sockets API,可以访问底层操作系统Socket接口的全部方法。
高级别的网络服务模块 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。
Socket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通讯。
Python 中,我们用 socket()
函数来创建套接字,语法格式如下:
socket.socket([family[, type[, proto]]])
参数:
family
: 套接字家族可以使AF_UNIX
或者AF_INET
;AF_INET
指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6
。type
: 套接字类型可以根据是面向连接的还是非连接分为SOCK_STREAM
或SOCK_DGRAM
;SOCK_STREAM
指定使用面向流的TCP协议
。protocol
: 一般不填默认为0
.
Socket 对象(内建)方法
服务器端套接字#
|函数|描述|
|:-|:-|:-|
|s.bind()
|绑定地址(host,port)
到套接字, 在AF_INET
下,以元组(host,port)
的形式表示地址。|
|s.listen()
|开始TCP监听。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。|
|s.accept()
|被动接受TCP客户端连接,(阻塞式)等待连接的到来|
客户端套接字#
|函数|描述|
|:-|:-|:-|
|s.connect()
|主动初始化TCP服务器连接,。一般address
的格式为元组(hostname,port)
,(port指端口号)如果连接出错,返回socket.error
错误。|
|s.connect_ex()
|connect()
函数的扩展版本,出错时返回出错码,而不是抛出异常|
公共用途的套接字函数#
|函数|描述|
|:-|:-|:-|
|s.recv()
|接收TCP数据,数据以字符串形式返回,bufsiz
e指定要接收的最大数据量。flag
提供有关消息的其他信息,通常可以忽略。|
|s.send()
|发送TCP数据,将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。|
|s.sendall()
|完整发送TCP数据,完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。|
|s.recvform()
|接收UDP数据,与recv()
类似,但返回值是(data,address)
。其中data
是包含接收数据的字符串,address
是发送数据的套接字地址。|
|s.sendto()
|发送UDP数据,将数据发送到套接字,address
是形式为(ipaddr,port)
的元组,指定远程地址。返回值是发送的字节数。|
|s.close()
|关闭套接字|
|s.getpeername()
|返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)
|
|s.getsockname()
|返回套接字自己的地址。通常是一个元组(ipaddr,port)
|
|s.setsockopt(level,optname,value)
|设置给定套接字选项的值。|
|s.getsockopt(level,optname[.buflen])
|返回套接字选项的值。|
|s.settimeout(timeout)
|设置套接字操作的超时期,timeout
是一个浮点数,单位是秒。值为None
表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()
)|
|s.gettimeout()
|返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None
。|
|s.fileno()
|返回套接字的文件描述符。|
|s.setblocking(flag)
|如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()
没有发现任何数据,或send()
调用无法立即发送数据,那么将引起socket.error
异常。|
|s.makefile()
|创建一个与该套接字相关连的文件|
# 导入socket库:
import socket
# 创建一个socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接:
s.connect(('www.sina.com.cn', 80))
客户端#
客户端要主动发起TCP连接,必须知道服务器的IP地址
和端口号
。新浪网站的IP地址可以用域名www.sina.com.cn
自动转换到IP地址
80端口是Web服务的标准端口。其他服务都有对应的标准端口号,例如SMTP服务是25端口,FTP服务是21端口,等等。端口号小于1024的是Internet标准服务的端口,端口号大于1024的,可以任意使用。
因此,我们连接新浪服务器的代码如下:
s.connect(('www.sina.com.cn', 80))
建立TCP连接后,我们就可以向新浪服务器发送请求,要求返回首页的内容:
# 发送数据:
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
60
# 接收数据:
buffer = []
while True:
# 每次最多接收1k字节:
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)
# 关闭连接:
s.close()
接收数据时,调用recv(max)
方法,一次最多接收指定的字节数,因此,在一个while循环中反复接收,直到recv()
返回空数据,表示接收完毕,退出循环。
当我们接收完数据后,调用close()方法关闭Socket,这样,一次完整的网络通信就结束了。
接收到的数据包括HTTP头和网页本身,我们只需要把HTTP头和网页分离一下,把HTTP头打印出来,网页内容保存到文件:
(header, html) = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的数据写入文件:
with open('sina.html', 'wb') as f:
f.write(html)
HTTP/1.1 200 OK
Server: nginx
Date: Tue, 22 Aug 2017 08:03:04 GMT
Content-Type: text/html
Content-Length: 601703
Connection: close
Last-Modified: Tue, 22 Aug 2017 07:58:35 GMT
Vary: Accept-Encoding
Expires: Tue, 22 Aug 2017 08:04:03 GMT
Cache-Control: max-age=60
X-Powered-By: shci_v1.03
Age: 0
Via: http/1.1 cnc.beixian.ha2ts4.205 (ApacheTrafficServer/4.2.1.1 [cMsSf ]), http/1.1 ctc.ningbo.ha2ts4.106 (ApacheTrafficServer/4.2.1.1 [cRs f ])
X-Cache: MISS.205
X-Via-CDN: f=edge,s=ctc.ningbo.ha2ts4.101.nb.sinaedge.com,c=218.75.27.189;f=Edge,s=ctc.ningbo.ha2ts4.106,c=115.238.190.101;f=edge,s=cnc.beixian.ha2ts4.213.nb.sinaedge.com,c=115.238.190.106;f=Edge,s=cnc.beixian.ha2ts4.205,c=115.238.190.101
X-Cache: MISS.MERGE.106
现在,只需要在浏览器中打开这个sina.html文件,就可以看到新浪的首页了。
服务器:#
我们使用
socket
模块的socket()
函数来创建一个socket
对象。socket
对象可以通过调用其他函数来设置一个socket
服务。通过调用
bind(hostname, port)
函数来指定服务的port
(端口)。我们调用
socket
对象的accept
方法。该方法等待客户端的连接,并返回connection
对象,表示已连接到客户端。
完整代码如下
# 文件名:server.py
import threading
# 导入 socket模块
import socket
# 创建 socket 对象
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 绑定端口
s.bind(('127.0.0.1', 1024))
# 设置最大连接数,超过后排队
s.listen(5)
print('请稍后,正在连接中...')
# 每个连接都必须创建新线程(或进程)来处理,否则,单线程在处理连接的过程中,无法接受其他客户端的连接:
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
sock.send(b'Welcome!')
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
sock.close()
print('Connection from %s:%s closed.' % addr)
while True:
# 建立客户端连接
sock,addr = serversocket.accept()
# 创建新线程来处理TCP连接:
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()
请稍后,正在连接中...
客户端 接下来我们写一个简单的客户端实例连接到以上创建的服务。端口号为 9999。
socket.connect(hosname, port )
方法打开一个 TCP 连接到主机为 hostname 端口为 port 的服务商。连接后我们就可以从服务端后期数据,记住,操作完成后需要关闭连接。
完整代码如下:
# 文件名:client.py
# 导入 socket模块
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接:
s.connect(('127.0.0.1', 9999))
# 接收欢迎消息:
print(s.recv(1024).decode('utf-8'))
for data in [b'Michael', b'Tracy', b'Sarah']:
# 发送数据:
s.send(data)
print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
s.close()
现在我们打开两个终端,第一个终端执行 server.py 文件
第二个终端执行 client.py 文件
Python Internet 模块#
以下列出了 Python 网络编程的一些重要模块:
|协议|功能用处|端口号|Python 模块|
|:-|:-|:-|:-|:-|:-|
|HTTP
|网页访问|80
|httplib, urllib, xmlrpclib
|
|NNTP
|阅读和张贴新闻文章,俗称为"帖子"|119
|nntplib
|
|FTP
|文件传输|20
|ftplib, urllib
|
|SMTP
|发送邮件|25
|smtplib
|
|POP3
|接收邮件|110
|poplib
|
|IMAP4
|获取邮件|143
|imaplib
|
|Telnet
|命令行|23
|telnetlib
|
|Gopher
|信息查找|70
|gopherlib, urllib
|