初学Python——Socket网络编程

简介: 认识socketsocket本质上就是在2台网络互通的电脑之间,架设一个通道,两台电脑通过这个通道来实现数据的互相传递。我们知道网络 通信 都 是基于 ip+port(端口) 方能定位到目标的具体机器上的具体服务,操作系统有0-65535个端口,每个端口都可以独立对外提供服务,如果 把一个公司比做一台电脑 ,那公司的总机号码就相当于ip地址, 每个员工的分机号就相当于端口, 你想找公司某个人,必须 先打电话到总机,然后再转分机 。

认识socket

socket本质上就是在2台网络互通的电脑之间,架设一个通道,两台电脑通过这个通道来实现数据的互相传递。我们知道网络 通信 都 是基于 ip+port(端口) 方能定位到目标的具体机器上的具体服务,操作系统有0-65535个端口,每个端口都可以独立对外提供服务,如果 把一个公司比做一台电脑 ,那公司的总机号码就相当于ip地址, 每个员工的分机号就相当于端口, 你想找公司某个人,必须 先打电话到总机,然后再转分机 。

建立一个socket必须至少有2端, 一个服务端,一个客户端, 服务端被动等待并接收请求,客户端主动发起请求, 连接建立之后,双方可以互发数据。

基本参数

Socket Families(地址簇)

socket.AF_UNIX  本机进程间通信 

socket.AF_INET  IPV4(默认) 

socket.AF_INET6  IPV6

Socket Types(类型)

socket.SOCK_STREAM  流式socket,代表TCP协议(默认)

socket.SOCK_DGRAM  数据报式socket,代表UDP协议

socket方法

sk = socket.socket(family=AF_INETtype=SOCK_STREAMproto=0fileno=None)

建立socket连接对象

sk.bind(address)

  s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。

sk.listen(backlog)

  开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。

      backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
      这个值不能无限大,因为要在内核中维护连接队列

sk.setblocking(bool)

  是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。

sk.accept()

  接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。

  接收TCP 客户的连接(阻塞式)等待连接的到来

sk.connect(address)

  连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。

sk.connect_ex(address)

  同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061

sk.close()

  关闭套接字

sk.recv(bufsize[,flag])

  接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。

sk.recvfrom(bufsize[.flag])

  与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。

sk.send(string[,flag])

  将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。

sk.sendall(string[,flag])

  将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。

      内部通过递归调用send,将所有内容发送出去。

服务端步骤:

步骤:
1.server = socket.socket() 声明实例,生成连接对象
2.server.bind() 绑定要监听的端口
3.server.listen() 开始监听
4.conn,addr = server.accept()等待客户端发起连接,阻塞
5.接收数据(发送数据)
6.当客户端断开连接后,继续监听等待下一个客户端建立连接
……
关闭连接对象

代码示例:

import socket
"服务器端"

server = socket.socket() # 生成连接对象
server.bind(("localhost",6000)) # 绑定要监听的端口
server.listen(5) # 开始监听(最大允许挂起的连接)
while True:
    print("\n服务器在等待...")
    conn,addr = server.accept() # 等待客户端发起建立连接,起到阻塞作用
    # conn 是客户端链接过来而在服务器端为其生成的连接实例,addr是IP地址+端口
    print("已成功连接")
    print("连接对象:{0},地址:{1}\n".format(conn,addr))
    while True:
        try:
            data = conn.recv(1024)  # 接收数据
            # (如果客服端断开连接,此步骤将会被无限循环操作,所以一定要有检查机制)
            if data != b"000001":  # 接收到的信号不是"000001"的话就正常执行
                print("接收客户端信息:", data.decode())
                msg = input(">>输入返回客户端的数据:")
                conn.send(msg.encode(encoding="utf-8")) # 向客户端发送数据
            else:
                print("该客户已主动断开连接")
                break
        except ConnectionResetError as e:
            print("该客户机异常!已被强迫断开连接",e)
            break
        else:
            print("It's OK !")

server.close()

客户端步骤:

步骤:
1.client = socket.socket() 声明实例,生成连接对象
2.client.connect() 与服务器建立连接
3.与服务器交互(发送接收数据)
4.client.close() 断开连接

代码示例:

import socket
"通信案例客户端消息接收与发送"
client = socket.socket() # 声明socket类型,并生成socket连接对象
try:
    client.connect(("localhost",6000)) # 与服务器建立连接

    while True:
        msg = input(">>输入要向服务器发送的信息:")
        client.send(msg.encode(encoding="utf-8")) # 向服务器发送信息(只能发送bytes字节类型,不能是str字符类型)
        data = client.recv(1024) # 接收来自服务器的1024个字节
        print("接收来自服务器的数据:",data.decode()) # 打印服务器发送的数据
        chioce = input("按任意键继续,按0退出客户端")
        if chioce == "0":
            client.send(b"000001") # 发送此信号表明客户端要断开连接
            break
        client.close()
except ConnectionRefusedError as e:
    print("服务器还没开机!请静候")

需要注意的是:

1.客户端再发送数据时,要主要服务器接收的大小限制。如果超过了这个限制,超出的部分暂时存在系统缓冲区,第二次接收的时候再输出剩下的部分。例如服务器端的recv(1024),而客户端一次发了2024字节,那么剩下的1000字节存在缓冲区,第二次接收的时候会接收缓冲区的内容,将不会接收新发来的数据,会造成数据错误。官方建议一次性不超过8192字节

2.双发收发数据只能是bytes类型

3.粘包问题,下面讲

socket粘包问题

什么是粘包呢?我们知道发送数据,并且数据量比较大时,并不会一次性发送,即使能一次发送,客户端也不一定能一次性接收,所以服务器有个缓冲区,等客户端下次再接收数据的时候再发送给客户端,所以,就需要将数据分成几次发送,客户端分成几次接收。那又出来问题了,客户端知道数据(文件)有多大么?它怎么知道要接收几次?当然是要服务器告诉他啦!

于是,我们设计服务器首先发送数据大小(数据),再开始分批发送数据,客户端先接收文件大小(数据),再开始分批接收。问题就有可能在这里出现了。如果连续2次send数据,很有可能将两次的数据黏在一起发送出去,在客户端也无法将其分开,怎么办呢?

我们可以让服务器每次发送数据后,接收来自客户端的确认,这样会强制清空缓冲区,就不会造成粘包。当然,基于上面讲的方法,只需要在发送正式数据之前接收确认就好。

最后,如果希望100%确认双发收发数据是否一致,可以采用MD5校验。

服务器端步骤:

1.读取文件名
2.检测文件是否存在
3.打开文件
4.检测文件大小
5.将文件大小发给客户端
6.确认
7.开始边读边发(循环发送)
8.发送MD5

代码:

import socket,os,hashlib

ser = socket.socket()
ser.bind(("localhost",5000))
ser.listen()

while True:
    try:
        print("正在等待客户端连接...")
        conn,addr = ser.accept()
        print("已连接,new conn:",addr)
        while True:
            data = conn.recv(8192)
            filename = data.decode()
            print("寻找文件",filename)
            if os.path.isfile(filename):
                conn.send(b"01")
                conn.recv(1024)
                f = open(filename,"rb")
                m = hashlib.md5()
                file_size = os.stat(filename).st_size
                conn.send(str(file_size).encode(encoding="utf-8"))
                client_ack = conn.recv(1024)  # 接收确认信息
                if client_ack == b"1":
                    print("开始发送数据")
                for line in f:
                    m.update(line)
                    conn.send(line)
                f.close()
                conn.send(m.hexdigest().encode(encoding="utf-8")) # 发送MD5值
            else:
                conn.send(b"00") #表示文件不存在
                print("该文件不存在!")
    except ConnectionResetError:
        print("该客户端已断开连接")


ser.close()
print("服务器已关闭")

客户端步骤:

1.发送接收文件请求,同时将文件名发送给服务器

2.接收文件长度

3.本地新建同名文件,循环接收数据,并将其写入文件

4.同时更新本地MD5值

5.接收数据完毕后,再接收服务器的MD5值,与本地MD5值进行比较

代码:

import socket,hashlib


def receive1(client):
    "真正的数据接收"
    while True:
        res = b""
        res = res + client.recv(1024)
    return res

def receive(client,filename):
    "接收处理"
    m = hashlib.md5()
    rece_res_size = int(client.recv(1024).decode())  # 接收的结果长度,转成int型
    client.send(b"1")
    rece_size = 0
    res = b""
    filename = filename.decode()
    f = open(filename + ".new","wb")
    while rece_size < rece_res_size:
        if rece_res_size - rece_size >1024: # 如果不是最后一次接收数据
            size = 1024
        else: # 最后一次接收数据
            size = rece_res_size - rece_size
        a = client.recv(size) # 循环接收数据
        res = res + a
        rece_size = len(res)
        m.update(a)
        f.write(a)
        print("发送数据量:{0},接收数据量:{1}".format(rece_res_size,rece_size))
    else:
        serves_md5 = client.recv(1024).decode()
        print("服务器MD5:",serves_md5)
        print("客户端MD5:",m.hexdigest())
        if serves_md5 == m.hexdigest():
            print("文件接收并校验完毕!")
    res.decode()
    f.close()

def main():
    client = socket.socket()
    try:
        client.connect(("localhost", 5000))
        while True:
            filename = input("请输入需要的文件名").strip().encode(encoding="utf-8")
            if len(filename) == 0:
                print("输入为空,重新输入")
                continue
            client.send(filename)
            is_file = client.recv(1024)
            if is_file == b"01":
                client.send(b"OK")
                receive(client,filename) # 调用函数接收数据,返回结果res(bytes)
            else:
                print(" {0} 文件不存在!".format(filename.decode()))

    except ConnectionRefusedError:
        print("等待服务器开机")
    client.close()

main()

socketserver

什么是socketserver?为什么需要它呢?

我们在前面的文章中普通的socket并不能同时处理多个客户端,当一个客户端在与服务器连接时,其它客户端只能排队。而sockerserver则不同,它可以并发地处理多个客户端请求。

import socketserver
'''
每一个客户端请求过来,都会实例化 MyTCPHandler
'''

class MyTCPHandler(socketserver.BaseRequestHandler):
    def handle(self):
        "跟客户端所有的交互都是在handle里完成的"
        while True:
            try:
                self.data = self.request.recv(1024).strip()
                print("{0} wrote:".format(self.client_address[0]))
                print(self.data)
                if not self.data:
                    print("输入为空")
                    self.request.send(bytes("输入为空", "utf-8"))
                else:
                    self.request.send(self.data.upper())
            except ConnectionResetError :
                print("客户已断开连接")
                break

if __name__ == "__main__":
    HOST, PORT = "localhost", 9999
    #server = socketserver.TCPServer((HOST, PORT), MyTCPHandler) # 实例化一对一的连接对象
    server = socketserver.ThreadingTCPServer((HOST, PORT), MyTCPHandler) # 实例化多并发的连接对象(多线程)
    server.serve_forever()

客户端并没有什么区别:

import socket

HOST, PORT = "localhost", 9999
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect((HOST, PORT))
while True:
    data = input("输入字符")
    try:
        sock.sendall(bytes(data + "\n", "utf-8"))

        received = str(sock.recv(1024), "utf-8")
    finally:
        print("Sent:     {0}".format(data))
        print("Received: {0}".format(received))

sock.close()

 

相关文章
|
20天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
217 55
|
2月前
|
Python
Python中的异步编程:使用asyncio和aiohttp实现高效网络请求
【10月更文挑战第34天】在Python的世界里,异步编程是提高效率的利器。本文将带你了解如何使用asyncio和aiohttp库来编写高效的网络请求代码。我们将通过一个简单的示例来展示如何利用这些工具来并发地处理多个网络请求,从而提高程序的整体性能。准备好让你的Python代码飞起来吧!
88 2
|
2月前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
121 6
|
30天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
155 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
5天前
|
算法 网络协议 Python
探秘Win11共享文件夹之Python网络通信算法实现
本文探讨了Win11共享文件夹背后的网络通信算法,重点介绍基于TCP的文件传输机制,并提供Python代码示例。Win11共享文件夹利用SMB协议实现局域网内的文件共享,通过TCP协议确保文件传输的完整性和可靠性。服务器端监听客户端连接请求,接收文件请求并分块发送文件内容;客户端则连接服务器、接收数据并保存为本地文件。文中通过Python代码详细展示了这一过程,帮助读者理解并优化文件共享系统。
|
30天前
|
机器学习/深度学习 人工智能 算法
深度学习入门:用Python构建你的第一个神经网络
在人工智能的海洋中,深度学习是那艘能够带你远航的船。本文将作为你的航标,引导你搭建第一个神经网络模型,让你领略深度学习的魅力。通过简单直观的语言和实例,我们将一起探索隐藏在数据背后的模式,体验从零开始创造智能系统的快感。准备好了吗?让我们启航吧!
72 3
|
2月前
|
网络安全 Python
Python网络编程小示例:生成CIDR表示的IP地址范围
本文介绍了如何使用Python生成CIDR表示的IP地址范围,通过解析CIDR字符串,将其转换为二进制形式,应用子网掩码,最终生成该CIDR块内所有可用的IP地址列表。示例代码利用了Python的`ipaddress`模块,展示了从指定CIDR表达式中提取所有IP地址的过程。
55 6
|
2月前
|
机器学习/深度学习 自然语言处理 语音技术
Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧
本文介绍了Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧,并通过TensorFlow和PyTorch等库展示了实现神经网络的具体示例,涵盖图像识别、语音识别等多个应用场景。
71 8
|
2月前
|
数据采集 XML 存储
构建高效的Python网络爬虫:从入门到实践
本文旨在通过深入浅出的方式,引导读者从零开始构建一个高效的Python网络爬虫。我们将探索爬虫的基本原理、核心组件以及如何利用Python的强大库进行数据抓取和处理。文章不仅提供理论指导,还结合实战案例,让读者能够快速掌握爬虫技术,并应用于实际项目中。无论你是编程新手还是有一定基础的开发者,都能在这篇文章中找到有价值的内容。
|
2月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
94 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络