【问题标题】:Multithreaded Python Socket Sender/Client多线程 Python 套接字发送方/客户端
【发布时间】:2014-10-16 16:18:27
【问题描述】:

我有一个 Twisted 应用程序正在侦听 Int32StringReceiver 消息,然后将它们重新发送到另一个应用程序。基本上,它是一个路由器,但它有一些智能,可以内省数据的去向。

我的问题是出站端,收到很多错误消息等。

入站是一个类Receiver(Int32StringReceiver):

def doActualForwarding(self, data):         
    self.stats.recvBits  += 8 * (4 + len(data))
    self.stats.recvMsgs += 1
    dlen = len(data) 
    if dlen > 1024*256:
        self.logger.info("router.Receiver.doActualForwarding(): data len: %s" % (dlen))
    self.router.forward(data)

def stringReceived(self, data):
    d = threads.deferToThread(self.doActualForwarding, data)
    d.addCallback(self.forwardingDoneOkay)
    d.addErrback(self.forwardingDoneError)

self.router 是实例化的对象,需要通过套接字通信以相同的格式发送这些消息。所以,它只是转身在路由器类中执行此操作:

def connect(self):
    if self.sock:
        try:
            self.sock.close()
        except:
            pass
    try:
        self.stats.connectAttempts += 1
        self.sock = socket.socket()
        self.sock.settimeout(self.CONNECT_TIMEOUT)
        self.sock.connect(self.destination)
        self.sock.settimeout(self.SEND_TIMEOUT)
        self.set_keepalive_linux(self.sock)
        self.connected = True
        self.log.info("connected to %s" % (self.destination,))
        self.stats.reconnects += 1
        self.stats.connectCompletes += 1
        return True
    except Exception, e:
        self.connected = False
        if not self.drop_ok:
            self.log.error("connect %s: %s" % (self.destination, e))
        return False

def send(self, msg):
    trynum = 0
    while trynum < self.MAX_SEND_ATTEMPTS:
        self.logSent()
        if not self.connected:
            if not self.connect():
                self.stats.badSends += 1
                time.sleep(self.DELAY_BEFORE_RECONNECT)
                continue
        try:
            if ((time.time() - self.lastReconnectTime) > self.RECONNECT_EVERY):
                self.lastReconnectTime = time.time()
                assert False, "Reconnecting with destination to redistribute load."
            self.sock.sendall(msg)
            #self.closeSocket()
            self.stats.events += 1
            return True
        except Exception, e:
            whichKind = None
            if 'Broken pipe' in str(e):
                self.stats.brokenPipe += 1
            elif 'Resource temporarily unavilable' in str(e):
                self.stats.resourceTempUnavail += 1
            elif 'Bad file descriptor' in str(e):
                self.stats.badFileDescriptor += 1
            self.log.error("send: %s %s" % (str(self.destination), str(e)))
            try:
                self.sock.close()
            except:
                pass
            self.connected = False
            self.stats.badSends += 1
        trynum += 1
        if trynum == 1:
            self.stats.eventsWithRetry += 1
    if trynum > 1:
        self.log.warning("recon_sender.send(): Trynum non-singular, was: %s" % (trynum))
    return False

def __del__(self):
    try:
        self.sock.close()
    except:
        pass

问题:

  1. Python 的 Socket 库是线程安全的吗?也就是说,在功能上,两个或多个线程都有一个指向对象路由器的指针。两个线程都在调用 self.sock.sendall(msg),我担心它们会互相踩踏。

  2. 一个症状是可能是连续的消息相互附加。我不确定这一点,但看起来是这样的。

  3. 我看到很多资源临时。 unavail(意味着目的地很忙),大约相同数量的损坏管道,以及少量的坏文件描述符。

    • [Errno 9] 文件描述符错误
    • [Errno 11] 资源暂时不可用
    • [Errno 32] 断管

这些消息可能对应于通过这个东西的消息数量的 0.5% (.005)。

  1. 我尝试让每个发送都执行一次连接/发送/关闭/关闭,但这会导致大量有关“对等方重置连接”的消息。

似乎每个人都专注于处理套接字上的多线程接收的代码,但对套接字上的多线程发送的评论并不多。

  1. 我也尝试使用(可能不正确):

    导入线程 self.lock = threading.Lock() 使用 self.lock: sock.sendall(msg)

但这会导致有关超时的错误消息(糟糕)。

  1. 有人能指出一些好的例子(或提供一些例子吗?!?!?!?),演示多线程套接字 sendall()?

【问题讨论】:

  • Python 本身通常不是线程安全的,因此您必须使用多处理来绕过 gil。
  • 你推迟到一个线程有什么原因吗?这不是在 Twisted 中处理连接的常用方法,并且可能是问题的原因。
  • Twisted 不是线程安全的,通常没有理由使用线程在 Twisted 中发送网络流量。为什么要做线程和低级套接字 IO?真的不清楚你为什么不只是打电话给transport.write...

标签: python multithreading sockets twisted


【解决方案1】:

我想说,如果进程不必相互通信,最好的解决方案是生成一个新进程来处理每个传入的连接。这样您就不必担心锁定,因为每个连接都将单独处理。

简单的实现是:

import socket
import multiprocessing
import pdb
import random
from pycurl import Curl
import os
import time
import re

class query(object):
    pid, addr, conn, url, ua, ref = [None for i in range(6)]
    compression = True

    def __init__(self, conn, addr):
        self.pid = addr[1]
        self.addr = addr
        self.conn = conn
        self.process()

    def process(self):
        #do your socket stuff here

class ProxyServer(object):
    def __init__(self, host, port):
        self.host = host
        self.port = port

    def start(self):
        logging.info("Server started on %s:%i" % (self.host, self.port))
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        self.sock.bind((self.host, self.port))
        self.sock.listen(0)

        while True:
            conn, addr = self.sock.accept()
            logging.info('Connection made from %s' % conn)
            proc = multiprocessing.Process(target=query, args=(conn, addr))
            proc.daemon = True
            proc.start()
            logging.info('Started processing query %r for %s' % (proc, addr))

if __name__ == "__main__":
    serv = ProxyServer(host, port)
    try:
        serv.start()
    except:
    finally:
        for proc in multiprocessing.active_children():
            proc.terminate()
            proc.join()

请记住,这是我从旧的概念验证代码中截取的示例,您必须对其进行一些调整,然后才能投入生产。

【讨论】:

    猜你喜欢
    • 2021-11-09
    • 2018-03-26
    • 1970-01-01
    • 2018-05-16
    • 2016-01-05
    • 1970-01-01
    • 2016-08-27
    • 1970-01-01
    • 2021-07-19
    相关资源
    最近更新 更多