【问题标题】:C infinite loop breaks with code 141 when opening two threads after accepting connection在接受连接后打开两个线程时,C 无限循环以代码 141 中断
【发布时间】:2015-04-09 10:17:59
【问题描述】:

在一个简单的 C 程序中,每次接受 TCP 套接字上的传入连接以异步处理客户端输入时,我都会打开一个新线程。接受发生在无限循环中。客户端数据在传递给 pthread_create 的回调函数中处理。当客户端发送数据时,套接字将立即关闭并断开连接。

只要我通过 telnet 客户端连接到程序侦听的端口,程序就准备好接受新连接。到目前为止一切顺利。

现在,当我同时连接两个客户端并一个接一个地给它一些输入时,主程序将退出 code 141

服务器控制台

cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ ./sysmon 
Thu Apr  9 12:03:17 2015: Finished reading configuration file
Thu Apr  9 12:03:17 2015: Initializing server socket
Thu Apr  9 12:03:17 2015: Accepting connections...
Thu Apr  9 12:03:19 2015: Inbound connection from  127.0.0.1
Using Thread: 0
Thu Apr  9 12:03:19 2015: Accepting connections...
Thu Apr  9 12:03:22 2015: Inbound connection from  127.0.0.1
Using Thread: 1
Thu Apr  9 12:03:22 2015: Accepting connections...
Client msg: asdf
Client msg: asdfasdfdsfadsf
cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ echo $?
141
cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ 

客户端控制台 1

cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ telnet 127.0.0.1 50231
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
asdfasdfdsfadsf
Connection closed by foreign host.
cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ 

客户端控制台 2

cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ telnet 127.0.0.1 50231
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
asdf
Message was: asdf
Connection closed by foreign host.
cehrig@devbox /home/cehrig/projects/SystemMonitor/build $ 

这是从用于接受连接的函数中截取的。

int connections = 0;
pthread_t * newthread = malloc(sizeof(pthread_t));

while(1) {
    _print(stdout, "messages.socketacceppt", cfg, 1);
    newsockfd = accept(sockfd, (struct sockaddr *) &cli_addr, &clilen);

    thrpass_st thr_pass;
    thr_pass.sockfd = newsockfd;
    thr_pass.cfg = cfg;

    _print(stdout, "messages.socketreceived", cfg, 0);
    fprintf(stdout, "%d.%d.%d.%d\n",
        cli_addr.sin_addr.s_addr&0xFF,
        (cli_addr.sin_addr.s_addr&0xFF00)>>8,
        (cli_addr.sin_addr.s_addr&0xFF0000)>>16,
        (cli_addr.sin_addr.s_addr&0xFF000000)>>24);

    printf("Using Thread: %d\n", connections);
    pthread_create(newthread+connections, NULL, &read_socket, (void *) &thr_pass);

    newthread = (pthread_t *) realloc(newthread, (++connections+1)*sizeof(pthread_t));
}

这是每个新线程的回调函数/入口点。

void * read_socket(void * args)
{
    thrpass_st * _args = (thrpass_st *) malloc(sizeof(thrpass_st));
    _args = (thrpass_st *) args;

    int n;
    char * _buf = (char *) malloc(512*sizeof(char));
    char * _cor = (char *) malloc(512*sizeof(char));
    char * _out = _cor;

    bzero(_buf, 512);
    bzero(_cor, 512);


    size_t bread = 0;
    do {
        if((n = read(_args->sockfd, _buf+bread, 512-bread)) < 0) {
            _print(stderr, "messages.socketreadfail", _args->cfg, 1);
            _exit(0);
        }
        bread+=n;
    } while(strchr(_buf, '\n') == NULL && bread <= 512);


    int x = 0;
    while(*_buf != '\n' && x++ <= 512) {
        *_cor++ = *_buf++;
    }

    printf("Client msg: %s\n", _out);
    fflush(stdout);

    FILE * sstream = fdopen(_args->sockfd, "w+");
    fprintf(sstream, "Message was: %s\n", _out);
    fflush(sstream);
    shutdown(_args->sockfd, 2);
}

我认为问题出在这个函数的末尾,因为第二个 telnet 客户端没有收到“已发送消息:”行。

任何帮助将不胜感激!干杯。

【问题讨论】:

  • 当您的退出代码超过 128 时,可能是一个信号。您可以找到信号代码here,返回值是信号代码 + 128。所以在您的情况下,它是 SIGPIPE:在没有阅读器的情况下写入管道。你可能写在一个封闭或结束的文件描述符上。我建议不要将网络文件描述符上的 fdopen 用作套接字。它更多用于文件管理。
  • 感谢有关流与直接写入 fd 的提示。它或多或少是在玩流而不是使用“正常”的低级方式

标签: c sockets pthreads


【解决方案1】:

这是因为undefined behavior,你的线程函数中有这个UB,源于以下几行:

thrpass_st * _args = (thrpass_st *) malloc(sizeof(thrpass_st));
_args = (thrpass_st *) args;

第一行分配内存,然后你用另一个指针覆盖指向这个内存的指针,一个指向另一个函数内的局部变量的指针,一个在accept循环后立即超出范围的变量迭代。

最简单的解决方案是复制结构:

*_args = *(thrpass_st *) args;

其实在这种情况下根本不需要指针,只做eg即可。

thrpass_st _args = *(thrpass_st *) args;

这样也不会因为忘记free线程末尾的指针而导致内存泄漏。


另请注意,您在此处有一个 竞态条件。如果两个客户端非常紧密地连接在一起,则存在两个线程将具有作为参数传递的相同结构数据的风险。

适当的解决方案是为循环中的参数结构分配内存,并将该指针传递给线程函数。当然不要忘记free线程函数结束时的内存。

【讨论】:

  • 'race condition' 比这更糟糕 - 线程可能会得到一个复制的切片结构:(
  • 啊,抱歉烦人:-/ ...正如你所说,在线程函数中,我刚刚使用传递给线程函数的结构指针的内容初始化了一个新的结构变量
  • 如果您没有在 accept() 循环中动态分配结构,或者以其他方式确保每个客户端服务器线程对其自己的结构实例具有唯一访问权限,那么您的服务器将不可靠。
  • 好的。当我对参数结构进行动态分配时,我不必在线程函数中创建新变量,对吗?只需将指针转换为我的类型并直接使用它。
  • @ChristianEhrig 是的,正是这样,将指针转换为您的类型*(并在线程退出时释放它,正如其他人所建议的那样)。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-12-20
  • 1970-01-01
  • 1970-01-01
  • 2015-12-15
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多