【发布时间】:2012-07-31 07:17:01
【问题描述】:
我在 Linux 下遇到了服务器套接字问题。由于某种我不知道的原因,服务器套接字消失了,我在等待传入连接的选择调用中收到Bad file descriptor 错误。当我在不同的线程中关闭不相关的套接字连接时,总是会出现此问题。这发生在具有 2.6.36 内核的嵌入式 Linux 上。
有人知道为什么会这样吗?服务器套接字可以简单地消失导致Bad file descriptor 是否正常?
编辑:
另一个套接字代码实现了一个 VNC 服务器并在一个完全不同的线程中运行。其他代码的唯一特别之处是使用了setjmp/longjmp,但这应该不是问题。
创建服务器套接字的代码如下:
int server_socket = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);
struct sockaddr_in saddr;
memset(&saddr, 0, sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_addr.s_addr = htonl(INADDR_ANY);
saddr.sin_port = htons(1234);
const int optionval = 1;
setsockopt(server_socket, SOL_SOCKET, SO_REUSEADDR, &optionval, sizeof(optionval));
if (bind(server_socket, (struct sockaddr *) &saddr, sizeof(saddr)) < 0) {
perror("bind");
return 0;
}
if (listen(server_socket, 1) < 0) {
perror("listen");
return 0;
}
我使用以下代码等待传入连接:
static int WaitForConnection(int server_socket, struct timeval *timeout)
{
fd_set read_fds;
FD_ZERO(&read_fds);
int max_sd = server_socket;
FD_SET(server_socket, &read_fds);
// This select will result in 'EBADFD' in the error case.
// Even though the server socket was not closed with 'close'.
int res = select(max_sd + 1, &read_fds, NULL, NULL, timeout);
if (res > 0) {
struct sockaddr_in caddr;
socklen_t clen = sizeof(caddr);
return accept(server_socket, (struct sockaddr *) &caddr, &clen);
}
return -1;
}
编辑: 当问题发生时,我目前只是重新启动服务器,但我不明白为什么服务器套接字 id 会突然变成无效的文件描述符:
int error = 0;
socklen_t len = sizeof (error);
int retval = getsockopt (server_socket, SOL_SOCKET, SO_ERROR, &error, &len );
if (retval < 0) {
close(server_socket);
goto server_start;
}
【问题讨论】:
-
你贴的代码没有问题,错误肯定在别处。例如,您在关闭它之后使用套接字吗?
-
线程具体用在哪里?
-
以上代码在一个线程中运行。另一个代码在另一个也运行线程的模块中。关闭那里的连接会杀死这里的服务器。我没想到如果我不关闭它,服务器套接字会变得无效。
-
我敢打赌,您的代码中的某些错误导致您使用
close与您稍后select相同的套接字。 -
@trenki 它不能。某处有一个错误导致您关闭侦听套接字具有的相同文件描述符值,或者有一个错误覆盖了保存侦听套接字描述符的变量。您可以在 strace 下运行程序,例如
strace -f -e accept,socket,close,shutdown ./yourserver看看你是否曾经使用与监听套接字相同的文件描述符值调用 close(),或者你是否突然开始将不同的文件描述符传递给 accept()。