【发布时间】:2011-11-22 03:32:08
【问题描述】:
我正在为我的分布式系统课程做作业。我是 C.S. 的硕士生,但我的编程专长是 .NET,我正在从事一个需要一些相当多的 Unix 知识的项目,这让我很受挫。
任务正在实现一个刷新通道协议 API。所以我正在编写一个小型函数库,其他应用程序可以实现该函数库以使用刷新通道通信。我已经对其进行了设置,以便在调用 init 函数时,它会派生一个子进程来充当传入消息的服务器。子进程通过管道将传入数据发送给父进程,从而与父进程通信。
如果一次发送和接收一条消息,这可以正常工作;例如,
发送 -> 接收 -> 发送 -> 接收 -> 等等。
但是,如果在接收之前发送了多条消息;例如,
发送->发送->发送->接收
然后就搞砸了。具体来说,第一条消息接收正确,但是当我去接收第二条消息时,程序挂了,需要被杀死。我已经在网上进行了大量搜索,并为此花费了几个小时,但没有取得太大进展。
整个程序太大,无法在此处显示,但这里是最相关的部分。这是我让服务器运行并接收消息的部分。注意这一行
写(fd[1], 缓冲区, (strlen(buffer)+1));
-- 我认为这是成为问题根源的好人选,但不知道该怎么做。 (尝试了 fwrite() 并且根本不起作用。)
fd = malloc(2 * sizeof(int));
int nbytes;
if (pipe(fd) < 0) {
perror("Could not create pipe");
return -1;
}
pID = fork();
if (pID < 0) {
perror("Failed to fork");
return -1;
} else if (pID == 0) { // child
close(fd[0]); // close input side of pipe
int cc;
int fsize;
struct sockaddr_in from;
int serials[500];
int i;
for (i = 0; i < 500; i++) serials[i] = 0;
char buffer[2048];
while (1) {
fsize = sizeof(from);
cc = recvfrom(socketNo, buffer, 2048, 0, (struct sockaddr*)&from, &fsize);
if (cc < 0) perror("Receive error");
datagram data = decodeDatagram(buffer);
if (serials[data.serial] == 0) {
write(fd[1], buffer, (strlen(buffer)+1));
serials[data.serial] = 1;
}
}
} else { // parent
close(fd[1]); // close output side of pipe
return 0;
}
(“序列”数组用于不转发重复的消息,因为消息被多次发送以提高可靠性。我知道这个数组的固定大小不是好的做法,但是这个分配的测试不会发送那个很多消息,所以在这种情况下没关系。)
接收函数的开头是这样的:
int fRecv(int* id, char* buf, int nbytes) {
checkDatagramTable(*id);
char* tbuf = malloc((nbytes + 9) * sizeof(char));
int rbytes = read(fd[0], tbuf, nbytes + 9);
“+9”用于容纳与要发送的消息一起打包的附加信息,用于刷新通道排序。这也是一个相当粗略的区域,但分配更多空间以更加确定并没有解决问题。
我知道这里有很多无关的东西,对其他函数的引用等。但问题肯定在于我如何通过管道传输数据,所以我的问题的根源应该在某个地方。
提前感谢您的帮助;真的很感激。
【问题讨论】:
-
你每次通过
while(1)循环分配一个新的buffer——为什么?我不明白为什么它是动态分配的而不是堆栈分配的,我不明白为什么它会在这个函数之外持续存在。 -
顺便说一下,
strace(1)在尝试追踪问题时可能真的很有帮助。这就像每个系统调用上的免费printf(3)行。 -
我不记得我为什么这样做,但显然有一个很好的理由,因为将其更改为堆栈分配会导致编译器发出一些看起来非常不祥的警告。为什么?您认为这与我遇到的问题有关吗?
-
我很好奇你收到的警告——但这不应该是你遇到的错误,它只是一个简单的内存泄漏。您可能甚至不会注意到几十万条消息。
-
原来警告是由于我搞砸了更改。在凌晨 2 点 30 分编辑代码并不是一个好主意——我想我会在早上睡觉并解决这个问题。