【问题标题】:In what cases I may lose access to pointer allocated by malloc?在什么情况下,我可能无法访问 malloc 分配的指针?
【发布时间】:2012-09-25 08:44:02
【问题描述】:

编辑:更改标题以忽略我的假设。

我有一个用 c 编写的库,它使用 posix 消息队列在线程之间传递指向某些运行时数据的指针。

在数据来自用户应用程序的情况下,一切似乎都运行良好,并且我能够访问来自消息队列的结构指针所指向的数据。

现在,我有一个特殊情况,库本身将对结构的一个实例进行 malloc,设置一个标志并将其发送到同一个队列。在接收端,结构为空,标志为零。在指针上调用 free 会导致崩溃。

代码如下:

volatile s_thestruct * volatile data = malloc(sizeof(s_thestruct));
data->flags = THE_FLAG;
mq_send(handle, (char *)&data, sizeof(s_thestruct *), 1)

在接收端:

ssize_t read = mq_receive(handle, (char*)&data, sizeof(s_thestruct*), NULL);
if(read != sizeof(s_thestruct *))
{
 // Error handling, no problems here
}
if(data->flags == THE_FLAG)
{
// Do something, never gets here
}
// Do something else, no it is not freed here

// Finally
free(data); // <--CRASH

我会得到:

*** glibc detected *** /usr/bin/applicationthingy: free(): invalid pointer: 0x08053cf0 ***

随后是转储。 在内存映射转储中我发现:

....
08048000-0804a000 r-xp 00000000 08:01 802680     /usr/bin/applicationthingy
0804a000-0804b000 r--p 00001000 08:01 802680     /usr/bin/applicationthingy
0804b000-0804c000 rw-p 00002000 08:01 802680     /usr/bin/applicationthingy
0804c000-0806f000 rw-p 00000000 00:00 0          [heap]
b6e00000-b6e21000 rw-p 00000000 00:00 0 
....

那么,有人对这里发生的事情有任何建议吗?

【问题讨论】:

  • 您应该使用gcc -Wall -g 编译您的应用程序,改进它直到没有给出警告,然后使用valgrind.orggdb 来调试该问题。您应该检查malloc 是否失败。
  • 你确定这是正确的:sizeof(s_thestruct *)) 在发送和接收?
  • @Kiril 是的。我只想传递指向结构的指针。我没有通过消息队列传递整个结构。这实际上在正常更复杂的情况下工作正常,其中其他数据是从这个库的用户应用程序传递的。这只发生在库分配结构只是为了传递标志的特殊情况下。我怀疑编译器或 malloc 优化了一些东西,但我可以弄清楚是什么以及为什么。
  • @Rohan 的回答是正确的。您也不应该使用volatile (stackoverflow.com/questions/2484980/…)。您需要显式强制转换的事实是您做错了什么的另一个确定信号。
  • 你的身体似乎错过了发送 指针 的事实,而不是它指向的数据。因此,&amp;data 是正确的。

标签: c pthreads malloc ipc message-queue


【解决方案1】:

假设它们来自同一个地址空间,那(传递指针)应该可以正常工作。

我唯一能想到的是,队列是否有可能从一个单独的进程中写入?这会使指针变得无用,因为它们指向的内容在不同的进程中完全不同。

老实说,除非结构本身很大,否则我不会这样传递指针。如果您通过该结构,您将获得能够进行适当的进程间队列的所有优势。

要检查的另一件事是,库以某种方式从与您的主代码不同的内存领域获取其分配。这种情况会导致 free 失败,但可能不是错误的标志,因为即使它们使用不同的 arena,它们也会位于相同的地址空间中。

至少,您应该在发送端和接收端打印出data 的值,以确保它完好无损地通过。完全有可能一些其他代码可能会破坏它(la缓冲区溢出等等)。

【讨论】:

  • 谢谢!我想我知道这里发生了什么。消息队列的描述符在程序初始化时打开。在这种情况下,我正在运行一个测试程序,该程序在运行 pthreads 之上,还派生了新进程。我实际上考虑了使用 getpid() 的唯一队列,但由于早期初始化,正在发生一些有趣的事情。
【解决方案2】:

您应该在mq_send(handle, (char *)&amp;data, sizeof(s_thestruct *), 1) 中传递data 而不是&amp;data(数据地址)。

【讨论】:

  • 我原本是这么想的,但我不相信是这样。 OP 将指针本身作为消息发送,“mq_send() 函数应添加由参数 msg_ptr 指向的消息指向”。使用data 将发送消息结构的前四个(/八)字节而不是地址。
  • 不。我实际上需要传递指针的地址,因为 mq_send 转换为 (char *)。如果没有这种间接,它将从结构的实际内容中发送前四个字节。
  • @paxdiablo,我不认为这是有效的。在data 中分配、初始化和分配了一个内存,该地址需要传递。使用&amp;data,它的传递地址存储分配的地址,&amp;data 在接收器读取时可能不包含有效数据(函数返回等)。
  • 正如@ugoren 指出的那样,由于传递的消息的大小,这可能是个问题。
  • 我很确定 mq_send 将其数据复制到队列中——事实上我依赖它,将本地数据发送到队列然后返回。无论是结构还是指针都没有关系。这意味着在 mq_send() 之后堆栈值是否消失并不重要,队列上的指针仍然有效,因为它已经被复制了。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-02-24
  • 1970-01-01
  • 2016-07-30
  • 1970-01-01
  • 2020-11-08
相关资源
最近更新 更多