【问题标题】:Segmentation fault when calling PyObject_CallObject() the second time第二次调用 PyObject_CallObject() 时出现分段错误
【发布时间】:2018-01-07 13:38:07
【问题描述】:

我正在编写一个调用 python 脚本的 c++ 类。但是当我再次调用该方法时,它停止工作。我到处搜索,没有发现任何线索。我以为是因为引用计数问题,所以我删除了所有Py_DECREF 调用,但仍然没有帮助。

这是c++代码(在原代码中,我每次在RunModel中调用PyObject_GetAttrString,但在第二次调用gdb中表示第二个func<Py_NoneStruct>。所以我改成这个):

#include <Python.h>
#include <fstream>
#include <iostream>
#include <stdexcept>
#include <thread>

using namespace std;

class PyRecognitionContext {

  PyObject *module, *func, *result, *args;

  public:

  PyRecognitionContext(int argc, char **argv) {
    Py_Initialize();
    PySys_SetArgv(argc, argv);
    module = PyImport_Import(PyString_FromString("model.t"));
    if (module == NULL) {
      PyErr_Print();
      throw std::invalid_argument("fails to import the module");
    }
  }

  ~PyRecognitionContext() {
    Py_Finalize();
  }

  void LoadModel(std::string model) {
    func = PyObject_GetAttrString(module, "load");
    args = PyTuple_New(1);
    PyTuple_SetItem(args, 0, PyString_FromString(model.c_str()));
    PyObject_CallObject(func, args);
    func = PyObject_GetAttrString(module, "run");
  }

  char* RunModel(const char *imageBytes, size_t size) {
    args = PyTuple_New(1);
    PyTuple_SetItem(args, 0, PyByteArray_FromStringAndSize(imageBytes, size));
    result = PyObject_CallObject(func, args);
    char* resultStr = PyString_AsString(result);
    return resultStr;
  }

};

int task(PyRecognitionContext pr, string fileName) {
  cout << "//";
  cout << fileName << endl;
  std::ifstream ifs(fileName, ios::binary|ios::ate);
  size_t imgSize = ifs.tellg();
  char *result = new char[imgSize];
  ifs.seekg(0, ios::beg);
  ifs.read(result, imgSize);
  ifs.close();
  std::cout << pr.RunModel(result, imgSize) << endl;
  return 0;
}

int main(int argc, char *argv[]) {
  PyRecognitionContext pr(argc, argv);
  pr.LoadModel("/home/dickzhou/data/sex_256/cp/");
  cout << "//loaded" << endl;

  task(pr, "/home/dickzhou/data/face/male/24-28/24/135.JPG");
  task(pr, "/home/dickzhou/data/face/female/24-28/24/138.JPG");

  //thread t1(task, pr, "/home/dickzhou/data/face/male/24-28/24/135.JPG");
  //thread t2(task, pr, "/home/dickzhou/data/face/female/24-28/24/125.JPG");

  //t1.join();
  //t2.join();

  cout << "//done" << endl;
  return 0;
}

我使用以下方法编译它:

g++ -I/usr/include/python2.7 -I/usr/include/python2.7 -fno-strict-aliasing -O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector-strong --param=ssp-buffer-size=4 -grecord-gcc-switches -m64 -mtune=generic -D_GNU_SOURCE -fPIC -fwrapv -DNDEBUG -O1 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector-strong --param=ssp-buffer-size=4 -grecord-gcc-switches -m64 -mtune=generic -D_GNU_SOURCE -fPIC -fwrapv -lpthread -ldl -lutil -lm -lpython2.7 -Xlinker -export-dynamic -std=c++11 pdr.cpp

这是我的 gdb 输出:

(gdb) break 40
Breakpoint 1 at 0x401f47: file pdr.cpp, line 40.
(gdb) run
Starting program: /home/dickzhou/data/sex_256/c++/a.out
[Thread debugging using libthread_db enabled]
Using host libthread_db library "/lib64/libthread_db.so.1".
//loaded
///home/dickzhou/data/face/male/24-28/24/135.JPG

Breakpoint 1, RunModel (size=14637, imageBytes=0x6e5270 "\377\330\377", <incomplete sequence \340>, this=0x7fffffffe040) at pdr.cpp:40
40          result = PyObject_CallObject(func, args);
Missing separate debuginfos, use: debuginfo-install glibc-2.17-105.el7.x86_64 libgcc-4.8.5-16.el7.x86_64 libstdc++-4.8.5-4.el7.x86_64 python-libs-2.7.5-34.el7.x86_64
(gdb) p func
$1 = (PyObject *) 0x2aaaaabfa9b0
(gdb) p args
$2 = (PyObject *) 0x2aaaaabf2d10
(gdb) c
Continuing.
a
///home/dickzhou/data/face/female/24-28/24/138.JPG

Breakpoint 1, RunModel (size=13572, imageBytes=0x68d9f0 "\377\330\377", <incomplete sequence \340>, this=0x7fffffffe040) at pdr.cpp:40
40          result = PyObject_CallObject(func, args);
(gdb) p func
$3 = (PyObject *) 0x2aaaaabfa9b0
(gdb) p args
$4 = (PyObject *) 0x2aaaaab8bbd0
(gdb) c
Continuing.

Program received signal SIGSEGV, Segmentation fault.
0x00002aaaab33c09a in PyObject_Call () from /lib64/libpython2.7.so.1.0
(gdb)

一个最小的python代码是:

def load(str):
    pass

def run(bytes):
    return "a"

【问题讨论】:

  • 从不检查 Python 函数的返回值。您必须始终检查返回值并对其采取行动!
  • @AnttiHaapala 我只是快速制作原型,肯定会收拾这个烂摊子。我认为这与问题无关,对吧?
  • 很可能,但我们现在不知道会不会!?!
  • 反正Py_NoneStructNone的实现对象,所以你的函数是None,而None是不可调用的,所以PyObject_CallObject会返回NULL。跨度>
  • @AnttiHaapala 感谢您的帮助。但是在我贴的代码中,func 不是None,你可以在gdb 输出中看到。它与上次调用的值相同。我什至刚才检查了一下,然后PyCallable_Check(func) 返回了1,我认为这意味着它可以被调用。

标签: python c++ segmentation-fault


【解决方案1】:

您的实际问题不是关注Rule of Zero。您有一个资源类(资源是以后需要释放的任何东西)手动管理。那不行。

PyRecognitionContext 的实例被复制,Py_Finalize() 被调用两次,而且还过早地调用。

全局 Python 上下文需要初始化和完成。我们可以将其委托给一个单独的类以促进单一职责原则。

struct PyContext
{
    PyContext()
    {
        Py_Initialize();
    }

    ~PyContext()
    {
        Py_Finalize();
    }

    PyContext& operator=(const PyContext&) = delete;
    PyContext(const PyContext&) = delete;
    PyContext& operator=(PyContext&&) = delete;
    PyContext(PyContext&&) = delete;
};

现在您可以将该类的成员放入您的 PyRecognitionContext

class PyRecognitionContext {
    PyContext pyContext;

    // ... rest of the code
};

这会将运行时错误移至编译时。

其他 Python 对象也是资源,因为它们需要被释放。 We can use std::unique_ptr with a custom deleter to manage these.

【讨论】:

    【解决方案2】:

    感谢大家的帮助,我已经解决了这个问题。

    问题在于解构函数被调用了两次,因为task 函数是按值传递的。我将其更改为传递引用:

    int task(PyRecognitionContext *pr, string fileName) {
      cout << "//";
      cout << fileName << endl;
      std::ifstream ifs(fileName.c_str(), ios::binary|ios::ate);
      size_t imgSize = ifs.tellg();
      char *result = new char[imgSize];
      ifs.seekg(0, ios::beg);
      ifs.read(result, imgSize);
      ifs.close();
      std::cout << pr->RunModel(result, imgSize) << endl;
      return 0;
    }
    

    【讨论】:

    • 你也在泄漏内存,分配的字节串永远不会被释放。
    猜你喜欢
    • 1970-01-01
    • 2018-05-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多