【发布时间】:2017-12-19 11:47:21
【问题描述】:
有时在训练后或当我按 CTRL + C 手动停止训练时,我会收到以下 cuda 错误:
检查失败:错误 == cudaSuccess (30 vs. 0) 未知错误
不过,这只是最近才开始发生的。有没有人经历过,或者您知道如何解决这个问题或问题是什么?
完整的日志:
I1027 09:29:37.779079 11959 caffe.cpp:217] Using GPUs 0
I1027 09:29:37.780676 11959 caffe.cpp:222] GPU 0: �|���
F1027 09:29:37.780697 11959 common.cpp:151] Check failed: error == cudaSuccess (30 vs. 0) unknown error
*** Check failure stack trace: ***
@ 0x7f6cc4f465cd google::LogMessage::Fail()
@ 0x7f6cc4f48433 google::LogMessage::SendToLog()
@ 0x7f6cc4f4615b google::LogMessage::Flush()
@ 0x7f6cc4f48e1e google::LogMessageFatal::~LogMessageFatal()
@ 0x7f6cc5558032 caffe::Caffe::SetDevice()
@ 0x40b3f8 train()
@ 0x407590 main
@ 0x7f6cc3eb7830 __libc_start_main
@ 0x407db9 _start
@ (nil) (unknown)
【问题讨论】:
-
由于程序
caffe仍在运行或持有资源而出现此问题。在这种情况下它可能会被杀死,请参阅下面的答案