【发布时间】:2018-09-12 07:03:48
【问题描述】:
我正在尝试将字符串转换为日期时间对象。这些字符串存储在 csv 列中。文件很大,我想多处理它。
我的代码如下所示:
def conv_datetime(file):
return ([pd.to_datetime(j[3]) for j in file])
if __name__ == "__main__":
n = 0
file = pd.read_csv("csv_file",header=None,chunksize=200,skiprows=n)
n += 200
pro = mp.Process(target=conv_datetime,args=(file,))
pro.deamon = False
pro.start()
pro.join()
我得到了:
AttributeError
Traceback (most recent call last)
<ipython-input-1-5d16d82af0d2> in <module>()
15 pro = mp.Process(target=conv_datetime,args=(file,))
16 pro.deamon = False
---> 17 pro.start()
18 pro.join()
19
C:\ProgramData\Anaconda33\lib\multiprocessing\process.py in start(self)
103 'daemonic processes are not allowed to have children'
104 _cleanup()
--> 105 self._popen = self._Popen(self)
106 self._sentinel = self._popen.sentinel
107 # Avoid a refcycle if the target function holds an indirect
C:\ProgramData\Anaconda33\lib\multiprocessing\context.py in _ Popen(process_obj)
221 @staticmethod
222 def _Popen(process_obj):
--> 223 return _default_context.get_context().Process._Popen(process_obj)
224
225 class DefaultContext(BaseContext):
C:\ProgramData\Anaconda33\lib\multiprocessing\context.py in _Popen(process_obj)
320 def _Popen(process_obj):
321 from .popen_spawn_win32 import Popen
--> 322 return Popen(process_obj)
323
324 class SpawnContext(BaseContext):
C:\ProgramData\Anaconda33\lib\multiprocessing\popen_spawn_win32.py in __init__(self, process_obj)
63 try:
64 reduction.dump(prep_data, to_child)
---> 65 reduction.dump(process_obj, to_child)
66 finally:
67 set_spawning_popen(None)
C:\ProgramData\Anaconda33\lib\multiprocessing\reduction.py in dump(obj, file, protocol)
58 def dump(obj, file, protocol=None):
59 '''Replacement for pickle.dump() using ForkingPickler.'''
---> 60 ForkingPickler(file, protocol).dump(obj)
61
62 #
AttributeError: Can't pickle local object '_make_date_converter.<locals>.converter'
在有人为我提供代码解决方案之前,如果能够深入了解守护进程的工作原理,那将非常有帮助。
【问题讨论】:
-
对不起。我已经添加了整个错误语句。
-
没问题;既然您已经对其进行了编辑,这是一个很好的问题。
-
你能给我一些参考迷你项目/github 链接,这些链接在我正在尝试做的类似丁字裤上工作吗?
-
对不起,我不知道任何副手。我认为
dill的一些示例与您正在做的非常接近,如果您想使用它来代替标准的pickle。 -
顺便说一句,您似乎使用的是相当旧的 Anaconda 版本。如果是,可以升级吗?在过去的几年里,Python 3 中的
multiprocessing有了一些改进,Anaconda 还添加了新的预安装包(包括dill和cloudpickle)。
标签: python csv datetime multiprocessing daemon