【发布时间】:2022-11-10 15:39:10
【问题描述】:
我正在尝试使用 pandas-dedupe,但在标记数据后,我遇到了无法解决的权限问题。最小工作示例:
import pandas_dedupe
import seaborn as sns
if __name__ == "__main__":
iris = sns.load_dataset('iris')
result = pandas_dedupe.dedupe_dataframe(iris, ["sepal_width", "sepal_length", "species"])
标记一些数据后,文件dedupe_dataframe_learned_settings 和dedupe_dataframe_training.json 被创建。
但是在重复数据删除过程中,我遇到了类似的错误
PermissionError: [WinError 32] The process cannot access the file because it is being used by another process: 'C:\\Users\\THOMAS~1\\AppData\\Local\\Temp\\tmp_vrp9vbr'
我尝试在dedupe_dataframe 方法中设置n_cores=1,但这对我没有帮助。我能做些什么?
【问题讨论】:
标签: python pandas windows duplicates permissionerror