【发布时间】:2021-01-18 17:42:44
【问题描述】:
有没有办法在 Julia 的 CSV.read 上实现多线程? Parallelism for reading a large file in Julia 中提供了一个读取大文件的好例子。
但由于我必须经常更改我的数据集,这些方法可能不适用。
using CSV
file = ("C:\\Users\\User\\Desktop\\Datasets\\X_train_sat4.csv")
@time df = CSV.read(file, DataFrame)
Output:
69.469112 seconds (6.29 M allocations: 9.767 GiB, 0.76% gc time)
29723 rows × 2456 columns
我已经使用了Speed up loading and compilation time 此处推荐的步骤,但这些步骤只改善了第一次加载时间。
提前致谢!
【问题讨论】:
标签: multithreading csv julia