【发布时间】:2021-01-12 11:19:36
【问题描述】:
我正在尝试使用以下代码(来自 parquetjs-lite 和 stackoverflow 示例)来读取 nodejs 中的 parquet 文件:
const readParquetFile = async () => {
try {
// create new ParquetReader that reads from test.parquet
let reader = await parquet.ParquetReader.openFile('test.parquet');
}
catch (e){
console.log(e);
throw e;
}
// create a new cursor
let cursor = reader.getCursor();
// read all records from the file and print them
let record = null;
while (record = await cursor.next()) {
console.log(record);
}
await reader.close();
};
当我运行这段代码时,什么也没有发生。控制台没有写入任何内容,出于测试目的,我只使用了一个小的 csv 文件,我使用 python 将其转换为 parquet。
- 是因为我已经使用 python 从 csv 转换为 parquet(我找不到任何 JS 等价于我最终必须能够使用的大文件)。
- 我希望我的应用程序能够接收并读取任何 parquet 文件。 parquetjs-lite 在这方面是否有任何限制。
- 我的 CSV 中有 NaN 值,这可能是个问题吗?
任何指针都会有所帮助。
谢谢
【问题讨论】:
标签: javascript node.js apache parquet apache-arrow