【发布时间】:2019-07-26 02:00:06
【问题描述】:
我正在尝试使用 nodejs 读取 parquet 文件:
var parquet = require('parquetjs');
(
async () => {
try {
// create new ParquetReader that reads from 'fruits.parquet`
let reader = await parquet.ParquetReader.openFile('f1.snappy.parquet');
// create a new cursor
let cursor = reader.getCursor();
// read all records from the file and print them
let record = null;
while (record = await cursor.next()) {
console.log(record);
}
} catch (e) {
console.log('error while reading a parquet file:\n', e)
}
}
) ();
得到错误:
error while reading a parquet file:
invalid page type: DICTIONARY_PAGE
相同的 parquet 文件 - 我可以毫无问题地使用 Python pyarrow 库进行阅读..
可能是什么原因?
【问题讨论】:
-
我也有同样的问题。
-
有人找到解决这个问题的方法吗?
-
我也有同样的问题。你有没有以某种方式修复它? @user9750148
标签: javascript typescript module parquet