【发布时间】:2017-04-07 18:09:26
【问题描述】:
这是由 Stanford GLOVE 项目提供的流行的预训练词向量文件。它通常用于自然语言应用程序。
解析错误可能是我试图修复的一些不可预测行为的根本原因。在这个十六进制框架上执行 as.data.frame 之后出现了奇怪的东西(未显示)。所以我想以某种方式修复这个早期的错误。
# How to eliminate parse error?
g6B = h2o.importFile(path = "/mnt/fastssd/glove/glove.6B/glove.6B.100d.txt", header=FALSE, na.strings=NA, sep=" ")
WARNING: ParseError at file nfs://mnt/fastssd/glove/glove.6B/glove.6B.100d.txt at byte offset 7674; error = 'Unmatched quote char "'
|======================================================================| 100%
Warning message in doTryCatch(return(expr), name, parentenv, handler):
“ParseError at file /mnt/fastssd/glove/glove.6B/glove.6B.100d.txt at byte offset 7674; error = 'Unmatched quote char "'”
H2O 中是否有解决此错误的方法?如果没有,那么还有什么方法?谢谢
【问题讨论】:
-
您能否提供该文件中内容的快照(头部)?我需要看看那个文件的格式是什么:sparse 还是 CSV 或者别的什么?
-
在从 Kaggle 的“Two Sigma Connect: Rental Listing Inquiries”竞赛中读取测试文件时遇到了类似的错误:kaggle.com/c/two-sigma-connect-rental-listing-inquiries/data