【问题标题】:OrientDB import from CSV, nullValue property从 CSV 导入 OrientDB,nullValue 属性
【发布时间】:2016-01-11 03:04:01
【问题描述】:

我正在尝试将伪造的 CSV 文件导入 OrientDB Server 2.1.2。 ETL 工具看起来很棒,允许人们输入许多选项,但是在我看来,csv 转换器(当我尝试使用 CSV 提取器时,我得到了一个Extractor 'csv' not found 错误)没有正确解释“nullValue”选项。

我使用以下 JSON 尝试加载一个简单文件,当在数据和 JSON 中使用“NULL”作为空值时,我可以正确导入文件,而使用“?”我不能。 `

{
    "source": { "file": {"path": "Z:/test.tsv"}},
    "extractor": { "row": {}},
    "transformers": [
        {"csv": {
            "separator": "  ",
            "nullValue": "?",
            "columnsOnFirstLine": true,
            "columns": [
                "a:STRING",
                "b:STRING",
                "c:String",
                "n:Integer"
            ],
            "dateFormat": "dd.mm.yyyy"
            }
        },
        {"vertex": {"class": "Test", "skipDuplicates": true}}
    ],
    "loader": {
        "orientdb": {
            "dbURL": "plocal:C:/Users/taatoal1/tmp/orientdb/databases/test",
            "dbType": "graph",
            "classes": [
                {"name": "Test"}
            ]
        }
    }
}

`

数据如下: a b c 1 a0 b0 c0 2 a1 b1 c1 ?

我做错了吗?

【问题讨论】:

    标签: orientdb csv-import


    【解决方案1】:

    我的建议是尝试(刚刚发布的)最新版本,2.1.4:Orient Download 在 2.1.4 中,我们添加了对 CSV 提取器的支持,它在内部使用 Apache 的 commons-csv。

    【讨论】:

    • 我试过了:CSV 提取器存在,但“?”有问题仍然存在,当我在数据和 ETL 配置中都使用“NULL”时消失。这是输出的一部分:OrientDB etl v.2.1.4 (build @BUILD@) www.orientdb.com BEGIN ETL PROCESSOR [file] INFO Reading from file Z:/projects/employees2graph/final_data/orientdb/test.tsv with encoding UTF-8 {a:a,b:b,c:c,n:1} {a:a0,b:b0,c:c0,n:2} Exception in thread "main" java.util.IllegalFormatConversionException: d != java.lang.String
    • 能否请您填写问题请求:github.com/orientechnologies/orientdb-etl/issues
    • 嗨,我们刚刚提升 ETL 成为核心模块的一部分。你的问题也被转移了:github.com/orientechnologies/orientdb/issues/5154。您可以等待下一个修补程序版本 (2.1.5) 或从源代码构建 etl jar。 注意:来源现在位于主要的 orientDB repo github.com/orientechnologies/orientdb
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-09-27
    • 1970-01-01
    • 1970-01-01
    • 2018-11-28
    相关资源
    最近更新 更多