【发布时间】:2017-05-19 01:22:19
【问题描述】:
我有一个带有双引号分隔时间戳和电子邮件字段的 CSV 文件,例如
Timestamp,Email
"2017-01-01 00:00:01",abc@email.com
"2017-01-01 00:02:31",sampleaddress@email2.com
我为 CSV 文件定义了一个元数据源,它能够正确识别和键入两列。但是,当我执行包时,它会将时间戳列视为不存在(通常我收到错误“无法解析的日期:“abc@email.com”')
我尝试使用多种设置更改 tFileInputDelimited,包括转义和文本附件选项,并将时间戳作为日期和字符串导入(如果我将其作为字符串导入,则时间戳字段包含电子邮件地址和电子邮件地址为空白),但我无法让导入识别双引号分隔的时间戳列的存在。
我假设我做了一些导致它转义整个时间戳值的事情,但我想不出那可能是什么。
【问题讨论】:
-
双引号来自 mailchimp 摘录。我无法控制输入格式。
-
我通过重置组件以使用存储库中定义的元数据解决了这个问题,但这些其他解决方案也有效。
标签: csv talend double-quotes