【问题标题】:Resume the previous aborted COPY in CQL在 CQL 中恢复之前中止的 COPY
【发布时间】:2013-08-14 08:50:25
【问题描述】:

使用 CQL 中提供的COPY 命令将大型 csv 文件导入 Cassandra 表时,有时会出现某些字段输入错误,从而导致如下错误:

Bad Request: line 1:1033 no viable alternative at input ','
Aborting import at record #277561 (line 277562). Previously-inserted values still present.
277561 rows imported in 8 minutes and 20.296 seconds.

识别并修复错误输入的字段后,接下来就是将 csv 文件的其余部分移植到表中。我能知道有没有好方法来恢复以前中止的 COPY 以便以前插入的行不会再次重新插入?或者,是否可以从csv文件的指定行而不是csv文件的开头执行COPY

【问题讨论】:

  • 为什么不删除你知道你已经插入的行?
  • 因为csv文件很大,编辑和存储需要很长时间:(
  • 检查csvfix。它可以将指定行之后的所有行删除到一个单独的文件中,听起来对你很有用。
  • 试过 csvfix,但还是很慢 :~

标签: csv copy cassandra cql


【解决方案1】:

parameter list 似乎没有指定文件中从哪一行开始的选项,因此您似乎无法指定从哪里开始。如果您认为这很有用,您可以报告您的问题并使用 Cassandra JIRA 请求实现此类功能。

但是,这种功能似乎是多余的,您可以通过删除您知道已经插入到 cassandra 中的数据来编辑 csv 文件。

【讨论】:

    猜你喜欢
    • 2019-01-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-02-20
    • 2013-09-22
    相关资源
    最近更新 更多