【问题标题】:Best practices for creating csv file(s) with multiple record types创建具有多种记录类型的 csv 文件的最佳实践
【发布时间】:2020-03-31 00:22:32
【问题描述】:

我正在尝试为复杂类型构建 csv 文件格式,该文件格式类似于具有车轮 (B) 和扬声器 (C) 的汽车 (A),其中每个实体(汽车、车轮、扬声器) 也会有自己特定的属性(例如汽车的颜色、车轮的气压、扬声器的分贝)。
我想知道是否有关于以 csv 格式组织多个记录类型(在本例中为这 3 个实体)的一般最佳实践,这使得从文件中提取数据更简单且无错误。
我应该为每种记录类型创建 1 个文件,还是可以将所有这 3 个文件分组到一个文件中?
如果我将它们放在单个文件中,我应该按实体类型 (A-A-A-B-B-B-C-C-C) 还是按对象 (A-B-C-A-B-C-A-B-C) 将它们组织在一起?

csv 文件将每天作为批处理加载到 SQL 数据库中,该数据库在规范化结构中具有这 3 个实体关系。

【问题讨论】:

    标签: sql csv design-patterns csvhelper


    【解决方案1】:

    CSV 文件没有标准,但按照惯例,CSV 文件只包含一种记录类型,因此该文件本质上相当于一个表。以任何顺序在单个 CSV 文件中混合三种记录类型都不是最佳实践。相反,编写三个不同的 CSV 文件或以旨在包含结构化记录类型(例如 JSON 或 XML)或多个表(例如 HDF5)的格式写入数据。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-11-26
      • 2016-08-19
      • 2011-05-09
      • 2018-12-22
      • 1970-01-01
      • 1970-01-01
      • 2021-06-16
      相关资源
      最近更新 更多