【发布时间】:2016-04-12 04:02:54
【问题描述】:
我有以下格式的数据(样本数据,有很多行):
"Rec Open Date","number 1","number 2","Data Volume (Bytes)","Device Manufacturer","Device Model","Product Description"
"2015-10-06","0427","70060","137765","Samsung Korea","Samsung SM-G900I","$39 option"
"2015-10-06","7592","55620","0","Apple Inc","Apple iPhone 6 (A1586)","some text #16"
...
我想知道的是,将其导入 mysql 的最佳格式/实践是什么?
一些具体问题是:
- 日期应该是“2015-10-06”
- 第 2、3 和 4 列是否应为带双引号的字符串格式,例如“0427”
- 对于列标题,我应该删除所有空格和括号
- 其他的
也许我的数据在导入我的数据库之前看起来会更好:
- 用下划线替换所有空格
- 去掉括号
- 通过删除双引号将第 2、3 和 4 列转换为值
看起来像这样:
"Rec_Open_Date","number_1","number_2","Data_Volume_Bytes","Device_Manufacturer","Device_Model","Product_Description"
"2015-10-06",0427,70060,137765,"Samsung Korea","Samsung SM-G900I","$39 option"
"2015-10-06",7592,55620,0,"Apple Inc","Apple iPhone 6 (A1586)","some text #16"
...
再次只是在寻找最佳实践。
下一个问题是是否有一个解析器可以完成所有这些工作,可能是 bash 或其他等效的?
【问题讨论】:
-
CSV 文件的顺序应与导出数据的顺序完全相同。导出的数据应与导入的 csv 数据相同。
-
所以你会按原样导入,而不做任何更改?
-
你应该对数据库进行数据库更改;不在 csv 上。
-
我该怎么做?只是要清楚。我是否按原样导入,然后在数据库中进行更改(名称更改等),不确定我是否完全遵循...