【发布时间】:2013-10-16 04:11:26
【问题描述】:
我正在尝试将一个大的 csv 文件导入 Mysql。不幸的是,文件中的数据由空格和制表符分隔。
结果,每当我将数据加载到我的表中时,我都会得到无数的空单元格(因为 Mysql 只识别一个字段分隔符)。不能在导入前修改数据。
以下是数据示例:
# 1574 1 1 1
$ 1587 6 6 2
$115 1878 8 9 23
(每行的第二个和第三个值用制表符分隔)
有什么想法吗?
【问题讨论】:
我正在尝试将一个大的 csv 文件导入 Mysql。不幸的是,文件中的数据由空格和制表符分隔。
结果,每当我将数据加载到我的表中时,我都会得到无数的空单元格(因为 Mysql 只识别一个字段分隔符)。不能在导入前修改数据。
以下是数据示例:
# 1574 1 1 1
$ 1587 6 6 2
$115 1878 8 9 23
(每行的第二个和第三个值用制表符分隔)
有什么想法吗?
【问题讨论】:
如果我的目标只是导入文件,我会使用sed -i 's/,/ /g' *.txt 来创建一个需要担心的分隔符。
我喜欢 CSV,但也许有一个包含逗号或空格的双引号括起来的字符串,在这种情况下这并不完美。它仍然会导入,只是会修改这些字符串。
在这种情况下,我在生产中使用的另一种方法是 Stat/Transfer。有一种语法语言可以创建一个 shell 脚本来转换文件并指定多个分隔符。
【讨论】:
假设您正在使用 LOAD DATA INFILE 试试这个:
load data local infile 'c:/somefile.txt' into table tabspace
columns terminated by ' '
(col1, @col23, col4, col5)
set col2 = left(@col23, instr(@col23,char(9))-1),
col3 = substr(@col23,instr(@col23,char(9))+1);
请注意,分隔符是一个空格,因此第二列包含 col2/col3 数据。这分配给变量@col23,然后将其拆分并将部分分配给col2和col3。
【讨论】: