【问题标题】:Converting sublist of string (csv) to float (list comprehension)将字符串(csv)的子列表转换为浮点数(列表理解)
【发布时间】:2018-07-10 06:14:00
【问题描述】:

我尝试读取一个 csv 文件,我需要将其转换为浮点数列表以进行评估。该列表如下所示:

[['Time [s];17063_X;17063_Y;17063_Z;17064_X;17064_Y;17064_Z;17065_X;17065_Y;17065_Z;17067_X;17067_Y;17067_Z;17068_X;17068_Y;17068_Z'], ['0;0.01952;0.04337;0.0242;0.01151;0.04152;0.03236;0.00015;-0.01679;0.05328;0.02872;0.01717;0.09341;0.01452;0.01489;0.07444'], ['0.00042;0.02188;0.04351;0.02803;0.0062;0.04108;0.03312;-0.00529;-0.01412;0.05167;0.02173;0.01377;0.04098;0.00807;0.00246;0.04354'],...]

但实际上它有超过 17000 个附加条目。我需要的列表应该是这样的:

[['Time [s]', '17063_X', '17063_Y', '17063_Z', '17064_X', '17064_Y', '17064_Z', '17065_X', '17065_Y', '17065_Z', '17067_X', '17067_Y', '17067_Z', '17068_X', '17068_Y', '17068_Z'], [0, 0.01952, 0.04337, 0.0242, 0.01151, 0.04152, 0.03236, 0.00015, -0.01679, 0.05328, 0.02872, 0.01717, 0.09341, 0.01452, 0.01489, 0.07444], ...]

到目前为止,我设法将单行(列表中的最后一个元素)转换为这种格式,但不是所有列表。这是我到目前为止所得到的:

import csv

with open(filepath, 'r') as f:
  reader = csv.reader(f)
  data = list(reader)

for j in range(1, len(data)):    # this loop does nothing?!
    for i in data[j]:
    dt = i.split(';')

da = [float(i) for i in dt]
print(da)

输出:

[0.005, 0.0207, 0.02925, 0.02095, 0.02332, 0.04211, 0.02223, 0.0075, -0.01961, 0.05093, 0.02604, 0.00711, 0.06644, 0.00689, -0.00092, 0.04737]  

在列表理解方面,我将不胜感激任何帮助和一些提示。 谢谢!

【问题讨论】:

    标签: python string csv split


    【解决方案1】:

    你可以试试:

    data=[['Time [s];17063_X;17063_Y;17063_Z;17064_X;17064_Y;17064_Z;17065_X;17065_Y;17065_Z;17067_X;17067_Y;17067_Z;17068_X;17068_Y;17068_Z'], ['0;0.01952;0.04337;0.0242;0.01151;0.04152;0.03236;0.00015;-0.01679;0.05328;0.02872;0.01717;0.09341;0.01452;0.01489;0.07444'], ['0.00042;0.02188;0.04351;0.02803;0.0062;0.04108;0.03312;-0.00529;-0.01412;0.05167;0.02173;0.01377;0.04098;0.00807;0.00246;0.04354']]
    
    
    print(list(map(lambda x:list(map(lambda y:y.split(';'),x)),data)))
    

    输出:

    [['Time [s]', '17063_X', '17063_Y', '17063_Z', '17064_X', '17064_Y', '17064_Z', '17065_X', '17065_Y', '17065_Z', '17067_X', '17067_Y', '17067_Z', '17068_X', '17068_Y', '17068_Z'], ['0', '0.01952', '0.04337', '0.0242', '0.01151', '0.04152', '0.03236', '0.00015', '-0.01679', '0.05328', '0.02872', '0.01717', '0.09341', '0.01452', '0.01489', '0.07444'], ['0.00042', '0.02188', '0.04351', '0.02803', '0.0062', '0.04108', '0.03312', '-0.00529', '-0.01412', '0.05167', '0.02173', '0.01377', '0.04098', '0.00807', '0.00246', '0.04354']]
    

    【讨论】:

    • 谢谢!但不幸的是,我得到一个 IndexError: list index out of range。你知道为什么吗?
    • 几乎完美!现在它会在类似[[[a, b, c]], [[a, b. c]],...] 的列表中创建一个列表
    【解决方案2】:

    利用你所拥有的。 csv.reader 可以传递一个分隔符参数。

    import csv
    
    with open(filepath, 'r') as f:
      reader = csv.reader(f, delimiter=':')
    

    reader 支持在上下文中一次性直接迭代打开的文件句柄,如下所示:

    for data in reader:
        print(data)
    

    如果您需要在上下文范围之外的读取器中使用数据,请将包含其数据的列表绑定到上下文范围内的其他名称。

    import csv
    
    entries = []
    with open(filepath, 'r') as f:
      reader = csv.reader(f, delimiter=':')
      entries = list(reader)
    

    【讨论】:

      【解决方案3】:

      显然,您的 csv 文件使用的是 ;,而不是 ,

      我认为您应该尝试指定 csv 文件的分隔符。我还没有测试过,但你可以这样做:

      import csv
      with open(filepath, 'r') as f:
          reader = csv.reader(f, delimiter = ';')
          # omit the first line  
          for row in reader[1:]:
              da = [float(i) for i in dt]
              print (da)
      

      【讨论】:

        【解决方案4】:

        您需要将最后两行放在for 循环中,并检查您的缩进:

        for j in range(1, len(data)):
            for i in data[j]:
                dt = i.split(';')
                da = [float(v) for v in dt]
                print(da)
        

        【讨论】:

          【解决方案5】:

          试试下面的

          s=[["a;b;c"],["d;e;f"]]
          [x[0].split(';') for x in s]
          

          你会得到:

          [['a', 'b', 'c'], ['d', 'e', 'f']]
          

          【讨论】:

            猜你喜欢
            • 1970-01-01
            • 1970-01-01
            • 2017-09-26
            • 2017-09-17
            • 2017-03-29
            • 2019-10-31
            • 2019-03-31
            • 1970-01-01
            相关资源
            最近更新 更多