将解析后的数据从 csv 文件打印到新文件答案

【问题标题】：Printing parsed data from a csv file to a new file将解析后的数据从 csv 文件打印到新文件
【发布时间】：2017-11-28 21:31:53
【问题描述】：

我正在使用 Python 从以下 csv 文件中解析数据 -

{::[name]str1_str2_str3[0]},1,U0.00 - Sensor1 Not Ready\nTry Again,1,0,12

{::[name]str1_str2_str3[0]},2,U0.01 - Sensor2 Not Ready\nTry Again,1,0,12

{::[name]str1_str2_str3[0]},3,U0.02 - \n,1,0,12

{::[name]str1_str2_str3[0]},4,U0.03 - Sensor4 Not Ready\nTry Again,1,0,12

{::[name]str1_str2_str3[0]},5,U0.04 - \n,1,0,12

在 column1 中，我正在解析 0 中的值 [ ]。然后是 column2 和 column3 中的值，我正在解析子字符串“Sensor1 Not Ready”，然后按如下方式打印到另一个文件 -

SENSOR1_NOT_READY 0,1
SENSOR2_NOT_READY 0,2

等等……

现在，当我打印解析后的值时，我得到以下信息 -

SENSOR1_NOT_READY 0,1
SENSOR2_NOT_READY 0,2
SENSOR2_NOT_READY 0,3
SENSOR4_NOT_READY 0,4
SENSOR4_NOT_READY 0,5

我想跳过打印 column3 中没有数据的行（例如 - csv 文件中的行 3 和 5）。我该怎么做？

预期输出 -

SENSOR1_NOT_READY 0,1
SENSOR2_NOT_READY 0,2
SENSOR4_NOT_READY 0,4

以下是我的 Python 脚本 -

with open('filename.csv','rb') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        tag_name = row[0]
        bit_num = row[1]
        error_name = row[2]

        # Regular expressions
        term0 = '\[(\d)\].*'
        term1 = '(\d+)'
        term2 = r'.*-\s([\w\s]+)\\n'

        capture0 = list(re.search(term0, tag_name).groups())
        capture1 = list(re.search(term1, bit_num).groups())
        temp = re.search(term2, error_name)
        if temp:
            result = list(temp.groups())
        else:
            None
        result[-1] = '_'.join(result[-1].split()).upper()
        capture2 = ','.join(result)

        tp = (capture0[0], capture1[0], capture2) # Tuple
        f.write('{2} {0},{1},\n'.format(tp[0], tp[1], tp[2]))

【问题讨论】：

为什么不做类似的事情：如果“传感器”在行中：做其他事情：打个盹

标签： python csv

【解决方案1】：

构建一个搜索“正常”行的正则表达式。也许像"^U0.0[1-5] - \n$" 这样的东西？然后在打印错误之前使用if not re.search(x): 之类的东西。

with open('filename.csv','rb') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        tag_name = row[0]
        bit_num = row[1]
        error_name = row[2]

        # Regular expressions
        term0 = '\[(\d)\].*'
        term1 = '(\d+)'
        term2 = r'.*-\s([\w\s]+)\\n'
        term3 = '^U0.0[1-5] - \n$'

        capture0 = list(re.search(term0, tag_name).groups())
        capture1 = list(re.search(term1, bit_num).groups())
        temp = re.search(term2, error_name)
        if temp:
            result = list(temp.groups())
        else:
            None
        result[-1] = '_'.join(result[-1].split()).upper()
        capture2 = ','.join(result)

        tp = (capture0[0], capture1[0], capture2) # Tuple
        if not re.search(temp3,error_name):
            f.write('{2} {0},{1},\n'.format(tp[0], tp[1], tp[2])) #I assume this is the print line?

【讨论】：

我已经在最初的帖子中进行了更新，U0.00 在每一行更新，并且每一行都不相同。我为错字道歉
正则表达式输出仍然很简单。
重要的是技术，而不是确切的代码。
是的。感谢您的帮助。