【发布时间】:2019-07-15 03:37:28
【问题描述】:
我正在加载带有逗号分隔值的 csv 文件。 Buit Tax_Amount 列有特殊字符,它正在替换值。 如何解决这个问题? 我试过下面的代码。但不工作。 Tax_Amount 值 = SN45000000001 40HX750_SEPT17 STOCK'';:??/?<.>
bad_chars = [";:??/?<."]
#df['Tax_Amount'].replace(regex=True, inplace=True, to_replace=r'?', value=r'')
#df['Tax_Amount'] = df['Tax_Amount'].astype(str)
all_columns = list(df) # Creates list of all column headers
df[all_columns] = df[all_columns].astype(str)
#df['Tax_Amount'] = translate(None, ''.join(bad_chars))
test_string =df['Tax_Amount']
test_string = filter(lambda i: i not in bad_chars, test_string)
【问题讨论】:
-
??/?真的是字面意思,或者你的代码中的某些东西如何代表一些不可打印的 mojibake?为什么以及如何首先添加这些垃圾?有没有办法在上游的某个地方避免这种情况? -
您的一些被注释掉的尝试看起来几乎是正确的,但可以说是由于对文档的一些不那么神奇的阅读的结果。
标签: python python-3.x pandas