【发布时间】:2022-01-20 02:20:53
【问题描述】:
我正在对 S3 中存在的 csv 文件进行一些处理
reader = pd.read_csv(io.BytesIO(body), delimiter=',', quotechar='"',
encoding='utf8', quoting=csv.QUOTE_ALL, skipinitialspace=True,
usecols=cols)
reader.reset_index()
csv_buffer = BytesIO()
reader.to_csv(csv_buffer, index=False)
所有文件都成功了,除了一个。我得到一个错误 UnicodeEncodeError: 'ascii codec can't encode character u'\xc1'
谁能帮帮我
【问题讨论】:
-
to_csv需要指定encoding -
该文件显然包含字母 Á(A 带锐角),默认“ascii”
encoding不支持该字母;您要么需要指定一个支持它的encoding,例如“utf8”,要么以其他方式处理它(剥离它,替换为“?”,替换为“A”或其他特定于语言的替换,替换使用 "\xc1" 或 "Á" 或其他面向计算机的替换)
标签: python python-3.x pandas amazon-s3 boto3