【发布时间】:2020-06-04 15:27:08
【问题描述】:
我有一个包含 436 列和 14k 行的 CSV 文件。 单元格内的数据格式为字符串。 例如,它看起来像这样:
A,A,A,B,B,C,C,,,,,
D,F,D,F,D,F,H,,,,,
我的目标是让每一行都具有其唯一值。像这样:
A,B,C,,,,,,,,
D,F,H,,,,,,,,
文件位于 csv/txt 文件中。我可以使用 Jupyter 笔记本(使用 Python3 或你们将提供的任何其他代码)。但这是我的工作环境。任何帮助都会很棒! 我还将 csv 作为数据框上传到笔记本。你们有什么建议?
【问题讨论】:
标签: python dataframe duplicates rows data-cleaning