【发布时间】:2021-01-25 04:21:33
【问题描述】:
我有一个包含 22000 行作者姓名的 CSV 文件。
- 每一行都有多个作者姓名,用“;”分隔。
- 一行中的每个作者姓名都按“姓,名”的顺序排列。
我想将它们拆分并附加到新列,如下所示。
原始数据集预览:
+------------------------------------+
| author_full_name |
+------------------------------------+
| Kahana, M J; Adler, M |
|Gautam, H; Potdar, G G; Vidya, T N C|
+------------------------------------+
预期输出:
+------------------------------------+------------------------------------------+
| author_full_name | author_first_names| author_last_names |
+------------------------------------+------------------------------------------+
| Kahana, M J; Adler, M | M J; M | Kahana; Adler |
|Gautam, H; Potdar, G G; Vidya, T N C| H; G G; T N C | Gautam; Potdar; Vidya|
+------------------------------------+------------------------------------------+
如何使用 pandas 完成此任务?
【问题讨论】:
标签: python pandas csv data-science data-cleaning