【发布时间】:2020-04-18 09:43:23
【问题描述】:
所以我有两个 CSV 文件,我正在尝试比较它们并获得该项目的结果具有相同的列。第一个文件 a.csv 如下所示:
name pubmedid country
legge 3064733 U.S
legge 3034763 U.S
Hoffman 2888122 NA
第二个 CSV 是 b.csv,看起来像:
name pubmedid country category
Sung 3454733 U.K European
NA 2035763 U.S American
Hoffman 3194992 NA Asian
legge 3064733 U.S African-American
我想从两个文件共有的列中提取信息
而不是将其合并到一个 CSV 文件中 ,并删除所有包含“NA”的行
所以我想要的结果是这样的:
name pubmedid country
legge 3064733 U.S
legge 3034763 U.S
Sung 3454733 U.K
legge 3064733 U.S
比我想把这个结果写在 c.csv 文件上。
我该怎么做?
我试图找到不使用熊猫的方法,因为我仍然没有完全理解熊猫是如何工作的,并尝试在读取原始 a、b csv 文件时跳过包含“NA”的行,但我失败...合并两个文件后删除包含 NA 的行会更好吗?
【问题讨论】:
-
您要从两个文件的列中查找哪些共同信息?
-
@Shubham Sharma 我正在尝试提取涉及 a.csv 和 b.csv 的列...a.csv 没有类别列,所以我想从名称中提取两个 csv到国家,而不是删除包含 NA 的行