【发布时间】:2017-02-25 05:06:17
【问题描述】:
如何从许多 Python Pandas 数据帧中“连接”特定列,其中每个数据帧中的另一列满足特定条件(这里通俗地称为条件“X”)。
在 SQL 中,使用带有 WHERE df2.Col2 = "X" 和 df3.Col2 = "X" 和 df4.col2 = "X"... 等的 JOIN 子句很简单(可以动态运行)。
在我的例子中,我想创建一个大数据帧,其中包含来自许多数据帧中的每一个的所有“Col1”,但只包括 Col1 行值,其中对应的 Col2 行值大于“0.8”。不满足此条件时,Col1 值应为“NaN”。
任何想法都会很有帮助!提前致谢!
【问题讨论】:
-
请提供数据。连接意味着堆叠数据帧,因此类似的 SQL 语句将是
UNION。合并将对应于JOIN。WHERE也表示过滤行,但您正在描述条件变化的值,因此保留行。
标签: python pandas join where concat