【发布时间】:2016-03-20 05:14:03
【问题描述】:
using DataFrames
df = DataFrame(A = 1:10, B = 2:2:20)
10x2 DataFrame
| Row | A | B |
|-----|----|----|
| 1 | 1 | 2 |
| 2 | 2 | 4 |
| 3 | 3 | 6 |
| 4 | 4 | 8 |
| 5 | 5 | 10 |
...
...
是否可以通过使用值列表来子集数据帧,例如
df[df[:A] .in [3,4], :]
如果列表很小,这可以由
完成df[(df[:A] .== 3) | (df[:A] .== 4), :]
但我想知道是否有办法为大型值列表执行此操作
【问题讨论】:
-
df[ [x in [3,4] for x in df[:A]] ,:]是一个等价物。易于适应其他设置和条件。 -
Matt B 的 vectorin 函数非常有用,对于 julia 新用户来说,双数组理解不是很直观。我认为应该将其添加到 Base 中。
标签: dataframe subset julia data-manipulation