【发布时间】:2014-12-23 01:22:17
【问题描述】:
我正在观看 Greg Reda 制作的关于 Pandas 的视频[1],以了解 Pandas 与 data.table 相比可以做什么。我很惊讶地发现在 data.table 中连接表是多么困难。如果您观看视频,特别是 @49:00 到 @52:00 分钟,您会看到 Pandas 允许您根据不同的列名连接表,并且您可以为左右表选择不同的后缀。我了解 setkey 用于优化目的 [2] 并了解如何使用相同的列名 [3] 连接表。我尝试了 data.table 的合并,但在使用不同的列名设置 by= 关键字参数时遇到了很多困难。所以这是我的问题。
是否可以在 data.table 中根据不同的列名连接表?如果是这样,怎么做?如果不是,为什么不呢?另外,更有用的是,这个功能不会有用吗?我发现这个问题没有更早出现令人惊讶。如果之前已经讨论过,请原谅我(请指点我)。
顺便说一句,Greg 所说的数据是在他的 github[4] 上找到的。
【问题讨论】:
-
Vijay,这两个功能都在 1.9.5 中实现。如果您有其他改进建议,请在 github 页面上告诉我们。谢谢。
-
谢谢,阿伦。现在,data.table 的行为更像常规的 data.frame。现在我可以更频繁地使用 data.table!
标签: r data.table