【发布时间】:2016-03-02 18:57:32
【问题描述】:
我想要数据框中的每条记录,其中每条记录的前 3 个属性等于另一个数据框中记录的相同 3 个属性。
例如,我有:
File, Paragraph, Sentence, E, ED
1.txt, 1, 1, CM, C.M.
1.txt, 1, 1, LF, L.F.
1.txt, 2, 1, E, E.
1.txt, 2, 1, M, M.
1.txt, 4, 1, LF, L.F.
1.txt, 4, 1, NM, N.M.
1.txt, 6, 1, RN, R.N.
1.txt, 7, 1, AO, A.O.
我的这个数据框有 3 个公共列,但行数更少。
File Paragraph Sentence occurrences
1.txt 1 1 2
1.txt 2 1 2
1.txt 4 1 2
应该是这样的:
File, Paragraph, Sentence, E, ED
1.txt, 1, 1, CM, C.M.
1.txt, 1, 1, LF, L.F.
1.txt, 2, 1, E, E.
1.txt, 2, 1, M, M.
1.txt, 4, 1, LF, L.F.
1.txt, 4, 1, NM, N.M.
我怎样才能有效地做到这一点?
【问题讨论】:
标签: r dataframe filtering data-manipulation querying