【发布时间】:2016-04-07 09:46:17
【问题描述】:
我有一个庞大的公司名称列表。如下图所示,如果名称 company 是 ABBEYCREST.DEAD...10.10.14...ASK.PRICE,这意味着 ABBEYCREST.DEAD...10.10.14... 是公司名称,ASK.PRICE 是 ASK 价格数据当它以 BID.PRICE 结尾时,表示它的 BID PRICE 数据。我想确定数据框中只有一个列名可用的公司。实际上,我有一个具有列标题的数据框,如下图所示,这意味着每个公司应该有 2 列,如果有 4000 家公司,那么我的数据框中应该有 8000 列,但我有 7999(虽然我的数据框有一个日期列,但我排除了当我计算列时它)。
df<-AskBid
ABBEYCREST.DEAD...10.10.14...ASK.PRICE
ABBEYCREST.DEAD...10.10.14...BID.PRICE
ABBOT.GROUP.DEAD...07.03.08...ASK.PRICE
ABBOT.GROUP.DEAD...07.03.08...BID.PRICE
ABERDEEN.ASSET.MAN..FULLY.PAID.23.09.05...ASK.PRICE
ABERDEEN.ASSET.MAN..FULLY.PAID.23.09.05...BID.PRICE
ABERDEEN.ASSET.MAN..NIL.PAID.23.09.05...ASK.PRICE
ABERDEEN.ASSET.MAN..NIL.PAID.23.09.05...BID.PRICE
ABERDEEN.FTBL.CLUB.DEAD...DEAD.04.08.03...ASK.PRICE
ABERDEEN.FTBL.CLUB.DEAD...DEAD.04.08.03...BID.PRICE
ABERTIS..IRS....BID.PRICE
ABGENIX..IRS..DEAD...12.11.07...ASK.PRICE
ABGENIX..IRS..DEAD...12.11.07...BID.PRICE
ABLON.GROUP.DEAD...31.05.13...ASK.PRICE
ABLON.GROUP.DEAD...31.05.13...BID.PRICE
ACAMBIS.DEAD...25.09.08...ASK.PRICE
ACAMBIS.DEAD...25.09.08...BID.PRICE
我要找的是
missing <- df
ABERTIS..IRS....BID.PRICE
非常感谢您的帮助。这导致我的估计出现问题。
【问题讨论】:
标签: r dataframe duplicates multiple-columns