【问题标题】:How to find differences in two sheet index then copy differences into another sheet index如何找到两个工作表索引中的差异然后将差异复制到另一个工作表索引
【发布时间】:2021-03-06 17:36:57
【问题描述】:

有人可以帮我用 R 中的这个脚本吗 我实际上不知道如何编写脚本。 这就是我想要的

我有一个包含两个不同工作表的数据集 表 1 被命名为 James 表 2 被命名为 Bruce

我想使用差异参数或列比较 James 和 Bruce 的两张表

对于 Sheet1 (James),参数或列名称称为“确认代码” 对于 sheet2 (Bruce),参数或列名称为“参考”

我希望结果显示 James 的内容,而不是 Bruce 的内容,结果显示为 NA。

将 James 中不在 Bruce 中的内容复制到另一张表中,并将该表命名为 James VAR

将 Bruce 中不在 James 中的内容复制到另一张纸上并将其命名为 Bruce Var

一个例子是我刚刚使用 excel 执行的那个,我想要使用 R 脚本做同样的事情。谢谢

更新更新 这是下面的数据集

请参阅下面的 james 数据集 商户接收方网络提供商类型 FaceValue 日期状态 Net Val M Ref Confirm Code Tranx ID SEAMAFIXER 8036638190 MCN CSW 通话时间 10000 05/03/2021 0:00 成功 9750 77352c77d0e5459789de8305730215df 2021030500000923904229397 210305803663819012 SEAMAFIXER 7035471431 MCN CSW 通话时间 10000 05/03/2021 0:00 成功 9750 eff681b9716e4f559cc258c38c98507d 2021030500001003808058125 2103057035471431281 SEAMAFIXER 8037291170 MCN CSW 通话时间 10000 05/03/2021 0:00 成功 9750 64ec355e6dc844fb999098c11e493437 2021030500001031602687683 2103058037291170986 MORUFAT 7066994246 MCN CSW 数据 500 05/03/2021 0:00 成功 480 000006210305000042335138858174 2021030500004510105381114 2103050000531640792 OPONA 7049587980 MCN CSW 数据 300 05/03/2021 0:01 成功 287.4 BB88B5D94F9F490D8C7605DB2998904A 2021030500013156906225325 2103050001403684526 STANLEY 7039555954 MCN CSW 数据 500 05/03/2021 0:01 成功 477.5 SBP1310477351 2021030500014422205381372 2103050001523220139 STANLEY 9130078373 MCN CSW 数据 2000 05/03/2021 0:02 成功 1910 SBP000001210305000209100174071647 2021030500021196802688150 2103050002203575056 STANLEY 7030104764 MCN CSW 数据 100 05/03/2021 0:02 成功 95.5 SBP1310481102 2021030500023319307044836 2103050002414711929 STANLEY 8144791686 MCN CSW 数据 500 05/03/2021 0:02 成功 477.5 SBP000001210305000231100010646086 2021030500023325604229833 2103050002412320838 WEMBA 8104686137 MCN CSW 数据 300 05/03/2021 0:02 成功 289.5 Ref2021030423023741-9 2021030500023936702688271 2103050002473164596 MORUFAT 9031854650 MCN CSW 数据 200 05/03/2021 0:03 成功 192 000006210305000255887561541158 2021030500030088808058831 2103050003091469623 STANLEY 9033942149 MCN CSW 数据 500 05/03/2021 0:03 成功 477.5 SBP1310482928 2021030500031469503308082 2103050003231606090 OPONA 7066475616 MCN CSW 数据 200 05/03/2021 0:05 成功 191.6 304F9AD6BAA14345A00CD0A2A405D604 2021030500051352205382226 2103050005221639551 OPONA LADDER 8163737378 MCN CSW 数据 500 05/03/2021 21:55 成功 482.5 61480816373737820210305215536​​ 210305215536​​4088772 OPONA LADDER 7038302679 MCN CSW 数据 1500 05/03/2021 21:55 成功 1447.5 63750703830267920210305215514 2103052155153229255 WEMBA 7038788822 MCN CSW Data 1500 05/03/2021 21:55 成功 1447.5 Ref20210305205​​51122-84 2103052155132078269 OPONA 9037163970 MCN CSW 数据 100 05/03/2021 21:53 交易被拒绝 95.8 84771DA669AC40AFBC899F54B7D15E0D 2103052153517389341 OPONA LADDER 8139598533 MCN CSW 数据 500 05/03/2021 21:52 交易被拒绝 482.5 32190813959853320210305215159 2103052152001545858 OPONA LADDER 7061261254 MCN CSW 数据 100 05/03/2021 21:48 成功 96.5 74150706126125420210305214853 2103052148543299615 OPONA 8160384574 MCN CSW 数据 500 05/03/2021 21:47 交易被拒绝 479 62BB50815A6B4D5693C29152AB3F06B6 2103052147191090354 OPONA LADDER 8036958609 MCN CSW 数据 100 05/03/2021 21:47 交易被拒绝 96.5 47730803695860920210305214717 2103052147172579196 OPONA LADDER 8134675997 MCN CSW 数据 1500 05/03/2021 21:47 成功 1447.5 276908134675997202103052147028423 2103052147032553149 WEMBA 8102801556 MCN CSW Data 1200 05/03/2021 21:47 成功 1158 Ref202103052047002-12 2103052147021005875 STANLEY 8137989325 MCN CSW 数据 5000 05/03/2021 21:46 成功 4775 SBP000001210305214656100351453835 2103052146591335636 OPONA LADDER 8167985479 MCN CSW 数据 500 05/03/2021 21:46 成功 479 6ABAEECBC06375057761028050950509 2103052146571238439 OPONA LADDER 8107047178 MCN CSW 数据 100 05/03/2021 21:46 交易被拒绝 96.5 64450810704717820210305214635 2103052146362836975 OPONA LADDER 7033050336 MCN CSW 数据 100 05/03/2021 21:46 交易被拒绝 96.5 50780703305033620210305214611 2103052146121603154

布鲁斯数据集 参考类型 Account Date_Created DistributorRef TRANX ID 2021030500000923904229397 经销商 05/03/2021 0:00 19721 2103058036638190120 2021030500001003808058125 经销商 05/03/2021 0:00 19721 2103057035471431281 2021030500001031602687683 经销商 05/03/2021 0:00 19721 2103058037291170986 2021030500004510105381114 经销商 05/03/2021 0:00 19721 2103050000531640792 2021030500013156906225325 经销商 05/03/2021 0:01 19721 2103050001403684526 2021030500014422205381372 经销商 05/03/2021 0:01 19721 2103050001523220139 2021030500021196802688150 经销商 05/03/2021 0:02 19721 2103050002203575056 2021030500023319307044836 经销商 05/03/2021 0:02 19721 2103050002414711929 2021030500023325604229833 经销商 05/03/2021 0:02 19721 2103050002412320838 2021030500023936702688271 经销商 05/03/2021 0:02 19721 2103050002473164596 2021030500030088808058831 经销商 05/03/2021 0:03 19721 2103050003091469623 2021030500031469503308082 经销商 05/03/2021 0:03 19721 2103050003231606090 2021030500051352205382226 经销商 05/03/2021 0:05 19721 2103050003593501665 2021030500051870107045507 经销商 05/03/2021 0:05 19721 2103050004318589635 2021030500054012507045647 经销商 05/03/2021 0:05 19721 2103050004439248876 2021030500062158606226477 经销商 05/03/2021 0:06 19721 2103050004481737976 2021030500063036501735063 经销商 05/03/2021 0:06 19721 2103050004593616931 2021030500063730503308566 经销商 05/03/2021 0:06 19721 2103050005221639551 2021030500072107704230363 经销商 05/03/2021 0:07 19721 2103050005276790762 2021030500072696007046098 经销商 05/03/2021 0:07 19721 2103050005483950219 2021030500074582102689356 Vend RESELLER 05/03/2021 0:07 19721 2103050006303993014

【问题讨论】:

  • 您需要学习如何在 R 中呈现可重现的示例。数据似乎在 Excel 中,所以第一个任务可能是进行传输?无论如何,请搜索“R 中的可重现示例”。

标签: r dplyr data-science tidyverse


【解决方案1】:

假设您已将数据集加载为data.frame(),我认为这应该可以:

JamesVAR <- James[!James$`Confirm Code` %in% Bruce$Reference,]
write.csv(JamesVAR, "JamesVAR.csv")

BruceVAR <- Bruce[!Bruce$Reference %in% James$`Confirm Code`,]
write.csv(BruceVAR, "BruceVAR.csv")

【讨论】:

  • 数据似乎还没有在 R 对象中。
  • 嗨……我只是想要一些看起来和图片一模一样的东西。谢谢
  • 我建议您将 EXCEL 文件另存为 CSV 文件(转到另存为并在下拉菜单中选择 csv)。然后,您可以使用 James &lt;- read.csv("james.csv")Bruce &lt;- read.csv("bruce.csv") 将它们加载到 R 中。那么上面的代码应该可以工作。我建议您不要在列名中使用空格。
【解决方案2】:

假设你有两个数据框,例如

a <- data.frame(x=c(1,2,3),y = c("p","q","r"))
a
  x y
1 1 p
2 2 q
3 3 r

b <- data.frame(x=c(1,2,3),y = c("j","q","l"))
b
  x y
1 1 j
2 2 q
3 3 l

library(dplyr)
intersect(a,b)
  x y
1 2 q

您将看到使用 intersect() 函数从dplyr 包中弹出的匹配值。您可以轻松提取这些相似的值。

【讨论】:

  • 我不认为它回答了这个问题。数据在 Excel 中,他需要学习如何创建 csv 文件并处理 R 与 Excel 中日期表示的差异。无论如何,应该建议他以人们可以使用的形式发布数据,而不是图片。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多