【问题标题】:Remove duplicate rows from unpivoted table从非数据透视表中删除重复行
【发布时间】:2018-07-26 10:57:30
【问题描述】:

我在 Power Query 中有一个扁平的交叉表,其中包含重复的行,第 1 列和第 2 列的值颠倒了。我想删除 Power Query 中的重复项,这样我就只剩下唯一的行了。

我可以使用 COUNTIF 在 Excel 中实现这一点,但我希望找到一个面向 Power Query 的解决方案。到目前为止,我已经尝试在 Power Query 中创建两个新列(newCol1 = Col1+2,newCol2 = Col2+1)并匹配它们。然而,这只给了我 Col1=Col2 的行。

我觉得这应该是直截了当的,但尽管在这里和在线其他地方找到了类似的帖子,但我还是没有得到它。非常感谢任何帮助!

【问题讨论】:

  • 在我看来,您解决的是症状而不是问题。源数据是否真的包含这两个条目?还是两个条目都是由数据提取中的处理问题引起的?我经常看到这种情况发生在 SQL 中的表连接上使用 = 时,而应该使用 > 或
  • 源数据是一个非常大的交叉表。我正在寻找一种扁平化从另一个程序导入 Excel 的交叉表的好方法,并使用 Power Query:建议使用“从表-->取消透视其他列”。

标签: excel powerquery


【解决方案1】:

我认为@xQbert 有一个很好的观点。您可能想尝试在上游修复此问题。

但是,如果您确实想在这一点上修复它,那么我建议如下:

创建一个按字母顺序排列的自定义列。您可以使用这样的公式:

if [Col 1] < [Col 2] then [Col 1] & [Col 2] else [Col 2] & [Col 1]

选择新创建的列(仅),然后单击删除行 > 删除重复项。

如果需要,删除新列。

【讨论】:

    猜你喜欢
    • 2012-05-15
    • 1970-01-01
    • 2020-11-18
    • 2021-06-03
    • 1970-01-01
    • 1970-01-01
    • 2011-09-07
    • 1970-01-01
    • 2020-11-19
    相关资源
    最近更新 更多