【问题标题】:table distinct from Editor Power Query to Python不同于编辑器 Power Query 到 Python 的表
【发布时间】:2021-11-24 09:43:18
【问题描述】:

我需要将数据转换程序从 Editor Power Query 转换为 Python。 我不太擅长编辑器电源查询。

我有一个有 30 列的表,任务如下:

= Table.Distinct(#"Previous task", {"column1"})

当我这样做时,它会占用哪一行?第一个?最后一个?一个随机的? 如何将其翻译成 Python Pandas,以确保拥有相同的数据?

感谢回答

【问题讨论】:

    标签: python pandas powerquery


    【解决方案1】:

    默认情况下,我相信Table.Distinct 保留第一行。

    在 Pandas 中,您可以使用如下内容:

    df.drop_duplicates(keep='first', inplace=True)
    

    keep 参数指定要保留哪一行,inplace 参数只是确保对数据框本身而不是数据框的副本进行更改。

    pandas.DataFrame.drop_duplicates 上查看更多here

    另外,here's 提供了有关 Table.Distinct 的更多信息,以及如何在执行操作之前保留表的排序顺序。

    【讨论】:

      猜你喜欢
      • 2020-05-29
      • 1970-01-01
      • 2019-01-27
      • 2016-02-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多