【问题标题】:Pandas select unique values from column熊猫从列中选择唯一值
【发布时间】:2018-06-25 20:02:33
【问题描述】:

通过这样做,我能够在 jupyter 笔记中摄取 csv:

csvData= pd.read_csv("logfile.csv")

我的数据如下所示:

event_timestamp ip  url 
2018-01-10 00:00 111.111.111.111 http://webpage1.com
2018-01-10 00:00 222.222.222.222 http://webpage2.com
...
..
.

我得到了一个唯一 ips 列表:

list_ips = csvData("[ip]")

我想做的是获得一个独特的。通常我会这样做:

list_ips.unique()

但在这种情况下,我得到了这个错误:

AttributeError: 'DataFrame' object has no attribute 'unique'

(我可以使用 list_ips.head() 它会列出一些 IP,但它不是唯一的列表)

谢谢

编辑 我的问题是我实际上有:

list_ips = csvData([["ip"]]) 

所以我删除了一组括号,所以它变成了:

list_ips = csvData(["ip"]) 

然后我就可以按照文的例子做了:

list_ips.unique().tolist()

输出:

['111.111.111.111','222.222.222.222'...]

【问题讨论】:

    标签: python-3.x pandas


    【解决方案1】:

    您需要正确选择列然后应用unique

    csvData['ip'].unique().tolist()
    Out[677]: ['111.111.111.111', '222.222.222.222']
    

    【讨论】:

      【解决方案2】:

      您遇到此问题的原因是pd.read_csv("logfile.csv").unique() 不是DataFrame 的有效属性。我建议你做的是因为 csvData 以列表的形式出现,你可以通过csvData['ip'] 搜索所有 ip,然后使用csvData['ip'].unique() 搜索唯一 ip。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2015-01-14
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-03-17
        • 2020-03-26
        相关资源
        最近更新 更多