【问题标题】:Index mistake when using pandas read_csv使用 pandas read_csv 时出现索引错误
【发布时间】:2021-12-31 01:14:43
【问题描述】:

在尝试从 github 端点导入流行的 UCL bank marketing dataset 时,我遇到了一些问题。读取语句未正确获取 17 列的数据集。我检查了分隔符和标题,但我不确定如何更正索引。

# URL endoint
url = 'https://raw.githubusercontent.com/ThamuMnyulwa/bankMarketing/main/bank-additional-full.csv'

column_names = ["age","job","marital","education","default","balance","housing","loan","contact","day","month"
 ,"duration","campaign","pdays","previous","poutcome", "y"]


raw_dataset = pd.read_csv(url, names=column_names,
                          na_values='?',sep=';'
                          , skipinitialspace=False, index_col=None)

相反,它给了我这样的东西:

如何使用 pandas read_csv 从 URL 正确导入数据集 (link)?

【问题讨论】:

    标签: python pandas dataframe csv import


    【解决方案1】:

    以下语法显示一致的结果:

    raw_dataset = pd.read_csv(url, sep=";")
    

    【讨论】:

      【解决方案2】:

      您不需要设置标题。它已经带有 CSV 中的标题。你的看起来很奇怪的原因是你的标题列表中缺少 3 个值,这就是它偏移 3 的原因。

      【讨论】:

      • 这会修复索引吗?
      • 是的,它应该在第一列之前添加一个索引。只需从 read_csv 调用中删除names=column_names,
      • 我明白你在说什么@FishMonkey,谢谢。
      • 很高兴我能帮上忙 :)
      猜你喜欢
      • 2013-07-07
      • 1970-01-01
      • 2016-06-02
      • 2022-07-25
      • 2012-09-11
      • 2020-05-07
      • 1970-01-01
      • 2017-03-06
      • 1970-01-01
      相关资源
      最近更新 更多