【问题标题】:how to read text from excel file in python pandas?如何从 python pandas 中的 excel 文件中读取文本?
【发布时间】:2018-09-14 02:45:42
【问题描述】:

我正在处理一个包含大文本数据的 excel 文件。 2列有很多文本数据。喜欢描述,工作职责。

当我在 python df=pd.read_excel("form1.xlsx") 中导入我的文件时。它将带有文本数据的列显示为 NaN。

如何导入列中的所有文本? 我想对职位、描述和工作职责进行分析。描述和职位是长文本。我有超过 150 行。

【问题讨论】:

  • 你应该给出一个简短的例子来说明你的数据和到目前为止的代码,这样可以更容易地帮助你。现在的问题很难理解。请看stackoverflow.com/help/how-to-ask

标签: excel python-3.x pandas import


【解决方案1】:

尝试将文件从 .xlsx 转换为 .CSV 我对文本列有同样的问题,所以我尝试转换为 CSV(逗号分隔)并且它有效。不是很有帮助,但值得一试。

【讨论】:

    【解决方案2】:

    您可以使用 dtype 关键字将列名和数据类型的字典传递给 read_excel:

    col_dict = {‘a’: str, ‘b’: int}
    pd.read_excel("form1.xls", dtype=col_dict)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-06-08
      • 2017-07-27
      相关资源
      最近更新 更多