【问题标题】:Open .dat files using pandas (Python)使用 pandas (Python) 打开 .dat 文件
【发布时间】:2020-04-01 21:53:17
【问题描述】:

我刚开始学习 Python 并使用 pandas 进行数据分析,我想知道打开 .dat 文件的正确方法是什么,以及将 .dat 转换为 .csv 并改用此文件扩展名是否会更好?

我试图通过简单的输入来打开文件

df_topex = open('datasets/TOPEX.dat', 'r')
print(df_topex)

我得到了以下信息:

<_io.TextIOWrapper name='datasets/TOPEX.dat' mode='r' encoding='UTF-8'>

尝试时:

df_topex = pd.read_csv('datasets/TOPEX.dat')
df_topex

第一行数据被视为标题。在这个特定的数据文件中,没有标题,所以我希望避免这种情况。有没有一种简单的方法可以说这个特定文件没有标题或者我应该创建它们?如果有,怎么做?

【问题讨论】:

  • 我强烈建议先学python,再学pandas。如果您一头扎进 pandas,就会陷入语言的基本功能的陷阱。

标签: python python-3.x pandas


【解决方案1】:

只需设置header=None

df_topex = pd.read_csv('datasets/TOPEX.dat', header=None)
df_topex

【讨论】:

  • 谢谢!在处理 .dat 文件时,这是否是正确的方法?在良好的编程方面。
  • 老实说,文件扩展名无关紧要,实际格式很重要——无论是逗号分隔还是制表符分隔。 Pandas 允许非常快速地了解数据,我建议将此方法用于逗号和制表符分隔的文件。如果您确实认为答案正确,请投票并将其标记为答案。
  • 您介意向我解释一下为什么内置函数 open() 不起作用吗?我很难从文档中理解原因。
  • 成功了。你停下来的只是文件打开对象。您尚未阅读该文件。 print(df_topex .read()) 将显示文件的内容。 readline() 将显示文件中的一行
【解决方案2】:

我的经验是 pd.read_csv 在尝试导入 .dat 文件时不起作用,因此您也可以考虑使用:

topex = np.fromfile('datasets/TOPEX.dat')

然后将其转换为Dataframe:

df_topex = pd.DataFrame(data=x)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-06-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-17
    • 1970-01-01
    • 2021-12-09
    相关资源
    最近更新 更多