【问题标题】:How to read HDF5 file in Python/Pandas via SSH?如何通过 SSH 在 Python/Pandas 中读取 HDF5 文件?
【发布时间】:2019-04-22 09:45:34
【问题描述】:

我正在通过 SSH (Putty) 访问远程机器。数据集存储在该机器上的目录中,我需要在本地计算机上使用 Python 中的 pandas 读取该目录。我正在尝试使用dataframe=pandas.read_hdf(path, key="data"),但我不知道要指定哪个路径将指向存储在本地 Python 代码中的远程计算机上的数据集,因为它没有存储在本地。正如我提到的,我正在使用 Putty 访问数据集。 路径应该是什么样的? 我尝试将 C: 替换为主机名,后跟我在 Putty 中用来访问文件的路径。

提前致谢。

【问题讨论】:

标签: pandas ssh path putty hdf


【解决方案1】:

我不知道您所说的读取是什么意思,但是您可以使用以下内容显示数据框:

  1. SSH 到您的远程服务器
  2. 导航到存储数据框的目录: cd /directory/of/dataframe
  3. 启动 Python 或 iPython 解释器:pythonipython
  4. 执行那些 python 命令:
>>> import pandas as pd
>>> dataframe=pandas.read_hdf("hdf_file.h5", key="data")
# This should work because `hdf_file.h5 is 
# in the directory you launched the python command
  1. 打印您的数据框:print(dataframe)

【讨论】:

  • 感谢您的回答。这看起来很有希望,但是当我尝试导入 pandas 时在 shell 中启动 Python 后,我收到了这个错误:"ImportError: No module named pandas"。这是否意味着主机上没有安装pandas?有没有办法可以在那里安装它?在我的本地笔记本电脑上,我通常使用 Python 3.7,但在 shell 中,它会在远程机器上启动 Python 2.7。这可能是一个原因吗?
  • 您可以尝试将python3 用作启动python3 解释器的命令(并查看是否为python3 安装了pandas)。否则,您可以使用pip install pandaspip3 install pandas 安装pandas(请使用virtualenv
  • 编辑:我用pip install pandas 尝试过,它开始收集熊猫但给了我这个错误:Download error on https://pypi.python.org/simple/: [Errno 2] No such file or directory -- Some packages may not be found!Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-robfndta/pandas 另外,主机是一台unix机器,也许我应该提到早些时候。你能帮我安装熊猫吗?我不知道如何处理该错误
  • 您遇到此错误是因为您没有将其安装在 virtualenv 上。要为用户安装 pandas,您应该执行 pip install pandas --user,它应该可以工作。
猜你喜欢
  • 2015-03-26
  • 2018-04-19
  • 1970-01-01
  • 2017-03-13
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-07-08
  • 2017-11-26
相关资源
最近更新 更多