【问题标题】:How to load a data set into Jupyter Notebook如何将数据集加载到 Jupyter Notebook
【发布时间】:2018-10-23 23:06:10
【问题描述】:

将数据集加载到 Jupyter 时,我知道它需要几行代码才能加载:

from tensorflow.contrib.learn.python.learn.datasets   import base

 # Data files
IRIS_TRAINING = "iris_training.csv"
IRIS_TEST = "iris_test.csv"

# Load datasets.
training_set =  base.load_csv_with_header(filename=IRIS_TRAINING,
                                         features_dtype=np.float32,
                                         target_dtype=np.int)
test_set = base.load_csv_with_header(filename=IRIS_TEST,
                                    features_dtype=np.float32,
                                    target_dtype=np.int)

那么为什么会有错误NotFoundError: iris_training.csv 还扔?我觉得将数据集加载到 jupyter 上似乎还有更多内容,如果对此主题有任何帮助,我将不胜感激

我正在学习 AI 冒险课程,但不知道如何在 .csv 文件中添加;该视频没有提及如何添加它。

这里是链接:https://www.youtube.com/watch?v=G7oolm0jU8I&list=PLIivdWyY5sqJxnwJhe3etaK7utrBiPBQ2&index=3

【问题讨论】:

  • "iris_training.csv" 是一个应该位于本地目录中的文件。确保它的路径是正确的。
  • 那么它应该保存在哪里?代码中是否缺少要保存的内容?

标签: python tensorflow jupyter-notebook


【解决方案1】:

问题是您需要使用文件的绝对路径,即 C:\path_to_csv\iris_training.csv 用于 windows 和 UNIX/Linux /path_to_csv/iris_training.csv 或者您需要将文件放在您的笔记本工作区中,即在您的 Jupyter UI 中列出的目录,该目录可以在 http://localhost:8888/tree Web UI 中找到。如果您在查找目录时遇到问题,则只需执行以下 python 代码并将文件放在打印位置

import os
cwd = os.getcwd()
print(cwd)

【讨论】:

    【解决方案2】:

    解决方案 A

    如果您正在使用 python,您可以使用 python lib pandas 导入您的文件 .csv,使用:

    import pandas as pd
    IRIS_TRAINING = pd.read_csv("../iris_training.csv")
    IRIS_TEST     = pd.read_csv("../iris_test.csv")
    

    解决方案 B

    import numpy as np
    mydata = np.genfromtxt(filename, delimiter=",")
    

    阅读更多关于 python-pandas 阅读更多关于 python-Numpy

    【讨论】:

      最近更新 更多