【发布时间】:2019-12-05 12:06:53
【问题描述】:
我已经创建了我的项目所需的数据集:
http://www.robots.ox.ac.uk/~vgg/software/via/via-1.0.6.html
当我以 csv 格式导出数据集时,我得到了包含这些属性的下表:
[#filename] [file_size] [file_attributes] [region_count] [region_id] [region_shape_attributes] [region_attributes]
我已经使用以下方法加载了数据集:
from pandas import read_csv
dataset = read_csv("dataset.csv")
现在我不知道需要将哪些列属性传递给数据集。
这些是列的值类型:
[#filename] [0.jpg][1.jpg]...[1000.jpg]
[file_size] [74709][74709]...[63595]
[file_attributes] [{}][{}]...[{}]
[region_count] [5][2]...[16]
[region_id] [0][1][0][2]...[1]
[region_shape_attributes] ["name":"polygon","all_points_x":[319, 496...]
[region_attributes] ["object type":"cat"]...["object type":"cat"]
我应该向 Keras 加载什么?
如果我说:
cnn = Sequential()
.
.
.
cnn.fit(data, label, ...)
表中的数据是什么?我需要 [#filename] 告诉 Keras 在哪里查找图像,不是吗?那么,我如何告诉 keras 我的对象所在的点?我猜是[region_shape_attributes]?
如何将其集中到训练神经网络所需的数据字段中?
我相信我可以使用的标签来自 [region_attribute] 字段,但我不确定如何将数据集传递给 Keras,所以我需要帮助。
【问题讨论】:
-
嗯,进行机器学习首先是了解您的数据以及您想用它们做什么。所以我不确定我们是否真的能在这里为您提供帮助。
标签: python pandas machine-learning keras dataset