【问题标题】:google cloud plateform Auto ML谷歌云平台 Automl
【发布时间】:2020-05-27 09:05:47
【问题描述】:

大家好,我正在尝试在“AutoML Tables”中导入一个表格,只是为了进行测试,我创建了一个带有随机数的表格,所以不要介意。 每次我测试尝试导入表时,它似乎都不起作用 我的 CSV 似乎没有任何问题。只有字母数字字符,没有空单元格,只有测试的数字数据 3 列,300 行...... 但不,它不起作用,它告诉我:

Error Messages: Invalid column names:

我的列名称是:房间,或,价格。 我不知道这些名字有什么问题......

感谢您的帮助

enter image description here

我试过带引号和不带引号

"id","rooms","OR","price","space","toilets"
0,5,8,200,200,1
1,5,8,200,200,1
2,5,8,200,200,1
3,5,8,200,200,1
4,5,8,200,200,1
5,5,8,200,200,1
6,5,8,200,200,1
7,5,8,200,200,1
8,5,8,200,200,1
9,5,8,200,200,1
10,5,8,200,200,1
11,5,8,200,200,1
12,7,9,300,400,2
13,7,9,300,400,2
14,7,9,300,400,2
15,7,9,300,400,2

【问题讨论】:

  • 会不会是它检测到了 4 列和第一个空名称?
  • 没有别的东西,因为即使我感到空白它也不起作用......
  • Helena,你能不能给我一个示例 txt 以便重现问题?
  • 嗨,谢谢 Temu,我不知道如何在此处附加文件,但我将数据粘贴到问题中,实际上值并不重要,因为它只是用于测试
  • 我想我已经发现了可能发生的情况。我在示例中也遇到了错误,并重新阅读了您提到的仅使用 3 列 300 行的描述“>错误消息:>行太少:16。最小数量为:1000”。您能否尝试至少 1000 行并告诉我会发生什么?

标签: google-cloud-platform automl


【解决方案1】:

当使用索引列创建 CSV 时,我重新创建了该问题。

import pandas as pd

columns = ["id","rooms","OR","price","space","toilets"]
data = [
    [0,5,8,200,200,1],
    [1,5,8,200,200,1],
    [2,5,8,200,200,1],
    [3,5,8,200,200,1],
    [4,5,8,200,200,1],
    [5,5,8,200,200,1],
    [6,5,8,200,200,1],
    [7,5,8,200,200,1],
    [8,5,8,200,200,1],
    [9,5,8,200,200,1],
    [10,5,8,200,200,1],
    [11,5,8,200,200,1],
    [12,7,9,300,400,2],
    [13,7,9,300,400,2],
    [14,7,9,300,400,2],
    [15,7,9,300,400,2]
]

df = pd.DataFrame(data=data, columns=columns)
# resampled the data to avoid AutoMLTables error: 
# Too few rows: 16. Minimum number is: 1000
df = df.sample(1000, replace=True)
df.to_csv('/your/data/path/here', index=True)

但如果我将index 设置为False 并重新创建文件,则导入成功。

也有可能是早期版本的 AutoMLTables 不喜欢您使用保留关键字 id 作为列名,但这不太可能。

【讨论】:

    猜你喜欢
    • 2020-06-02
    • 2020-12-11
    • 1970-01-01
    • 2020-08-06
    • 2018-09-26
    • 1970-01-01
    • 1970-01-01
    • 2020-11-09
    • 2019-02-27
    相关资源
    最近更新 更多