【问题标题】:Image classification of house build year: regression or classification?房屋建造年份的图像分类:回归还是分类?
【发布时间】:2018-09-20 05:00:15
【问题描述】:

假设我想通过使用以下映射在一组房屋图像上训练 CNN 来了解房屋是何时建造的:

Input Pictures [244, 244, 3] -> Output Year [1850, 1850, ... , 2018] 

这是一个有监督的学习问题,因此标签是已知的(从 1850 年到 2018 年)。

我会构建一个分类或回归分类器来解决这个问题吗?我不确定,因为我没有从 1850 年到 2018 年的每一年的输入,但我希望分类器输出我在训练完成后提供给分类器的新图片的所有值。所以这会指向一个回归分类器。

另一方面,我不希望分类器输出连续的 Y,因为我对建筑物建造的具体年份感兴趣。不是中间值。

这个问题的答案可能非常简单,但我想不通。

【问题讨论】:

    标签: machine-learning deep-learning classification regression supervised-learning


    【解决方案1】:

    这显然是一个回归问题。如果您将每年视为一个单独的类19002017 类将同样接近2018(数值在分类中无关紧要)。但显然两个预测 - 20171900,当真正的标签是 2018 - 是非常不同的。正如您自己所说,回归问题也将允许您概括到看不见的年份。如果训练中不存在这些类,这在分类中实际上是不可能的。

    如果您的最终结果必须是整数,我建议您实现回归输出的解释。例如,如果它在特定范围内,则它可能返回一个整数值,否则返回两年(当模型不确定时):

    regression_output=2000.23 -> result_year=2000
    regression_output=2000.96 -> result_year=2001
    regression_output=2000.45 -> result_year=2000/2001
    

    这样您就可以多调整一个参数。例如,拥有tolerance=0.5 将使您的模型始终可靠。

    【讨论】:

    • 感谢您的解释。现在对我来说很明显。它需要是一个回归问题,因为显然这些年份是有序的。还有另一个阈值预测值的参数解决了第二个问题。
    猜你喜欢
    • 2018-09-12
    • 2020-03-22
    • 2020-07-05
    • 1970-01-01
    • 2020-06-30
    • 1970-01-01
    • 1970-01-01
    • 2017-06-10
    • 1970-01-01
    相关资源
    最近更新 更多