【发布时间】:2020-08-17 16:58:15
【问题描述】:
我有一个数据集,其中包含有关全球房屋的信息,具有以下特征:房屋大小、卧室数量、城市名称、国家名称、花园与否……(以及许多其他典型的房屋信息)。目标变量是房子的价格。
我知道字符串不能作为机器学习或神经网络模型中的输入,因此我决定不再对城市名称和国家名称进行热编码(因为我最终会得到几百列)用地理坐标替换城市名称(一列经度,一列纬度)。 房子所在的城市显然会帮助确定房子的价格。
那么更改城市名称及其经度和纬度是否会保留这些重要信息?用经度和纬度更改城市名称可以吗?
【问题讨论】:
标签: machine-learning neural-network feature-engineering