【发布时间】:2018-09-01 15:15:36
【问题描述】:
背景
我目前正在使用kmodes python package 对包含分类参数的数据执行无监督学习。
我需要能够保存这些模型,因为我计划在生产管道中使用它,我希望能够“回滚”到旧的工作模型,如果有的话管道失败。
要求
我可以使用任何文件格式,包括HDF5 format。我也不喜欢kmodes,但是我确实需要能够处理混合的分类和数字数据。
帮助
我似乎找不到任何方法可以将完整的kmodes 模型保存到磁盘,但我希望我只是遗漏了一些明显的东西.请提供任何可能的选择。
【问题讨论】:
-
请提供投反对票的原因。问题不清楚吗?例如,不需要样本数据。它似乎既自足又不言自明。
-
你能举个例子吗?在@chthonicdaemon 示例中,KModes 返回的数据是一个简单且高度相关的 numpy 数组,可以非常有效地保存在压缩的 HDF5 格式中。
-
@MikeWilliamson 对于为什么其中一个答案不够好,我将不胜感激一些额外的 cmets...
-
@chthonicdaemon 您的回答已经足够好了。我被其他工作分心了,好几天都没有回到这个页面。非常感谢!非常有帮助,事实上!
标签: python cluster-analysis hdf5