【发布时间】:2018-09-12 16:44:05
【问题描述】:
我正在尝试为最近邻搜索创建一个 forst,但我不确定我做对了,或者即使 MinHash / LSH 是否适合我的数据。我问这个是因为结果不可用。
我正在尝试关注文档中的example。
我的数据:
512 个维度,例如值是一个位,例如 0 或 1 这实际上可用于 MinHash / LSH 吗? 如果是,我将如何为每条记录构造 MinHash?
据我了解,minhash 的重点已经是将数据映射到这样的位结构?所以我可以把这些位加载进去吗?如h = MinHash(num_perm=512, hashvalues=listOfBits) ?
【问题讨论】: