【发布时间】:2021-02-05 23:52:02
【问题描述】:
我习惯于在 Ruby 中对大量字符串进行精确匹配检查,但我想知道是否有办法让这个过程更高效。
例如,我从一个区域获取数据并将其与活动记录中的数据进行比较。如果www.domain.com 在一个位置,但domain.com 在另一个位置,我可以确定的唯一方法是在一个位置删除www 或在另一个位置添加它。
有没有办法智能地判断两条数据是否相似?
在上面的例子中,14 个字符中有 10 个(或 71.42%)是相似的,所以我认为可以安全地假设这两个记录属于链接,因为它们只是略有不同。
有没有一种方法可以明智地做出这种决定?
【问题讨论】:
-
dowmawiwn.com?通常,您会将事物规范化为更简单的一致形式。 -
是的,我们通常就是这样做的,但是对于这个特定的项目,我必须找到相似的数据并使它们保持一致,这样才能继续下去。
-
可能与Ruby compare two strings similarity percentage 重复,它链接了一些类似的问题,但这是最新的。
标签: ruby