【发布时间】:2013-03-27 01:09:16
【问题描述】:
上周我接受了一次采访。我被困在算法回合中的一个问题中。我回答了这个问题,但面试官似乎并不相信。这就是我分享相同内容的原因。
请告诉我这个问题的优化方法,以便在以后的面试中帮助我。
问题:-
给出了 20 个文本文件,所有文件都是 ASCII 文本文件,有 大小小于 10^9 字节。还给出了一个输入,这是 还有一个 ASCII 文件,比如 input.txt。
我们的任务是策略性地将这个输入文件的内容与 给定 20 个文件,并打印最接近的匹配文件的名称。这 输入文件的内容可能仅部分匹配
提前致谢。期待您的友好回复。
【问题讨论】:
-
这个表格真的没法回答。这些文件是真实文本,还是任何可打印的 ASCII、基本 ASCII 或扩展 ASCII?结果必须是最佳匹配,还是近似值就足够了?
-
我相信有一个用于这个特定目的的系统工具。
cmp我相信是被命名的。符合 POSIX 标准的 SO。 -
@Kira 有些事情告诉我这不是面试官所希望的!
-
@JBentley 哈哈,只是说 XD,有时重新发明可用工具并不明智。
-
@Kira 除了
cmp做了一些完全不同的事情。
标签: c++ c string algorithm string-matching