【问题标题】:Strings & possible anagrams of those strings字符串和这些字符串的可能字谜
【发布时间】:2011-09-11 00:14:23
【问题描述】:

我正在做一个小项目(使用 Java),而 uni 只是为了测试自己而我遇到了一个绊脚石。

我正在尝试编写一个程序,该程序将从文本版本的字典中读取,将其存储在 ds(数据结构)中,然后向用户询问随机字符串(最好是无意义的字符串,但只有字母和-'s,没有数字或其他标点符号 - 我对其他任何东西都不感兴趣),找出输入字符串的所有字谜,将其与字典 ds 进行比较并返回字典中所有可能的字谜的列表.

好的,对于第 1 步和第 2 步(从字典中读取),当我阅读其中的所有内容时,我将其存储在一个 Map 中,其中键是字母表中的字母,值是存储所有单词开头的 ArrayLists用那封信。

我一直在寻找所有的字谜,我想出了如何递归地(自豪地)计算可能排列的数量,但我不确定如何实际进行重新排列。

将其分解为 char 并以这种方式使用它更好,还是将其拆分并保留为字符串元素?我已经在不同的网站上在线看到了示例代码,但我不想看到代码,我想知道为此开发解决方案背后的方法/想法,因为我有点卡住了如何开始:(

我的意思是,一旦我生成了所有排列,我想我知道我将如何与字典 ds 进行比较。

任何建议都会有所帮助,但如果可以的话,不要编写代码,只是想法。

附:如果您想查看我的代码(无论出于何种原因),我会发布我所拥有的。

【问题讨论】:

  • 您实际上是在编写一个字谜求解器。 scrabblecheat.com
  • 我知道最好的方法是使用某种树结构。但我不是 100% 确定如何去做。
  • @Jeff Foster 是的,经过反思,我的意思是字谜!该死的,我什至想不出那个词:/现在需要重新发布。谢谢!真的一棵树就解决了吗?怎么会?
  • 它被称为字典树,我不得不为 CMU 的暑期班写一个非常简单的程序。您的支持数据结构是真正重要的部分。
  • 哈哈!直到后来才真正意识到 trie 实际上是您的意思:P 以为您的意思是说树并拼错了:P 谢谢:D

标签: java string recursion arraylist anagram


【解决方案1】:
public String str = "overflow";
public ArrayList<String> possibilities = new ArrayList<String>();
public void main(String[] args)
{
    permu(new boolean[str.length()],"");
}
public void permu(boolean[] used, String cur)
{
    if (cur.length()==str.length())
    {
        possibilities.add(cur);
        return;
    }
    for (int a = 0; a < str.length(); a++)
    {
        if (!used[a])
        {
            used[a]=true;
            cur+=str.charAt(a);
            permu(used,cur);
            used[a] = false;
            cur = cur.substring(0,cur.length()-1);
        }
    }
}

简单,运行时间非常糟糕,但它可以完成工作。

编辑: 更高级的版本称为字典树。基本上它是一棵树,其中每个节点有 26 个节点,每个节点对应字母表中的每个字母。每个节点也有一个布尔值来判断它是否是一个单词的结尾。有了这个,您可以轻松地将单词插入字典,并轻松检查您是否在创建单词的正确路径上。

如果你愿意,我会粘贴代码

【讨论】:

  • 一个更好的应用是字典树,你可以在其中获取每个字符并遍历树以查看前缀是否存在,然后再继续沿着该路径。
  • 谢谢你!只是在寻找一些想法,虽然没有任何实际代码,但同样感谢您的努力!
  • +1 表示树的想法(事实上,我正在考虑它)。将其作为注释放在您的帖子中!
  • 不,没关系,没有必要的代码粘贴我自己做研究谢谢:D,我把它拿走并继续工作!非常感谢主要有用的输入! :D 再次感谢!
【解决方案2】:

在这种情况下,计算排列似乎真的是个坏主意。例如,“溢出”这个词有 40320 个排列。

确定一个词是否是另一个词的排列的更好方法是计算每个字母出现的次数(它将是一个 26 元组)并将这些元组相互比较。

【讨论】:

  • 啊好吧,我的错我不是说所有的排列(应该说清楚)我只对相同长度的字符串的所有排列感兴趣,例如所有可以组成的词来自字典中的溢出并且与溢出长度相同
  • 什么意思?所有排列显然具有相同的长度。
  • 只是想澄清一下,我不想要小于原始单词的单词。好的,那么请在字典中查找包含搜索字符串中所有字母的单词?
  • 没错。计算输入字符串的所有排列很可能是不可行的。
  • 谢谢,这是个好建议,但是通过 273000 个单词查找包含它的所有单词是否会比生成 40320 个字谜并通过适当的字母进行二进制搜索以检查其中是否存在所需的时间更长?我当然可以根据英语语言规则制定规则以丢弃某些字谜,但通过字典查找(没有特定顺序)包含所有字母的单词会更糟,不是吗?
【解决方案3】:

如果您举例说明问题可能会有所帮助。据我了解,您是说如果用户输入“islent”,程序会回复“listen”、“silent”和“enlist”。

我认为最简单的解决方案是获取字典中的每个单词,并将其与输入的单词以及按字母顺序重新排列的单词一起存储。我们称其为“规范值”。规范值的索引。然后将输入转换为规范值,并直接搜索匹配项。

继续上面的例子,当我们构建字典并看到单词“listen”时,我们会将其翻译为“eilnst”并存储“eilnst -> listen”。我们还会存储“eilnst -> silent”和“eilnst -> enlist”。然后我们获取输入字符串,将其转换为“eilnst”,进行搜索并立即找到三个匹配项。

【讨论】:

  • 和你的差不多,就像我有溢出一样,我会在英语词典中的所有单词都可以从长度为 8 的字符串中提取出来(例如,与搜索词的长度相同)例如我得到了 ckod,我可以将 dock 作为输出之一,但 kodc 不会是输出,因为它不在字典中
  • 非常感谢!有一些东西我现在要尝试,非常感谢您的建议,非常有帮助!
猜你喜欢
  • 2016-06-24
  • 2015-11-11
  • 2023-03-25
  • 2017-12-04
  • 1970-01-01
  • 2014-10-24
  • 2021-09-16
  • 2020-10-28
  • 2020-06-20
相关资源
最近更新 更多