【发布时间】:2011-11-05 23:40:20
【问题描述】:
假设我有字符串:
-dog--cat--d--
我想从该字符串中查找所有单词,并且长度应大于 1。
但更重要的是,我想知道每个单词的第一个和最后一个索引。
我该怎么做?
我正在考虑创建结构。它可以存储一些数据(索引开始和停止,单词,长度等)
但我真的不知道如何找到任何方法来获取这些单词。
到目前为止,我只创建了存储值 0 和 1 的数组(如果元素为“-”则为 0,否则为 1)。 有谁能够帮助我? :)
【问题讨论】:
-
你如何定义“单词”? 2 个或更多 Unicode 字母的序列?
-
A suffix tree 符合我理解的您的要求,可能与您的意思有所不同。
-
@MarkByers,我在“-”之间定义了序列 Unicode 字母,例如。
"-dog-" => dog