修改广义后缀树以保存节点在文本字符串中出现的次数

【问题标题】：Modifying a Generalised Suffix Tree to hold number of times a node appears in the text string修改广义后缀树以保存节点在文本字符串中出现的次数
【发布时间】：2025-11-24 23:00:02
【问题描述】：

如何修改Ukkonen's paper 中的过程以保存一个单词在文本中出现的次数的值。有没有这样的实现也可以提供字符串频率？

我想要的修改就像一个字符串“hehe”，树中所有“h”、“e”、“he”的频率计数应该是2。其余节点的默认值为 1。

我发现了一些库，如 the best so far 和一些以前的问题，如 this。

但是他们都没有描述一个足够好的解决我的问题的方法。我还必须处理一个非常大的字典文件（大约十亿字）。然后算法需要非常快。而且我准备在空间上妥协一点。

【问题讨论】：

标签： tree suffix-tree suffix-array

【解决方案1】：

可以在这里找到答案：Counting the number of substrings

基本上，构建后缀树，从根开始匹配子字符串并计算该点以下的叶节点。这是单词在文本中出现的次数。

【讨论】：

猜你喜欢

BIRT 4.5 - 禁用在 report.rptdesign 中保存连接字符串，PHP 以分配连接字符串 1970-01-01
在较大字符串中查找字符串的函数 2025-11-24
为什么在容器的状态树中只修改了一个子节点的状态时，容器的所有 PureComponent 子节点都会更新？ 2025-11-24
在.ajax提交上的JQuery中转义字符串以提交到mySQL 2025-11-23
将字符串转换为字节（0x??） 2025-11-22
在字符串 Oracle 中查找子字符串 2025-11-23
C 编程 - 将随机数生成到一个新的文本文件中并检索它们以计算出现次数（然后在旁边进行统计） 2025-11-23
将逗号添加到浮点数或字符串？ 2025-11-24
自定义 UIAlertView 在第一次出现后未调整键盘大小 2025-11-22

相关资源

HTML5 SVG实现的水波中文本文字漂浮显示动画特效源码下载 2023-04-18
基于PJBlog3修改的清爽大气的博客程序 v1.0下载 2023-01-31
DB2-SQL 数据库函数中文WORD版下载 2022-12-15
Android 操作系统的介绍中文WORD版下载 2025-11-24
Sprintf函数的用法 WORD版下载 2023-02-09

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式