【发布时间】:2021-01-13 19:20:26
【问题描述】:
使用 uima ruta 2.7.0
DECLARE Substance;
WORDLIST EnzymeSearchList = 'enzyme.txt';
Document{-> MARKFAST(Substance, EnzymeSearchList, true)}; // true ignores case
enzyme.txt 包含约 16.000 个条目(=行)
如果我使用包含少量条目的文件,例如 5,我的进一步规则可以正常工作。一旦我提供了数千个条目的完整列表,我的结果就不完整了。
可能是达到 WORDLIST 限制导致的问题?或者堆可能?程序执行时没有任何错误。
我找到a thread 专门说明
UIMA Ruta 中的词表没有最大大小。 ...我最大的词表包含大约 50 万个条目
【问题讨论】: