【发布时间】:2013-08-28 15:36:58
【问题描述】:
我目前面临的问题如下。我有一组单词,如果可能的话,我想从中构造一个语法正确的短语/句子。到目前为止我尝试过的是:
- 从参考文本语料库中计算每个单词在句子中的平均位置;
- 使用它,对集合中的单词进行排序,并用空格分隔。
这种方法的问题在于,大多数时候它会产生毫无意义的奇怪短语。有没有办法做到这一点,也许使用nlp 技术(假设我只使用英语)?
【问题讨论】:
-
您是否只有一袋单词或一个文本可以从中生成更多文本?另外,您所说的有意义或没有意义的短语是什么意思?看看this other question,它涉及到使用 Python 的 NLTK 使用 n-gram 从源/种子文本生成文本。 (This project 在学术层面处理这个问题。)
-
您只想要语法正确的短语吗? “无色的绿意酣睡”有意义吗?
-
@amp 我有一袋词,想从每个袋子中生成语法正确的短语,最好使用袋子里的所有词,袋子的大小小于 10 个词。感谢您的链接,将看看。
-
@Kevin 是的,语法正确的短语就足够了。 “无色的绿色想法疯狂地睡觉”会很好。