【发布时间】:2020-08-11 15:08:51
【问题描述】:
我从来没有做过自然语言处理,所以请原谅任何错误的术语。我愿意使用任何语言/库,例如 NLTK 或 spaCy,但没有付费 API。
我正在尝试制作一款游戏,用户必须自己完成一句名言。
示例输入:
没有书的房间就像没有灵魂的身体。
期望的输出:
没有书的房间...
我想要更复杂的句子,例如:
我知道人们会忘记你说过的话,人们会忘记你做过的事,但人们永远不会忘记你给他们带来的感受。
期望的输出:
我知道人们会忘记你说的话...
另一个例子:
别走在我面前……我可能不会跟着
别走在我后面……我可能不会领导
走在我身边……做我的朋友
期望的输出:
不要走在我面前……我可能不会跟着……
我觉得提取名词/动词短语/块几乎是我想要的,但不完全是。也许像(伪代码):
phrases = extractAllPhrases(sentence)
middlePhrase = phrases.length / 2
desiredOutuput = sentence.substring(0, sentence.offset(middlePhrase) + middlePhrase.length))
这是否太复杂而无法使用 NLP 实现?英语中是否有太多的句法变量无法覆盖以获得一致的结果?我应该手动拆分引号吗?我愿意接受建议而不是工作答案,例如“阅读等等”,我只是不知道从哪里开始。但在我花大量时间学习 NLP 只是为了发现这是不可能的之前,我想知道这是否可行。
【问题讨论】: