【发布时间】:2018-04-01 08:43:15
【问题描述】:
在给定的文本中,如何找到字符串前面的单词数?
例如:"how to format this article? put return between paragraphs'
我希望确定'put return between paragraphs' 从第 6 个单词开始,或者换句话说,它之前有 5 个单词。
或者,有没有办法在标记化过程中考虑自定义标记,以便我可以将'put return between paragraphs' 视为一个标记,将其余单个单词分别视为一个标记?
更新:这与换行无关。
【问题讨论】:
-
第六个字在这里真的有意义吗?问号不是触发换行符的实际标记吗?