【发布时间】:2013-11-22 17:00:03
【问题描述】:
标签有时会结合两个或多个单词,例如:
content marketing => #contentmarketing
如果我有一堆主题标签分配给一篇文章,并且该词在那篇文章中,即content marketing。如何获取该主题标签并检测构成该主题标签的单词?
如果主题标签是一个单词,这很简单:只需在文章中查找该单词即可。但是,如果哈希标签是两个或更多单词怎么办?我可以简单地将主题标签拆分为所有可能的索引,然后检查产生的两个词是否在文章中。
所以对于#contentmarketing,我会检查以下单词:
- 内容营销
- 内容营销
- 内容营销
- ...
- 内容营销
- ...
但是,如果主题标签中有三个或更多单词,则此操作会失败,除非我递归拆分它,但这似乎很不雅。
同样,这是假设哈希标签中的单词在文章中。
【问题讨论】:
标签: ruby-on-rails ruby regex twitter