【发布时间】:2011-05-08 18:23:01
【问题描述】:
当然,Google 多年来一直在这样做!但是,与其从头开始,不如花 10 年以上的时间浪费大笔金钱使用 PHP 的页面或文本块?
在基本层面上,我猜大多数蜘蛛会拉入单词,删除没有真正意义的单词,然后计算其余的。出现次数最多的词很可能是我感兴趣的词。
任何类型的指针都会非常感激!
【问题讨论】:
-
有人见过圣杯吗?
-
啊哈!那是Python线索对吗? NLP 工具nltk.org
-
LOL - Larry Page 刚刚将脚本通过电子邮件发送给我。不过说真的,我当然不是在寻找任何复杂的东西。一些关键字或非常粗略的上下文。
标签: php artificial-intelligence web-crawler