【发布时间】:2011-11-28 18:07:01
【问题描述】:
我想制作一个小程序,它将使用来自任何网站的每一个有意义的词
它是用python编写的,我听说过BeautifulSoup,但我不太清楚如何使用它来达到这个目的……小教程? :p
还是就像正则表达式一样简单?喜欢:
re.compile('<.*>(.*)<.*>')
所以括号之间的所有内容?
换行符和其他东西已经完成了;)
提前谢谢各位,对不起小英语...
【问题讨论】:
-
这似乎与 HTML 没有任何关系......您能否提供更多关于每个“单个有意义的词”含义的信息?
-
可以这么说,我的意思是你会去那个网站,全选然后粘贴到记事本中......不需要标记
标签: python html screen-scraping beautifulsoup