【发布时间】:2011-02-14 16:50:50
【问题描述】:
我不久前使用 python 编写了一个爬虫,它在命令行中运行良好。我现在已经为应用程序制作了一个 GUI,但是我遇到了一个问题。当我尝试更新 gui 内的文本时(例如“获取 URL 12/50”),我无法看到刮板中的函数正在抓取 100 多个链接。此外,当从一个抓取功能转到一个应该更新 gui 的功能时,再到另一个功能时,在运行下一个抓取功能时似乎会跳过 gui 更新功能。一个例子是:
scrapeLinksA() #takes 20 seconds
updateInfo("LinksA done")
scrapeLinksB() #takes another 20 seconds
在上面的例子中,updateInfo 永远不会执行,除非我用 KeyboardInterrupt 结束程序。
我认为我的解决方案是线程,但我不确定。我该怎么做才能解决这个问题?
我正在使用:
- PyQt4
- urllib2
- 美汤
【问题讨论】:
标签: python pyqt4 urllib2 beautifulsoup screen-scraping