【发布时间】:2010-08-17 11:15:27
【问题描述】:
我正在开发一个网络爬虫。为此,我正在使用 Webbrowser 控件。我有存储在数据库中的 url 列表,我想一一遍历所有这些 URL 并解析 HTML。
我使用了以下逻辑
foreach (string href in hrefs)
{
webBrowser1.Url = new Uri(href);
webBrowser1.Navigate(href);
}
页面完全加载后,我想在“webBrowser1_DocumentCompleted”事件中做一些工作。但是“webBrowser1_DocumentCompleted”没有得到控制,因为我在这里使用循环。只有在“hrefs”中的最后一个url被导航并且控件退出循环时才获得控件。
处理此类问题的最佳方法是什么?
【问题讨论】:
标签: c# navigation browser url-routing web-crawler