ajax页面的无浏览器网页抓取答案

【问题标题】：Browserless web scraping of ajax pageajax页面的无浏览器网页抓取
【发布时间】：2013-03-05 03:37:24
【问题描述】：

在阅读了一些网页抓取教程后尝试使用 Selenium ..

目的是网页/屏幕抓取一个页面，该页面在 Ajax 调用后加载所需数据时（此 ajax 调用在初始页面加载后进行）..

第二个目标是在后台运行 Selenium 代码（不打开任何浏览器）以允许加载页面（包括 Ajax 调用），检索最终 HTML 并在本地执行所需的处理..

目前的代码如下（代码教程来自http://www.geekonweb.com/net/web-page-scraping-using-selenium-and-net/）

public ActionResult Index()
    {
        //--
        //Below path should contain IEDriverServer.exe
        var chrome = new ChromeDriver(@"file path");
        chrome.Url = @"<url>";

        chrome.Navigate();

        //extract the html
        //var retval = ie.ExecuteScript("return document.body.outerHTML");

        string result = chrome.PageSource;


        return View();
    }

目前还没有找到静默运行 Selenium 的方法（没有 GUI）。如果可以的话，请提供帮助。

其次，请告诉 Selenium 如何被告知等待 Ajax 调用完成然后检索数据。

问候，

【问题讨论】：

标签： ajax selenium web-scraping

【解决方案1】：

这是how to wait until an element is present 上的一个问题。这样做是为了等待 AJAX。

这是一个关于天气的问题，可以run selenium headless。

【讨论】：

等待问题似乎已经解决了:)。（有点）..将尝试研究无头运行并通知以防万一实现..谢谢。
无法实现无头浏览器问题。不过，谢谢您的回答。似乎解决了一半的问题。