【发布时间】:2016-02-19 20:25:57
【问题描述】:
我们有一个旧的 windows 窗体应用程序,使用类似于以下代码的代码
using System.Net;
using System.IO;
using System.Windows.Forms;
string result = null;
string url = "http://www.despegar.cl/shop/flights/results/oneway/ANF/SCL/2016-03-30/1/0/0?from=SB";
WebResponse response = null;
StreamReader reader = null;
try
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
request.Method = "GET";
response = request.GetResponse();
reader = new StreamReader(response.GetResponseStream(), Encoding.UTF8);
result = reader.ReadToEnd();
}
catch (Exception ex)
{
// handle error
MessageBox.Show(ex.Message);
}
finally
{
if (reader != null)
reader.Close();
if (response != null)
response.Close();
}
从despegar cl等外部网站获取源代码,然后获取航班起飞时刻表的数据。 问题在于使用 AngularJS 或类似框架的页面在运行时替换了这些字段。获得的源代码类似于
<span class="hour">{{data.departure.hour.formatted}}</span>
当我们想要找到时
<span class="hour">09:05</span>
如何获取动态字段更新的数据?
【问题讨论】:
标签: c# asp.net angularjs parsing web-crawler