【发布时间】:2012-05-03 15:02:48
【问题描述】:
我的问题是基于一个我非常陌生的领域,所以如果可能的话,我会很感激一些耐心/指向有用资源的指针。
我计划编写一系列 Windows Phone 应用程序。这些应用程序的总体思路是提取网站上可用的信息并将其放到手机上,以便更精简等。
这个想法是我完全陌生的。我以前写过程序来解析应用程序和 xml 文件,但从来没有从网站上删除信息。因此,我完全迷失了。
为了让这个问题变得不那么模糊,更具体 - 让我们举个例子; http://www.luas.ie/。您可以看到该网站有一个“实时信息”部分,您可以在其中选择您的站点并查找下一趟电车的出发时间。
假设我想编写一个简单的 Windows Phone 7 应用程序,它只允许我选择一个车站,然后使用与该网站相同的查询来找出下一趟电车何时离开——我想做的就是是提取,例如“5分钟”并将其打印到屏幕上。
我该怎么做呢?有哪些好的资源可供阅读以在这里学习良好做法?
【问题讨论】:
-
题外话,但您是否查看过这些网站的使用条款?
-
@NicholasButler,不,这是我想知道的另一个领域 - 但是,我认为 SO 不是询问合法性的地方! :)
-
绝对 - 只是想知道!我想除非你很幸运并且该网站使用某种 Web 服务 API,否则你将不得不抓取网站 html,这总是很脆弱。
-
那么本质上是不是可以归结为使用正则表达式(bleh!)和 HtmlAgilityPack 之类的东西来解析 HTML? (htmlagilitypack.codeplex.com)。我希望有一种神奇的、更好的方式,我以前从未听说过或见过! :) 因为它是相关的,我猜使用条款是一个问题,应该始终要求网站所有者允许使用他们的信息?
-
两者都是。您最好的选择可能是联系网站并寻求支持或某种形式的合资企业。
标签: c# parsing web-scraping data-binding windows-phone-7