【发布时间】:2012-08-13 08:23:21
【问题描述】:
我正在使用 Argotic Syndication Framework 来处理提要。
但问题是,如果我将 URL 传递给 Argotic,它不是有效的提要(例如,http://stackoverflow.com 这是一个 html 页面,而不是提要),程序就会挂起(我的意思是,Argotic 停留在无限循环)
那么,如何检查一个 URL 是否指向一个有效的提要?
【问题讨论】:
我正在使用 Argotic Syndication Framework 来处理提要。
但问题是,如果我将 URL 传递给 Argotic,它不是有效的提要(例如,http://stackoverflow.com 这是一个 html 页面,而不是提要),程序就会挂起(我的意思是,Argotic 停留在无限循环)
那么,如何检查一个 URL 是否指向一个有效的提要?
【问题讨论】:
从 .NET 3.5 开始,您可以在下面执行此操作。如果它不是有效的提要,它将引发异常。
using System.Diagnostics;
using System.ServiceModel.Syndication;
using System.Xml;
public bool TryParseFeed(string url)
{
try
{
SyndicationFeed feed = SyndicationFeed.Load(XmlReader.Create(url));
foreach (SyndicationItem item in feed.Items)
{
Debug.Print(item.Title.Text);
}
return true;
}
catch (Exception)
{
return false;
}
}
或者您可以尝试自己解析文档:
string xml = "<?xml version=\"1.0\" encoding=\"utf-8\" ?>\n<event>This is a Test</event>";
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.LoadXml(xml);
然后尝试检查根元素。它应该是 feed 元素并具有“http://www.w3.org/2005/Atom”命名空间:
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule" xmlns:re="http://purl.org/atompub/rank/1.0">
参考资料: http://msdn.microsoft.com/en-us/library/system.servicemodel.syndication.syndicationfeed.aspx http://dotnet.dzone.com/articles/systemservicemodelsyndication
【讨论】:
System.ServiceModel.Syndication 支持哪些提要格式?
System.ServiceModel.Syndication 不支持。
您可以检查内容类型。它必须是text/xml。请参阅this question 以查找内容类型。
您可以使用此代码:
var request = HttpWebRequest.Create("http://www.google.com") as HttpWebRequest;
if (request != null)
{
var response = request.GetResponse() as HttpWebResponse;
string contentType = "";
if (response != null)
contentType = response.ContentType;
}
感谢the question的回答
更新
要检查它是否是提要地址,您可以使用W3C Feed Validation 服务。
更新2
正如 BurundukXP 所说,它有一个 SOAP API。要使用它,您可以阅读this question 的答案。
【讨论】:
您可以使用Feed Validation Service。它有SOAP API。
【讨论】:
如果您只想将其转换为有效的 RSS/ATOM,您可以使用http://feedcleaner.nick.pro/ 对其进行清理。或者,您可以fork the project。
【讨论】: