【发布时间】:2020-09-04 03:41:16
【问题描述】:
我开始开发应用程序。下载到数据库后,我需要从网站上获取一些信息,然后我需要处理这些信息。 好吧,我没有足够的经验,并感谢您的任何推荐。 例如 - 我将与体育网站合作。 (https://terrikon.com/football/spain/championship/) 我需要从表中接收信息并将这些数据下载到数据库中。 我尝试了一些下载数据的方法并理解了最好的方法——使用“htmlagilitypack”。 我阅读了有关使用此库的文档,并且做得最好:
using System;
using System.Xml;
using HtmlAgilityPack;
namespace Parser
{
class Program
{
static void Main(string[] args)
{
var html = @"https://terrikon.com/football/spain/championship/";
HtmlWeb web = new HtmlWeb();
var htmlDoc = web.Load(html);
var node = htmlDoc.DocumentNode.SelectSingleNode("//head/title");
var table = htmlDoc.QuerySelector("#champs-table > table");
var tableRows = table.QuerySelectorAll("tr");
foreach (var row in tableRows)
{
var team = row.QuerySelector(".team");
var win = row.QuerySelector(".win");
var draw = row.QuerySelector(".draw");
var lose = row.QuerySelector(".lose");
Console.WriteLine(team.OuterHtml );
};
}
}
}
如果我要更改此字符串,我可以接收网站标题或所有信息
var node = htmlDoc.DocumentNode.SelectSingleNode("//head");
【问题讨论】:
标签: c# asp.net parsing html-parsing html-agility-pack