【问题标题】:Extracting a table with Html Agility Pack使用 Html Agility Pack 提取表格
【发布时间】:2012-07-10 09:59:53
【问题描述】:

我正在尝试使用 Html Agility Pack 从网页中提取表格。到目前为止,我已经设法在它方面取得了一些进展。这是我目前的代码

    Dim web As New HtmlAgilityPack.HtmlWeb()
    Dim htmlDoc As HtmlAgilityPack.HtmlDocument = web.Load("--Website url--")
    Dim html As String = htmlDoc.DocumentNode.OuterHtml

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table")

基本上我需要找到一个带有以下html标签的表格

     <table width="100%"  border="0" cellspacing="0" cellpadding="3" summary="Contains search results">

知道如何将表格搜索减少到该特定表格吗?

【问题讨论】:

    标签: html vb.net web-scraping html-agility-pack


    【解决方案1】:

    您需要确定表格在文档中所有表格中的唯一性。它可能是表的这些属性之一,例如使其唯一的summary 属性。或者,它可能是您需要查找的表格内的子元素之一。由于您没有指定,我将展示一个示例,说明如何根据 summary 属性限制结果:

    Dim tabletag = htmlDoc.DocumentNode.SelectNodes("//table[@summary='Contains search results']")
    

    【讨论】:

    • 谢谢,我自己做了,但方式不同。不过,您的方法更优雅。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多