【问题标题】:How can I get values from Html Tags?如何从 Html 标签中获取值?
【发布时间】:2010-02-12 17:59:50
【问题描述】:

我想从网页中的 html 标签中获取一些数据。例如,我有一个有“www.example.com/test.html”的网站,这是我要拆分的文本。我想要第一个 URL,第一个跨度标签之间的第一个文本和最后一个跨度标签之间的最后一个文本。

如何使用 C# ASP.NET 2.0(不是 3.5)做到这一点?

<a class="tablolinkmetin" target="_blank" href="http://www.iwantthisurl.com/test/2010/subat/12022010_adli_krrnme.htm">
  <img alt=icon src="images/icon/ok.gif" border=0 width="7" height="8">
  <span class=tablolink>
    <span class="genelgeler_mbaslik">I want this text.</span>
  </span>
  <span class="tablolinkaltyazi"><br>and i want here</span> 
</a>
<img src="images/icon/cizgi.png" width="260" height="1"><br>

【问题讨论】:

    标签: c# asp.net html


    【解决方案1】:

    你需要看看:


    这是来自 codePlex.com 的示例

     HtmlDocument doc = new HtmlDocument();
     doc.Load("file.htm");
     foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
     {
        HtmlAttribute att = link["href"];
        att.Value = FixLink(att);
     }
     doc.Save("file.htm");
    

    希望对你有帮助

    【讨论】:

      【解决方案2】:

      如果你给控件一个 id 并将它们设置为 runat="server" 你应该能够直接在你的代码中引用它们。

      所以你的页面应该是这样的:

      <a id="myanchor" runat="server" class="tablolinkmetin" target="_blank" href="http://www.iwantthisurl.com/test/2010/subat/12022010_adli_krrnme.htm"> 
        <img alt=icon src="images/icon/ok.gif" border=0 width="7" height="8"> 
        <span class=tablolink> 
          <span id="firstSpan" runat="server" class="genelgeler_mbaslik">I want this text.</span> 
        </span> 
        <span id="secondSpan" runat="server" class="tablolinkaltyazi"><br>and i want here</span>  
      </a> 
      <img src="images/icon/cizgi.png" width="260" height="1"><br> 
      

      【讨论】:

      • 我无法更改任何值,因为我要解析的 html 文件不是我的。它是另一个站点的页面。我想获取此标记值并在我的站点中使用该值。
      猜你喜欢
      • 2017-04-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-10-29
      • 1970-01-01
      相关资源
      最近更新 更多