【问题标题】:VBA, Extract innertext, excluding specific tags, from HTMLVBA,从 HTML 中提取内部文本,不包括特定标签
【发布时间】:2017-02-07 20:17:45
【问题描述】:

您好,我需要使用 VBA 并排除一些标签(例如 span 标签)从 HTML 中提取特定行(例如所需行)。 这是 HTML 示例:

<div id="main-content">
     <span>...sometext</span>
     required text 1
     required text 2
     <span>...sometext</span>
</div>

这是我的 VBA 代码:

Excel.ActiveWorkbook.ActiveSheet.Cells(11, 11).Value = doc2.GetElementById("main_content").innertext

显然这会返回:

...sometext
required text 1
required text 2
...sometext

因此我对这个特定示例的问题是如何提取“必需的文本 i”(没有标签),而没有“...sometext”(包含在跨度标签中)?

谢谢

【问题讨论】:

  • Split(Split(doc2.GetElementById("main_content").innerHTML, "&lt;/span&gt;")(1), "&lt;span&gt;")(0)
  • np 你能接受作为答案吗?谢谢。

标签: html vba excel


【解决方案1】:
Split(Split(doc2.GetElementById("main_content").innerHTML, "</span>")(1), "<span>")(0) 

【讨论】:

    猜你喜欢
    • 2018-05-22
    • 2020-11-21
    • 1970-01-01
    • 2019-07-13
    • 2021-08-08
    • 1970-01-01
    • 2021-05-05
    • 1970-01-01
    相关资源
    最近更新 更多