【发布时间】:2013-03-08 22:59:40
【问题描述】:
我尝试使用 HTML 敏捷包解析以下 HTML。
这是一段 HTML 代码:
<body id="station_page" class="">
...
<div>....</div>
<script type="text/javascript">
if (Blablabla == undefined) { var Blablabla = {}; }
Blablabla .Data1= "I want this data";
Blablabla .BlablablaData =
{ "Data2":"I want this data",
"Blablabla":"",
"Blablabla":0 }
{ "Blablabla":123,
"Data3":"I want this data",
"Blablabla":123}
Blablabla .Data4= I want this data;
</script>...
我正在尝试获取这 4 个数据变量(Data1、Data2、Data3、Data4)。首先,我试图找到javascript:
doc.DocumentNode.SelectSingleNode("//script[@type='text/javascript']").InnerHtml
如何检查它是否真的是正确的 javascript? 找到相关的 javascript 后如何获取这 4 个数据变量(Data1、Data2、Data3、Data4)?
【问题讨论】:
-
我认为这是错误的做法。不知道什么是正确的方法,但这(使用 htmlagilitypack)不是。
-
听起来您需要执行 javascript,而不仅仅是解析它?如果是这样,那么这是一种方法:stackoverflow.com/questions/2530789/…
标签: c# html parsing html-agility-pack