【发布时间】:2016-12-17 23:04:32
【问题描述】:
我不是语言专家,也没有任何相关知识。我正在从一个半动态的网站中提取数据。
例如,我需要为“就购房计划提供建议 - 客户类型”和“就购房计划提供建议 - 投资类型”两个栏目列出客户和投资的类型(每种可以有几个)它们可以进入一个单元格,但有某种分隔符,例如“;”。
这是表格的样子
代码如下所示:
就购房计划提供建议
<div id="a2Nb000000035ohEAA" class="collapse DisciplineDetails PassportDetails PermDesc">
<h3 class="PermissionsListHeader">Advising on a home purchase plan</h3>
<br>
<br>
</div>
<ul class="PermissionConditionsList">
<li class="PermissionsConditionsItem">
Customer Type
<ul class="PermCondsLimitationsList">
<li style="list-style: none"><span id="j_id0:j_id1:j_id110:regActTable:0:j_id531:0:j_id533:0:j_id535:0:j_id538"></span></li>
<li class="PermCondsLimitationsItem Popover">Customer</li>
</ul>
</li>
</ul>
<ul class="PermissionConditionsList">
<li class="PermissionsConditionsItem">
Investment Type
<ul class="PermCondsLimitationsList">
<li style="list-style: none"><span id="j_id0:j_id1:j_id110:regActTable:0:j_id531:1:j_id533:0:j_id535:0:j_id538"></span></li>
<li class="PermCondsLimitationsItem Popover">Home purchase plans</li>
</ul>
</li>
</ul>
</div>
【问题讨论】:
-
P.S.我使用 Import.io 进行此提取。
-
在开始使用 RegExp 之前,请向 tony the pony 打个招呼...使用 xpath,或者干脆 querySelector 和 querySelectorAll
-
感谢您的帮助 Jaromanda X,您是否有机会为此任务编写这样的 xpath?我正在努力寻找这方面的任何简单信息,因为它对我来说太技术性了..
-
呃,不,我不这样做
-
可能是为了钱?
标签: javascript java regex xpath import.io