【发布时间】:2018-04-09 14:25:35
【问题描述】:
我正在使用 Powershell 来试验网页抓取,并想知道是否有更简单的方法来处理元素?
有没有办法将 Html 页面转换为 powershell 中具有适当深度的对象?类似于 Convert-ToJson -Depth 的东西?
例如,要得到某个结果:
$page = Invoke-WebRequest -uri $URI
Write-Host $page.html.body.div[4].a[5]
或许
$page = Invoke-WebRequest -uri $URI
$divs = $page.getElementsbyID("image-div")
$thumbs = $ $divs.getElementsbyID("thumbnails")
Write-host $thumbs[4]
Powershell 中是否已经有一些附加组件或功能可以将 html 解析为具有深度的对象?
【问题讨论】:
-
您可以尝试使用Selenium Web Browser automation。
-
HTML 敏捷包看起来很有希望。我会在测试后报告。我在 PS 中使用过 Selenium Web Driver,它运行良好,但只是在 Powershell 中学习和探索替代方案。
标签: html powershell parsing