【发布时间】:2021-07-01 19:55:43
【问题描述】:
那是网址:https://www.zebrafell.de/starkwind_check.html
我想提取(用于我的天气页面):
Letzte Aktualisierung: Mo, 07. Jun, 21:31
阿默西
Amtliche WARNUNG vor STARKWIND
Mo, 07. Jun, 20:37 Uhr
Es treten Gewitter und Windböen mit Geschwindigkeiten um 45 km/h (13m/s, 25kn, Bft 6) auf.
这是网页上的相关剪辑:
...<body><div id="main"><div id="wettertab">
<p><strong>Letzte Aktualisierung: Mo, 07. Jun, 21:31 Uhr</strong></p>
<h1 id="Bayern">Bayern</h1>
<h2 id="Ammersee">Ammersee</h2>
<table>..<thead>
<tr><th>Schlagzeile</th><th>Gültig von</th><th>Gültig bis</th><th>Beschreibung</th></tr></thead>
<tr><td>Amtliche WARNUNG vor STARKWIND</td><td>Mo, 07. Jun, 20:37 Uhr</td><td></td><td>Es treten Gewitter und Windböen mit Geschwindigkeiten um 45 km/h (13m/s, 25kn, Bft 6) auf.
</td></tr></table>...
我还没有找到解决它的正确方法......(这是我第一次 - 我尝试使用 got 和 JSDOM)
const vgmUrl = "https://www.zebrafell.de/starkwind_check.html";
const response = await got(vgmUrl);
const dom = new JSDOM(response.body);
console.log("test", dom.window.document.querySelectorAll("Ammersee"));
但结果总是空的...我什至找不到“Ammersee”?! 也许有人有时间向我展示基础知识...谢谢 loz(我厌倦了尝试和错误)
【问题讨论】:
-
就我个人而言,我会使用 Puppeteer 库进行网页抓取,但您可以从这篇文章中获得一些灵感 stackoverflow.com/questions/58052001/…
-
还有为什么你有
querySelectorAll("Ammersee")而不是querySelectorAll("#Ammersee")?