【发布时间】:2018-10-29 01:55:51
【问题描述】:
加载此页面时在 HtmlPage 对象中返回的动态内容没有任何运气:https://www.fangraphs.com/leaders/splits-leaderboards?splitArr=5&strgroup=season&statgroup=1&startDate=2018-03-01&endDate=2018-11-01&filter=IP%7Cgt%7C0&position=P&statType=player&autoPt=true&players=&pg=0&pageItems=30&sort=22,1&splitArrPitch=&splitTeams=false
“react-drop-test” div 为空。我正在尝试使用“导出数据”文本找到锚点,以便我可以单击它并将内容作为流获取。
有什么想法可以让 HtmlPage 包含动态内容吗?
这是我现在拥有的示例。锚永远不会返回任何元素。
webClient = new WebClient(BrowserVersion.CHROME);
webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);
webClient.getCookieManager().setCookiesEnabled(false);
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.setAjaxController(new NicelyResynchronizingAjaxController());
webClient.setJavaScriptTimeout(jsTimeout);
updateJSErrorListener(webClient);
int thisYear = year;
if (isEarlySeason()) {
thisYear = year - 1;
}
String leftyURL = "https://www.fangraphs.com/leaderssplits.aspx?splitArr=5&strgroup=season&statgroup=1&startDate=" + thisYear + "-03-01&endDate=" + year + "-11-01&filter=IP%7Cgt%7C0&position=P&statType=player&autoPt=true&players=&pg=0&pageItems=30&sort=22,1";
HtmlPage page = webClient.getPage(leftyURL);
HtmlAnchor leftyAnchor = null;
HtmlDivision div = (HtmlDivision) page.getElementById("react-drop-test");
List<HtmlElement> anchors = div.getElementsByTagName("a");
for (DomElement anchor:anchors2) {
if ((anchor.getAttribute("class").contains("data-export"))) {
leftyAnchor = (HtmlAnchor) anchor;
break;
}
}
Page p = leftyAnchor.click();
InputStream is = p.getWebResponse().getContentAsStream();
List<List<String>> leftyCSV = readCSVFile(is);
【问题讨论】:
-
寻求调试帮助的问题(“为什么这段代码不起作用?”)必须包括所需的行为、特定的问题或错误以及在问题本身中重现它所需的最短代码。没有明确问题陈述的问题对其他读者没有用处。请参阅:如何创建 Minimal, Complete, and Verifiable 示例
-
已更新代码。