【发布时间】:2015-08-24 12:44:10
【问题描述】:
我想从这个谷歌搜索中提取数据
https://www.google.com.ph/?gfe_rd=cr&ei=JQ7bVZjRDOSL8QeqibewAwgws_rd=ssl#q=scarlett+johansson+age
我想通过获取这个特定的 div 标签来了解艺术家的年龄
<div class="_eF">30 years (November 22, 1984)</div>
这是我目前的代码
Document doc = Jsoup.connect("https://www.google.com.ph/?gfe_rd=cr&ei=eKfaVbWXBomM8QexmIOACw&gws_rd=ssl#q=scarlett+johansson+age").get();
Elements age = doc.getElementsByClass("#_eF");
String urlSource = age.html();
但我得到的只是 javascript 代码,而不是实际的 html 源代码
【问题讨论】:
-
班级明明是
_eF,为什么还有#_eF? -
不管怎样都行不通,因为返回的值是javascript,不包含两者中的任何一个。(#_eF和_eF)
-
向我们展示它为您提供了什么。
-
它给出了实际的页面源
_.Ib=!_.L||9<=_.Hb;_.Jb=!_.sb&&!_.L||_.L&&9<=_.Hb||_.sb&&_.N("1.9.1");_.Kb=_.L&&!_.N("9");_.Lb=_.L||_.qb||_.M; }catch(e){_._DumpException(e)} try{ _.x("gbar.elr",function(){return{es:{f:152,h:60,m:30},mo:"md",vh:window.innerHeight||0,vw:window.innerWidth||0}}); }catch(e){_._DumpException(e)} })(this.gbar_); // Google Inc. -
试试 Deximus 刚刚发布的答案