【发布时间】:2019-06-18 04:29:20
【问题描述】:
所以,首先我有这个代码
$html = file_get_html('https://www.roblox.com/groups/'.$groupid);
$elem = $html->find('div[id=ctl00_cphRoblox_GroupClosed]', 0);
然后在这样做的时候,我得到了这个
<div id="ctl00_cphRoblox_GroupClosed">
<p>Group Closed</p>
</div>
我会过滤掉所有内容,直到到达Group Closed。
现在,在 ROBLOX 更新之后,他们使页面将由 javascript 生成。所以,当我尝试使用file_get_html 函数时,它不会给我很多回报。接下来他们改变了
<div id="ctl00_cphRoblox_GroupClosed"></div>
到
<span ng-if="showJoinGroupButtonUI() == groupConstants.joinStatus.groupClosed" class="small group-membership-text ng-binding ng-scope" ng-bind="layout.closedGroupText">Group Closed</span>
我真的不知道如何让页面加载,以及抓取网站的 html。如您所见,here。加载需要很长时间。
有人将我的问题设置为 7 年前的问题的副本。我正在使用与 directadmin 的共享虚拟主机。所以安装 PhantomJS,对我来说真的不行..
【问题讨论】:
标签: javascript php html web-scraping