【发布时间】:2020-06-26 23:32:36
【问题描述】:
大家晚上好,
我不熟悉网络抓取,所以我想我会为自己挑选一个简单的项目,但我遇到了一些问题。
我的 html 的一小部分如下所示:
<div id="comment-901408_wrap">
<div class="cPost_contentWrap ipsPad">
<div data-role="commentContent" class="ipsType_normal ipsType_richText ipsContained" data-controller="core.front.core.lightboxedImages">
<p>
Text1
</p>
<p>
Text2
</p>
<p>
Text3
</p>
<p>
Text4
</p>
</div>
</div>
</div>
会有多个comment-[id]_wrap id,都带有1个或多个p元素。我想要实现的是制作一个有两列的表格;评论 ID 和文本。一个例子看起来像这样(只是数据框很好):
这可以实现吗?我可以附上一些我尝试过的代码,但我不相信它会真正导致任何地方
【问题讨论】:
标签: python html selenium xpath web-scraping