【发布时间】:2017-10-05 05:02:21
【问题描述】:
我刚开始在 R 中进行网络抓取,我输入了以下代码:
mps <- read_html("http://tunisie-annonce.com/AnnoncesImmobilier.asp")
mps %>%
html_nodes("tr") %>%
html_text()
获取我放入文本文件中的所需内容。我的问题是我想消除这些红点,但我做不到。请你帮助我好吗?
我认为这些要点正在替换html代码中的<b>和<br>。
【问题讨论】:
-
着陆页包含一个表格。我不清楚你的目的,你想提取该表的内容并在 R 中的 data.frame 中吗?或者您可能对页面的其他内容感兴趣?
-
@SabDeM 是的,是的,我想提取表格的内容。我提取了该文本,我只需要消除那些奇怪的点即可将其放入数据框中。
标签: r web html-parsing screen-scraping rvest