【发布时间】:2021-10-14 05:55:52
【问题描述】:
我使用了两种方法来获取内部应用链接的页面源。
- 第一种方法 - 使用 Robot Framework 关键字 ${html_page} =。获取源代码
- 第二种方法 -
- 使用请求-- visit_url_content = urllib.request.urlopen(url).read().decode('utf-8') 和
- visit_url_content = requests.get(url, 'html.parser').text
在获取页面源代码后,我使用beautifulsoup 提取所有带有标签a 和属性为“href”的链接。 汤 = BeautifulSoup(html_page, "html.parser")
第一种方法我得到大约 20 个链接,但第二种方法我只得到 2 个链接... 我需要在 python 中处理这个,所以不能使用机器人框架选项。 关于为什么会发生的任何帮助
【问题讨论】:
-
为什么这个问题是-1?
标签: html python-3.x python-requests robotframework urllib