【问题标题】:Python Webscraping, how to navigate on a website?Python Web Scraping,如何在网站上导航?
【发布时间】:2021-02-05 07:15:43
【问题描述】:

我正在编写一个程序,该程序应该从网站读取某些数据并只输出某些数据(表格中的数据)。但是,我遇到了一个问题。我编写了一个登录网站的程序,但我必须从那个网站转到下一个网站,然后打开包含数据的文档。不幸的是,我不知道如何更改网站,然后打开文档并读出数据。 有谁知道我怎么能上去吗?

from bs4 import BeautifulSoup
import requests

User = ''
Pass = ''
LOGIN_URL = ''
LOGIN_API_URL = ''


def main():
    session_requests = requests.session()
    result = session_requests.get(LOGIN_URL)
    cookies = result.cookies
    soup = BeautifulSoup(result.content, "html.parser")
    auth_token = soup.find("input", {'name': 'logintoken'}).get('value')

    payload = {'username': User, 'password': Pass , 'logintoken':auth_token }

    result = session_requests.post(
    LOGIN_API_URL,
    data=payload,
    cookies=cookies
    )

    #Report successful login
    print("Login succeeded: ", result.ok)
    print("Status code:", result.status_code)
    print(result.text)

    #Get Data



    # Close Session
    requests.session().close()
    print('Session closed')

# Entry point
if __name__ == '__main__':
    main()

【问题讨论】:

  • 登录后,您应该可以使用会话进入下一页。

标签: python beautifulsoup request


【解决方案1】:

您应该阅读Selenium with Python。由于没有特定的 URL 或登录详细信息(无论如何您都不应该在此处发布),因此我们中的任何人都很难创建一个有效的示例,因为我们没有任何东西可以使用。

尝试使用上面链接中的 selenium,如果您有任何问题或遇到任何问题,请返回并提出具体问题。

BS4 和 requests 可以很强大,但是 selenium 模拟了一个网络浏览器,让你可以像“人类”一样浏览网站。从那里开始。

【讨论】:

  • 谢谢它工作得很好,但现在我遇到了我不知道如何从表中获取数据的问题。
  • @Oskar_GER 没问题,我很高兴它(有点)为你工作!如果此答案确实对您的原始问题有所帮助,请记住选择它作为您问题的答案。如果您的新代码也有问题,请使用新代码创建一个新问题。这里有很多关于硒的问题,还有很多人可以帮助你!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-09-20
  • 2013-01-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-11-13
相关资源
最近更新 更多