【发布时间】:2017-06-12 16:38:13
【问题描述】:
我正在尝试抓取除另一个我知道名称的单元格之外的单元格的内容,例如“Staatsform”、“Amtssprache”、“Postleitzahl”等。在图片中,所需的内容总是在正确的单元格中。
基本代码如下,但我坚持下去:
source_code = requests.get('https://de.wikipedia.org/wiki/Hamburg')
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
stastaform = soup.find(text="Staatsform:")...???
提前非常感谢!
【问题讨论】:
-
请包含描述两个感兴趣单元格的 HTML 片段。
-
您只需要单元格中的文本,还是其他内容?
标签: python web-scraping beautifulsoup wikipedia