【发布时间】:2018-05-08 14:48:57
【问题描述】:
最近我一直在学习使用 Python 和 Beautiful Soup 进行网页抓取。但是,在尝试抓取以下页面时,我遇到了一些问题:
http://www.librarything.com/work/3203347
我想要从页面中获取的数据是这本书的标签,但我找不到任何方法来获取数据,尽管我花了很多时间在互联网上拖网。
我尝试遵循一些在线指南,但似乎没有一个有效。我尝试将页面转换为 XML 和 JSON,但仍然找不到数据。
目前很困惑,如果能提供任何帮助,我将不胜感激。
谢谢。
【问题讨论】:
-
你的意思是抓取页面上的特定元素吗? IE,Tags 头下的数据?
标签: python json xml web-scraping beautifulsoup