【发布时间】:2015-02-08 20:18:57
【问题描述】:
我正在尝试创建一个 python 函数,该函数接受 youtube url 视频链接并将描述(如果存在)作为字符串返回,其中所有非 ascii 字符都替换为空格。我在让它工作时遇到了一些麻烦。
任何人都有任何想法。我认为 <p id="eow-description" ></p> 在所有视频中都用于保存描述,但我不知道如何让它只返回一个完整的字符串,格式化我们如何看待它,而不是它在页面源中的格式化方式。
我正在使用这 2 个视频来测试它,有无描述。
https://www.youtube.com/watch?v=9bZkp7q19f0
https://www.youtube.com/watch?v=eHvccEXfacM
video_source = requests.get("https://www.youtube.com/watch?v=9bZkp7q19f0")
parsed_soup = BeautifulSoup(video_source.content)
print parsed_soup.find_all("p", {"id": "eow-description"})[0]
我不知道如何将其格式化为字符串。
【问题讨论】:
-
到目前为止你能告诉我们你的代码吗?
-
您是否考虑过使用YouTube Data API?它允许您使用
/list端点一次获取多个视频的信息,并且返回的信息包括描述。 -
否则,请给我们您的实际代码,也许您有错误?
-
@MartijnPieters 你能检查我是否做得对吗:)
-
@MohitBhasi:恐怕你做得不对。
标签: python web-scraping beautifulsoup