【发布时间】:2018-07-28 18:23:07
【问题描述】:
我正在尝试使用推文 ID 抓取推文文本,我的代码是:
import selenium
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
browser=webdriver.Chrome()
base_url='https://twitter.com/FoxNews/status/'
query='964981093127655424'
url=base_url+query
browser.get(url)
title=browser.find_element_by_tag_name('title')
print(title)
输出是:
selenium.webdriver.remote.webelement.WebElement(session="7ca1c0e4c33d62a122bc51bbc171c7eb", element="0.37665530454795326-1")
如何以人类可读的格式打印文本? (在这种情况下:“在推特上,前总统@BillClinton 呼吁更新突击武器禁令”。)
【问题讨论】:
-
@Jayanth,您已经得到了两个合格的答案,您应该选择其中一个作为您预期的解决方案。看来您对标记 answers 感到不自在。
-
如果你收到这样的推文,你既不是在帮自己,也不是在推特上帮个忙。看看developer.twitter.com/en/docs/tweets/post-and-engage/…。只有在没有其他可能性的情况下才应该进行网络抓取,并且 twitter 提供了一种因此使用它。
标签: python selenium web-scraping