【发布时间】:2022-01-16 10:54:56
【问题描述】:
我是 Python 新手,一直在尝试编写一个可以从 Twitter 抓取数据的应用程序。我尝试在堆栈和互联网上搜索所有类似的可能解决方案,但失败了。
我想抓取所有这些用户名: See here
这是我的代码:
driver.get("https://twitter.com/twitterusername/followers")
sleep(10)
usernames = driver.find_elements_by_class_name("css-901oao.css-16my406.r-poiln3.rbcqeeo.r-qvutc0")
for username in usernames:
print(username.get_attribute("href"))
我得到的结果:
None
None
None
None
None
None
None
... 继续
感谢您的帮助。
【问题讨论】:
-
为什么是巨大的
sleep(10)? -
我只是在测试它。我稍后会改变它。你能帮我么? :(
-
使用这种类不是一个好习惯,因为它们被混淆了并且会改变。只需使用父类并接触到下面的孩子。
document.querySelectorAll('div[aria-label="Timeline: Followers"] a[role="link"]').forEach(a => console.log(a['href'])) -
我不明白这个...你能用我的代码为我提供修复吗?
-
我正在使用 Python。我认为上面的代码是在 Java/JavaScript 中的。