【发布时间】:2019-05-26 03:05:47
【问题描述】:
我正在尝试为特定网站构建代理抓取工具,但无法转到下一页。
这是我正在使用的代码。
如果你回答了我的问题,请向我解释一下你使用了什么,如果可以的话,如果有关于这种代码的任何好的教程,请给我一些:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time
options = Options()
#options.headless = True #for headless
#options.add_argument('--disable-gpu') #for headless and os win
driver = webdriver.Chrome(options=options)
driver.get("https://hidemyna.me/en/proxy-list/")
time.sleep(10) #bypass cloudflare
tbody = driver.find_element_by_tag_name("tbody")
cell = tbody.find_elements_by_tag_name("tr")
for column in cell:
column = column.text.split(" ")
print (column[0]+":"+ column[1]) #ip and port
nxt = driver.find_element_by_class_name('arrow_right')
nxt.click()
【问题讨论】:
-
试试
nxt = driver.find_element_by_css_selector('.arrow__right>a')。注意类名中有两个下划线 -
在此处发布相关的 HTML。
标签: python python-3.x selenium screen-scraping webdriverwait