【发布时间】:2020-11-04 07:17:06
【问题描述】:
我正在尝试使用多处理,其想法是从 Bing 搜索的结果中获取链接,但使用 selenium 更改其中一种配置(cep 配置)。我有一个列表(filecep)中的所有cep,我想将所有结果写在一个csv文件上。 这是我的 getUrlCleans 函数:
def getUrlCleans(search):
driver = webdriver.Firefox()
f = open('out/'+str(date.today())+'.csv','w')
f.write('url,cep')
f.write('\n')
url_cleans=[]
pool=mp.Pool(mp.cpu_count())
pool.starmap(getUrlbyCEP,[(cep,driver,search,f) for cep in filecep])
pool.close()
f.close()
这是我的 getUrlbyCEP 函数:
def getUrlbyCEP(cep,driver,search,f):
driver.get('https://www.bing.com/account/general?ru=https%3a%2f%2fwww.bing.com%2f%3fFORM%3dZ9FD1&FORM=O2HV65#location')
cepInput = driver.find_element_by_id('geoname')
cepInput.clear()
cepInput.send_keys(cep)
time.sleep(0.5)
driver.execute_script("window.scrollTo(0,document.body.scrollHeight)")
saveButon=driver.find_element_by_id('sv_btn')
saveButon.click()
try:
driver.find_element_by_id('geoname')
# continue
except:
pass
searchInput=driver.find_element_by_id('sb_form_q')
searchInput.send_keys(search)
driver.find_element_by_id('sb_form_q').send_keys(Keys.ENTER)
time.sleep(0.5)
url_cleans=[]
for i in range(2):
url_cleans=getLinks(driver,url_cleans)
time.sleep(2)
driver.find_element_by_xpath('//*[@title="Próxima página"]').click()
url_cleans=getLinks(driver,url_cleans)
for u in url_cleans:
f.write(u+','+cep)
f.write('\n')
我终于打电话了
getUrlCleans('sulamerica')
ang 它给了我错误....我不知道为什么?
【问题讨论】:
-
multiprocessing基本上腌制进程需要与之通信的对象。threading对你有用吗? -
我没用过线程,好建议。
-
谢谢@PanwenWang 我听从了你的建议,成功了!
标签: python selenium multiprocessing pool