【发布时间】:2014-09-14 07:54:56
【问题描述】:
我在使用 lxml 进行抓取时遇到了一些问题 我刚刚编写了一个运行良好的代码,但我有两个问题
-
我希望姓名和地址在同一行,每个条目都应该在不同的行中
name1,adress1 name2,adress2
我不需要数据中的任何方括号
- 我必须输入 500 个代码,所以我想从外部文本/csv 文件中导入它 请帮我看看我该怎么做
import lxml.html as lh
from selenium import webdriver
browser = webdriver.Firefox()
from lxml import html
for cod in ("35211","36116","36542"):
browser.get('http://kmbsapps.konicaminolta.us/wheretobuy/main_search.jspx?productCategory=Office+Systems&sl_zip='+cod)
content = browser.page_source
tree = lh.fromstring(content)
name=tree.xpath('//tr/td/span[@class="largecol"]/text()')
adress=tre.xpath('//tr/td/span[@class="smallcol"]/text()')
print(name,adress)
【问题讨论】:
-
text/csv 长什么样子?
-
它在列中的excel中
-
我的意思是:有哪些列?
-
csv 文件类似于 36116 36542 36693 35630 35802 35805 85719 85713 85040 85281 86301 72703
-
很难在评论中说出它是什么。它们是单行数字(没有标题)吗?
标签: python selenium web-scraping lxml