【发布时间】:2015-12-02 18:08:56
【问题描述】:
我在使用 BeautifulSoup 提取的网站上有下表 这是网址(我还附上了图片
理想情况下,我希望将每家公司放在 csv 中的一行中,但是我将其放在不同的行中。请看附图。
我希望它像在“D”字段中一样,但我在 A1、A2、A3 中得到它...
这是我用来提取的代码:
def _writeInCSV(text):
print "Writing in CSV File"
with open('sara.csv', 'wb') as csvfile:
#spamwriter = csv.writer(csvfile, delimiter='\t',quotechar='\n', quoting=csv.QUOTE_MINIMAL)
spamwriter = csv.writer(csvfile, delimiter='\t',quotechar="\n")
for item in text:
spamwriter.writerow([item])
read_list=[]
initial_list=[]
url="http://www.nse.com.ng/Issuers-section/corporate-disclosures/corporate-actions/closure-of-register"
r=requests.get(url)
soup = BeautifulSoup(r._content, "html.parser")
#gdata_even=soup.find_all("td", {"class":"ms-rteTableEvenRow-3"})
gdata_even=soup.find_all("td", {"class":"ms-rteTable-default"})
for item in gdata_even:
print item.text.encode("utf-8")
initial_list.append(item.text.encode("utf-8"))
print ""
_writeInCSV(initial_list)
有人可以帮忙吗?
【问题讨论】:
-
如果我可以在 csv 中复制整个表格会更好,但我正在为如何做到这一点而苦苦挣扎
标签: python csv web-scraping beautifulsoup html-parsing