【发布时间】:2018-12-11 23:12:34
【问题描述】:
非常简单的问题,我正在编写这个脚本来抓取一些网络数据:
for x in df['Product ID']:
search_url = 'url' + x
uclient = uReq(search_url)
page_html = uclient.read()
uclient.close()
page_soup = soup(page_html,"html.parser")
rp = page_soup.findAll("h2",{"class" : 'highlightValue'})[0].text.strip()
将循环的这个结果写回我的数据框的最佳方法是什么?如果我分配一个新列让我们称之为 df['Price'] 它将在循环的每个元素中被覆盖,而我只希望它为 x 分配一个值。
data = ['12345','6789']
pd.DataFrame({'Product ID' : data})
所以如果 12345 = 25 英镑在我的网站上的价格和 6789 英镑 50 英镑我想分别分配回来,我错过了一些简单的东西吗?
想要的输出
Product ID Price
12345 £25
6789 £50
【问题讨论】:
标签: python pandas beautifulsoup