【发布时间】:2014-04-15 08:16:30
【问题描述】:
我正在使用漂亮的汤从这个页面http://in.finance.yahoo.com/q?s=AAPL 中提取标题,但我需要过去 3 个月的标题,即从 2013 年 12 月 10 日到 2014 年 3 月 10 日。但我只能提取他们在这个特定的标题页。如何提取任何特定公司所需的标题?
代码:
url = 'http://in.finance.yahoo.com/q?s=AAPL'
data = urllib2.urlopen(url)
soup = BeautifulSoup(data)
divs = soup.find('div',attrs={'id':'yfi_headlines'})
div = divs.find('div',attrs={'class':'bd'})
ul = div.find('ul')
lis = ul.findAll('li')
hls = []
for li in lis:
headlines = li.find('a').contents[0]
print headlines
【问题讨论】:
-
更具体,先发布您的代码。
标签: python web-scraping beautifulsoup yahoo-finance