【发布时间】:2013-03-11 01:57:38
【问题描述】:
我正在尝试从 Google 财经网络抓取数据,特别是股票报价。我正在使用此处找到的答案:How to create a stock quote fetching app in python,它工作正常,但仅适用于谷歌。我是正则表达式的新手,注意到需要更改的内容,但不知道该怎么做。
以下代码用于解析 google 报价的数据以获取当前价格。
m = re.search('id="ref_694653_l".*?>(.*?)<', content)
694653 是特定于谷歌的。如果我做Zynga,ZNGA,应该找:
<span id="ref_481720736332929_l">3.57</span>
我想要一个搜索的正则表达式
id="ref_SOME_NUMBER_l">SOME_PRICE"
任何帮助将不胜感激!
【问题讨论】:
-
改用BeautifulSoup。使用 BeautifulSoup 从 HTML 中提取信息要比制作一个在每种情况下都可能有效也可能无效的复杂正则表达式要容易得多。