【发布时间】:2015-02-28 02:45:54
【问题描述】:
大家好,我是 python 新手。请帮我解决这个要求。
http://www.example.com/ratings/ratings-rationales.jsp?date=true&result=true
在此链接中,我必须先选择日期,然后评级公司会将其出版物列为链接。现在我想搜索一个包含我感兴趣的单词的链接说“稳定”。我使用 python 3.4.2 尝试了以下操作
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import requests
url = "http://www.example.com/ratings/ratings-rationales.jsp?date=true&result=true"
r = requests.get(url)
soup = BeautifulSoup(r.content)
example_links = lambda tag: getattr(tag, 'name', None) == 'a' and 'stable' in tag.get_text().lower() and 'href' in tag.attrs
results = soup.find_all(example_links)
result_links = [urljoin(url, tag['href']) for tag in results]
print (result_links)
这不是打印任何东西。我在下面看到结果
>>>
[]
显然我没有提供日期作为输入。
1.今天的日期如何输入起止日期? (显然要定期检查包含感兴趣单词的链接的更新,这将是以后的问题)
例如,在从日期:31-12-2014 到日期:31-12-2014 作为输入之后
是我需要的超链接输出。
任何建议都会非常有用。提前致谢
这是更新后的代码,我仍然无法得到结果。 >>> [] 是输出
from datetime import datetime
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import requests
#Getting the current date
today = datetime.today()
#For the sake of brevity some parameters are missing on the payload
payload = {
'selArchive': 1,
'selDay': 31,
'selMonth': 12,
'selYear': 2014,
'selDay1': 31,
'selMonth1': 12,
'selYear1': 2014,
'selSector': '',
'selIndustry': '',
'selCompany': ''
}
example_url = "http://www.example.com/
r = requests.post(example_url, data=payload)
rg = requests.get(example_url)
soup = BeautifulSoup(rg.content)
crisil_links = lambda tag: getattr(tag, 'name', None) == 'a' and 'stable' in tag.get_text().lower() and 'href' in tag.attrs
results = soup.find_all(example_links)
result_links = [urljoin(url, tag['href']) for tag in results]
print (result_links)
【问题讨论】:
-
您应该考虑到日期不能相等,并且它们的差异不能超过一个月。
-
但在网站上,我给出了相同的结果(2014 年 12 月 31 日)。我只看到这个条件和另外两个条件,但不是相同的日期条件
if(todate-fromdate>2678400000){ alert('The Date range can not exceeds one month'); document.frmCrisil.selDay.focus(); return false; } -
是的,但是当您尝试单击具有相同日期的日期范围时,会显示错误消息。
-
我不确定我是否理解。如果您尝试输入今天的日期,它将不会显示任何内容,因为今天还没有更新。但如果您有任何日期(星期日除外),您可以看到结果。再次抱歉,如果我占用了您的时间。所以我认为同一日期是有效的。不是吗?
-
是的,你是对的......我正在尝试未来的约会
标签: python html python-3.x beautifulsoup html-parsing