【发布时间】:2016-10-19 08:45:13
【问题描述】:
我正在使用漂亮的汤来报废一个网站。这是CSS
<div id="listing-details-list">
<h3 class="listing-details-header">
Details:
<span>Posted on: 14th June 2016</span>
</h3>
</div>
我用来获取日期的代码是这样的
# date
try:
date=soup.find("h3","listing-details-header")
date_result= str(date.get_text().encode("utf-8").strip()[20:])
print "\nPublished date: ", date_result
except StandardError as e:
date_result="Error was {0}".format(e)
print date_result
我得到的结果是一个日期作为字符串。一些样本是
23rd June 2016
21st July 2016
20th July 2016
3rd July 2016
现在,我希望日期是一个正确的日期,格式如下所示,以便我可以对其进行计算
23/6/2016
21/7/2016
20/7/2016
3/7/2016
在我的代码中获得所需日期的最佳方法是什么?
我希望以这种方式保存日期:
Month= 6
Day = 23
Year = 2016
我尝试了标记为最佳答案的解决方案,它有效
try:
date=soup.find("h3","listing-details-header")
date_result= str(date.get_text().encode("utf-8").strip()[20:])
date_result=parse(date_result) #added
month = date_result.month
day = date_result.day
year = date_result.year
print month
print day
print year
print "\nPublished date: ", date_result
except StandardError as e:
date_result="Error was {0}".format(e)
print date_result
【问题讨论】:
-
“我尝试了标记为最佳答案的解决方案并且它有效” - 并且您将其标记为“已接受”,因此每个人都清楚特定的解决方案对您有用。无需在您的帖子中重复答案。如果您认为您自己的答案与提供的答案有很大不同,您可以随时将其添加为作为单独的答案。
-
谢谢。我会记下来的。我是新来的
标签: python regex string python-2.7 beautifulsoup