【发布时间】:2015-09-14 16:45:42
【问题描述】:
更新:关于我的第二个问题(如何在 MySQL 中将字符串转换为日期格式),我找到了一种方法并想分享它:
1) 将“字符串日期”数据另存为 VARCHAR(不要使用 TEXT)
2) 用PHP或其他方式展示MySQL数据时,使用str_to_date(string-date-column, date-format)的函数,例如如下示例:
$sql = "SELECT * FROM yourtablename ORDER BY str_to_date(string-date-column, '%d %M %Y')";
我正在使用 scrapy 收集数据,写入数据库。从一个网站上,每个项目的发布日期如下:
<p> #This is the last <p> within each <div>
<br>
[15 May 2015, #9789]
<br>
</p>
所以日期总是在“[”之后和“,”之前。我使用以下xpath代码提取:
sel.xpath("p[last()]/text()[contains(., '[')]").extract()
但我会得到整行:
[15 May 2015, #9789]
那么,如何只获取“15 May 2015”的部分?如果可以做到这一点,如何将抓取的字符串(2015 年 5 月 15 日)转换为真实的 DATE 数据,以便用于排序?非常感谢!
【问题讨论】:
标签: python xpath web-scraping scrapy