【发布时间】:2018-03-24 20:52:40
【问题描述】:
我一直在互联网上四处寻找获取事件日期并将该日期存储到数据库中的方法,但找不到太多。
我能够从网站上获取日期,但我不知道如何存储它。
我只想从网站获取日期,然后以 Y-m-d 的格式存储它。如果您知道任何方法,请告诉我。
链接:https://www.brent.gov.uk/events-and-whats-on-calendar/?eventCat=Wembley+Stadium+events
<?php
$curl = curl_init();
$all_data = array();
$url = "https://www.brent.gov.uk/events-and-whats-on-calendar/?eventCat=Wembley+Stadium+events";
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
$result = curl_exec($curl);
$event = array();
preg_match_all('/<h3 style="margin:0px!important;">(.*?)<\/h3>/si',$result,$match);
$event['title'] = $match[1];
print_r($event['title']);
echo $all_data;
?>
【问题讨论】:
-
这里没有 db 的东西。
-
建议使用 python 脚本而不是 PHP。 BeautifulSoup 可以很容易地用来写一个又快又脏的刮板。 Scrapers 应该不那么频繁地使用(也许一天一次),所以用 php 编写它太费力了。
-
@udiboy1209 那些懂 PHP 而不懂 Python 的人呢?
-
@FunkFortyNiner 这就是问题所在,我只是不知道如何将该数组数据存储为一种格式,然后我可以将其保存到数据库中
-
@udiboy1209 我真的不知道python,但是我正在使用爬虫来获取原始网站每天添加的事件日期,我不知道每天爬一次
标签: php mysql database curl web-scraping