【问题标题】:Combine associated data from single data sets合并来自单个数据集的关联数据
【发布时间】:2023-03-21 18:00:01
【问题描述】:

我接手了一个已经包含大量数据的项目。 给定的格式不是最好的,并且只包含单个数据集。它们中的大多数属于同一个“事件”。我想合并这些数据集。

给定的数据集采用以下格式:

给定数据集:

[0] => Array
    (
        [id] => 4
        [title] => Party 1
        [start] => 2017-06-14
        [end] => 2017-06-14
        [className] => Array
            (
                [0] => yyy
                [1] => zzz
            )

        [color] => #26B99A
        [zeit] => xxx
    )

[1] => Array
    (
        [id] => 6
        [title] => Party 2
        [start] => 2017-04-27
        [end] => 2017-04-27
        [className] => Array
            (
                [0] => xxx
                [1] => yyy
            )

        [color] => #26B99A
        [zeit] => zzz
    )

[2] => Array
    (
        [id] => 7
        [title] => Party 2
        [start] => 2017-04-28
        [end] => 2017-04-28
        [className] => Array
            (
                [0] => xxx
                [1] => yyy
            )

        [color] => #26B99A
        [zeit] => zzz
    )

[3] => Array
    (
        [id] => 9
        [title] => Party 2
        [start] => 2017-04-29
        [end] => 2017-04-29
        [className] => Array
            (
                [0] => xxx
                [1] => yyy
            )

        [color] => #26B99A
        [zeit] => zzz
    )

[4] => Array
    (
        [id] => 11
        [title] => Party 3
        [start] => 2017-07-30
        [end] => 2017-07-30
        [className] => Array
            (
                [0] => xxx
                [1] => yyy
            )

        [color] => #26B99A
        [zeit] => zzz
    )

[5] => Array
    (
        [id] => 13
        [title] => Party 3
        [start] => 2017-07-31
        [end] => 2017-07-31
        [className] => Array
            (
                [0] => xxx
                [1] => yyy
            )

        [color] => #26B99A
        [zeit] => zzz
    )......

在这种情况下,将只有一个“Party 1”,并结合了“Party 2”和“Party 3”

因此结果应如下所示:

预期结果

[0] => Array
(
    [id] => 4
    [title] => Party 1
    [start] => 2017-06-14
    [end] => 2017-06-14
    [className] => Array
        (
            [0] => yyy
            [1] => zzz
        )

    [color] => #26B99A
    [zeit] => xxx
)

[1] => Array
(
    [id] => 6
    [title] => Party 2
    [start] => 2017-04-27
    [end] => 2017-04-29    <---- end date edited
    [className] => Array
        (
            [0] => xxx
            [1] => yyy
        )

    [color] => #26B99A
    [zeit] => zzz
)


[2] => Array
(
    [id] => 11
    [title] => Party 3
    [start] => 2017-07-30
    [end] => 2017-07-31     <---- same
    [className] => Array
        (
            [0] => xxx
            [1] => yyy
        )

    [color] => #26B99A
    [zeit] => zzz
)

因此,我使用了一个 PHP 函数,它通过事件的标题对其进行格式化:

PHP:

function formateEvents($event_array){
$events = array();

foreach($event_array as $event)
{
    if(!isset($events[$event['title']]))
    {
        $events[$event['title']]['id']           = $event['id'];
        $events[$event['title']]['title']        = $event['title'];
        $events[$event['title']]['start']        = $event['start'];
        $events[$event['title']]['end']          = $event['end'];
        $events[$event['title']]['name']         = $event['title'];
        $events[$event['title']]['className']    = $event['className'];
        $events[$event['title']]['color']        = $event['color'];
        $events[$event['title']]['zeit']         = $event['zeit'];
    }else{


        if(strtotime($event['start']) < strtotime($events[$event['title']]['start']))
        {
            $events[$event['title']]['start']    = $event['start'];
        }

        if(strtotime($event['end']) > strtotime($events[$event['title']]['end']))
        {
            $events[$event['title']]['end']    = $event['end'];
        }
    }
}

return array_values($events);
}

这适用于上述这些数据集。 但是:问题是,我也有几年前的事件数据,它们通常具有相同的标题。在这种情况下,事件持续时间超过多年。我想防止这种情况的发生,只有同名的数据以及连接的天数应该合并。

我想到的唯一方法是检查日期是否连续......比如 2018-01-01、2018-01-02、2018-01-03 应该是同一个事件...如果中间缺了一天,它应该算作另一个事件

【问题讨论】:

  • 我认为需要指定一个事件可以连接到另一个具有相同标题的事件多长时间。但是有了这个设置,您可以将结果累积在另一个由标题索引的数组中,并与您拥有的日期进行比较来评估它们中的每一个。你明白我的意思吗?
  • 我明白了,但不可能一概而论事件持续时间......它们可以从 1 天到 3 个月不等。其中一些是从 12 月到 1 月 - 所以我也不能按年份分开它们。
  • 我明白这一点。但是您说:“我想以一种方式防止这种情况发生,即只有具有相同名称的数据以及连接的日期应该组合在一起”。在这种情况下,您如何确定这些日子是否相互关联?
  • 我想到的唯一方法是检查日子是否连续......就像 2018-01-01, 2018-01-02, 2018-01-03 应该是一样的事件...如果中间缺少一天,它应该算作另一个事件
  • 好的,这很有帮助。请将此信息添加到问题本身,以便每个人都可以阅读。 :)

标签: php algorithm sorting multidimensional-array


【解决方案1】:

我的解决方案比我想要的要复杂得多,但它确实有效。 所以,让我解释一下。

首先我按标题映射所有事件。

$eventsIndexedByTitleAndEndDate = array();
foreach ($event_array as $event) {
    $eventTitle = $event['title'];
    $eventEnd = $event['end'];

    $eventsIndexedByTitleAndEndDate[$eventTitle][$eventEnd] = $event;
}    

然后我遍历这些数据以找到我想要使用的日期,然后我将这些日期映射到另一个仍然使用事件标题作为主索引的数组中。

$eventDates = array();
foreach ($eventsIndexedByTitleAndEndDate as $eventTitle => $eventIndexedByTitle) {
    $datesFromIndexedTitle = (array_keys($eventIndexedByTitle));

    $start = $datesFromIndexedTitle[0];
    $end = $datesFromIndexedTitle[0];
    foreach ($datesFromIndexedTitle as $dateFromIndexedTitle) {
        $nextDayFromEnd = date('Y-m-d', strtotime("+1 day", strtotime($end)));
        if ($dateFromIndexedTitle == $nextDayFromEnd) {
            $end = $dateFromIndexedTitle;
        } elseif ($dateFromIndexedTitle > $nextDayFromEnd) {
            $eventDates[$eventTitle][] = [
                'start' => $start,
                'end' => $end,
            ];
            $start = $dateFromIndexedTitle;
            $end = $dateFromIndexedTitle;
        }
    }
    $eventDates[$eventTitle][] = [
        'start' => $start,
        'end' => $end,
    ];
}

我映射了所有日期之后,我使用引用运行此数组,以使用由 Title 索引的数组中的数据更新键,并按应有的方式更新开始/结束日期。

foreach ($eventDates as $title => &$eventDate) {
    foreach ($eventDate as &$eachEvent) {
        $start = $eachEvent['start'];
        $end = $eachEvent['end'];

        $eachEvent = $eventsIndexedByTitleAndEndDate[$title][$start];
        $eachEvent['start'] = $start;
        $eachEvent['end'] = $end;
    }
}

我相信可能有一种更简单的方法可以做到这一点,但我现在想不出一个解决方案,尽管这是一个很好的练习。 :)

【讨论】:

  • 这个功能和我的差不多。 - 如果旧事件与新事件具有相同的标题,问题仍然存在。 :-)
  • 立即查看。 :)
  • 嗯...如果我将每个 $eachEvent 保存到一个新数组中并在 fkt 结束时返回它,它可以按我的意愿工作,谢谢! :)
  • 请注意,在这种特殊情况下,如果您确实有很多事件,这将严重影响性能,因此我建议您找到更新数据库的方法为此在某个时候。由于不再需要此功能(一旦数据库正确)。
  • 我已经在表格中添加了一个新字段event_id 并使用此函数相应地组合事件;-) 之后我就可以通过它的新事件ID获取我想要的事件
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-09-27
  • 2017-01-31
  • 1970-01-01
  • 1970-01-01
  • 2022-11-23
  • 1970-01-01
相关资源
最近更新 更多