【问题标题】:PHP How To convert a list of strings (array) to an nested array based on string contentPHP如何根据字符串内容将字符串列表(数组)转换为嵌套数组
【发布时间】:2015-12-20 18:08:45
【问题描述】:

我有一个包含关键字的字符串列表。

//random keywords random order
$array = array(
    'Keyword7 keyword4 keyword9 keyword1'
    'keyword4 keyword9 Keyword7 keyword2'
    'Keyword7 keyword4 keyword9 keyword3'
    'keyword3 keyword9 Keyword7 keyword5'

);

我想找到一个存在于所有字符串"Keyword7" and Keyword9" 中的关键字并删除它们。我现在想将这些关键字设置为我的新数组的键。

$new_array = array();
$new_array["Keyword7 Keyword9"] = array();

这个新数组的值现在应该是相同的字符串,但现在它们缺少父关键字/s。

$new_array = array(
    'Keyword7 keyword9' =>array(
        array(
            ' keyword4 keyword1'
            ' keyword4 keyword2'
            ' keyword4 keyword3'
            ' keyword3 keyword5'
        );
    )
)

"keyword4" 是出现次数最多的下一个匹配项,因此接下来会出现。其次是下一个最佳匹配“keyword3”或“keyword5”。

$new_array = array(
    'Keyword7 keyword9' =>array(
        'keyword4' => array(
            'keyword1'
            'keyword2'
            'keyword3'
        ),
        'keyword3' =>array(
            'keyword5'
        )
    )
)

下面的字符串都是唯一的关键字数组是完整的。

到目前为止我做了什么

准备好数组

    $keywordlist_array = array();

    foreach ($keywordlist as $key => &$string) {

        $new_str = trim(preg_replace('/\s+/', ' ',$string),' ');
        $arr = explode(' ', $new_str);
        asort($arr);

        $keys = array_values($arr);

        $keywordlist_array[$key] = array_combine($keys, array_fill_keys($keys, 0));

        $string = implode(' ', $arr);
    }

这会删除任何多余的空白并按字母顺序排列单词,以便于比较。我还保存了字符串的数组版本供以后使用。

这个循环计算每个关键字在所有字符串中出现的次数,这确实有效,但我还没有设法将它用于任何用途。

    foreach ($keywordlist_array as $key_1 => $array_1) {

        foreach ($keywordlist_array as $key_2 => $array_2) {

            foreach (array_keys($array_1) as $keyword) {

                if(array_key_exists($keyword,$array_2)){

                    $keywordlist_array[$key_1][$keyword]++;
                }
            }
        }
    }

ive 还创建了一个函数来完成大部分工作,但是当涉及到具有多个父键的数组时,我就卡住了。

    function keywordListToNestedArray($keywordlist_array){

        $new_array = array();

        $length = count($keywordlist_array);

        $all_share_keywords = false;
        $some_share_keywords = false;


        $keywords  = array();

        $new_keywordlist_array = array();

        $max_values = array();


        foreach ($keywordlist_array as $key => $arr) {

            if(in_array($length, $arr)){

                $all_share_keywords = true;

                if(!$keywords){

                    foreach ($arr as $keyword => $value) {

                        if($value == $length){
                            $keywords[] = $keyword;
                        }
                    }
                }
                if($keywords){

                    $new_keywordlist_array[$key] = array_diff_key($arr, array_flip($keywords));
                }


            } else {



            }
        }

        if($all_share_keywords){

            $keyword = implode(' ', $keywords);
            $new_array[$keyword] = keywordListToNestedArray($new_keywordlist_array );

        } else if($some_share_keywords){

            // will have multiple new parents


        } else {

            //all values equal 1 (one occurance)

            foreach ($keywordlist_array as $key => $keywords) {

                $new_array[$key] = implode(' ', array_keys($keywords));
            }
        }

        return $new_array;
    }

    $new_array = keywordListToNestedArray($keywordlist_array);

可能有帮助的 PHP 函数是similar_text() 和 levenshtein(),

问题是“你会做什么,或者你将如何实现这一目标?”。不需要完整的编码答案,只需要一点帮助即可开始。

【问题讨论】:

    标签: php arrays string string-comparison


    【解决方案1】:

    我有一些空闲时间,所以我试了一下。它并不完美 - 但它可以满足您的需求。也许对你有帮助。

    例如。输出:

    数组 ( [keyword1 ] => 数组 ( [keyword2 ] => 数组 ( [keyword3 ] => 数组 ( [0] => 关键字 4 [1] => 关键字 5 [2] => 关键字 7 [3] => 关键字6 [4] => 关键字10 [5] => 关键字9 [6] => 关键字8 ) ) ) )

    <?php
            $keywords = array(
                'keyword1 keyword2 keyword3 keyword4',
                'keyword1 keyword2 keyword3 keyword5',
                'keyword1 keyword2 keyword7 keyword6',
                'keyword1 keyword10 keyword9 keyword8'
            );
    
            //create a new array with all the keywords
            $keywordArray = [];
            foreach($keywords as $keyword){
                $pieces = explode(" ", $keyword);
                foreach($pieces as $piece){
                    $keywordArray[] = $piece;
                }
            }
            //count each keyword appearence
            $keywordCount = array_count_values($keywordArray);
    
            //create associative array key names
            $max = count($keywords);
            $newArray = [];
            while($max >= 0){
                $myStr = "";
                foreach($keywordCount as $key => $value){
                    if($value == $max){
                        $myStr .= $key." ";
                    }
                }
                if($myStr != ""){
                    $newArray[$myStr] = $max;
                }
                $max--;
            }
    
            //get final array data
            end($newArray);
            $values = explode(" ", key($newArray));
            foreach($values as $value){
                if($value != ""){
                    $finalArray[] = $value;
                }
            }
            unset($newArray[key($newArray)]);
            reset($newArray);
    
            //add previous key and final data to it
            end($newArray);
            $testArray[key($newArray)] = $finalArray;
            $rKey = key($newArray);
            unset($newArray[key($newArray)]);
            reset($finalArray);
    
            //repeat proccess from bottom to top
            while(!empty($newArray)){
                end($newArray);
                $testArray[key($newArray)] = $testArray;
                unset($newArray[key($newArray)]);
                unset($testArray[key($testArray)]);
                reset($newArray);
            }
            unset($testArray[$rKey]);
    
    print_r($testArray);
    
    ?>
    

    【讨论】:

      猜你喜欢
      • 2014-03-16
      • 2018-09-28
      • 1970-01-01
      • 2016-02-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-06-16
      相关资源
      最近更新 更多