【发布时间】:2015-12-20 18:08:45
【问题描述】:
我有一个包含关键字的字符串列表。
//random keywords random order
$array = array(
'Keyword7 keyword4 keyword9 keyword1'
'keyword4 keyword9 Keyword7 keyword2'
'Keyword7 keyword4 keyword9 keyword3'
'keyword3 keyword9 Keyword7 keyword5'
);
我想找到一个存在于所有字符串"Keyword7" and Keyword9" 中的关键字并删除它们。我现在想将这些关键字设置为我的新数组的键。
$new_array = array();
$new_array["Keyword7 Keyword9"] = array();
这个新数组的值现在应该是相同的字符串,但现在它们缺少父关键字/s。
$new_array = array(
'Keyword7 keyword9' =>array(
array(
' keyword4 keyword1'
' keyword4 keyword2'
' keyword4 keyword3'
' keyword3 keyword5'
);
)
)
"keyword4" 是出现次数最多的下一个匹配项,因此接下来会出现。其次是下一个最佳匹配“keyword3”或“keyword5”。
$new_array = array(
'Keyword7 keyword9' =>array(
'keyword4' => array(
'keyword1'
'keyword2'
'keyword3'
),
'keyword3' =>array(
'keyword5'
)
)
)
下面的字符串都是唯一的关键字数组是完整的。
到目前为止我做了什么
准备好数组
$keywordlist_array = array();
foreach ($keywordlist as $key => &$string) {
$new_str = trim(preg_replace('/\s+/', ' ',$string),' ');
$arr = explode(' ', $new_str);
asort($arr);
$keys = array_values($arr);
$keywordlist_array[$key] = array_combine($keys, array_fill_keys($keys, 0));
$string = implode(' ', $arr);
}
这会删除任何多余的空白并按字母顺序排列单词,以便于比较。我还保存了字符串的数组版本供以后使用。
这个循环计算每个关键字在所有字符串中出现的次数,这确实有效,但我还没有设法将它用于任何用途。
foreach ($keywordlist_array as $key_1 => $array_1) {
foreach ($keywordlist_array as $key_2 => $array_2) {
foreach (array_keys($array_1) as $keyword) {
if(array_key_exists($keyword,$array_2)){
$keywordlist_array[$key_1][$keyword]++;
}
}
}
}
ive 还创建了一个函数来完成大部分工作,但是当涉及到具有多个父键的数组时,我就卡住了。
function keywordListToNestedArray($keywordlist_array){
$new_array = array();
$length = count($keywordlist_array);
$all_share_keywords = false;
$some_share_keywords = false;
$keywords = array();
$new_keywordlist_array = array();
$max_values = array();
foreach ($keywordlist_array as $key => $arr) {
if(in_array($length, $arr)){
$all_share_keywords = true;
if(!$keywords){
foreach ($arr as $keyword => $value) {
if($value == $length){
$keywords[] = $keyword;
}
}
}
if($keywords){
$new_keywordlist_array[$key] = array_diff_key($arr, array_flip($keywords));
}
} else {
}
}
if($all_share_keywords){
$keyword = implode(' ', $keywords);
$new_array[$keyword] = keywordListToNestedArray($new_keywordlist_array );
} else if($some_share_keywords){
// will have multiple new parents
} else {
//all values equal 1 (one occurance)
foreach ($keywordlist_array as $key => $keywords) {
$new_array[$key] = implode(' ', array_keys($keywords));
}
}
return $new_array;
}
$new_array = keywordListToNestedArray($keywordlist_array);
可能有帮助的 PHP 函数是similar_text() 和 levenshtein(),
问题是“你会做什么,或者你将如何实现这一目标?”。不需要完整的编码答案,只需要一点帮助即可开始。
【问题讨论】:
标签: php arrays string string-comparison