后缀数组很久很久以前就出现了,具体的概念读者自行搜索,小菜仅略知一二,不便讨论。

     本文通过寻找两个字符串的最长公共子字符串,演示了后缀数组的经典应用。

     首先需要说明,小菜实现的这个后缀数组算法,并非标准,只是借鉴了其中的思想。

     小菜实现的算法,有两个版本,第一个是空间换时间,第二个是时间换空间。

空间换时间版本

  1 /*
  2   利用后缀数组获取两个字符串最长公共子字符串
  3   空间换时间版本
  4   @params
  5     s1 String,要分析的字符串
  6     s2 String,要分析的字符串
  7     norepeat Boolean,是否对结果进行去重,默认true
  8 */
  9 function commonSubString(s1, s2, norepeat){
 10   var norepeat = norepeat == undefined ? true : norepeat,
 11       array = suffixArray(s1, 1).concat(suffixArray(s2, 2)),
 12       maxLength = 0,
 13       maxStrings = [],
 14       tempLength = 0,
 15       i = 0,
 16       length = 0,
 17       result = {};
 18   
 19   //排序,根据字符串排序,直接比较即可
 20   array.sort(function(s1, s2){
 21     return (s1.s == s2.s) ? 0 : (s1.s > s2.s) ? 1 : -1;
 22   });
 23   
 24   //寻找最长公共子字符串
 25   for(i = 0, length = array.length - 1; i < length; i++){
 26     tempLength = commonLength(array[i].s, array[i+1].s);
 27     if(array[i].g != array[i+1].g){
 28       if(maxLength == tempLength){
 29         maxStrings.push(array[i]);
 30       }
 31       if(maxLength < tempLength){
 32         maxLength = tempLength;
 33         maxStrings = [];
 34         maxStrings.push(array[i]);
 35       }
 36     }
 37   }
 38   
 39   //构造结果
 40   result.length = maxLength;
 41   result.contents = [];
 42   for(i in maxStrings){
 43     result.contents.push(maxStrings[i].s.substring(0, maxLength));
 44   }
 45   
 46   //去重
 47   if(norepeat){
 48     result.contents  = norepeatArray(result.contents);
 49   }
 50   
 51   return result;
 52   
 53   /*
 54     获取字符串的后缀数组
 55   */
 56   function suffixArray(s, g){
 57     var array = [],
 58         i = 0,
 59         length = s.length;
 60     for(i = 0; i < length; i++){
 61       array.push({
 62         s: s.substring(i),
 63         g: g   //加分组是为了保证最长公共子字符串分别来自两个字符串
 64       });
 65     }
 66     
 67     return array;
 68   }
 69   /*
 70     获取最大匹配长度
 71   */
 72   function commonLength(s1, s2){
 73     var slength = s1.length > s2.length ? s2.length : s1.length,
 74         i = 0;
 75     
 76     //循环次数=较短的字符串长度
 77     for(i = 0; i < slength; i++){
 78       //逐位比较
 79       if(s1.charAt(i) != s2.charAt(i)){
 80         break;
 81       }
 82     }
 83     
 84     return i;
 85   }
 86   
 87   /*
 88     字符串数组去重,不会影响原数组,返回一个新数组
 89   */
 90   function norepeatArray(array){
 91     var _array = array.slice(0),
 92         map = {},
 93         i = 0,
 94         key = "";
 95     
 96     //将内容作为散列的key
 97     for(i in _array){
 98       map[_array[i]] = 1;
 99     }
100     
101     //提取散列key,重新填充到数组
102     _array.splice(0, _array.length);
103     for(key in map){
104       _array.push(key);
105     }
106     
107     return _array;
108   }
109 }
View Code

相关文章:

  • 2021-11-04
  • 2022-12-23
  • 2022-12-23
  • 2021-10-27
  • 2021-06-19
  • 2021-08-12
  • 2021-10-13
猜你喜欢
  • 2021-12-04
  • 2022-12-23
  • 2021-07-01
  • 2021-12-08
  • 2022-02-07
  • 2022-12-23
  • 2021-11-11
相关资源
相似解决方案