【发布时间】:2016-05-12 20:18:33
【问题描述】:
例子:
d1 = "天空是蓝色的"
d2 = "这辆车是蓝色的"
Key Value
the [<d1,1>,<d2,1>]
sky [<d1,1>]
is [<d1,1>,<d2,1>]
blue [<d1,1>,<d2,1>]
car [<d2,1>]
在哪里: 键=字符串
例如:
<d1,1>
d1 = 文档 ID
1 = 单词在文件中出现的次数
我用 docid 变量和频率创建了一个文档类型对象。
public class Documento {
private final int docid;
private final int frequencia;
public Documento(int docid, int frequencia) {
this.docid = docid;
this.frequencia = frequencia;
}
public int getDocid() {
return docid;
}
public int getFrequencia() {
return frequencia;
}
@Override
public boolean equals(Object o) {
if ((o instanceof Documento) && docid == ((Documento) o).docid && frequencia == ((Documento) o).frequencia) {
return true;
}
return false;
}
而字典类是一个带有
的哈希图public class Dicionario {
public Map<String, Documento> indice = new HashMap<>();
public void InsereDicionario(String palavra, int docid) {
int cont = indice.containsKey(palavra) ? indice.get(palavra).getFrequencia() : 0;
indice.put(palavra, new Documento(docid, cont + 1));
}
public int frequencia(String palavra) {
return indice.get(palavra).getFrequencia();
}
public void criaDicionario(String entrada) {
String[] palavras = entrada.split("\\s+");
for (int i = 0; i < palavras.length; i++) {
InsereDicionario(palavras[i], 1);
}
}
public void ListaPalavras(){
for(String key:indice.keySet()){
System.out.println("");
}
}
但是我真正需要的字典是一个文档列表,我不知道该怎么做,有人可以帮助我吗?
或者有更简单的方法吗?
【问题讨论】:
标签: java object arraylist hashmap