【发布时间】:2021-12-19 02:50:41
【问题描述】:
我将 main 中的字符串列表拆分为 2 个不同的线程来映射里面的单词。
每次执行此代码时,我都会得到不同的映射结果。
要么我有一个很大的逻辑缺陷,要么我缺少关于线程和并发集合的一些东西。
谁能理解为什么会发生这种情况?
列表中添加了 8 个“a”和 6 个“b”。
附言如果我只使用一个线程,这不会发生!
编辑 1
将 map.put() 更改为 map.merge(word, 1, Integer::sum),仍然不起作用
编辑 2
以下解决方案我没有使用 if/else,仅合并,它按预期工作。
public class MyThread extends Thread {
private List<String> list;
private final ConcurrentHashMap<String, Integer> map;
public MyThread(ConcurrentHashMap<String, Integer> map, List<String> list) {
this.map = map;
this.list = list;
}
@Override
public void run() {
for (String word : list){
map.merge(word, 1, Integer::sum);
}
}
public ConcurrentHashMap<String, Integer> getMap() {
return map;
}
}
public static void main(String[] args) throws InterruptedException {
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();
List<String> list = new ArrayList<>();
list.add("a");list.add("a");list.add("a");list.add("a");list.add("b");list.add("b");list.add("b");
list.add("a");list.add("a");list.add("a");list.add("a");list.add("b");list.add("b");list.add("b");
MyThread[] ts = new MyThread[2];
int start = 0;
int end = list.size()/2;
for (int i = 0; i < 2; i++){
ts[i] = new MyThread(map,new ArrayList<>(list.subList(start, end)));
ts[i].start();
start = end;
end = list.size();
}
for (int i = 0; i < 2; i++){
ts[i].join();
}
for(String word : map.keySet()){
System.out.println("Key = " + word + ". Value = " + map.get(word));
}
}
【问题讨论】:
-
"
map.put(word, map.getOrDefault(word, 0) + 1);" - 这些操作不是原子执行的。我建议改用ConcurrentHashMap<String, AtomicInteger>。 This question by Makkador 有类似的根本原因,尽管我认为它不是重复的。 -
或者
map.merge(word, 1, Integer::sum); -
@Turing85 使用 ConcurrentHashMap
并使用 put(StringKey, incremented AtomicInteger or 1) 更新地图仍然返回不同的结果 -
我们的想法是不使用
put(....)覆盖现有值,而是通过get(...)tin 和ConcurrentHashMap中的AtomicInteger修改现有值并在其上调用incrementAndGet()。但老实说:看到@shmosel 的评论,这似乎更清晰,更容易理解。 -
@Turing85,好吧,脑子坏了。实际上没有想到这一点。会及时通知您!
标签: java multithreading concurrency java-threads concurrenthashmap