鍍金池/ 問答/Linux/ 多并發(fā)下多線程遍歷list問題

多并發(fā)下多線程遍歷list問題

今天做導(dǎo)出 查出的數(shù)據(jù)有3萬條 還要遍歷做一些處理 結(jié)果就超時
想到多線程遍歷list 去網(wǎng)上查找 找到這塊代碼:

public String list2Str(List<String> list, final int nThreads) throws Exception {  
            if (list == null || list.isEmpty()) {  
                return null;  
            }  
              
            StringBuffer ret = new StringBuffer();  
      
            int size = list.size();  
            ExecutorService executorService = Executors.newFixedThreadPool(nThreads);  
            List<Future<String>> futures = new ArrayList<Future<String>>(nThreads);  
              
            for (int i = 0; i < nThreads; i++) {  
                final List<String> subList = list.subList(size / nThreads * i, size / nThreads * (i + 1));  
                Callable<String> task = new Callable<String>() {  
                    @Override  
                    public String call() throws Exception {  
                        StringBuffer sb = new StringBuffer();  
                        for (String str : subList) {  
                            sb.append(str);  
                        }  
                        return sb.toString();  
                    }  
                };  
                futures.add(executorService.submit(task));  
            }  
              
            for (Future<String> future : futures) {  
                ret.append(future.get());  
            }  
            executorService.shutdown();  
              
            return ret.toString();  
        }  
    } 

我調(diào)用時開了5個線程 我想問 每次導(dǎo)出就開啟5個線程 如果多個人同時導(dǎo)出 比如10000個人同時導(dǎo)出 那豈不是就開啟了50000個線程了!??!

沒問題嗎???

回答
編輯回答
司令

一般導(dǎo)出數(shù)據(jù)都是生成 xlsx 文件的,這種情況,建議不要使用 多線程 技術(shù)——容易因為一個功能,導(dǎo)致整個應(yīng)用失去響應(yīng);因為數(shù)據(jù)量大的時候,CPU 資源都被你這樣的多線程占用住了,其它用戶的正常操作反而會得不到服務(wù)器響應(yīng)。

至于樓上 補充恢復(fù)中提到的 parallelStream ,別去用它,用了就知道有多坑!用 parallelStream 可能導(dǎo)致其它也用 parallelStream 的模塊功能出現(xiàn)半天不反映的情況,所以,整個應(yīng)用里就不要用 parallelStream ,這玩意兒就是個定時炸彈。

如果不想做的很復(fù)雜,比如樓上說的,先提交請求然后隊列處理,然后通知用戶下載。那就只能采用最簡單的直線型同步處理下載了,接收到用戶請求,查詢數(shù)據(jù),塞入導(dǎo)出文件,文件好了之后,直接輸出到客戶端就行了。這整個過程中,就同步慢慢做就行了,不要開多線程(上面已經(jīng)說了原因了)。誰讓你下載時選的那么多呢,活該你等久點。但這個里面有個細節(jié),就是你不能一次把數(shù)據(jù)都拉取到 內(nèi)存里面來做寫入文件處理,應(yīng)該對數(shù)據(jù)進行分頁,比如500 條一個批次的從數(shù)據(jù)庫取出來寫入文件,再去數(shù)據(jù)庫取下500個,直到全部完成;不然,jvm 可能死給你看。

2017年3月26日 23:04
編輯回答
還吻

既然已經(jīng)使用過線程池,就不存在線程被大量創(chuàng)建的問題。Java7出了一個Fork/Join框架,利用多線程并行計算,跟這個業(yè)務(wù)有點相似,樓主可以自行去了解下

2017年1月3日 02:10
編輯回答
柚稚

沒看代碼,這個明顯是串行任務(wù),局部并行處理,簡單點可以用線程池和countdownlatch來做
樓上說可以用Fork/Join框架,分而治之的思想,其實要是支持jdk8的話,也可以用并行流parallelstream來做,底層就是Fork/Join,要代碼的話回頭給你寫一下

2017年7月15日 06:47
編輯回答
夢若殤

用戶提交一個下載請求,將請求放到隊列里面,程序開固定線程(或者動態(tài)調(diào)整)后臺執(zhí)行任務(wù),執(zhí)行完成生成文件,通知用戶下載文件。

對于用戶這個下載時異步的,用戶提交請求,只是接受用戶的下載參數(shù)生成一個后臺的task,放到隊列里面。什么時候做完是根據(jù)你后臺的線程數(shù),以及當前隊列中這個任務(wù)的位置來決定的?;蛘呖梢栽囋噇amda 的parallelStream 來遍歷,充分利用的機器的多核性能

https://www.roncoo.com/articl...

2018年3月7日 16:00