鍍金池/ 問答/Linux  網(wǎng)絡(luò)安全/ 封裝在docker中的TCP dump未占用大量CPU資源,但不能完全抓包

封裝在docker中的TCP dump未占用大量CPU資源,但不能完全抓包

想測試基于docker的一個平臺的抓包性能。docker分配的資源是10%(4核)的CPU,內(nèi)存128M。虛擬機是Linux的系統(tǒng),4核。
使用docker里的tcpdump抓包,用top查看的時候tcpdump只占了單核6%的CPU,但是抓包總結(jié)顯示有包沒抓到。ksoftirqd進(jìn)程只占了0.7%左右的CPU。

回答
編輯回答
尕筱澄

好吧,這個問題我自己來回答啦。

在linux系統(tǒng)上,使用tcpdump抓包結(jié)束之后會提示:

抓包結(jié)束的提示

簡單來說, captured是tcpdump處理過之后,得到的數(shù)據(jù)包數(shù)量,亦即最終獲得的pcap文件中數(shù)據(jù)包數(shù)量; received是經(jīng)過過濾器處理的所有數(shù)據(jù)包; dropped則是未經(jīng)處理的數(shù)據(jù)包數(shù)量。
received by filter的結(jié)果這取決于運行tcpdump的操作系統(tǒng)及其配置。如果指定一個過濾器,包無論是否被篩選器表達(dá)式匹配,即使他們被篩選器表達(dá)式匹配,無論tcpdump是否讀取和處理他們,都會進(jìn)行計算,即收到一個包,received by filter會加1。如果sock的接收buffer被填滿時,則把這個數(shù)據(jù)包丟棄,將dropped by kernel加1,所以 received by filter和dropped by kernel的計數(shù)由內(nèi)核維護。
造成丟包的原因,是由于libcap抓到包后,tcpdump上層沒有及時的取出,導(dǎo)致libcap緩沖區(qū)溢出,從而丟棄了未處理包,此處即顯示為dropped by kernel。這里的kernel并不是說是被linux內(nèi)核拋棄的,而是被tcpdump的內(nèi)核,即libcap拋棄掉的。

解決辦法也有一些,比如:
1、-n 參數(shù),禁止反向域名解析()
2、-s 參數(shù),控制抓取數(shù)據(jù)包的長度
(采用更大的捕捉范圍既增加了處理報文的時間,又相應(yīng)的減少了報文的緩沖數(shù)量,可能導(dǎo)致報文的丟失。嘗試把snaplen設(shè)的盡量小,只要能夠容納需要的協(xié)議信息就可以。)
3、將數(shù)據(jù)包輸出到cap文件
4、用sysctl修改SO_REVBUF參數(shù),增加libcap緩沖區(qū)長度

方法1我試過了,效果不理想。
方法2也試過了,效果不錯。但我本來就是要測抓包性能的,肯定得把包抓全啊,想想之后放棄了這個方案。
方法3這個.....我本來就是輸出到文件里的,但還是有丟包的問題,所以好像并沒有什么卵用。
方法4感覺有點復(fù)雜,不過前面解釋里也提到是因為緩沖區(qū)不夠才導(dǎo)致的丟包,遂覺得這方法有門,不過就是麻煩了一點。然后靈機一動,我查到了tcpdump里有個-B參數(shù)可以修改緩沖區(qū)大小,哈哈??!

所以最后的解決辦法就是:我使用-B參數(shù)修改了tcpdump的緩沖區(qū)大小?。。?br>這里要注意的是如果未指定 -B 選項,那么緩沖區(qū)大小缺省為32768,既然這樣我就乘二試了試,-B 65535。
嘻嘻,一下子什么丟包都飛走了~~

2017年5月7日 04:02