|
網(wǎng)絡(luò)流量基本特征數(shù)據(jù)集是整個網(wǎng)絡(luò)流量異常算法的基礎(chǔ)。為了保證該算法的可靠性和比較強的可擴展性,就要求基本特征能夠比較完備地描述網(wǎng)絡(luò)流量的特征。但同時由于網(wǎng)絡(luò)的異常檢測有實時性的要求,以及考慮到現(xiàn)有計算機的計算能力等問題,基本特征的選取不能對所有流量信息進行提取,而必須對之進行選擇。
除此以外在基本特征集中還預(yù)留了大約100個保留項,以便將來的擴展之需。由這些保留項以及上述各個提取的內(nèi)容共同組成了一個有256項的基本特征集。該基本特征集有以下幾方面的特點:
(1)比較詳細地涵蓋了現(xiàn)有網(wǎng)絡(luò)中主要流量的各種統(tǒng)計信息。
(2)不含敏感信息,比如IP地址,包內(nèi)容信息等。
(3)其存儲空間完全有限,如果每隔30秒統(tǒng)計一次,一個月大約有30×24×60×2=86400條記錄,每條記錄由256個數(shù)字組成,如按照文本格式保存大約是2048個字節(jié)。因而按照這種方式保存一年的數(shù)據(jù)所需空間大約是2048×8×86400×12=16986,931200bits,這大約是17GB的空間。
實驗過程
本試驗采用的試驗數(shù)據(jù)為1999 DARPA提供的試驗數(shù)據(jù)。其中第一周由于不含攻擊,因而可以作為訓(xùn)練數(shù)據(jù)進行訓(xùn)練,第二周的數(shù)據(jù)作為檢測數(shù)據(jù)。
我們選取其中的MailBomb和Neptune作為試驗檢測的項目。將試驗數(shù)據(jù)按五分鐘分割成各個數(shù)據(jù)點,我們可以得到1280個數(shù)據(jù)點。
其中L1~L5表示的是包長分布在32~63、64~127、128~255、256~511和512~1023各個段落中的包的個數(shù)。
在整個基于網(wǎng)絡(luò)流量模型的異常檢測框架下,能比較方便地通過組合不同的基礎(chǔ)特征實現(xiàn)對不同種類的異常攻擊的檢測,并能取得比較好的檢測效果。同時我們還可以看到,針對某種攻擊如果選取不同的特征組合,其檢測的結(jié)果之間還是有區(qū)別的,選取過程中如果缺少必要的基礎(chǔ)特征將導(dǎo)致漏報率的變大,而選取過多的無關(guān)基礎(chǔ)特征則會降低檢測誤報率的性能。這就要求我們在選取標(biāo)示某種攻擊的特征組合時必須在必要基礎(chǔ)特征的基礎(chǔ)上根據(jù)檢測的網(wǎng)絡(luò)的實際流量模型,對特征組合進行具體的優(yōu)化。
方法評測
基于網(wǎng)絡(luò)流量的異常檢測方法通過組合不同的基礎(chǔ)特征能比較靈活地檢測不同的網(wǎng)絡(luò)攻擊,同時每種組合特征又標(biāo)示著某種攻擊,所以能使網(wǎng)絡(luò)流量異常的報警更具實際意義。
基于網(wǎng)絡(luò)流量的異常檢測方法提供了一個壓縮比較高且能比較全面反映實際網(wǎng)絡(luò)流量的基礎(chǔ)特征,這為將來的異常檢測提供了一個較好的數(shù)據(jù)平臺,具有比較好的可擴展性,同時該數(shù)據(jù)集還能為不同域之間異常檢測信息的交互提供一種可能。 |
|
【收藏】【打印】【進入論壇】 |
|
|
|
|
|
|
|