期刊文章详细信息
基于XGBoost算法结合域名信息筛选的流量识别方法
Traffic identification method based on XGBoost algorithm combined with domain name information screening
文献类型:期刊文章
ZHANG Xian-yong;TANG Kun(Nanjing Fiber Home World Communication Technology Co.,Ltd.,Nanjing 210019,China;WuhanResearch Institute of Posts and Telecommunications,Wuhan 430074,China;Fiber Home Starry Sky Co.,Ltd.,Nanjing 210000,China)
机构地区:[1]南京烽火天地通信科技有限公司,江苏南京210019 [2]武汉邮电科学研究院,湖北武汉430074 [3]南京烽火星空通信发展有限公司,江苏南京210000
年 份:2019
卷 号:27
期 号:6
起止页码:177-182
语 种:中文
收录情况:RCCSE、ZGKJHX、普通刊
摘 要:传统的流量识别方法主要有基于流量行为特征的指纹信息匹配技术、深层数据包检测技术、基于端口映射的流量识别技术等。基于机器学习的识别技术是目前较为先进的一种,它利用机器学习自学习、自组织和自适应的特性,可有效解决传统流量识别方法存在实现复杂、速率慢等问题,但是由于网络环境当中存在大量的背景流量,导致机器学习的精确率较低。本文针对传统的流量识别技术和单纯机器学习方法的缺陷,提出了一种使用XGBoost机器学习模型与域名信息结合的方式进行流量识别的技术,首先分别对HTTP协议数据和HTTPS协议数据构建机器学习模型进行流量的初步识别,然后构建应用与其二级域名的映射关系。对于模型识别为正类的数据提取域名信息(HTTP提取host字段、HTTPS提取SNI域),最后根据应用与二级域名的映射关系对模型识别的结果进行二次筛选,进一步提高准确率。
关 键 词:XGBoost 域名筛选 流量识别 HTTP HTTPS
分 类 号:TN401]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...