登录    注册    忘记密码

期刊文章详细信息

基于特征转移概率的网络日志聚类分析算法    

Web Log Clustering Analysis Algorithm Based on Feature Transition Probability

  

文献类型:期刊文章

作  者:齐文[1] 朱曦源[2] 宋杰[2]

QI Wen;ZHU Xi-yuan;SONG Jie(School of Engineering and Technology,Liaodong University,Dandong 118001,China;Software College,Northeastern University,Shenyang 110819,China)

机构地区:[1]辽东学院工程技术学院,辽宁丹东118001 [2]东北大学软件学院,沈阳110819

出  处:《小型微型计算机系统》

基  金:国家自然科学基金项目(61672143)资助。

年  份:2023

卷  号:44

期  号:3

起止页码:514-520

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2023_2024、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:随着信息化建设,互联网行业的发展,各种信息设备在运行和通信中,会产生大量的网络日志数据.网络日志的内容是非结构化的格式,获取相关信息具有一定难度,并且这种数据正在迅速增长为庞大的体量,所以从中获得所需的信息并对相关信息进行处理,是一个非常具有挑战性的任务.数据挖掘的技术是非常传统的技术,实施往往耗费太多时间,并产生过多的数据,大数据环境下,传统的串行的网络日志聚类方法存在性能的局限性,不再适合处理网络日志这样的海量数据,目前比较常用的对于网络日志的并行处理方法在计算时间、并行效率、准确率等方面存在一定改进空间.因而,本文提出了一种基于特征转移概率改进的网络日志聚类处理技术,并在Apache Spark平台上实现了用于提取频繁的庞大的网络日志的模式.实验结果表明,所提出的方法能够在大数据环境下对完整的网络日志提取所需信息并实现高效的分析,相对于目前常见的聚类分析算法,本文提出的基于特征转移概率的处理方式将执行时间降低到了75.97%.

关 键 词:日志分析 大数据  Apache Spark  聚类算法  并行处理

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心