登录    注册    忘记密码

期刊文章详细信息

企业级海量代码的检索与管理技术  ( EI收录)  

Retrieval and Management Technology for Industrial-scale Massive Code

  

文献类型:期刊文章

作  者:刘志伟[1] 邢永旭[1] 于澔[1] 李涛[2] 张晓东[3]

LIU Zhi-Wei;XING Yong-Xu;YU Hao;LI Tao;ZHANG Xiao-Dong(Baidu (China) Co., Ltd, Shanghai 201210, China;Baidu Online Network Technology (Beijing) Co., Ltd, Beijing 100193, China;Department of Computer Science and Technology, Xi’an Jiaotong University, Xi’an 710049, China)

机构地区:[1]百度(中国)有限公司,上海201210 [2]百度在线网络技术(北京)有限公司,北京100193 [3]西安交通大学计算机科学与技术系,陕西西安710049

出  处:《软件学报》

基  金:国家重点研发计划(2018YFB1003900)~~

年  份:2019

卷  号:30

期  号:5

起止页码:1498-1509

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:在大型IT企业中,尤其像Google或者百度,代码搜索已是软件开发过程中不可或缺且频繁的活动,其通过借鉴或复用已有代码,加速开发过程的速度.多年以来,已有大量的研究人员关注代码搜索,且设计出很多优秀的工具.但是已有的研究和工具主要是在小规模或者编程语言单一的代码数据集上,没有从企业实际搜索需求出发,且对用户的查询输入也有所限制,尚缺少一套针对企业级海量代码的检索与管理技术方案.提出了一套企业级海量数据代码搜索引擎的方案和系统实现,面向开发过程中用户最直接的需求,通过离线分析与在线分析,完成对海量代码库的索引构建与检索.其中,离线分析负责代码相关数据的获取与分析、构建索引集群.在线过程负责变换用户的query、对搜索的结果进行高级排序、生成摘要.本系统部署在百度代码库上,为数十TB级的Git代码库构建了索引,平均一次检索时间在1s之内.在百度推出应用以来,访问量逐步增加,现每周平均用户有数千人,每周查询平均有数万次,广受百度工程师好评.

关 键 词:代码搜索  索引 排序 海量代码  

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心