期刊文章详细信息
融合加权模式挖掘与规则混合扩展的跨语言检索
Cross Language Retrieval Based on Weighted Patterns Mining and Rule Hybrid Expansion
文献类型:期刊文章
HUANG Ming-xuan;XIA Guo-en;GAO Rong;JIANG Cao-qing(Guangxi(ASEAN)Financial Research Center,Guangxi University of Finance and Economics,Nanning 530003,China;Guangxi Key Laboratory of Cross-border E-commerce Intelligent Information Processing,Guangxi University of Finance and Economics,Nanning 530003,China;School of Information and Statistics,Guangxi University of Finance and Economics,Nanning 530003,China;School of Business Administration,Guangxi University of Finance and Economics,Nanning 530003,China)
机构地区:[1]广西财经学院广西(东盟)财经研究中心,南宁530003 [2]广西跨境电商智能信息处理重点实验室(广西财经学院),南宁530003 [3]广西财经学院信息与统计学院,南宁530003 [4]广西财经学院工商管理学院,南宁530003
基 金:国家自然科学基金项目(61762006,71862003,61662003)资助;广西应用经济学一流学科(培育)开放性课题项目(2018MA07)资助;广西(东盟)财经研究中心开放性课题项目(2018DMCJYB08)资助;广西自然科学基金项目(2015GXNSFAA139310)资助
年 份:2019
卷 号:40
期 号:9
起止页码:2013-2020
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合扩展模型的跨语言信息检索算法.该算法通过项集权值比较从跨语言初检相关文档集挖掘含有原查询词项的频繁项集,利用基于有效性的剪枝方法对项集进行剪枝得到有效频繁项集,从有效频繁项集挖掘加权关联规则,根据规则混合扩展模型实现查询扩展,扩展词与原查询词组合为新查询再次检索文档得到最终检索结果.与现有跨语言检索算法比较,实验结果表明,本文算法能有效地减少查询漂移和词不匹配问题,提高和改善跨语言信息检索性能,有效性和置信度可使本文算法分别获得最优的检索结果 R-prec和P@10值.
关 键 词:信息检索 跨语言检索 文本挖掘 查询扩展 自然语言处理
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...