期刊文章详细信息
文献类型:期刊文章
机构地区:[1]苏州普达新信息技术有限公司,江苏苏州215021 [2]苏州大学智能信息处理及应用研究所,江苏苏州215006
基 金:国家自然科学基金项目(60970015;61003054);江苏省高校自然科学研究项目(10KJB520018);苏州市科技型企业技术创新资金专项(SG201043)
年 份:2013
卷 号:30
期 号:2
起止页码:54-57
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、ZGKJHX、核心刊
摘 要:针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。
关 键 词:数据提取 DEEP WEB 区间划 Top-k元组 范围型属性
分 类 号:TP3[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...