期刊文章详细信息
文献类型:期刊文章
机构地区:[1]内蒙古大学蒙古语文研究所
基 金:国家自然科学基金
年 份:1997
卷 号:29
期 号:2
起止页码:53-57
语 种:中文
收录情况:CSSCI、CSSCI1998、RWSKHX、普通刊
摘 要:在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上考察和比较了蒙古语的词根、词干和构形词尾,在传统语法的研究成果和计算语言学方法相结合的基础上把蒙古文近200种词尾分成三大类,并根据各类词尾的不同特点编制了几种词典,设计,提出了二十多组语法条件和若干个生成规则,在计算机上实现了自动切分。据测试,使用该系统可以覆,盖现代蒙古语各类文本的95%以上。
关 键 词:蒙古文 词根 词干 词尾 自动切分 系统
分 类 号:H53]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...