期刊文章详细信息
文献类型:期刊文章
LI Yongwei;TAO Jianhua;LI Kai(National Laboratory of Pattern Recognition,Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China;Department of Automation,Tsinghua University,Beijing 100084,China;Japan Advanced Institute of Science and Technology,Ishikaha 923-1211,Japan)
机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190 [2]清华大学自动化系,北京100084 [3]北陆先端科学技术大学院大学,日本石川923-1211
基 金:国家自然科学基金(62201571,U21B2010)。
年 份:2023
卷 号:39
期 号:4
起止页码:632-638
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2023_2024、JST、RCCSE、ZGKJHX、核心刊
摘 要:语音情感识别是实现自然人机交互不可缺失的部分,是人工智能的重要组成部分。发音器官的调控引起情感语音声学特征的差异,从而被感知到不同的情感。传统的语音情感识别只是针对语音信号中的声学特征或听觉特征进行情感分类,忽略了声门波和声道等发音特征对情感感知的重要作用。在我们前期工作中,理论分析了声门波和声道形状对感知情感的重要影响,但未将声门波与声道特征用于语音情感识别。因此,本文从语音生成的角度重新探讨了声门波与声道特征对语音情感识别的可能性,提出一种基于源-滤波器模型的声门波和声道特征语音情感识别方法。首先,利用Liljencrants-Fant和Auto-Regressive eXogenous(ARX-LF)模型从语音信号中分离出情感语音的声门波和声道特征;然后,将分离出的声门波和声道特征送入双向门控循环单元(BiGRU)进行情感识别分类任务。在公开的情感数据集IEMOCAP上进行了情感识别验证,实验结果证明了声门波和声道特征可以有效的区分情感,且情感识别性能优于一些传统特征。本文从发音相关的声门波与声道研究语音情感识别,为语音情感识别技术提供了一种新思路。
关 键 词:语音情感特征 声门波与声道 源-滤波器模型 语音情感识别
分 类 号:TP37]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...