专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN202510511612.5
申 请 日:20250423
申 请 人:贵州大学 贵阳市第一人民医院(贵阳市急救中心)
申请人地址:550025 贵州省贵阳市花溪区贵州大学(北区)科技处
公 开 日:20250729
公 开 号:CN120388030A
代 理 人:袁庆云
代理机构:贵阳东圣专利商标事务有限公司 52002
语 种:中文
摘 要:本发明的一种基于动静态注意力聚合机制的图像分割方法,包括:图像数据收集;构建图像分割模型,具体包括两种类型的编码器与一个掩码解码器;所述两种类型编码器为提示编码器与图像编码器,所述提示编码器对点与框进行编码,所述图像编码器通过对输入图像进行特征提取进而编码;所述掩码解码器对两种类型的编码器进行统一的解码,得到对应图像的掩码图;将待分割图像输入训练好的图像分割模型中,进而输出对应图像的掩码图,完成图像分割。本发明具有通过增强模型对特征信息的捕捉能力,提高图像分割精度的特点。
主 权 项:1.一种基于动静态注意力聚合机制的图像分割方法,其特征在于:该方法具体步骤包括:步骤一:数据收集:收集图像分割数据集;步骤二:构建模型:构建图像分割模型,包括两种类型的编码器与一个掩码解码器;所述两种类型编码器为提示编码器与图像编码器,所述提示编码器对点与框进行编码,所述图像编码器通过对输入图像进行特征提取,进而编码;所述掩码解码器对两种类型的编码器进行统一的解码,得到对应图像的掩码图;所述提示编码器通过对点和边界框进行编码,每个点被表示为一个向量,该向量包含了该点的位置信息、前景嵌入和背景嵌入,每个边界框通过它的左上角和右下角的位置编码来定义,并将左上角和右下角表示为学习嵌入;所述图像编码器:由一个补丁嵌入层和多个特征提取编码块DaSA-EFA组成;所述补丁嵌入层:输入图像X,该补丁嵌入层进行补丁嵌入编码,然后规范化处理得到一系列卷积投影,最后进入特征提取编码块DaSA-EFA进行特征提取;所述特征提取编码块DaSA-EFA:由动静态注意力聚合层DaSA Layer、高效特征聚合层EFA Layer、适配器层Adapter Layer、多层感知机层MLP组成;所述动静态注意力聚合层DaSA Layer,包括两部分,一部分用于增强模型获取长程依赖关系能力的动静态注意力计算,另一部分用于捕捉更广泛的上下文信息的卷积聚合计算,对于输入的一系列卷积投影,特征提取编码块并行的进行两部分计算,公式为:其中,
表示经过动静态注意力计算得到的结果,
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

