专利详细信息

一种基于跨模态注意力机制的激光雷达和视觉融合地点识别方法

文献类型：专利

专利类型：发明专利

是否失效：否

是否授权：否

申请号：CN202311789152.X

申请日：20231225

发明人：何豆张军余卓平尹东晓朱昊陆新民

申请人：上海智能新能源汽车科创功能平台有限公司同济汽车设计研究院有限公司

申请人地址：201805 上海市嘉定区安亭镇曹安公路4801号208室-1

公开日：20250627

公开号：CN120219780A

代理人：宣慧兰

代理机构：上海科盛知识产权代理有限公司 31225

语　　种：中文

摘　　要：本发明涉及一种基于跨模态注意力机制的激光雷达和视觉融合地点识别方法，包括以下步骤：使用体素的格式对激光雷达点云数据进行特征提取，得到激光雷达点云数据的多尺度BEV特征；对图像数据进行特征提取，得到图像的多尺度2D特征；通过引入跨模态融合方法和局部全局融合方法，将激光雷达点云数据的多尺度BEV特征和图像多尺度2D特征进行融合，得到融合特征；将融合特征映射为融合描述子；将融合描述子在地图数据库中查询，完成地点识别。与现有技术相比，本发明具有有效融合激光雷达和视觉信息，不受环境影响，能快速、准确进行地点识别，解决了现有技术中存在有效融合激光雷达和相机数据进行地点识别的问题等优点。

主权项：1.一种基于跨模态注意力机制的激光雷达和视觉融合地点识别方法，其特征在于，包括以下步骤：步骤S1、使用体素的格式对激光雷达点云数据进行特征提取，得到BEV特征；步骤S2、采用ResNet算法对图像数据进行特征提取，得到图像2D特征；步骤S3、引入跨模态融合方法和局部全局融合方法，将所述BEV特征和所述图像2D特征进行融合，得到跨模态融合特征；步骤S4、将所述跨模态融合特征映射为融合描述子；步骤S5、将所述融合描述子在地图数据库中查询，完成地点识别。

关键词：模态注意力机制激光雷达视觉融合地点识别体素格式点云数据特征提取 BEV ResNet 算法图像数据引入模态融合局部全局融合映射描述子地图数据库查询机器人同步定位地图构建 SLAM 自动驾驶表述实例检索给定大型数据库

IPC专利分类号：G06V 10/764;G06V 10/82;G06V 10/44;G06V 10/80;G06V 20/64;G06N 3/0464;G06N 3/048;G06N 3/08;G06F 16/29;G01S 17/89

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

专利详细信息

一种基于跨模态注意力机制的激光雷达和视觉融合地点识别方法

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：