LPIR-GSeg:基于激光雷达投影图像的城市环境区域地面分割

摘要

快速而精确的地面分割是各种应用(如点云聚类、3-D物体分割和同步定位与地图构建(SLAM))的关键任务。为同时提升准确度和效率,我们的方法避免了传统的 3-D 点云平面拟合方法。我们提出了一种基于激光雷达投影图像的城市道路场景下的区域地面分割方法,命名为 LPIR-GSeg。我们对激光雷达与水平面之间的安装角进行标定,以校正 3-D 点的高度。对于粗分割,我们将点云编码为同心环模型表示,并为每个 3-D 点找到对应的网格。网格的高度将用于快速地面分割,并作为精细分割的初始值。为提高准确度,我们依据激光雷达投影模型将点云投射到多种圆柱形图像中。随后,基于投影图像的区域生长算法被应用以实现精细地面分割。我们在真实平台和 SemanticKITTI 数据集上进行了全面实验。我们的提议方法在 SemanticKITTI 数据集上实现了 95.93% 的精度和 92.20% 的召回率。

作者

Yang Sun 仪器科学与工程学院,东南大学,南京,中国 ORCID: 0009-0002-3106-0164

Shengyi Liu 仪器科学与工程学院,东南大学,南京,中国 ORCID: 0000-0002-6639-372X

Chao Yan 电子与自动化工程学院,苏州工业园区科技大学,常熟,中国 ORCID: 0000-0002-2365-3122

Kaiwei Tang 仪器科学与工程学院,东南大学,南京,中国 ORCID: 0000-0003-4441-7468

Qing Wang 仪器科学与工程学院,东南大学,南京,中国 ORCID: 0000-0002-6940-6805

Xiaolin Meng 仪器科学与工程学院,东南大学,南京,中国 ORCID: 0000-0003-2440-8054

发表信息

期刊: IEEE Sensors Journal 年份: 2025 卷: 25 期: 16 页码: 31357-31369 DOI: 10.1109/JSEN.2025.3579686 文章编号: 11045759 ISSN: 印刷 ISSN: 1530-437X, 电子 ISSN: 1558-1748, CD: 2379-9153

指标

总下载量: 113

资助


关键词

IEEE 关键词: 点云压缩, 激光雷达, 图像分割, 准确性, 三维显示, 传感器, 拟合, 道路, 深度学习, 同时定位与地图构建

Index Terms: 城市环境, 光检测与测距, 地面分段, 点云, 分割方法, 投影图像, 分割精度, 城市道路, 最终分割, 同时定位与地图构建, 基于图像的方法, 城市场景, 快速分割, 算法性能, 图像像素, 平面, 精准率与召回率, 道路表面, 基于学习的方法, 地面平面, 地面点, 高度阈值, 垂直分辨率, 点云分割, 随机抽样一致性, 平面拟合, 分割结果, 地面坡度, 当前点, 倾斜角

作者关键词: 3-D 光检测与测距 (LiDAR) 同时定位与地图构建 (SLAM), 自动驾驶, 粗到细分割, 地面分割, LiDAR 投影图像

未定义

第一节. 引言

地面分割是点云感知任务中的关键预处理步骤,对于具有结构化可行驶区域表示的自动驾驶系统至关重要。通过从 3-D 光检测与测距(LiDAR)点云中分割地面,该步骤支持机器人自主导航、无碰撞路径规划以及同步定位与地图构建(SLAM)等基本功能,同时直接影响动态目标检测中的感知系统。与点云检测相比,基于相机的分割方法在理解复杂场景方面更成熟、更高效,利用层次化特征提取和并行计算。然而,3-D LiDAR 由于其全天气功能、高精度测距和全景覆盖,仍是复杂场景理解中最重要的传感器,与相机和 4-D 毫米波雷达等其他传感器相比。

准确性与效率之间的权衡是基于 LiDAR 的地面分割中最大的挑战。例如,Velodyne HDL-64 每秒生成数百万点云点,嵌入丰富的环境语义信息,但计算成本显著。当前方法通常采用划分策略将点云划分为少量网格,以提升特征提取和分割精度,例如 12。然而,过度的区域划分和拟合会显著增加计算复杂度,并且在不同场景下很难保持相同的准确性。此外,在复杂地形(如斜坡道路或草地区域)中,平地假设并不总是成立,尤其是传统方法依赖地面高度估计 3 或平面拟合 4 的情况。对于嵌入式平台而言,这种准确性与效率之间的权衡尤为关键,而超参数的存在进一步复杂化了工程部署。值得注意的是,计算机视觉领域已为图像分割任务建立了成熟框架 5,为点云分割提供了宝贵的见解。例如,机械式 3-D LiDAR 可以生成有序点云,并将稀疏点云投影到二维平面,形成具有特征表示和计算优化优势的 LiDAR 投影图像。然而,利用这些投影图像进行地面分割的研究仍然有限,这与其理论潜力形成了鲜明对比。

随着深度学习的发展,感知能力变得越来越准确和快速 67。然而,我们的设计并未使用任何深度学习模型,因为地面分割是整个感知任务的前端。地面分割是一个计算需求低、算法复杂度低的模块,传统方法无需深度学习即可满足。我们希望为我们的 LiDAR SLAM 系统设计一个简单、即插即用、无需学习的分割模块。

针对现有地面分割方法中精度与效率的固有权衡,本文创新性地将图像处理技术与区域划分策略相结合,提出了一种基于“粗-细”范式的快速地面点云分割算法。该框架通过避免复杂的空间拟合与优化过程,显著降低计算开销,同时最大化分割精度。本研究的核心贡献如下:

  1. 本文提出一种新的LiDAR倾斜角校准方法,以补偿3-D点的高度。该方法显著降低传统基于高度的分割的计算复杂度,仅需平坦场景,如地下停车场或广场,即可快速校准,显示出优异的工程实用性。

  2. 我们设计了一种结合网格处理与LiDAR投影图的自适应地面分割算法。该算法将LiDAR点云划分为多尺度同心扇形区域,通过邻域高度关系建立自适应阈值进行粗分割。为进一步解决粗分割中的误报问题,我们创新性地引入基于LiDAR投影图的区域生长算法,实现精准细分。

  3. 实验验证表明,我们的方法在 SemanticKITTI 8 与 BotanicGarden 9 基准数据集以及真实场景中均表现出色,特别是在倾斜道路等非平坦地形上显示出卓越的鲁棒性。在时间效率方面,我们的方法与最先进算法相当。

  4. 为促进学术交流与技术验证,我们已将完整的算法框架实现为 C++,并在 https://github.com/sychina/LPIR-GSeg

第 II 节公开发布源代码。相关工作

A. 基于学习的方法

基于学习的地面分割方法可分为两大类:传统机器学习方法和深度学习方法。在传统机器学习中,基于马尔可夫随机场(MRF)的分割算法是研究最多的。Rummelhard 等人 10 提出了一个基于3-D点云的地面分割系统,该系统通过将地面建模为时空条件随机场,基于对局部地面高程和坡度的动态估计实现分割。Golovinskiy 与 Funkhouser 11 首次提出了基于最小割的点云分割框架。他们构建了一个 k-最近邻图,并使用前景/背景种子点来实现点云的二值分割,这依赖于种子点的选择。随后,Huang 等人 12 和 Guo 等人 13 基于 MRF 预先设置地面和非地面种子点,以通过分层分割降低计算量,这提升了运行速度但降低了精度。总体而言,基于 MRF 的方法需要先验知识来设定背景和前景点,但其计算成本过高,难以用于实时使用。相比之下,深度学习方法在推理时运行非常高效。然而,训练这些模型需要数万张标记点云帧。深度学习方法 14 可以从训练数据中学习地面特征,例如 1516。Paigwar 等人 17 在基于网格的表示中提出了一种端到端的地面分割方法。该方法利用柱中的点来学习柱级特征,并将其散射回 2-D 伪图像,在公开数据集上表现良好。LiDAR 投影图像也被用于模型中以提高分割精度 18。大多数自动驾驶车辆配备有限的处理器,这使得在这些平台上部署计算成本高昂的深度学习地面分割模型变得困难。此外,基于学习的算法缺乏场景泛化能力,导致在其他场景和传感器上性能不佳,需要重新训练。

B. 拟合与划分方法

拟合与分区方法常常一起使用。在三维空间中,平面拟合通常使用随机样本一致性(RANSAC)算法 19,如 20 所示。主成分分析(PCA)算法 21 也是拟合地面平面的另一选项。基于 RANSAC 的方法在处理噪声点云时提供比基于 PCA 的方法更好的平面拟合精度。然而,PCA 的计算速度比 RANSAC 更快,例如 222324 的全局或局部拟合。它们将地面拟合为整体或多平面,并通过点与平面距离的高度或方差阈值对地面进行分割。然而,这些方法在非平坦地面上的拟合精度降低,并且易受垂直方向点云的影响。此外,需要多次拟合迭代才能从点云中得到结果,导致高昂的计算成本。大多数实际道路表面是非平直曲线。为避免曲线拟合,基于分区的方法将点云划分为许多小网格,并在每个网格中拟合地面 2526。或者,Lim 等人 27 与 Lee 等人 28 在网格中测量点云特征作为地面特征,例如平整度、海拔和竖直度,并可部署在现场可编程门阵列(FPGA)平台 29。惯性测量单元(IMU)传感器也可用于测量 LiDAR 的俯仰角和滚转角,将原始点云旋转为竖直方向以进行地面分割 30。该方法在复杂地形和地面至非地面过渡区表现良好,但仍受限于参数调优、数据依赖和实时性能。例如,过度分区会导致突变高度边缘的分割错误,如路缘石或轮胎接触区。此外,选择高度阈值在复杂地形变化中困难,例如植被覆盖区域,导致误将低障碍物识别为低障碍物。这些缺点直接降低了下游检测模块的召回率和精确度。

C. 有序点云与基于图像的方法

有序点云指的是每个点遵循明确定义的顺序的点云,类似于图像中像素的排列,直接对应于机械旋转激光雷达的物理扫描模式。
利用有序点云,可以根据地面坡度 3132 确定扫描线之间的几何关系,从而动态调整高度阈值,分割不满足所需间距的非地面点。
一些方法通过考虑不同距离下点云密度变化 33、地面平面坡度 34 以及地面平面法向量与激光雷达倾斜角的关系 [^31],全面设定距离和高度阈值。
虽然这些方法在结构化场景(如具有清晰障碍物边界和平坦表面的城市道路)中表现出卓越的滤波性能,并且非常适合在自动驾驶系统中部署,但它们存在局限性。
在颠簸或倾斜道路条件下,扫描线的不均匀分布可能显著降低分割精度。
此外,这些算法的有效性严格取决于传感器的安装参数(即激光雷达必须水平安装在车辆顶部)。
另外,3-D 点云可以基于其垂直和水平分辨率投影到 2-D 图像(通常称为激光雷达投影图像),从而通过图像处理技术实现地面分割。
此激光雷达投影图像包含深度图像、高度图像或坡度图像 [^32]。
随后,可以根据点云之间的几何关系 [^33] 设置像素阈值,并使用图像处理操作(如膨胀、腐蚀、闭运算、开运算 [^34] 以及卷积 [^35])进行分割。
然而,由于像素和投影误差,这种方法往往在图像边界产生错误的分割结果,需要额外的补偿方法。

总之,基于图像的点云分割研究仍相对缺乏。本研究解决了如边缘精度受限以及实现与最先进方法相当的性能等挑战。

第III节. 系统介绍

A. LPIR-GSeg框架

所提出的LPIR-GSeg工作流程如图1所示。后续段落重点说明LPIR-GSeg各模块的描述和推理。LPIR-GSeg主要由三部分组成:预处理、粗分割和细分割。

Figure 1

图1. LPIR-Seg概览。在预处理模块中,移除实际地面下方的一些噪声点以校准LiDAR倾斜角度,然后将点云投射到同心环模型中。一个快速粗分割模块通过自适应高度阈值和PCA将点云划分为高置信度地面点 {P}_{g} 和非地面点 {P}_{\textit {ng}}。细分割模块使用LiDAR投影图像的多阈值提取不确定边界点 {P}_{\textit {un}},并通过地面区域生长算法对点云进行细化。

B. 预处理

预处理模块采用基于球面投影的几何校正框架,通过地面趋势拟合实时估计LiDAR安装倾斜度,实现点云几何校正。处理流程包含若干关键步骤。

1) 地面反射噪声过滤:

城市环境中常见的反光材料(如玻璃幕墙和金属表面)会产生异常噪声点,通常具有负高程值(低于实际地面水平),严重影响粗分割模块中最小点高程阈值计算的准确性,如图2所示。为了解决此问题,常用做法是设置自定义高程阈值 h_{\text {noise}} 和强度阈值 i_{\text {noise}},以过滤入射角小且强度低的噪声点。

Figure 2

Fig. 2. 地面反射噪声图。使用 RS-Ruby-Lite LiDAR 捕获的城市道路点云数据演示典型的地面反射噪声现象。红色矩形突出显示需要被移除的由反射引起的点云。

2) LiDAR投影模型:

机械旋转 LiDAR 在其扫描模式中表现出确定性的几何特征,垂直分辨率和水平分辨率构成了一个规则的球面采样网格。基于此,我们采用球面投影模型将三维点云映射到二维图像平面,生成基于图像的特征表示。对于 LiDAR 点 \mathbf {p_{i}}=(x_{i},y_{i},z_{i}) 在 LiDAR 点云 p = \{ {\mathbf {p}_{1},\mathbf {p}_{2},\mathbf {p}_{3},\ldots ,\mathbf {p}_{\mathbf {i}},\ldots ,\mathbf {p}_{\mathbf {N}}} \} 中,投影图像 \mathbf {I}_{u_{i},v_{i}} 可通过以下方程得到:

\begin{align*} \begin{pmatrix} u_{i} \\ v_{i} \end{pmatrix} = \begin{pmatrix} {1}/{2} \times \left [{{ 1 - \tan ^{-1}\left ({{ {y_{i}}/{x_{i}} }}\right ) \cdot \pi ^{-1} }}\right ] \cdot I_{\text {width}} \\ \left [{{ 1 - \left ({{ \sin ^{-1}\left ({{ {z_{i}}/{d_{i}} }}\right ) + v_{\text {fov}}^{\text {up}} }}\right ) \cdot 1/{v_{\text {fov}}^{\text {up} + \text {down}}} }}\right ] \cdot I_{\text {height}} \end{pmatrix} \tag {1}\end{align*}

其中 I_{\text {width}} \times I_{\text {height}} 代表图像分辨率,图像宽度 I_{\text {width}} = h_{\text {fov}}/h_{\text {res}} 通过水平视场角(FOV)和水平分辨率 h_{\text {res}} 计算得到,图像高度 I_{\text {height}} = v_{\text {fov}}/v_{\text {res}} 通过垂直 FOV v_{\text {fov}} = v_{\text {fov}}^{\text {up}} + v_{\text {fov}}^{\text {down}} 和垂直分辨率 v_{\text {res}} 计算得到。图像高度通常与 LiDAR 行数一致。d_{i} = (x_{i}^{2} + y_{i}^{2})^{1/2} 是 LiDAR 点到 LiDAR 在 XOY 平面原点的距离。

3) LiDAR倾斜角校准:

非水平安装可能由 LiDAR 安装误差、支撑结构变形以及胎压不均造成。我们提出一种基于图 3 所示地面趋势拟合的实时倾斜角校准方法。倾斜角校准通过补偿点云高度来提升粗分割性能,图 4 给出了校准前后对比图像。倾斜角的校准并非每次代码执行都需要。作为传感器外参的一部分,它仅需针对同一采集硬件和传感器校准一次。

Figure 3

Fig. 3. LiDAR安装的倾斜角度图。ZOX和平面ZOY平面上的倾斜角度投影,其中\rightarrow {V}表示车辆的行驶方向向右,\otimes {V}表示车辆的行驶方向与纸面垂直。

Figure 4

Fig. 4. 倾斜角度校准前后对比。绿色点表示校准前的点云,蓝色点表示校准后的点云。

首先,将车辆驶向平坦开阔的道路表面,例如地下停车场,假设当地道路表面为理想平面。生成当前帧点云的 LiDAR 深度图 \mathbf {I}_{\text {range}} 并从四个主要方向(前、后、左、右)提取点云。为确保拟合精度,在每条拟合线两侧 3 像素宽度内采样点云。随后,通过设置地面高度阈值 h_{\text {thr}} 和距离阈值 d_{\text {thr}},选择有效拟合点。通过 RANSAC,可以利用以下方程获得 XOZYOZ 地面平面的拟合线:

\begin{align*} \widehat {z_{x}} = k_{xz}x + b_{x} \\ \widehat {z_{y}} = k_{yz}y + b_{y}. \tag {2}\end{align*}

其中 k_{xz}k_{yz} 是地面平面斜率,\widehat {z_{x}}\widehat {z_{y}}z 的补偿系数。b_{x}b_{y} 表示 LiDAR 坐标系原点处的传感器高度,它们之间的误差应小于 1 厘米。若误差过大,则需要在更平坦的表面上重新校准。最后,经过补偿的 LiDAR 点云 z_{t} 通过以下等式的观测测量获得:

\begin{equation*} z_{t} = z - \left ({{k_{xz}x + k_{yz}y}}\right ). \tag {3}\end{equation*}

4) 同心网格模型:

在城市环境的复杂地形中,斜率变化、曲率变化以及单平面或单表面假设不足以实现精确建模。因此,我们提出了一种基于非均匀扇区网格的区域分割策略。该设计基于两个关键观察:首先,随着距离的增加,地面检测能力下降,而近处区域包含了大部分地面点。其次,点云密度遵循径向衰减分布,近处密度是远处的数倍。

因此,采用了自适应网格划分策略:近区使用高分辨率小网格,远区使用低分辨率大网格。网格数量由半径分辨率 \text {res}_{r} 和方位分辨率 \text {res}_{\theta } 决定。对于特定的已校正 LiDAR 点 Z_{r,\theta }^{t},属于第 i 圈、第 j 个网格 Z_{r,\theta }^{i,j},如图所示,ij 定义如下:

\begin{align*} & \begin{cases} \displaystyle i = \text {floor}\left ({{ \frac {r}{{\text {res}}_{r}^{c}} }}\right ) \\ \displaystyle j = \text {floor}\left ({{ \frac {{1}/{2}\lbrack {1 - \theta \cdot \pi ^{- 1}} \rbrack \cdot I_{\text {width}}}{{\text {res}}_{\theta }^{c}} }}\right ) \end{cases}~,\text {if}~r \lt = r_{\text {thr}}^{\text {distance}} \\ & \begin{cases} \displaystyle i = \text {floor}\left ({{ \frac {r}{{\text {res}}_{r}^{c}} }}\right ) + \text {floor}\left ({{ \frac {r - r_{\text {thr}}^{\text {distance}}}{{\text {res}}_{r}^{f}} }}\right ) \\ \displaystyle j = \text {floor}\left ({{ \frac {{1}/{2}\lbrack {1 - \theta \cdot \pi ^{- 1}} \rbrack \cdot I_{\text {width}}}{{\text {res}}_{\theta }^{f}} }}\right ) \end{cases},\text {if}~r \gt r_{\text {thr}}^{\text {distance}}\!\!. \tag {4}\end{align*}

(4) 中,ij 从 0 开始,函数 \text {floor}(\cdot) 表示结果向下取整。r = (x^{2} + y^{2})^{1/2}\theta = {\tan ^{- 1}({y,x})}\text {res}_{r}^{c} 表示近区网格的径向分辨率,\text {res}_{\theta }^{c} 表示近区网格的方位角分辨率,r_{\text {thr}}^{\text {distance}} 表示附近的距离阈值,\text {res}_{r}^{f} 表示远区网格的径向分辨率,\text {res}_{\theta }^{f} 表示远区网格方向的角分辨率。

C. 粗略分割

在城市道路环境中,地面点通常表现为局部区域内的最低点。为实现快速分割,本研究采用自适应高度阈值策略,并结合多线程加速PCA算法进行地面分割。

1) 基于自适应高度阈值的地面种子点选择:

首先,对当前帧的点云进行遍历,计算每个 sector grid 周围 3\times 3 邻域格子内的最大高度 h_{\max }^{i,j}、最小高度 h_{\min }^{i,j} 以及平均高度 h_{a_{n}}^{i,j}。在每个 sector grid Z_{r,\theta }^{i,j} 内,利用 (5) 区分地面点 P_{g} 与非地面点 P_{ng}

\begin{align*} \begin{cases}P_g=\left\{P_i \in Z_{r, \theta}^{i, j}| | h_i-h_{\min }^{i, j} \mid \leq h_{\mathrm{thr}}^{i, j}\right. \\\text { or } \left.\left|h_{\max }^{i, j}-h_{n_{\text {amin }}}^{i, j}\right| \leq h_{\mathrm{athr}}^{i, j}\right\} \\\mid P_{n g}=\left\{P_i \in Z_{r, \theta}^{i, j} \mid P_i \notin P_g\right\} .\end{cases} \tag {5}\end{align*}

在 (5),h_{\text {thr}}^{i,j} = h_{\min }^{i,j} + \lambda 是网格 (i,j) 的高度阈值,\lambda = {Z_{r,\theta }^{i,j}}_{\text {size}} \times \xi _{\text {slope}} 是地面坡度因子的补偿系数,该系数通过乘以网格 {Z_{r,\theta }^{i,j}}_{\text {size}} 的尺寸得到。我们将地面最大坡度设置为 \xi _{\text {slope}},即 5%\thicksim 8h_{a_{\text {thr}}}^{i,j} 是网格 (i,j) 相邻网格的高度阈值。选择地面种子点包含两个方面。首先,在消除地面反射噪声后,网格内的最低点通常是地面点;其次,如果当前网格中的最高点低于相邻网格中的最低点,并且当前网格内的趋势变化最小,则确认整个网格代表地面。该方法可快速分割平坦地面。

2) 基于快速 PCA 的地面特征计算:

地面分割可以视为二分类问题,其目标是将 3-D 点云划分为两组。然而,对于倾斜路面,种子点可能包含过度分割的误报(FP)和欠分割的漏报(FN),如图 5 所示。FP 通常出现在地面与非地面点之间的边界,例如轮胎、街灯以及树木基部。FN 通常出现在陡坡和不平整的草地上。通过减小网格尺寸可以降低分割结果中的 FN 点,但无法通过增大网格分辨率来缓解 FP 点。

Figure 5

图 5. 自适应高度阈值分割的示意图。绿色代表 TP,红色代表 TN,蓝色代表 FP,黄色代表 FN。绿色平行四边形代表由 PCA 拟合的平面。

图5展示了自适应高度阈值分割的示意图。绿色代表真正阳性 (TP),红色代表真正阴性 (TN),蓝色代表假阳性 (FP),黄色代表假阴性 (FN)。绿色平行四边形表示由 PCA 拟合的平面。在本文中,使用 PCA 计算网格中的地面特征来估计地面趋势线,并调整高度阈值以减少 FP 和 FN 点的数量。地面种子点 P_{g} 位于网格 {Z_{r,\theta }^{i,j}}_{\text {size}},使用线性方法进行平面估计,公式如下:

\begin{align*} ax + by + cz & = {-} d \\ \mathbf {n}^{T}\mathbf {x} & = - d. \tag {6}\end{align*}

在 (6),\mathbf {n} = \lbrack {a,b,c} \rbrack ^{T} 表示平面法向量,\mathbf {x} = \lbrack {x,y,z} \rbrack ^{T}。多线程加速 PCA 模块用于计算 n,当前网格中地面种子点 P_{g} 的协方差矩阵可通过以下公式得到:

\begin{equation*} \mathbf {C}_{g} = \frac {1}{| P_{g} |}{\sum _{p_{i} \in P_{g}}{\left ({{p_{i} - \overline {p}}}\right )\left ({{p_{i} - \overline {p}}}\right )^{T}}} \tag {7}\end{equation*}

其中 \overline {p} 是非地面点的平均值。对应点云分布的三个主方向的特征值和特征向量可通过奇异值分解 (SVD) 获得。协方差矩阵 \mathbf {{C}_{g}} 的三个特征值按 \lambda _{1} \gt \lambda _{2} \gt \lambda _{3} 的顺序排列,对应特征向量 \boldsymbol {\xi }_{1}\boldsymbol {\xi }_{3}。对于平面分布,垂直于平面的特征向量 \boldsymbol {\xi }_{3} 的特征值为最小的 \lambda _{3},对应平面的法向量 n。随后得到平面参数 d。通过计算种子点到平面的平均距离作为阈值,可以有效减少 FP 和 f 点的数量。

D. 精细分割

虽然粗分割模块能有效处理平坦的城市道路场景,但在非结构化地形(例如斜坡和草地)中其性能显著下降。为了解决此问题,我们提出了一种基于 LiDAR 投影图的级联区域生长算法,以通过二次细化提高复杂环境下的地面建模精度。

1) 基于 LiDAR 投影图像的区域分割:

基于 LiDAR 投影模型,LiDAR 点云可以投影到固定尺寸的图像上以确定像素位置。投影图像的像素值由 LiDAR 点与其周围点的位置、距离和空间关系决定。根据投影图像的类型,后续模块利用几何信息,如轮廓、深度和周围环境的空间关系。此外,还采用计算机视觉图像处理技术,如腐蚀、膨胀、开运算和闭运算,对 LiDAR 点云进行分割。对应 LiDAR 点 \mathbf {p_{i}} 的投影图像包含以下七个类别,如图 6 所示。

  1. Range Image\mathbf {I}_{\text {range}}: 像素值为 \mathbf {I}_{\text {range}}({u_{i},v_{i}}) = \mathbf {p}_{\mathbf {i}}^{d}.

  2. Intensity Image\mathbf {I}_{\text {intensity}}: 像素值为 \mathbf {I}_{\text {intensity}}({u_{i},v_{i}}) = \mathbf {p}_{\mathbf {i}}^{\text {intensity}}.

  3. Height Image\mathbf {I}_{z}: 像素值为 \mathbf {I}_{z}({u_{i},v_{i}}) = \mathbf {p}_{\mathbf {i}}^{z}.

  4. Slope Image\mathbf {I}_{\text {slope}}: 像素值为每个 LiDAR 点及其相邻像素的高度变化率与深度变化率的比值。\mathbf {I}_{\text {slope}}({u_{i},v_{i}}) = (| {\mathbf {I}_{z}(u_{i} + 1,v_{i})-\mathbf {I}_{z}(u_{i},v_{i})} |/) | {\mathbf {I}_{\text {range}}({u_{i} + 1,v_{i}}) - \mathbf {I}_{\text {range}}({u_{i},v_{i}})} | 反映道路表面的平滑程度。

  5. Edge Image\mathbf {I}_{\text {edge}}: 像素值为当前 LiDAR 点对应像素与对应的左、右相邻像素之间的高度差。\mathbf {I}_{\text {edge}}^{\text {right}}({u_{i},v_{i}}) = | \mathbf {I}_{z}({u_{i+1},v_{i}}) -\mathbf {I}_{z}({u_{i},v_{i}})|\mathbf {I}_{\text {edge}}^{\text {left}}({u_{i},v_{i}}) = | \mathbf {I}_{z}({u_{i},v_{i}}) -\mathbf {I}_{z}({u_{i-1},v_{i}})|。图像中的像素被分为边缘像素和非边缘像素。边缘像素代表物体的边界,而非边缘像素可能对应平坦表面或建筑物。

  6. Elevation Standard Deviation Image\mathbf {I}_{\text {stdz}}: 像素值为 \mathbf {I}_{\text {zstd}}({u_{i},v_{i}}) = \overline {{\mathbf {I}_{z}({u_{i},v_{i}})}^{2}} - {\overline {\mathbf {I}_{z}({u_{i},v_{i}})}}^{2},而高程变差函数反映图像中高程变化的速率,并用于寻找地面平面和物体边界。

  7. Intensity Standard Deviation Image\mathbf {I}_{\text {stdi}}: 像素值为 \mathbf {I}_{\text {zsti}}({u_{i},v_{i}}) = \overline {{\mathbf {I}_{z}({u_{i},v_{i}})}^{2}} - {\overline {\mathbf {I}_{z}({u_{i},v_{i}})}}^{2}。点云强度方差图反映图像中强度变化率,每个物体的反射强度不同,可用于找到每个物体的边界。

Figure 6

图 6. LiDAR 投影伪彩色图.

根据不同的 LiDAR 投影图像,设置不同的阈值区间来对图像像素进行分类。分类规则如下:

\begin{align*} f_{\text {edge}}\left ({{u_{i},v_{i}}}\right ) & = \begin{cases} \displaystyle 1, \text {if}~ \mathbf {I}_{\text {edge}}^{\text {right}}\left ({{u_{i},v_{i}}}\right ) \geq T_{\text {edge}} \text {or} \\ \displaystyle \qquad \mathbf {I}_{\text {edge}}^{\text {left}}\left ({{u_{i},v_{i}}}\right ) \geq T_{\text {edge}} \\ \displaystyle 0, \text {else} \end{cases} \tag {8}\\ f_{\text {slope}}\left ({{u_{i},v_{i}}}\right ) & = \begin{cases} \displaystyle -1, & \text {if}~ \mathbf {I}_{\text {slope}}\left ({{u_{i},v_{i}}}\right ) \leq T_{\text {slope}}^{\text {low}} \\ \displaystyle 0, & \text {if}~ T_{\text {slope}}^{\text {low}} \lt \mathbf {I}_{\text {slope}}\left ({{u_{i},v_{i}}}\right ) \lt T_{\text {slope}}^{\text {high}} \\ \displaystyle 1, & \text {if}~ \mathbf {I}_{\text {slope}}\left ({{u_{i},v_{i}}}\right ) \geq T_{\text {slope}}^{\text {high}} \end{cases} \tag {9}\\ f_{\text {stdz}}\left ({{u_{i},v_{i}}}\right ) & = \begin{cases} \displaystyle -1, & \text {if}~ \mathbf {I}_{\text {stdz}}\left ({{u_{i},v_{i}}}\right ) \leq T_{\text {stdz}}^{\text {low}} \\ \displaystyle 0, & \text {if}~ T_{\text {stdz}}^{\text {low}} \lt \mathbf {I}_{\text {stdz}}\left ({{u_{i},v_{i}}}\right ) \lt T_{\text {stdz}}^{\text {high}} \\ \displaystyle 1, & \text {if}~ \mathbf {I}_{\text {stdz}}\left ({{u_{i},v_{i}}}\right ) \geq T_{\text {stdz}}^{\text {high}} \end{cases} \tag {10}\\ f_{\text {stdi}}\left ({{u_{i},v_{i}}}\right ) & = \begin{cases} \displaystyle -1, & \text {if}~ \mathbf {I}_{\text {stdi}}\left ({{u_{i},v_{i}}}\right ) \leq T_{\text {stdi}}^{\text {low}} \\ \displaystyle 0, & \text {if}~ T_{\text {stdi}}^{\text {low}} \lt \mathbf {I}_{\text {stdi}}\left ({{u_{i},v_{i}}}\right ) \lt T_{\text {stdi}}^{\text {high}} \\ \displaystyle 1, & \text {if}~ \mathbf {I}_{\text {stdi}}\left ({{u_{i},v_{i}}}\right ) \geq T_{\text {stdi}}^{\text {high}} \end{cases} \tag {11}\end{align*}

其中 T_{\text {edge}}T_{\text {slope}}T_{\text {stdz}}T_{\text {stdi}} 及其上标低/高构成像素级分割阈值。左、右边缘图像可以根据像素筛选出物体高度变化的边界,但该点可能位于地面或物体上,因此被归为未知分类点。\mathbf {I}_{\text {slope}}\mathbf {I}_{\text {stdz}}\mathbf {I}_{\text {stdi}} 的分割动机是利用特征的低阈值从非边缘像素中寻找地面像素,利用高阈值从边缘像素中重新确认非地面像素。根据 f_{\text {edge}}f_{\text {slope}}f_{\text {stdz}}f_{\text {stdi}} 的分割结果,生成分类结果图 \mathbf {I}_{\text {label}}。最终,使用 (12) 的区域增长算法进一步细化未知分类点。物理上,它们表示 LiDAR 投影图像中相邻像素关系的阈值。初始参数通过计算像素方差得到,然后根据分割结果进行经验细调。

\begin{align*} \mathbf {I}_{\text {label}}\left ({{u_{i},v_{i}}}\right ) = \begin{cases} \displaystyle l_{\text {ground}}, \text {if}~ f_{\text {edge}} = 0 \text {and} \\ \displaystyle \qquad -3 \leq f_{\text {slope}} + f_{\text {stdz}} + f_{\text {stdi}} \lt 0 \\ \displaystyle l_{\text {unknown}}, \text {if}~ f_{\text {edge}} = 1 \text {and} \\ \displaystyle \qquad f_{\text {slope}} + f_{\text {stdz}} + f_{\text {stdi}} = 0 \\ \displaystyle l_{\text {noground}}, \text {if}~ f_{\text {edge}} = 0 \text {and} \\ \displaystyle \qquad 0 \lt f_{\text {slope}} + f_{\text {stdz}} + f_{\text {stdi}} \leq 3. \end{cases} \tag {12}\end{align*}

2) 基于区域增长算法的精细分割:

在前述过程中,地面点和非地面点都是高置信度点,接下来的任务是区分未知分类点。首先,将粗分割分类结果P_{g}P_{ng}中与区域分割结果不同的点云设置为未知分类点。由于投影误差和噪声,区域分割和粗分割可能包含误分类点,这些误分类点通常被正确分类点包围。此外,对于城市道路,地面分割的结果通常是连续的,从附近地区延伸到更远的地方。因此,在假设地面区域连通的前提下,将地面区域扩展算法应用于 LiDAR 投影图。粗分割和区域分割的地面分类点作为种子点,算法在8邻域中迭代遍历未知分类点。通过判断连续点之间的 LiDAR 强度变化是否超过预定义阈值,算法区分当前点是否为地面点,从而生成分类结果地图\widehat {\mathbf {I}_{\text {label}}}。最终,通过逆投影获得分类地面点云\widehat {P_{g}}和非地面点云\widehat {P_{ng}}。算法流程图如算法1所示。

Figure 7

算法 1 地面区域扩展

第四节 实验

在本文中,所提出算法的准确性和实时性能将从定性和定量两个方面进行评估:公开数据集和自采集数据集。SemanticKITTI 35,作为 KITTI 数据集的扩展,增加了对 LiDAR 点云的人工注释语义标签,作为定量分析的主要数据集。BotanicGarden 36 为轮式机器人采集了非结构化场景,并未提供 LiDAR 点云的语义注释,我们利用该数据集进行非结构化环境下的定性分析。自采集的数据集记录了中国安徽省合肥市的城市街道环境,涵盖平坦道路、上坡与下坡道路、隧道和桥梁等场景。为展示所提出算法在分割精度和计算效率方面的优势,本节将其与几种现有开源方法进行对比分析。所有算法均在一台配备 16GB 内存、AMD Ryzen7 5800H CPU 与 NVIDIA GEFORCE RTX 3050TI GPU 的个人电脑上执行。

这部分使用精准率和召回率作为评估指标来评估地面分割的准确性,并识别潜在的欠分割和过拟合问题。F_{1}-分数结合了精准率和召回率,用于全面评估算法的整体性能。这些指标的定义如下:

\begin{align*} \text {Precision} & = \frac {\text {TP}}{\text {TP} + \text {FP}} \\ \text {Recall} & = \frac {\text {TP}}{\text {TP} + \text {FN}} \\ F_{1}\text {-}\text {score} & = 2 \times \frac {\text {Precision} \cdot \text {Recall}}{\text {Precision} + \text {Recall}} \tag {13}\end{align*}

其中 TP、FP 和 FN 分别对应“ground”类别的真正正例、假正例和假负例的地面分割结果。由于地面分割的主要目标是促进地面约束、目标检测或可驾驶区域提取,在城市道路环境中,“pedestrians”“cars”“bicycles”“trucks”和“vegetation”等类别也被视为非地面点。相反,诸如“terrain”和“sidewalks”等可被车辆或机器人接近的区域则被归类为地面点。

A. SemanticKITTI 实验

The SemanticKITTI 数据集通过加入语义注释扩展了 KITTI 里程计基准。该数据集使用配备 Velodyne HDL-64E S2 LiDAR 传感器、视场 360° 的车辆获取,采集 10Hz 的语义点云。它为道路环境中动态和静态对象提供全面注释,包括道路表面、建筑物、车辆、植被、行人和交通标志。该数据集包含十个训练序列,涵盖城市、公路和乡村场景,使其特别适合评估跨多种环境的地面分割算法性能。本研究对最先进算法和多种开源方法(包括 Patchwork 和 Patchwork++)进行了全面比较分析。不同分割算法的定量评估结果列于表 I。分割结果的可视化展示在随附的图 7 和图 8 中,其中绿色和红色点云分别代表 TP 和 TN。蓝色(FP)和黄色(FN)点云表示假阳性和假阴性。具体而言,蓝色点表示误分割的地面点,反映了算法分割过程中的过拟合问题;黄色点表示未检测到的地面点,表明欠拟合问题影响了分割精度。

Figure 8

表 I

Figure 9

图 7. SemanticKITTI 数据集上地面分割的定性比较。图中展示的点云来自 SemanticKITTI 00 序列。最左列显示 DipG-Seg 的分割结果,中间列显示 Patchwork++ 的结果,最右列展示我们提出的方法。图中绿色点表示 TP,红色点表示 TN,蓝色点表示 FP,黄色点表示 FN。

Figure 10

图 8. 对 SemanticKITTI 00 和 07 序列中分割算法不同阶段的消融实验的定性结果。左列显示模块 A+B 的分割结果,右列显示模块 A+B+C+D 的结果。(a) 00 A + B。(b) 00 A + B + C + D。(c) 07 A + B。(d) 07 A + B + C + D。

本文章中所有指标均基于 SemanticKITTI 数据集,在我们个人电脑上生成。代码与参数均从其开源平台在线下载。根据我们的实验结果,Patchwork 以及 Patchwork++ 均未能达到文中报告的结果。此外,在研究这些开源方法的代码后,我们发现它们在 SemanticKITTI 中对植被类别的处理方式不同。由于植被既不能被明确区分为地面点也不能被明确区分为非地面点,这导致不同序列之间的结果差异。在本文章中,我们将植被统一视为非地面点,并在这一一致标准下得到本文所报告的指标评估结果。

DipG-Seg 是一种基于 LiDAR 投影映射的点云分割方法。它将点云投影到图像上,其中像素值由对应映射点的高程或距离决定。虽然该方法利用图像分割技术来提取地面点云,但由于点云与像素之间的投影误差以及形态学开闭运算,导致在物体边界处出现过度分割问题。该方法不可避免地将边界点错误分类为非地面点,即使这些点实际上位于地面表面,正如图 7 中黄色点所示。

Patchwork++ 是一种基于网格的地面平面拟合方法,在平坦地形上通过将点云划分为多个扇区来表现出优异的性能。然而,其在崎岖地形中的效果下降。作为近年来召回率最高的地面分割算法,它试图从每个分区中提取地面点以最大化召回率。这一策略不可避免地导致物体下边界和墙基处的点被误分类为非地面点,从而牺牲精度,见图 7。

此外,我们将其与其他基于分区的地面分割方法进行了比较。GroundGrid 37 将 LiDAR 点划分为众多网格以维护网格地图,并使用每个网格的最大高度和最小高度进行分割。在 KITTI 00 数据集上,它获得了 92.42% 的精准率、98.70% 的召回率和 95.46% F1 分数,显示出良好的性能。GroundGrid 在远处道路和地形上的分割精度很高。GroundGrid 在车顶和墙壁远角处出现过度分割,导致召回率较高但精准率较低。对于城市环境中的自动驾驶车辆,过度分割比欠分割更不可接受,因为错误的地面高度估计可能导致不良的地面约束或地面重建。GroundGrid 需要每帧的全局位姿作为输入,平均耗时超过 25 毫秒,以维护内存消耗大的网格地图。

如图 7 所示,我们的方法在斜坡和崎岖地形上实现了精准的地面分割。根据表 I 的结果,与其他方法相比,我们的方法在大多数精准率和召回率指标上表现出强劲的竞争力,获得了所有评估算法中最高的平均 F1 分数。虽然计算复杂度略高于 DipG-Seg,但低于 Patchwork++。

由于我们采用了地面连通性约束,将小的地面点视为非地面点,可能导致欠分割,因此我们的方法相比 Patchwork++ 和 GroundGrid 的召回率更低。然而,我们实现了更高的精准率和 F1 分数,该分数代表算法的整体性能。此设计旨在获得 100% 的地面点,旨在提升后续模块,例如地面重建和地面约束。对于地面分割任务,过度分割的危害远大于欠分割。未提取的地面点对后续应用没有显著影响。总之,尽管我们的方法在所有指标上并未超过 Patchwork++ 和 GroundGrid,但它实现了最佳整体性能,并且易于部署。

B. 参数研究

为在分割的效率与准确性之间取得平衡,我们补充了参数研究,如表 II 所示。图 9 显示不同阈值对算法性能影响很小,并且不会影响算法的应用。针对不同的 LiDAR,我们建议根据不同的扫描线数量和垂直分辨率调整阈值。尽管深度学习在学习这些参数方面确实有优势,本研究的主要目的是为 LiDAR SLAM 提供一个轻量、计算效率高且可靠的前端地面分割模块。

Figure 11

表 II

Figure 12

图 9. 精度、召回率、{F}1 -分数以及准确率随参数变化.

C. 剔除实验

为验证每个子模块的贡献,我们设计了一项递进实验来评估各模块对分割性能的影响。实验结果如表 III 所示。

Figure 13

表 III

在 A 中,预处理模块估计了 LiDAR 的倾斜角并去除了反射噪声,显著提升了分割准确率。在预处理模块之后,SemanticKITTI 00 和 07 序列的精度分别提高了 3.36% 和 2.81%。召回率提高了 0.04% 和 0.24%,而总体性能(以 F1-score 衡量)分别升高了 1.86% 和 1.82%。由于 LiDAR 点云更好地与地面对齐,这导致了更准确的高度阈值。根据剔除实验,倾斜角对在平坦地形上行驶的自动驾驶车辆更有益,主要提升粗分割的准确性和速度,但对最终结果影响不大。然而,对于在不平坦地形上运行的轮式机器人,传感器的水平面很少与地面平行,因此倾斜角不需要经常校准。

在 B 模块中,粗分割模块为地面点提供了初始分割,并成功提取了大多数地面点。 然而,由于固定高度阈值的限制,边界区域会出现过度分割错误。 在 SemanticKITTI 00 和 07 序列中,粗分割模块分别实现了最高召回率 96.47% 和 95.38%,准确识别了大多数地面点。 然而,其精度普遍不足,仅为 84.04% 和 88.08%。 因此,粗分割模块的整体 F1-score 为 89.83% 和 90.04%。 这一发现与定性实验结果一致。 如图 8(a) 与 (c) 所示,只有模块 A + B 的方法即可分割大多数地面点。 然而,过拟合仍然在边界区域出现高 FP 比例,如蓝点所示。 过拟合主要出现在墙体底部、车辆轮胎与地面连接处以及草地等区域。 并且,观察到的欠拟合 FN 点非常少。

在 C 和 D 模块中,通过投影图像阈值和地面区域生长,算法实现了最平衡和最准确的结果。 投影处理的可视化如图 10 所示。

Figure 14

图 10. LiDAR 投影图像处理可视化(原始 $\rightarrow $ 形态 $\rightarrow $ 分割)。

最后,也是最重要的主张是,我们的方法运行速度快,如图 11 所示。 它仅需约 9.62 毫秒(占总 14.19 毫秒)即可对修复后的图像进行细分,4.41 毫秒用于粗分割。 这证明我们的算法具有良好的实时性能,可用作前端模块,例如 SLAM 和地面重建。

Figure 15

图 11. 我们的方法在 SemanticKITTI 07 上的运行时间。

在 SemanticKITTI 00 和 07 序列中,该算法实现了最高的分割准确率,分别提升至 97.27% 和 97.84%,提升幅度为 9.87% 和 9.76%。虽然召回率略微下降了 1.66% 和 0.7%,但整体算法达到了最平衡、最准确的结果,F1-score 提升了 4.31% 和 4.25%。虽然过拟合的 FP 点已被恢复,但由于模糊的物体边界和投影误差,仍引入了一小部分欠拟合的 FN 点。如图 8(b) 和 (d) 所示,完整算法在识别类似草地等对象时仍会误分类点,但在道路边界处实现了更高的分类准确率。这些结果充分验证了所提算法的有效性及其在处理地面到非地面转换区域的优势。

D. BotanicGarden 实验

BotanicGarden 38 在面积超过 48000 平方米的植物园中构建了复杂的现场环境数据集,以验证在非结构化环境中的算法。它采用四轮驱动差速装置,配备灰度和彩色立体相机、机械旋转式 LiDAR、固态 MEMS LiDAR、GNSS/IMU 系统和车轮里程计。

如图12所示。GndNet在非结构化场景中缺乏泛化能力。根据定性分析,GndNet在三种算法中表现最差。它倾向于过度分割,且无法充分估计地面高度。GroundGrid的表现与我们提出的方法相当。定性分析显示,我们的方法实现了更高的分割精度。GroundGrid在近距离(1米以内)和远距离处容易过拟合,如图12(b)所示。 这是因为缺乏对地面连通性的约束。相比之下,本文提出的算法在非结构化场景中取得了良好的定性实验结果。我们的方法不需要神经网络,且参数调优快速高效,无需输入如机器人位姿等额外先验信息。 然而,由于图像阈值选择缺乏细致调优,出现了欠分割现象。总之,在此数据集上的定性实验表明,我们的方法不仅适用于城市道路场景的地面分割,还具备在非结构化环境中分割不平整表面的能力。此外,GroundGrid的缺点是它需要位姿作为输入,而不仅仅是点云。由于系统与网格地图高度耦合,除KITTI之外,它无法灵活快速地部署到其他数据集。需要额外编程来适配参数和数据接口。此外,GroundGrid需要指定里程计坐标系以及不同坐标之间的关系以进行转换。

Figure 16

图12. 在BotanicGarden中的 (a) GndNet、(b) GroundGrid 和 (c) 我们的方法的定性结果。

E. 真实世界实验

真实的实验结果,如图 13 所示,作为对地面分割算法的定性分析,该算法基于改装的电动乘用车构建,图 14 则展示了该车的示意图。车辆顶部配备了三台 LiDAR,主要使用中间的 LiDAR RS-Ruby-Lite-80,拥有 360° 的视场,作为主要的数据来源;后方的 CGI-430 GNSS/IMU 双天线导航系统提供厘米级 RTK 定位和航向。车身底盘上安装了车轮转速传感器,用于实时测量四轮旋转速度。实验验证仅使用了中间的原始 LiDAR 点云数据。

Figure 17

图 13. 城市场景中地面分割算法的定性比较。蓝色矩形表示过分割,黄色矩形表示欠分割。(a) DipG-Seg。(b) Patchwork++。(c) 我们的算法。

Figure 18

图 14. 实验平台:配备 RS-Ruby-Lite LiDAR、CGI-430 GNSS/IMU 集成导航系统以及车轮转速传感器的自动驾驶电动汽车。

为评估算法在复杂城市环境中的适应性,收集了安徽省衡峰市高架高速公路上的多场景数据(图 15)。在图 13 中,真实数据集的分割标签的地面真值很难获得。因此,测试环境包含了坡度显著变化的坡道过渡区,仅用于对算法进行定性评估。

Figure 19

图 15. 高速公路环境中的真实数据集。

实验结果表明,在处理 80 行 LiDAR 数据时,图 13(a) 中的 DipG-Seg 显著产生过分割,尤其在护栏和植被附近生成异常噪声点。这表明该方法难以适应高行 LiDAR。尽管如此,它仍实现了最高的地面召回率,说明基于图像的分割方法需要在高度阈值约束下进行优化。

结果显示 Patchwork++(如图 13(b) 所示)相较于 digpseg 取得了更高的准确度。然而,它在斜坡转换区出现了特征性的欠分割,如红色矩形区域所示。此外,实验分析表明其对网格分辨率等参数敏感,需要针对平台进行参数调优。

相比之下,我们的方法即使在道路高度变化显著的情况下,也能成功保持高精度的分割准确性,如图 13(c) 所示。值得注意的是,在标记为陡坡段的矩形内,我们的方法实现了高度准确的连续地面分割。然而,在植被边界仍存在过度分割噪声。这些发现表明我们在处理真实世界点云时的地面分割方法的有效性,高精度进一步暗示了使用该算法的移动平台的行驶安全性提升。

第五节. 结论

本文提出了一种快速且精确的城市环境地面分割方法,称为LPIR-Seg。 该方法利用激光雷达投影图像和粗到细的分割策略。 它通过采用高度阈值化和块拟合策略对粗分割进行操作,充分利用激光雷达传感器的水平安装配置以及城市道路表面的独特特征。 随后,我们集成了一种基于激光雷达深度图的改进图像分割技术,该技术将粗分割结果融合,以将像素分类为三类: 地面、非地面和未知。 最后,未知像素通过细分模块进行细化,显著提升整体准确率。 我们在公共数据集和真实世界数据集上进行了广泛实验,这些数据集涵盖多样场景和多种激光雷达传感器型号,以验证我们的方案。 SemanticKITTI上的结果表明,我们的方法在地面分割准确率方面优于其他基于特征的算法。 BotanicGarden的实验表明,我们的方法在无结构场景中也表现良好。 进一步的实验进一步确认了我们方法在各种条件下的鲁棒性。

然而,我们的对比分析也表明,在召回率和执行效率方面仍需要改进。尤其是在地形不均匀的草地或灌木区,边界像素模糊导致提取精度下降。此外,算法在捕获空间语义信息方面能力有限。未来工作中,我们计划将我们的方法与基于深度学习的点云语义分割方法相结合,以提升语义准确性,并探索并行优化技术以进一步提升效率。

参考文献

额外参考文献