当前位置:首页/图片新闻
孙萍等—BOEG:考虑非滑坡样本采样策略对滑坡易发性评价的影响
  滑坡易发性评价中,数据与特征选择对模型效果具有决定性影响。滑坡与非滑坡样本的选择及特征输入的差异,是导致评价结果不确定性的主要因素。天水市位于青藏高原东北缘,地处南北地震带与秦岭地震带的交汇区,地质构造较为复杂。同时,极端天气进一步加剧了地质环境的脆弱性,使得滑坡灾害频发。深入研究天水市滑坡的空间分布规律,开展降雨滑坡易发性评价,对于防灾减灾和城市建设而言至关重要。
  中国地质科学院地质力学研究所孙萍研究员团队,针对天水市的滑坡易发性进行了研究(图1),采用三种不同的非滑坡采样策略对比分析滑坡与非滑坡样本的空间分布特征,并进行了相关性分析。研究基于频率比耦合机器学习模型,从因子重要性、预测精度、易发性指数分布规律以及易发性制图特征四个方面,比较了不同采样策略下的不确定性,得到以下认识:
  (1)因子重要性分析:分层采样策略使因子均衡分布,未表现明显偏倚。相比之下,低易发区采样和随机采样的因子重要性趋势相似,但随机采样的变异性较大。频率比耦合逻辑回归模型具有较强的可解释性,而其他模型则表现出更强的稳健性与泛化能力(图2)。
  (2)易发区划分与预测精度:随机采样将大部分区域划分为高易发和极高易发区,从而提高了预测精度。而分层采样和低易发区采样则倾向于将研究区划分为极低、低和中等易发区域(图3)。
  (3)模型预测精度:低易发区采样策略的精度最高,约为0.89;工程岩组分层采样次之,约为0.86;随机采样的精度最低,约为0.75。低易发区和工程岩组分层采样策略的预测精度高出随机采样9%-14%。在相同的采样策略下,不同模型之间的预测精度差异仅为2%-3%,说明采样策略比模型选择更为关键,非滑坡样本的分布对预测精度影响较大(图4)。
  (4)预测结果分布与模型表现:随机采样策略的均值和标准差最高,预测结果最为分散;分层采样策略的均值适中,标准差较大,表现较为稳定;低易发区采样策略的均值最低,标准差最小,预测结果较为集中。频率比-逻辑回归和频率比耦合AdaBoost的均值较高,频率比耦合AdaBoost与随机森林模型的标准差较大,表现出较强的栅格区分能力(图5)。
   
  图1 天水地区不同模型和采样策略下滑坡易发性评价结果
   
  图2 因子重要性
   
  图3 天水地区滑坡易发性区划分类面积百分比
   
  图4 不同模型和采样策略下Roc曲线
   
  图5各模型及采样策略下滑坡易发性指数分布规律
  上述研究结果近期发表在国际知名期刊Bulletin of Engineering Geology and the Environment: Ke CY, Sun P*, Zhang S, Li R, Sang, KY. Influences of non-landslide sampling strategies on landslide susceptibility mapping: a case of Tianshui city, Northwest of China. Bull Eng Geol Environ84, 123 (2025).