Abstract: The Tibetan Plateau is known as the Asian Water Tower. The distribution of surface water and its changes are closely related to global change, biodiversity and water-related ecosystems. Based on the collection of high-precision land surface water samples, we used the random forest classification algorithm in machine learning to extract land surface water information from Landsat series satellite images and produced a dataset of land surface water with a spatial resolution of 30 meters on the Qinghai-Tibet Plateau based on satellite remote sensing images in 2022. According to data quality assessment, the overall accuracy of the dataset is 92.9%, and the Kappa coefficient is 0.84. This dataset can provide foundational data support for water resource monitoring, ecosystem services, and global change research on the Qinghai-Tibet Plateau.
Keywords: Landsat; surface water; Qinghai-Tibet Plateau; random forest
青藏高原是地球上海拔最高、气候最寒冷的地方。独有的地形地貌及气候条件使青藏高原拥有广大的湖泊、冰川、积雪和冻土
[1]。在高海拔地势作用下,汇聚于青藏高原的水孕育了长江、黄河、澜沧江、怒江、雅鲁藏布江、印度河、恒河等多条世界著名河流,“亚洲水塔”因此得名
[2]。青藏高原地区湖泊、河流的空间分布和变化信息是研究该地区生态与环境变化的重要基础,可为青藏高原可持续发展和环境保护协同,实现绿水青山和金山银山共赢发展提供科学依据。
随着遥感技术的发展,由基于卫星遥感数据提取的陆地表面湖泊、河流、以及人工水体的水面分布结果所形成的陆表水体产品逐渐成为研究和应用的重要数据来源之一。几种主要的全球陆表水体产品包括:GlobeLand30-WTR(Global Land Surface Water Dataset at 30m Resolution)
[3]是由国家基础地理信息中心研发的全球陆表水体产品,其空间分辨率为30米,时间范围是2000、2010和2020年。GLCF-GIW(Global Land Cover Facility, GLCF; Global Inland Surface Water, GIW)
[4]是由马里兰大学地理科学系开发的全球内陆水体数据集,覆盖了全球范围的内陆水体,数据集的空间分辨率为30米,时间为2000年。JRC-GSW(European Commission’s Joint Research Centre, JRC; Global Surface Water, GSW)
[5]是欧盟委员会联合研究中心基于Landsat数据利用专家系统生产的全球陆表水体分布产品,产品的时间范围覆盖1984–2021年,空间分辨率为30米。G3WBM(Global 3 arc second Water Body Mask)
[6]是由日本国立海洋研究开发机构(Japan Agency for Marine-Earth Science and Technology, JAMSTEC)基于4期(1990,2000,2005和2010年)Landsat GLS(Global Land Survey)全球数据,应用徐涵秋提出的改进的归一化差值水体指数(Modified Normalized Difference Water Index, MNDWI)
[7]制作的全球水体数据集,其特点是以3弧秒的空间分辨率(约90米)展现水体出现的频次,将永久性水体和暂时性水覆盖区域分开。此外,利用遥感卫星数据提取的面向青藏高原地区的陆表水体产品主要包括:张国庆等人利用长时间序列Landsat遥感数据制作的青藏高原大于1平方公里湖泊数据集(v3.1)(1970s–2022)
[8-10],数据集共包含16期湖泊观测数据。宋开山等人基于Landsat遥感数据,采用波段比值与阈值分割方法制作的青藏高原湖泊动态数据集(V1.0)(1984–2016)
[11-12],数据集的时间分辨率为5年一期,空间分辨率为30米。计璐艳以1982–2020年AVHRR(Advanced Very High Resolution Radiometer)逐日反射率时间序列为基础制作的青藏高原0.05°逐日水体制图数据集(1982–2020)
[13]。
陆表水体分布及其变化与全球变化和生物多样性密切相关,量化陆表水体范围对与水有关的生态系统研究至关重要
[14],但目前仍缺乏青藏高原地区2022年度30米分辨率陆表水体数据。基于此,本文依托Google Earth Engine (GEE, https://earthengine.google.com/) 平台,利用2022年1月至2022年11月所获取的7245景Landsat 8和Landsat 9卫星遥感数据,采用随机森林分类算法实现对陆表水体信息的有效提取,形成2022年青藏高原30米分辨率陆表水体数据集。
刘慧婵, 何国金, 彭燕, 等. 2022年青藏高原30米分辨率陆表水体数据集[DS/OL]. Science Data Bank, 2023. (2023-02-01). DOI: 10.57760/sciencedb.06937.