其他数据论文 I 区论文(评审中) 版本 ZH2
下载
2020年武汉野战**园多源典型地物分类数据集
A multi-source typical land cover classification dataset of the National Defense Field Park in Wuhan (2020)
 >>
: 2024 - 03 - 21
: 2024 - 05 - 31
: 2024 - 05 - 31
Baidu
map
933 0 0
摘要&关键词
摘要:遥感地物分类是地表信息获取的重要途径,对精准掌握地表特性及其变化至关重要。鉴于现有地物分类数据集存在数据源单一、光谱信息不足等问题,本研究构建了一个具有丰富光谱信息、高空间分辨率的多源遥感地物分类数据集。本数据集采用无人机搭载多光谱相机和双光热红外相机对武汉**野战园区进行数据采集,并通过ArcGIS和Labelme软件进行数据处理和标注。本数据集包括可见光、热红外和5个单波段的多光谱数据,覆盖水体、植被、裸露土地、房屋、砖石路面和沥青路面等6类典型地物类型标签,包含共612张影像瓦片和对应标签样本对。本数据集为多源数据融合与分析、遥感地物提取和识别等研究领域提供了数据支持。
关键词:多源数据;地物分类;多光谱
Abstract & Keywords
Abstract: Land cover classification of remote sensing imagery is a crucial tool for obtaining surface information. It is essential for accurately understanding the characteristics and changes of the Earth's surface. Given the limitations of existing land cover classification datasets, such as single data sources and insufficient spectral information, this study constructs a multi-source remote sensing land cover classification dataset with rich spectral information and high spatial resolution. The dataset was collected using unmanned aerial vehicles (UAVs) equipped with a multispectral camera and a dual-light thermal infrared camera over the National Defense Park in Wuhan. Data processing and annotation were conducted using ArcGIS and Labelme software. This dataset includes visible light, thermal infrared, and multispectral images with five single bands, covering six typical land cover types: water bodies, vegetation, bare land, buildings, brick roads, and asphalt roads. In total, it contains a total of 612 image tiles and corresponding labels. This dataset provides data support for research fields such as multi-source data fusion and analysis, remote sensing land cover extraction, and recognition.
Keywords: multi-source data; land cover classification; multispectral images
数据库(集)基本信息简介
数据库(集)名称2020年武汉野战**园多源典型地物分类数据集
数据通信作者胡庆武(huqw@whu.edu.cn)
数据作者郑道远、兰逸舟、陈中桥、艾明耀、赵鹏程、胡庆武
数据时间范围2020
地理区域地理范围为114.01°E,30.45°N附近,地理区域范围为中国湖北省武汉市**野战园及其周边地区
空间分辨率可见光:0.0700 m,热红外:0.2684 m,多光谱:0.1540 m
数据量334 MB
数据格式*.tif
数据服务系统网址https://doi.org/10.57760/sciencedb.16649
基金项目国家重点研发计划(2021YFB2600401)
数据库(集)组成数据集共包括3个数据文件夹,分别对应可见光,热红外,多光谱3种数据源。每个文件夹包含裁剪前影像和标签,以及裁剪后影像瓦片和对应的标签。其中,(1) rgb.zip 是可见光数据,数据量70.4 MB;(2) infrared.zip 是热红外数据,数据量68.5 MB;(2) spectral.zip 是多光谱数据,数据量195.1 MB。
Dataset Profile
TitleA multi-source typical land cover classification dataset of the National Defense Park in Wuhan (2020)
Data corresponding authorHu Qingwu (huqw@whu.edu.cn)
Data authorsZHENG Daoyuan, LAN Yizhou, CHEN Zhongqiao, AI Mingyao, ZHAO Pengcheng, HU Qingwu
Time range2020
Geographical scopeGeographical scope: around 114.01°E, 30.45°N; specific areas include: the National Defense Park and its surrounding areas in Wuhan, Hubei Province, China
Spatial resolutionvisible light: 0.0700 m; thermal infrared: 0.2684m; multispectral:0.1540m
Data volume334 MB
Data format*.tif
Data service system<https://doi.org/10.57760/sciencedb.16649>
Source of fundingNational Key R&D Program of China (2021YFB2600401)
Dataset compositionThe dataset consists of 3 subsets in total, corresponding to three data sources: visible light, thermal infrared, and multispectral. Each subset contains images and labels before cropping, as well as cropped image tiles and their corresponding labels. The subsets are recorded as rgb.zip, infrared.zip and spectral.zip: RGB.zip is made up of visible light data, with a data volume of 70.4 MB; infrared.zip is made up of thermal infrared data, with a data volume of 68.5 MB; spectral.zip is made up of multispectral data, with a data volume of 195.1 MB.
Baidu
引 言
遥感技术作为一种获取地表信息的重要手段,已广泛应用于环境监测、资源管理和城市规划等领域[1]。随着遥感技术的快速发展,遥感地物分类作为提取地表信息的关键步骤,对于准确理解和分析地表特征及其变化趋势具有重要意义[2]。近年来,深度学习方法在遥感领域取得了显著成就,与传统地物提取方法相比,基于深度学习的地物分类方法展现出了卓越的性能和精度,成为研究领域的焦点[3]
基于深度学习的地物分类方法通常需要大量的遥感数据样本进行训练,以实现对地物的精确识别和分类。目前,已有多个遥感影像数据集被广泛应用于地物分类任务,如WHU-RS[4]、AID[5]、NWPU-RESISC[6]等,这些数据集的发布促进了地物分类技术的进步和创新性研究。然而,这些数据集主要以可见光或单一源数据为训练样本,通常来源于高空间分辨率的卫星或无人机影像,且多聚焦于影像的空间分辨率和地物覆盖类别[7]。因此,这些数据集存在一些局限性,如尺度单一、数据种类不足、光谱信息缺乏等。另一方面,随着遥感应用研究的深入,单一数据源的遥感影像往往无法完全满足实际应用需求[8],因其分辨率、波段设置、信息丰富度和可靠性等方面的限制。目前,适用于多源地物分类的数据集较为稀缺,这在一定程度上制约了地物分类技术的深入探索和应用拓展。
针对现有遥感数据集中数据源单一、光谱信息不足等问题,本文构建了一个具有丰富光谱信息、高空间分辨率特征的多源遥感地物分类数据集。本数据集旨在弥补单一数据源分类数据集在光谱信息和应用范围上的不足,进而丰富遥感地物分类的数据源,以期推动多源遥感地物分类领域的研究进展。
1   数据采集和处理方法
1.1   数据采集
本数据集选取自中国湖北省武汉市**野战园区及周边研究区域,采用无人机搭载多光谱相机和双光热成像相机进行拍摄,时间为2020年10月13日。数据采集过程中,使用了控制点测量实验和航空摄影测量实验。
航空摄影测量实验的无人机平台包括大疆精灵4多光谱版和大疆经纬M300 RTK。搭载传感器有多光谱相机和双光热红外相机。多光谱和可见光数据的采集通过大疆精灵4多光谱版上搭载的一体式多光谱成像系统完成。而热红外数据通过将双光热红外相机挂载到大疆经纬M300 RTK无人机上进行采集。
控制点测量实验采用中海达小蝶RTK-V200设备。由于测区具有大量的明显地面点,如道路标线、矩形花坛和矩形地砖等,因此不需要额外放置地面标志。我们在测区中心位置选取25个分布均匀的明显地物点作为像控点,并采集了这些点的数据。图1展示了像控点的位置分布。


图1   像控点布设示意图
1.2   数据处理方法
1.2.1   数据预处理
为了纠正影像的畸变,确保影像精度和三维空间信息,我们根据图2所示流程图进行数据预处理,首先进行了影像配准与对齐,以确保不同影像的几何一致性;接着进行空中三角测量,生成密集点云、数字高程模型(DEM)和正射影像(DOM);最后,在分别制作可见光数据、热红外数据以及多光谱数据的正射影像图后,将其导入ArcGIS Desktop软件进行掩膜提取和统一裁剪,以获得最终的处理结果。图3展示了数据预处理结果图。


图2   无人机影像数据预处理流程示意图


图3   数据预处理结果图
1.2.2   数据集构建
为确保数据集中典型地物的类型和准确性,我们对预处理后的研究区影像实施了细致的实地调绘作业,使用Labelme软件对砖石路面、沥青路面、水体、草地、建筑和裸露土地这6类典型地物进行了语义分割标注,如图4所示。由于在数据预处理中我们已经将测区不同数据源的影像进行了配准和对齐操作,由于在数据预处理阶段已完成不同数据源影像的配准和对齐,因此在手动勾绘标签时仅针对空间分辨率最高的可见光影像进行标注。


图4   典型地物的语义分割标注图
2   数据样本描述
本数据集共包含三种多源数据,分别是可见光、热红外和多光谱,其中多光谱数据由5个单波段影像组成。可见光影像的尺寸为8812×6201像素,单波段影像的尺寸为2642×1859像素,热红外影像的尺寸为1942×1367像素。因此,数据集包含各个波段尺寸影像图像7张以及涵盖水体、植被、裸露土地、房屋、砖石路面和沥青路面共计6类典型地物类型的语义分割标注图3张。同时为满足深度学习模型数据输入要求,本数据还提供了数据裁剪后的影像瓦片和标签,需要多源数据统一重采样到8812×6201后对齐再进行裁剪,生成各波段的裁剪影像和标签组成的样本对,裁剪影像以及一张对应的标签组成一个样本对,分开存储在各自的文件夹中,3种数据源文件夹中国的Image_Crop文件里相同文件名代表已配准的同一区域的多源数据,数据集的文件组织形式如表1所示。
表1   数据集文件组织形式
文件夹文件内容说明
rgb.zipImage_Crop裁剪后影像,图像大小512×512×3,数量204
Label_Crop裁剪后标签,图像大小512×512×1,数量204
TrueColor.tif裁剪前影像,图像大小8812×6201×3,数量1
TrueColorLabel.tif裁剪前标签,图像大小8812×6201×1,数量1
infrared.zipImage_Crop裁剪后影像,图像大小512×512×3,数量204
Label_Crop裁剪后标签,图像大小512×512×1,数量204
Infrared.tif裁剪前影像,图像大小1942×1367×3,数量1
InfraredLabel.tif裁剪前标签,图像大小1942×1367×1,数量1
spectral.zipImage_Crop裁剪后影像,图像大小512×512×5,数量204
Label_Crop裁剪后标签,图像大小512×512×1,数量204
Band*.tif裁剪前影像,图像大小2642×1859×1,数量1
BandLabel.tif裁剪前标签,图像大小2642×1851×1,数量1
每种数据源包含裁剪后的样本对共204,总样本对为612,每张可见光、热红外和多光谱影像瓦片大小分别为512×512×3、512×512×3和512×512×5。总数据量为334 MB。图5展示了部分数据的样本对。


图5   数据集组成示意图
3   数据质量控制和评估
本数据集制作过程中通过对齐优化完成空三加密,生成密集点云和数字高程模型DEM,确保了数据的精度和可靠性,并通过正射影像图DOM的获取对结果进行了验证。图6展示了密集点云、DEM和DOM结果。






图6   密集点云(上)、DEM(中)和DOM(下)
本数据集提供了典型地物分类数据源和标签,在遥感地物分类任务中,常使用语义分割模型评估对影像地物分类的精度,因此我们能使用语义分割的精度评定指标来验证数据集在深度学习典型地物提取中的适用性和有效性。具体而言,我们使用交并比(IoU)作为精度指标来进行后续实验和分析。IoU指标的计算方式如公式1所示:
\[IoU=\frac{TP}{TP+FP+FN}                                                               \left(1\right)\]
其中TP,FPFN分别代表了真阳性,假阳性和假阴性。本文采用语义分割模型U-Net[9],采用随机划分策略生成训练集和验证集,用以进行模型训练和精度验证,结果如表2所示:
表2   U-Net模型在每种数据源上的IoU精度
数据源沥青道路砖石道路水体建筑植被mIoU
可见光82.369.984.643.079.471.84
热红外37.058.983.834.750.352.94
多光谱63.166.596.335.477.067.66
结果表明,本数据集在深度学习模型中有良好的表现,说明本数据集的整体质量良好。
4   数据价值
目前已有的多源遥感数据集多采用卫星影像,空间分辨率不够高,提供的地物光谱和其他信息十分有限。本数据集提供的影像既具有7厘米的高空间分辨率特征又包含可见光、多光谱和热红外丰富的波谱信息,能更加全面地描述地物特性。因此本数据集能够用于当前多源遥感影像地物分类领域的研究,为遥感地物提取和识别等领域的研究提供数据资源支撑,具有较强的实际应用价值。
5   数据使用方法和建议
本数据集适用于基于语义分割算法的遥感地物分类任务,提供了6类典型地物的分割标签,满足语义分割模型训练的需求。考虑到不同分割模型的结构和效率有所差异,用户可以根据实际需求对各波段影像进行重新裁剪和数据集划分,以优化地物分类提取的性能。此外,本数据集提供的多源数据支持不同的输入组合,有助于分析不同源影像对地物分类提取性能的影响,并比较不同地物提取模型在不同波段组合下的表现。
致 谢
本数据集采集区域得到武汉市**野战院的许可和支持,同时特别感谢陈中桥同学对数据采集和处理所做的工作,同时对参与数据集构建和验证的老师和学生表示感谢。
[1]
董秀军, 邓博, 袁飞云, 等. 航空遥感在地质灾害领域的应用:现状与展望[J]. 武汉大学学报(信息科学版), 2023, 48(12): 1897–1913. DOI: 10.13203/j.whugis20220151. [DONG X J, DENG B, YUAN F Y, et al. Application of aerial remote sensing in geological hazards: current situation and prospects[J]. Geomatics and Information Science of Wuhan University, 2023, 48(12): 1897–1913. DOI: 10.13203/j.whugis20220151.]
[2]
杨军, 于茜子. 结合空洞卷积的FuseNet变体网络高分辨率遥感影像语义分割[J]. 武汉大学学报(信息科学版), 2022, 47(7): 1071–1080. DOI: 10.13203/j.whugis20200305. [YANG J, YU X Z. Semantic segmentation of high-resolution remote sensing images based on improved FuseNet combined with atrous convolution[J]. Geomatics and Information Science of Wuhan University, 2022, 47(7): 1071–1080. DOI: 10.13203/j.whugis20200305.]
[3]
VALI A, COMAI S, MATTEUCCI M. Deep learning for land use and land cover classification based on hyperspectral and multispectral earth observation data: a review[J]. Remote Sensing, 2020, 12(15): 2495. DOI: 10.3390/rs12152495.
[4]
DAI D X, YANG W. Satellite image classification via two-layer sparse coding with biased image representation[J]. IEEE Geoscience and Remote Sensing Letters, 2011, 8(1): 173–176. DOI: 10.1109/LGRS.2010.2055033.
[5]
XIA G S, HU J W, HU F, et al. AID: a benchmark data set for performance evaluation of aerial scene classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(7): 3965–3981. DOI: 10.1109/TGRS.2017.2685945.
[6]
CHENG G, HAN J W, LU X Q. Remote sensing image scene classification: benchmark and state of the art[J]. Proceedings of the IEEE, 2017, 105(10): 1865–1883. DOI: 10.1109/JPROC.2017.2675998.
[7]
PAPOUTSIS I, BOUNTOS N I, ZAVRAS A, et al. Benchmarking and scaling of deep learning models for land cover image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2023, 195: 250–268. DOI: 10.1016/j.isprsjprs.2022.11.012.
[8]
ALHASSAN V, HENRY C, RAMANNA S, et al. A deep learning framework for land-use/land-cover mapping and analysis using multispectral satellite imagery[J]. Neural Computing and Applications, 2020, 32(12): 8529–8544. DOI: 10.1007/s00521-019-04349-9.
[9]
RONNEBERGER O, FISCHER P, BROX T. U-net: convolutional networks for biomedical image segmentation[M]. NAVAB N, HORNEGGER J, WELLS W M, et al, eds. Lecture Notes in Computer Science. Cham: Springer International Publishing, 2015: 234–241. DOI: 10.1007/978-3-319-24574-4_28.
数据引用格式
郑道远, 兰逸舟, 陈中桥, 等. 2020年武汉野战**园多源典型地物分类数据集[DS/OL]. V1. Science Data Bank, 2024. (2024-05-31). DOI:10.57760/sciencedb.16649.
Baidu
稿件与作者信息
论文引用格式
郑道远, 兰逸舟, 陈中桥, 等. 2020年武汉野战**园多源典型地物分类数据集[J/OL]. 中国科学数据, 2024. (2024-05-31). DOI:10.11922/11-6035.csd.2024.0124.zh.
郑道远
ZHENG Daoyuan
主要承担工作:论文撰写和修改。
(1999—),男,湖北省荆州市人,博士研究生在读,研究方向为遥感智能解译、地物分类。
兰逸舟
LAN Yizhou
主要承担工作:数据处理、数据整理、论文撰写。
(2000—),男,广东省深圳市人,硕士研究生在读,研究方向为遥感地物信息提取、深度学习。
陈中桥
CHEN Zhongqiao
主要承担工作:数据采集、数据预处理。
(1997—),男,湖北省襄阳市人,硕士,研究方向为GIS开发、遥感监测与应用。
张寅
ZHANG Yin
主要承担工作:数据采集。
(1998—),男,天津市人,博士研究生在读,研究方向为植被遥感、夜光遥感。
艾明耀
AI Mingyao
主要承担工作:数据采集方案制定与修改。
(1989—),男,湖北省天门市人,博士,地面激光扫描数据三维重建、影像空三处理、GIS应用开发。
赵鹏程
ZHAO Pengcheng
主要承担工作:数据采集方案制定与修改。
(1993—),男,宁夏回族自治区固原人,博士,实验师,研究方向为点云数据智能化处理。
胡庆武
HU Qingwu
主要承担工作:数据采集方案修改、论文修改。
huqw@whu.edu.cn
(1975—),男,湖北省孝感市人,博士,教授,研究方向为激光点云智能处理、激光视觉融合导航与3D制图、遥感考古与数字文化遗产。
国家重点研发计划(2021YFB2600401)
National Key R&D Program of China (2021YFB2600401)
Baidu
出版历史
I区发布时间:2024年5月31日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata
Baidu
map