广西及东盟区域可持续发展目标数据集 II 区论文(已发表) 版本 ZH2 Vol 9 (2) 2024
下载
2018–2020年广西甘蔗10 m分辨率种植分布数据集
A dataset of the sugarcane planting distribution with the spatial resolution of 10 m in Guangxi from 2018 to 2020
 >>
: 2023 - 02 - 08
: 2023 - 08 - 11
: 2023 - 04 - 20
: 2024 - 05 - 13
Baidu
map
4880 20 0
摘要&关键词
摘要:作物种植分布的提取是作物监测的基础,及时准确地提取出甘蔗种植分布对甘蔗监测及种植结构调整具有重要意义。本文基于Sentinel-1和Sentinel-2数据,采用主被动遥感协同方法和决策树分类方法,开展了广西甘蔗种植分布提取方法研究,并结合多年调查的地面样本数据进行验证,在此基础上提取了2018–2020年广西甘蔗种植分布。该方法利用遥感数据提取得到的2018年广西甘蔗种植分布总体精度达92%,Kappa系数为0.85;2019年广西甘蔗种植分布总体精度达94%,Kappa系数为0.88;2020年广西甘蔗种植分布总体精度达94%,Kappa系数为0.88。本数据集可作为广西甘蔗时空变化分析的基础数据,也可为广西甘蔗生产管理与种植结构优化调整等提供基础数据支撑。
关键词:甘蔗;Sentinel-2数据;主被动遥感协同;决策树分类;广西
Abstract & Keywords
Abstract: The extraction of sugarcane planting distribution is the basis of crop monitoring. The extraction of timely and accurate sugarcane planting distribution is of great significance for monitoring sugarcane crops and making adjustments to the planting structure. Based on Sentinel-1 and Sentinel-2 data, in this paper, we adopted the active and passive remote sensing collaborative method and decision tree classification method to carry out research on the extraction method of sugarcane planting distribution in Guangxi. Then we verified the data by referring to multi-year survey ground sample data. On this basis, we produced dataset of the sugarcane planting distribution with the spatial resolution of 10 m in Guangxi from 2018 to 2020. The remote sensing extraction-based method yielded an overall accuracy of 92% for sugarcane planting distribution in Guangxi in 2018, with a Kappa coefficient of 0.8. The overall accuracy of sugarcane planting distribution in Guangxi in 2019 is 94%, with a Kappa coefficient 0.88; the overall accuracy of sugarcane planting distribution in Guangxi in 2020 is 94%, with a Kappa coefficient of 0.88. This dataset can be used as the basic data for the analysis of temporal and spatial changes of sugarcane in Guangxi. And it can also provide basic data support for the optimization and adjustment of sugarcane production management and planting structure in Guangxi.
Keywords: sugarcane; Sentinel-2; active and passive remote sensing collaboration; decision tree classification; Guangxi
数据库(集)基本信息简介
数据库(集)名称2018–2020年广西甘蔗10m分辨率种植分布数据集
数据作者陈森政,叶回春,聂超甲,雒培磊
数据通信作者雒培磊(luopl@aircas.ac.cn)
数据时间范围2018–2020年
地理区域广西(104°26'E–112°04' E, 20°54'N–26°20' N)
空间分辨率10 m
数据量4.81GB
数据格式Geo TIFF
数据服务系统网址https://doi.org/10.57760/sciencedb.07284
基金项目广西创新驱动发展专项资金项目(桂科AA20302022);中国科学院青年创新促进会项目(2021119);中国科学院空天信息创新研究院“未来之星”项目(2020KTYWLZX08)。
数据库(集)组成数据集时间范围是2018、2019和2020年,分别对应3个同名文件夹,每个文件夹单独存储对应的Geo TIFF和shp数据文件,共27个文件。
Dataset Profile
TitleA dataset of the sugarcane planting distribution with the spatial resolution of 10 m in Guangxi from 2018 to 2020
Data corresponding authorLUO Peilei (luopl@aircas.ac.cn)
Data authorsCHEN Senzheng, YE Huichun, NIE Chaojia, LUO Peilei
Time range2018–2020
Geographical scopeGuangxi Province, China (104°26'E-112°04' E, 20°54'N-26°20' N)
Spatial resolution10 m
Data volume4.81GB
Data formatGeo TIFF
Data service system<https://doi.org/10.57760/sciencedb.07284>
Sources of fundingInnovation Drive Development Special Project of Guangxi (Guike AA20302022),Youth Innovation Promotion Association CAS (2021119),Future Star Talent Program of Aerospace Information Research Institute, Chinese Academy of Sciences (2020KTYWLZX08).
Dataset compositionThe time range of the dataset is 2018, 2019 and 2020, corresponding to 3 folders of the same name. Each folder stores the corresponding Geo TIFF and shapefile data files separately, totaling 27 files.
Baidu
引 言
甘蔗是热带和亚热带作物,是多年生高大实心草木,是制作蔗糖的原料。而蔗糖是关系国计民生的重要战略物资,约占全球食糖总产量的70%,中国90%以上的糖产量来自甘蔗[1-2]。作为全国主要的甘蔗产区,广西多年来在甘蔗种植领域展现出卓越表现,其种植面积和产量均超过全国的60%,这一产业不仅为广西地区带来了稳定的支柱产业,同时也使超过两千万蔗农受益,成为他们脱贫致富的重要途径。
随着遥感技术与计算机技术的发展,遥感技术结合计算机技术已成为农作物种植结构信息提取的主要手段,精准获取甘蔗的种植信息可以实现甘蔗的精确管理,进而实现精准糖业。国内外学者对甘蔗的种植分布提取已开展了较多的研究,国外研究较多的主要国家是巴西和印度[3-6]。国内相关研究则起步较晚,目前数量还较少[7-13]。目前对甘蔗识别的研究中,研究区域多为甘蔗连片种植区域,且使用的数据主要为HJ[10]、MODIS[3,7,11]和Landsat系列[4,13]等卫星数据,缺少针对种植结构分散、地块破碎的甘蔗种植区域的高分辨率数据产品。
广西地处我国南疆,是亚热带季风气候区,多云多雨天气导致大区域的光学遥感数据质量不高,而雷达遥感影像数据获取不受云雨天气的影响,可以全天候获取,能够在一定程度上克服光学数据获取困难的问题。本研究基于哨兵1(Sentinel-1)和哨兵2(Sentinel-2)数据,采用主被动遥感协同的方法和决策树分类方法,并结合野外调查数据,提取2018–2020年广西10 m分辨率甘蔗种植分布数据集。Sentinel-1和Sentinel-2是欧洲空间局(European Space Agency, ESA)研制的两颗遥感卫星,采用C波段合成孔径雷达(SAR)和多光谱成像仪(MSI)等高分辨率传感器,提供全天候、高空间分辨率的地表观测数据。本数据集可用于合理调整广西的种植制度和甘蔗产量预测,为甘蔗的可持续生产和国家粮食安全提供数据支撑。
1   数据采集和处理方法
1.1   数据采集
本研究使用的Sentinel-1合成孔径雷达数据[14-15],空间分辨率为10米,时间范围为全年;使用的Sentinel-2多光谱遥感影像数据[16-17],空间分辨率为10米,时间范围为10–11月。
研究所需样本点数据主要通过多次野外调查实验,结合Google Earth高分辨率影像和Google Earth Engine平台获取得到。通过实地调查,利用GPS精确定位和拍照的方式,结合多时相Google Earth高分辨率影像以及Google Earth Engine平台提供的高分辨率影像,创建解译标志样本库。然后根据解译标志样本库勾画样本,最终得到290个多边形地物分类样本地块(如图1所示),其中有甘蔗50个、水稻40个、香蕉40个、柑橘40个、火龙果30个、林地30个、水体30个、建筑30个。这些样本数据将用于甘蔗种植分布提取与精度验证。


图1   广西各类地物样本地块分布图
Figure 1 Distribution of sample plots of various ground objects in Guangxi
1.2   数据处理
首先对数据进行预处理来提高影像质量,对Sentinel-2影像数据进行去云和大气校正等处理,对Sentinel-1雷达数据进行边界噪声的去除和辐射校正等处理,然后进行特征提取与分析。在光学特征方面,我们选择了原始光波段以及与植被相关的5个指数,包括NDVI、RVI、EVI、SAVI和MSAVI;而在雷达特征方面,我们选择了VV、VH波段的后向散射系数。特征分析是首先对选取的各个特征的时序曲线进行重构,然后对重构的时序曲线进行分析。特征的时序曲线的重构是利用插值法补全数据后通过SG滤波进行数据平滑,通过时序曲线的重构建立8种地物整年的VV、VH时序曲线和10到11月份的NDVI、RVI、EVI、SAVI、MSAVI时序曲线,对8种地物的VH、VV波段的后向散射系数和有关植被指数的时序特征进行分析,得到地物的生长趋势、季节变化和周期性变化等。经过时序特征分析后以信息增益最大为目标制定分类规则,基于Google Earth Engine平台利用制定好的分类规则建立决策树分类器,进而实现广西全区地物的分类。提取甘蔗的决策树如图2所示。最后将分类结果通过ArcGIS中的按属性提取功能将甘蔗提取出来,即得到甘蔗种植分布结果。


图2   广西甘蔗决策树分类
Figure 2 The decision tree classification rules for sugarcane in Guangxi
2   数据样本描述
本数据集包括了基于Sentinel-1和Sentinel-2影像提取的2018–2020年广西甘蔗种植分布影像,这些影像的空间分辨率为10 m,采用WGS84坐标系,总共占用存储空间为4.81 GB。本数据集包括2018–2020年的广西甘蔗种植分布栅格数据和2018–2020年的广西甘蔗种植分布矢量数据,3个年份分别对应3个文件夹,每个年份数据包含影像文件和矢量文件,其中影像文件分别命名为2018sugarcane.tif、2019sugarcane.tif和2020sugarcane.tif,矢量文件分别命名为2018sugarcane.shp、2019sugarcane.shp和2020sugarcane.shp。
广西各地区甘蔗种植分布数据样本展示如图3所示。

(a)


(b)


(c)

图3   2018年(a)、2019年(b)和2020年(c)广西甘蔗种植空间分布图
Figure 3 Spatial distribution of sugarcane planting in Guangxi in 2018 (a), 2019 (b), and 2020 (c)
3   数据质量控制和评估
本研究根据野外调查结果和遥感影像目视解译结果,利用Google Earth的高分辨率影像进行验证样本的勾画,以确保分类结果的准确性。最后,我们建立混淆矩阵来评估分类结果,基于混淆矩阵可以计算出分类的精度和Kappa系数,用于评估分类结果的准确性和一致性。用于评价分类结果的验证样本点数量为150个,其中2018、2019和2020年分别50个,每年的样本包含25个甘蔗样本点和25个非甘蔗样本点。结合验证样本点与分类结果构建混淆矩阵然后计算得到验证精度与Kappa系数对提取结果进行精度验证,结果如表1所示,其中表中的OA代表的是总体分类精度,Kappa代表的是Kappa系数。可以看出2018年广西甘蔗种植分布提取总体精度达到了92%,Kappa系数为0.85;2019年广西甘蔗种植分布提取总体精度达到了94%,Kappa系数为0.88;2020年广西甘蔗种植分布提取总体精度达到了94%,Kappa系数为0.88。以上结果表明,分类结果在不同年份都表现出较高的准确性和一致性,进一步验证了我们所采用的分类方法在提取广西甘蔗种植分布方面的可靠性和准确性。
表1   2018–2020年广西甘蔗种植分布遥感提取精度评价表
年份混淆矩阵OA(%)Kappa
甘蔗非甘蔗
2018甘蔗232920.85
非甘蔗223
2019甘蔗223940.88
非甘蔗025
2020甘蔗232940.88
非甘蔗124
4   数据使用方法和建议
本数据集是基于Sentinel-1和Sentinel-2数据得到的广西2018–2020年甘蔗种植分布数据产品。数据可以在ArcGIS等相关软件中进行读取、编辑以及后续的一系列分析工作。本数据集可用于广西农业部门进行甘蔗有关的监测,也可作为科学研究的关键基础数据,服务于广西甘蔗种植及生产政策的制定,为甘蔗的生长监测及制定适应市场变化和兼顾企业效益的价格策略提供了数据支撑。
致 谢
感谢项目中其他成员在项目实施和野外调查中的配合和协作。
[1]
王明. 基于支持向量机的甘蔗田识别方法研究[D]. 广西师范大学, 2020. [WANG M. Research on sugarcane field recognition method based on Support Vector Machine[D]. Guangxi Normal University, 2020.]
[2]
邓诗琴. 基于NDVI时间序列的甘蔗种植面积提取与长势监测[D]. 桂林理工大学, 2022. [DENG S Q. Planting area extraction and growth monitoring of sugarcane based on NDVI time series[D]. Guilin University of Technology, 2022.]
[3]
XAVIER A C, RUDORFF B F T, SHIMABUKURO Y E, et al. Multi-temporal analysis of MODIS data to classify sugarcane crop[J]. International Journal of Remote Sensing, 2006, 27(4): 755–768. DOI: 10.1080/01431160500296735.
[4]
VIEIRA M A, FORMAGGIO A R, RENNó C D, et al. Object Based Image Analysis and Data Mining applied to a remotely sensed Landsat time-series to map sugarcane over large areas[J]. Remote Sensing of Environment, 2012, 123: 553–562. DOI: 10.1016/j.rse.2012.04.011.
[5]
VERMA A K, GARG P K, HARI PRASAD K S. Sugarcane crop identification from LISS IV data using ISODATA, MLC, and indices based decision tree approach[J]. Arabian Journal of Geosciences, 2017, 10(1): 16. DOI: 10.1007/s12517-016-2815-x.
[6]
BAGHDADI N, BOYER N, TODOROFF P, et al. Potential of SAR sensors TerraSAR-X, ASAR/ENVISAT and PALSAR/ALOS for monitoring sugarcane crops on Reunion Island[J]. Remote Sensing of Environment, 2009, 113(8): 1724–1738. DOI: 10.1016/j.rse.2009.04.005.
[7]
谭宗琨, 吴良林, 丁美花, 等. EOS/MODIS数据在广西甘蔗种植信息提取及面积估算的应用[J]. 气象, 2007, 33(11): 76–81. [TAN Z K, WU L L, DING M H, et al. Study on the extraction of sugar-cane planting areas from EOS/MODIS data[J]. Meteorological Monthly, 2007, 33(11): 76–81.]
[8]
黄文校, 苏宇, 潘桂颖, 等. 面向对象的甘蔗种植面积提取方法研究[C]//2012年中国农业资源与区划学会学术年会论文集. 长沙, 2012: 296–302. [HUANG W X, SU Y, PAN G Y, et al. Research on object-oriented extraction method of sugarcane planting area[C]// Proceedings of the 2012 Academic Annual Meeting of the Chinese Association of Agricultural Resources and Regionalization. Changsha, 2012: 296–302.]
[9]
黄干淇, 王国安, 黄子航, 等. 基于GF-1的上思县甘蔗种植面积估算与长势监测研究[J]. 气象研究与应用, 2018, 39(3): 53–56. DOI: 10.3969/j.issn.1673-8411.2018.03.013. [HUANG G Q, WANG G A, HUANG Z H, et al. The study of estimation and growth monitoring of sugarcane planting area in Shangsi County based on GF-1[J]. Journal of Meteorological Research and Application, 2018, 39(3): 53–56. DOI: 10.3969/j.issn.1673-8411.2018.03.013.]
[10]
张东东, 周振, 宋晓东. 基于HJ卫星的中国南方地区甘蔗面积提取研究[J]. 中国农学通报, 2019, 35(16): 141–147. DOI: 10.3969/j.issn.1002-6819.2015.05.023. [ZHANG D D, ZHOU Z, SONG X D. Study on sugarcane crop classification in Southern China based on HJ-1 CCD images[J]. Chinese Agricultural Science Bulletin, 2019, 35(16): 141–147. DOI: 10.3969/j.issn.1002-6819.2015.05.023.]
[11]
谢鑫昌, 杨云川, 田忆, 等. 基于遥感的广西甘蔗种植面积提取及长势监测[J]. 中国生态农业学报(中英文), 2021(2): 410–422. [XIE X C, YANG Y C, TIAN Y, et al. Sugarcane planting area and growth monitoring based on remote sensing in Guangxi[J]. Chinese Journal of Eco-Agriculture, 2021(2): 410–422.]
[12]
钱丽沙. 岭南地区甘蔗作物种植面积监测和台风灾害遥感评估方法[D]. 中国科学院大学(中国科学院广州地球化学研究所), 2022. [QIAN L S. Monitoring of sugarcane crop planting area and remote sensing assessment method of typhoon disaster in Lingnan area[D]. University of Chinese Academy of Sciences (Guangzhou Institute of Geochemistry, Chinese Academy of Sciences), 2022.]
[13]
康倩文, 徐伟恒, 王雷光, 等. 基于Landsat-8和Sentinel-2时间序列合成影像的山区甘蔗种植区提取[J]. 热带作物学报, 2023, 44(6): 1276–1287. [KANG Q W, XU W H, WANG L G, et al. Extraction of sugarcane plantation in mountainous areas based on landsat-8 and sentinel-2 time-series synthetic images[J]. Chinese Journal of Tropical Crops, 2023, 44(6): 1276–1287.]
[14]
European Space Agency. Sentinel-1 SAR User Guide[EB/OL]. 2018. [2018-08-01]. https://sentinel.esa.int/web/sentinel/user-guides/sentinel-1-sar.
[15]
European Space Agency. Sentinel-1 Scientific Data Hub.[EB/OL]. (2014-10-03) [2022-09-21]. https://scihub.copernicus.eu/dhus/#/home.
[16]
European Space Agency. Sentinel-2 Scientific Data Hub.[EB/OL]. (2015-06-23) [2022-09-21]. https://scihub.copernicus.eu/dhus/#/home.
[17]
European Space Agency. Sentinel-2 MSI User Guide[EB/OL]. Issue 3.1. [2021-01-22]. https://sentinel.esa.int/web/sentinel/user-guides/sentinel-2-msi.
数据引用格式
陈森政, 叶回春, 聂超甲, 等. 2018–2020年广西甘蔗10m分辨率种植分布数据集[DS/OL]. Science Data Bank, 2023. (2023-02-21). DOI: 10.57760/sciencedb.07284.
Baidu
稿件与作者信息
论文引用格式
陈森政, 叶回春, 聂超甲, 等. 2018–2020年广西甘蔗10m分辨率种植分布数据集[J/OL]. 中国科学数据, 2024, 9(2). (2024-05-13). DOI: 10.11922/11-6035.csd.2023.0057.zh.
陈森政
CHEN Senzheng
数据采集与处理,数据论文撰写。
(1998—),男,山西朔州人,硕士研究生,研究方向为图像处理技术。
叶回春
YE Huichun
数据集生产,数据论文修改。
(1985—),男,浙江杭州人,博士,副研究员,研究方向为植被定量遥感机理及应用研究。
聂超甲
NIE Chaojia
数据采集与处理,数据管理评估。
(1992—),男,河北沧州人,硕士研究生,研究方向为农业遥感应用。
雒培磊
LUO Peilei
数据采集与处理,数据质量控制。
luopl@aircas.ac.cn
(1990—),女,山东东营人,博士,研究方向为植被定量遥感及应用研究。
广西创新驱动发展专项资金项目(桂科AA20302022);中国科学院青年创新促进会项目(2021119);中国科学院空天信息创新研究院“未来之星”项目(2020KTYWLZX08)。
Innovation Drive Development Special Project of Guangxi (Guike AA20302022),Youth Innovation Promotion Association CAS (2021119),Future Star Talent Program of Aerospace Information Research Institute, Chinese Academy of Sciences (2020KTYWLZX08).
Baidu
出版历史
I区发布时间:2023年4月20日 ( 版本ZH1
II区出版时间:2024年5月13日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata
Baidu
map