夜间灯光数据与第二三产业GDP之间有密切的关系
[30-31]。在青藏高原的市区,二三产业增加值高,灯光表现明显;相较于市区,县域二三产业增加值低,灯光表现不明显。研究在第二三产业增加值(GDP of Secondary and Tertiary Industries, GDP
23)空间分布模拟时引入了夜间灯光、POI、建筑用地数据,将青藏高原GDP
23空间化分布范围与辅助指标分成两类,一类为市区范围,采用夜间灯光与POI,另一类为县域范围,采用建筑用地与POI。利用珞珈一号01星产品数据,辐射亮度转换公式如下:
\[L =DN^{3/2}×10^{-10}\]
(3)
式中L为绝对辐射校正后辐射亮度值,单位为W/(m2.sr.μm),DN为图像灰度值。
将兴趣点(POI)进行核密度分析(Kernel Density Estimation, KED),通过计算搜索半径内每个点的权重值,得出每个圆表面的权重之和,做出格网单元密度值,最后绘制向外辐射的圆面区域
[32]。青藏高原GDP
23与各种类型POI核密度值的相关性不同,统计该区域各省份每种类型POI核密度与GDP
23统计值之间的相关关系(图2),在23种POI核密度中,删除相关性低(低于0.8)的POI类别,将各省相关性大于等于0.8的POI核密度归一化后进行重要性计算(表2)。核密度、夜间灯光归一化公式如下:
\[I = {X_i-\mathrm{min}(X_i) \over \mathrm{max}(X_i)-\mathrm{min}(X_i)}\]
(4)
式中I表示各类指标归一化后的值,Xi 表示核密度、夜间灯光中每个栅格像素值,max(Xi )表示所有栅格中最大像素值,min(Xi )表示所有栅格中最小像素值。
表2
青藏高原各省份相关性大于等于0.8的POI类型 省份 | 相关性大于等于0.8的POI类型 |
---|
甘肃 | 餐饮服务、公共设施、公司企业、购物服务、交通设施服务、金融保险服务、科教文化服务、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲服务、通行设施、医疗保健服务、政府机构及社会团体、住宿服务、事件活动、室内设施(19类) |
青海 | 餐饮服务、风景名胜、公共设施、公司企业、购物服务、交通设施服务、金融保险服务、科教文化服务、摩托车服务、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲服务、通行设施、医疗保健服务、政府机构及社会团体、住宿服务、室内设施(20类) |
四川 | 餐饮服务、风景名胜、公共设施、公司企业、购物服务、交通设施服务、金融保险服务、科教文化服务、摩托车服务、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲服务、通行设施、医疗保健服务、政府机构及社会团体、住宿服务、道路附属设施、地名地址信息、室内设施(22类) |
新疆 | 餐饮服务、风景名胜、公共设施、公司企业、购物服务、交通设施服务、金融保险服务、科教文化服务、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲服务、通行设施、医疗保健服务、政府机构及社会团体、住宿服务、事件活动、室内设施(20类) |
云南 | 餐饮服务、风景名胜、公共设施、公司企业、购物服务、交通设施服务、金融保险服务、科教文化服务、摩托车服务、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲服务、通行设施、医疗保健服务、政府机构及社会团体、住宿服务、道路附属设施、地名地址信息、事件活动、室内设施(23类) |
西藏 | 餐饮服务、风景名胜、公共设施、公司企业、购物服务、交通设施服务、金融保险服务、科教文化服务、汽车服务、汽车维修、汽车销售、商务住宅、生活服务、体育休闲服务、通行设施、医疗保健服务、政府机构及社会团体、住宿服务(18类) |
计算指标重要性需要用到随机森林模型,随机森林是Breiman提出的集成式学习算法
[33],与传统的回归不同的是随机森林由多层决策树开发,结果由所有决策树预测结果的均值来决定
[34],可以利用连续与分类变量,对复杂的相互作用进行建模
[35],通过增加的均方根误差(%IncMSE)
[36]来衡量变量的重要性。在已选与GDP
23相关性高的POI核密度数据基础上,分市区与县域建立夜间灯光、各种类型POI核密度、建筑用地核密度图层。市区各指标(归一化后的夜间灯光与各类POI核密度)叠加得到市区综合指标,县域各指标(归一化后的各类POI核密度与建筑用地核密度)叠加得到县域综合指标,综合指标计算公式如下:
\[I_c =\sum_{j=1}^kI_j\]
(5)
式中Ic 为综合指标,市区范围为归一化后夜间灯光与各类POI核密度栅格叠加,县域范围为归一化后各类POI核密度与建筑用地核密度栅格叠加;Ij 为第j项指标归一化后的栅格值;k为指标个数。
通过随机森林模型,计算出市区综合指标与各类POI核密度、夜间灯光值的重要性关系,县域综合指标与各类POI核密度、建筑用地核密度的重要性关系。确定各指标重要性后,代入公式计算空间模拟后的空间权重分布(即综合权重值),最后得到GDP
23的空间模拟值,计算公式
[28]如下:
\[F_i = \sum_{j=1}^k\sum_{i=1}^nw_jp_{ij}\]
(6)
\[G_{23mn} = G_{23}×{F_i \over \sum_{i=1}^nF_i}\]
(7)
其中Fi 表示每个格网综合权重值;\({w}_{j}\)表示每项指标的重要性;\({p}_{ij}\)指第j项指标的第i个网格的像素值;k表示指标个数;n表示格网数量;\({G}_{23mn}\)为辅助数据空间展布后的格网第二三产业单元增加值;G23为第二三产业统计值。