论文部分内容阅读
国民生产总值(Gross Domestic Product,GDP)是衡量一个国家或地区经济发展的综合性指标,能够有效地反映不同地区的经济发展情况和规律。然而传统的GDP通常是以行政区划为单元,利用抽样调查和经济普查的方式获取所得,存在时效性差、直观性差等局限。夜间灯光数据的发布为GDP的建模与模拟提供了有效数据源,但灯光数据主要反映的是社会夜间活动,难以捕捉白天的经济活动信息。互联网的普及和智能移动设备的广泛使用产生了大量基于位置服务的社交媒体数据(Location Based Social Media data,LBSM)。LBSM数据与人类活动密切相关,能同时反映社会白天和夜晚的经济活动情况,但该数据类型在我国不同空间尺度下的经济建模能力如何还不确定。因此,本研究首先利用线性回归模型(Ordinary Least Squares,OLS)和地理加权回归模型(Geography Weighted Regression model,GWR)分别对比了社交媒体数据中的腾讯用户密度数据(Tencent user density data,TUD)和NPP/VIIRS夜间灯光数据在我国省、市、县空间尺度的GDP建模能力,以探索TUD数据在中国经济建模上的应用潜力。其次,社会的进步促进了中国经济的快速发展,但同时也导致了中国内部不同地区的经济发展失衡。然而,目前针对我国全国县域经济发展影响因素探索的研究较少,且使用传统的回归模型容易忽略变量的空间尺度效应。因此,本研究基于土地利用、DEM、降雨量等遥感数据以及感兴趣点(Point of Interest,POI)、TUD、交通道路等社会感知数据,采用OLS、GWR和多尺度地理加权回归模型(Multiple Geography Weighted Regression model,MGWR)分别对中国县级GDP进行建模,探讨MGWR模型能否更好地理解中国县域经济发展影响因素的空间异质性,并利用聚类分析的方法结合MGWR模型的自变量空间回归系数实现中国七大经济区的划分。最后,目前已有的中国GDP格网化研究主要采用全局统一的模拟模型,忽略了经济发展影响规律的空间异质性。因此,本研究利用随机森林模型结合遥感和社会感知数据,在七大经济分区的基础上开展顾及分区和未顾及分区的格网尺度GDP模拟,探讨分区局部建模方法在全国格网尺度GDP模拟中的有效性。本研究的主要发现如下:(1)TUD数据和NPP/VIIRS数据在不同空间尺度上的GDP建模能力存在明显差异性,NPP/VIIRS数据在省和市级空间尺度下的GDP建模能力更强,而TUD数据则在县级尺度下有更突出的GDP建模能力。尤其在气候多变、地形复杂的经济欠发达地区和存在居民职住分离现象的经济较发达地区,TUD数据在县域尺度GDP建模能力方面比NPP/VIIRS数据具有显著的优势。(2)基于MGWR模型的县域GDP影响因素建模效果优于传统的OLS模型和GWR模型,说明不同的因素对中国县域经济的发展影响存在空间异质性和空间尺度效应。通过分析MGWR模型结果发现,各因素对我国不同区域经济的影响差异性较大。研究结果进一步揭示了我国的长三角、珠三角和京津冀地区呈现出不一样的经济发展特点,如道路密度对珠三角和长三角经济具有积极影响,但对京津冀地区呈消极影响;房地产业对京津冀和珠三角的经济具有促进作用,但对长三角地区的经济却存在负向作用;建设用地面积的大小对长三角地区的经济具有积极影响,但对珠三角和京津冀地区的经济存在消极影响等。为了更有效地实现经济可持续发展,中国政府未来应该考虑多维的发展目标,包括自然生态、基础设施建设、企业布局、人口引进和土地利用等,依据区域经济发展特点,制定因地制宜的经济发展规划。(3)随机森林模型在格网尺度GDP模拟方面要优于普通的多元线性回归模型,基于随机森林模型模拟所得的GDP格网数据不仅能够较准确的在大空间尺度上反映中国经济发展现状,还能精细地捕捉小空间尺度如县区内部的经济差异。同时,研究发现顾及经济分区进行局部非线性建模和模拟的方法能够有效地提高GDP格网化精度。