所属栏目:统计论文范文发布时间:2011-03-14浏览量:76
摘要:空间关联规则知识的发现是空间数据挖掘一个重要的方面,而把空间统计分析技术应用于空间数据库中的空间关联规则挖掘,是一种不同于传统方法的可用技术。该方法首先建立空间对象之间的空间权重矩阵,然后采用Moran‘sI统计量等来发现全局空间相关关系,利用G统计量等来发现局部空间相关关系,并通过实例分析证明了该方法的有效性。
说明:数据来自湖南统计信息网[13]。
根据湖南省各市州的拓扑空间相邻关系建立各市州边界多边形的拓扑关系,我们利用相邻关系图来直观的表达(如图2-1),图上各节点中的数字代表各市州相应的编号,节点间有边相连,说明两市州在空间上具有相邻关系。根据此相邻关系图,建立各市州的空间权重矩阵如表2-2所示。
图2-1湖南省各市州空间拓扑关系的相邻关系图(节点上的数字代表各市州编号)
表2-2各市州基于邻接标准的空间权重矩阵
利用湖南省各市州2004年到2006年连续3年的平均GDP增长率(见表2-1)这个指标来进行分析。根据空间权重矩阵,计算所得的各市州全局Moran‘sI和局部G统计值分别见表2-3和表2-4。
表2-3全局空间自相关Moran’sI及其Z(I)值
由表2-4可以得到,由于Moran‘sI为正值,说明各市州的GDP增长率在空间上存在明显的相关性,不是随机分布的,而是存在必然的内在联系,GDP增长率高的区域和GDP增长率高的区域有相互邻接的趋势,低增长率区域与低增长率区域有相互邻接的趋势。
表2-4局部G统计量及其Z(Gi)值
根据表2-5中的G统计量及其Z值,我们可以发现湖南省各市州局部区域之间既存在显著的正的空间关联,又存在显著的负的空间关联。怀化、湘西、常德、郴州、邵阳、张家界和永州市的Z值为负,说明这些市被平均GDP增长率低的市所包围;岳阳、娄底、衡阳、湘潭、株洲、长沙和益阳的Z值为正,说明这些市被平均GDP增长率高的市所包围。
通过分析可以发现,长沙、湘潭、娄底、株洲、岳阳五市州平均GDP增长率较高的地区连成一片,形成湖南省东部地区的经济高速发展区域;常德和张家界连成一片,形成湖南省北部地区的经济高速发展区域;从而可以看出,增长率较高的地区有相互邻接的趋势;增长率较低的地区有怀化、湘西、衡阳、郴州、邵阳、永州和益阳,即GDP增长率较低的地区有相互邻接的趋势,它们形成湖南省西南部的经济低速发展区域。作为省会城市的长沙,同时也是湖南省经济发展的中心,其GDP增长率明显高于省内其它城市,而其它增长率较高的城市大部分都与长沙为邻,说明长沙的经济发展对相邻地市的经济发展存在一定的带动作用。
我们可以对上述发现的知识进行整理、加工,为进一步分析奠定基础,同时为经济政策决策的制定提供一定的参考和支持。通过上述的例子,说明了空间统计分析方法在确定、量化区域内存在的空间关联关系的正确性和有效性。
3结论
基于空间统计分析技术进行空间关联规则挖掘的方法,既考虑了空间对象的空间分布特征,又利用了空间对象的属性数据,因此是一种结合空间、属性特征的空间数据挖掘方法。本文的实例证明了该方法所发现的空间关联知识与实际相吻合,说明空间统计学方法的有效性和实用性。但是,对于非数值型数据而言,空间统计学方法还存在一定的局限性。
参考文献
[1]AgrawalR,ImielinskiT,SwamiA.Miningassociationrulesbetweensetsofitemsinlargedatabases.InProceedingsofthe1993InternationalConferenceonManagementofData(SIGMOD93),1993:207-216.
[2]AgrawalR,SrikantR.Fastalgorithmforminingassociationrulesinlargedatabases.InVLDB’94,1994:487-499.
[3]JongSooPark,Ming-SyanChen,PhilipS.Yu.AneffectiveHash-BasedAlgorithmforMiningAssociationRules.SIGMOD’95,1995:175-186.
[4]DonatoMalerba,FrancescaA.Lisi.AnILPMethodforSpatialAssociationRuleMining.
[5]H.Mannila,H.Toivonen,A.InkeriVerkamo.EfficientAlgorithmsforDiscoveringAssociationRules.1994:181-192.
[6]A.Savasere,E.Omiecinski,S.Navathe.AnEfficientAlgorithmforMiningAssociationRulesinLargeDatabases.Proceedingsofthe21stVLDBConference.1995:432-444.
[7]M.J.Zaki,S.Parthasarathy,M.Ogiharaetc.NewAlgorithmsforFastDiscoveryforAssociationRules.TechnicalReport,1995:1-24.
[8]J.Han,Yj.Fu.DiscoveryofMultiple-LevelAssociationRulesfromLargeDatabases.Proceedingsofthe21stVLDBConference.1995:420-431.
[9]AnselinL,GetisA.Spatialstatisticalanalysisandgeographicinformationsystem.AnnalsofRegionalScience,1992,26:19-33.
[10]陈斐,杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报(自然科学版),2002,Vol.27,No.4:391-396.
[11]吕安民.人口空间数据挖掘及其应用方法研究[D].武汉大学博士学位论文,2002.
[12]马荣华,黄杏元,朱传耿.用ESDA技术从GIS数据库中发现知识[J].遥感学报,2002,Vol.6,No.2:102-108.
[13]http://www.hntj.gov.cn/,湖南统计信息网.