资源整理。
1 Coding:
1.数据科学课程。课程、实验、教程以及code。
2.自动根据github生成你的程序员简历。只需要输入github账户名即可生成。
3.R语言包av,可以结合animation或者gganimate生成mp4视频。
4.Python开源项目PointProcesses,Python里点过程的简单模拟,点过程、时间点过程、时空过程,包括核密度估计。
5.用GDAL/QGIS/WebGL制作3维地图,以DEM为主。
6.R语言开源项目,使用.stl文件中的R生成以3D打印。
7.机器学习研讨会。
8.基于R和QGIS的英国房价3维可视化。
9.R语言包ggcorrplot,ggplot2的拓展包,
10.R语言周报,R语言社区的重要部分之一。更新R语言相关的各项资讯。
11.美国环保署EPAR语言用户研讨会议程。
12.Python机器学习书第二版代码和在线资源。
python machine learning book 2nd edition
13.R语言包facetscales,ggplot2拓展包,针对分面展示。
14.将图片转成花。
15.R语言的一些脚本用来生成贝叶斯层次模型里的不同分布。
16.USGS-R开源项目,计算给定数据集的水文指标统计数据和每日流量的基本属性。
17.LANDIS II模型的生物量拓展模块。
2 Paper:
作为中国黄土高原最活跃的沟壑类型之一,河岸沟壑通常表明土壤流失和土地退化。这项研究解决了缺乏对堤坝的详细,大规模监测的问题,并提出了一种基于5米分辨率DEM的典型地形特征,提取堤坝的半自动方法。中国黄土高原林家尖流域黄土丘陵区的试验结果表明,生产精度达到87.5% 。精度受DEM分辨率和RGD参数以及沟渠肩线精度的影响。在具有高DEM分辨率的Madigou流域中的应用证实了该方法在其他领域的可重复性。整体性能表明,银行沟渠可以在大面积上以可接受的精度提取,为土壤侵蚀,地貌和环境生态学研究提供了必要的信息。南师大汤国安老师团队的成果,从DEM提取堤坝的方法。
可以以流的形式说明不同区域之间的相互作用。例如,人流和不同地区之间的信息之间的相互作用可以反映城市网络结构,以及城市功能和互连。大数据的普及促进了各类人员的流量数据的获取。区域交互模型的应用是基于个体流数据挖掘的总结水平,目前是一个热门的研究课题。然而,到目前为止,先前关于空间交互方法的研究主要集中在点对点和区域到区域的交互模式,以及对具有预定义邻域关系的两个区域组之间的交互热点模式的研究,即两个地区,仍然稀缺。在本研究中,提出了一种识别两个区域组之间相似交互热点模式的方法,并应用地理信息图谱方法来可视化交互模式。以中国的空中交通流量数据为例,说明所提方法的性能,以识别和分析中国各地区相互关系的区域群之间的交互热点模式。研究结果表明,该方法有效地识别了区域组之间交互流热点的模式。此外,它可以应用于分析区域群互动热点模式的挖掘中的任何流动空间。南师大汤国安老师团队的成果,关于流交互作用的数据挖掘和可视化研究。
由固体燃料烹饪造成的污染(称为家庭空气污染(HAP))引起的疾病暴露和相关负担已被纳入全球疾病负担(GBD)项目的评估中。相比之下,使用固体燃料进行空间加热的HAP(在中高海拔国家普遍存在)在GBD评估中的研究较少且缺失。考虑到从北方到南方的供暖需求发生显着变化以及依赖固体燃料的大量农村人口,中国是一个理想的例子,可以在空间供暖被忽略时估算暴露偏差和疾病评估负担。在这项研究中,基于对中国农村27个田间测量研究的荟萃分析,我们得出了加热和非加热季节的室内PM2.5(空气动力学直径小于2.5μm的细颗粒物)浓度。将这一数据集与时间活动模式和使用固体燃料的家庭百分比相结合,我们评估了2010年各县人口加权年均PM2.5(PWE)暴露量和中国大陆农村HAP对健康的影响。我们发现忽略加热影响导致全国农村人口PWE估计值低估38微克/立方米(四分之四范围为16至40),北方省份存在显着的负偏差。相应地,2010年过早死亡和残疾调整生命年将分别被低估约30×103和60×104。我们的研究表明,需要将加热效应纳入中国和全球的HAP风险评估。发表在EI(Environment International)上的一篇论文,目前热门的环境健康影响研究的题目,并且是基于家庭的视角,非常不错的研究。
4.Modified data-driven framework for housing market segmentation/住房市场细分的改进数据驱动框架
房地产市场细分在概念和经验层面都很重要,因为它反映了房价的空间异质性,提高了房价的预测准确性,并表明住房市场的动态变化。现有文献提供了一种流行的框架,称为数据驱动方法,用于基于主成分分析(PCA)和聚类分析来描绘子市场;然而,传统的框架不考虑空间异质性,并且难以平衡空间关系(即距离和拓扑关系)和属性相似性。为了解决这些局限性,本文提出了一种改进的数据驱动框架,用于通过整合地理加权主成分分析(GWPCA),空间异质性测试,基于密度的空间聚类(DBSC)算法和特征验证来描绘住房子市场。修改后的框架适用于中国深圳的住房市场细分。结果表明,改进后的框架在深圳的子市场细分中表现最佳。该框架具有重要的意义和在统计上确定住房子市场的巨大潜力,并且可以推广并应用于其他城市的住房市场。此外,可视化结果可供评估人员用于房产评估,也可由城市规划人员用于设施管理和社会平等改善与平衡。叶信岳老师团队成果,基于数据驱动方法在城市规划方面做探索,使用了大量的地理加权、空间分析针对住房市场细分。GWPCA和DBSC的结合值得关注。
在本研究中,我们将基于网络的活动日记数据与GPS跟踪器记录的每日移动信息进行匹配,以便在2012年北京为期7天的调查中对709名居民进行抽样调查,以调查活动满意度。鉴于GPS集成日记数据的不规则时间间隔和相关的复杂依赖结构引起的复杂性,标准(空间)面板数据计量经济学方法的直接应用是不合适的。本研究开发了一种多层次的时间自回归建模方法来分析这些数据,将时间概念化为连续的,并通过时间或时空权重矩阵检查顺序相关性。此外,我们设法通过包含个体随机效应来同时模拟个体异质性,这些随机效应可以灵活地处理为独立的或依赖的。贝叶斯马尔可夫链蒙特卡罗(MCMC)算法是为模型实现而开发的。发现正序相关和个体异质性效应具有统计学意义。发生活动的场所的地理环境特征与日常活动满意度,控制一系列情境特征和个人社会人口统计特征显着相关。除了我们研究中可以想象的城市规划和发展影响之外,我们还展示了一种用于分析语义GPS轨迹数据的新颖统计方法。关美宝老师团队的关于时间地理学的成果,针对居民日常生活轨迹分析的新方法,基于时间自回归和MCMC算法,当大数据到来之后,关于人的移动轨迹的研究将会越来越重要,本文发表于IJGIS上,后续值得继续关注。
忽视人们的日常流动性和暴露于非居住环境可能导致人们暴露于环境因素的健康影响的流行病学研究中的错误结果。 本文确定并描述了一种称为邻里效应平均的现象,当检查依赖于行动的暴露(例如,空气污染)对健康的影响时,这种现象可能会显着的混淆邻近效应。 最近的几项研究为邻里效应平均问题(NEAP)提供了有力的证据。 该论文的结论是,由于观察到与人们日常活动相关的邻里效应减弱,增加生活在贫困社区的人的流动性可能有助于改善他们的健康结果。关美宝老师的通讯文章,关注的是邻里效应造成的分析不确定性,关美宝老师近年来一直在关注地理学、GIS空间分析,尤其是大数据兴起后造成的分析不确定性。对此发表过多项研究成果。
传统的基于消费的温室气体排放核算将消费和基于生产的排放之间的差距归因于国际贸易。然而,很少有人尝试分析当前排放与未来消费之间的时间偏差,这可以通过资本存量的变化来解释。在这里,我们开发了一个动态模型,将资本存量变化纳入基于消费的统计。使用1995 - 2009年的全球数据应用新模型。我们的研究结果表明,新模型确定的消费体现的全球排放量小于传统模型。在此期间,全球资本存量所体现的排放量稳步增长。然而,资本在为具有不同发展特征的经济体制定基于消费的排放量方面起着非常不同的作用因此,与传统模型相比,动态模型为许多发达国家产生类似的基于消耗的排放估算,但它突出了快速发展中国家的动态。能源消耗和温室气体排放的研究,发表于NC,多个团队合作成果。