【干货】刘伦:大数据时代的城市模型研究

简介:

嘉宾介绍:

刘伦:剑桥大学土地经济系博士研究生,清华大学建筑学院,城乡规划学硕士,清华大学建筑学院,建筑学学士,北京大学国家发展研究院,经济学学士(双学位)。研究方向:定量城市研究,城市模型,英国城乡规划等。


讲座全文:

刘伦:非常高兴来这里和大家交流,我交流的题目是数据时代的城市模型研究,来自于麦克·巴蒂访谈的启示。


城市模型发展的初级阶段。城市模型发展的历程已经有半个世纪之长,上世纪五十年代出现了一些比较经典的模型,同心圆模型、扇形模型、中心理论等等。


九十年代,随着计算机技术和地理信息技术的发展,城市模型出现了一些新的发展,右边这个图形是我参与开发的徐州市沛县城市空间演变的元胞模型。




这些年大数据的出现在国内国外引发了又一轮城市定量模型的研究,在这一轮城市模型研究中怎么样吸取过去的经验与教训?城市模型的发展方向是什么,在大数据时代,城市模型研究将具有哪些特征?



麦克·巴蒂是目前全世界城市模型研究领域最权威的几个专家之一,是英国UCL大学的教授,他研究的理论是基于复杂科学的建模和城市定量研究。他的理论著作包括城市模拟、城市复杂性等等。


在我访问他不久之前,他的新书《城市新科学》刚刚出版,这也是产生了很大影响的里程碑意义的著作。在这本书里面,麦克·巴蒂提出了城市新科学的思想。他认为这本书更准确的一个说法是不止存在一种关于城市的新科学,而是存在多种新科学。


他提出的是他认为的城市新科学。


新科学和老科学之间是什么区别,主要是这样几个方面:


一,新城市科学是基于复杂性理论,老的是基于城市经济学、社会学、地理学理论。


二,新城市科学是演进的老的示教,新的是演进的动态的视角。他们之间更加简单直接的区别是新的城市科学更多应用了新技术和新工具。




下面是我们这次访谈的内容,这个内容既包括了麦克·巴蒂在访谈时提出的一些观点,也包括了我和合作者进行的总结和延伸。我们的访谈主要涉及了大数据时代城市模型研究的几个问题:


第一,如何评价城市研究目前的状况。


总体上讲,目前的城市模型是以动态模型为主,可以按照他的基础理论分为三个类别,但是也有很多模型是不能完全归类的模型,他们往往是上面这三类模型的糅合,是更加问题导向型的、更加一次性的,这也是麦克·巴蒂认为未来城市模型发展的主要方向。


城市模型的发展有从早期上而下到自下而上的趋势,也是从静态到动态的发展趋势,以交通出行为例子,最早出现的也是目前最广泛使用的交通模型,他们的建模是以一个交通小区移动为单位,根据交通区域的人口和经济数量判断小区人口的可能出行量。但是交通量不是凭空产生的。


家庭内部之间的互动也被纳入了交通模型的建模内容范畴里。


从整体上看,就可以看到交通模型出现了一个明显的自上而下的以区块为单位的,到自下而上的以个体、家庭为单位的建模思想的转变方式。


精细化是城市模型发展的主要方向,城市模型并不等于复杂化,并不等于增加模型的内容,因为我们做模型的本身是对现实世界的抽象和简化,所以模型的本质是追求简化、简单的。


城市模型在过去的发展中主要遭遇了哪些挑战?


麦克·巴蒂认为,最主要的一个挑战是不确定性问题,这也是和我们城市规划领域谈到的以人为本的概念相关。


在上一轮的城市模型发展热潮里面,可以看到在城市发展中对政策制订最关键的领域也最难以建模,比如说住房问题、交通问题、城市更新问题等等。


深层次的原因在于当时的理论对于不确定性研究不足。现在经过了三十年的发展,城市理论有了更多的内容,但是不确定性问题仍然是城市研究中的难题。甚至有句话说:未来唯一确定的事情就是它存在不确定性。



在当前的技术背景下,城市模型有哪些发展趋势?


第一,宏观模型和微观模型的结合。上面提到,模型整体上有一个从宏观模型到微观模型的演化趋势。


这两种类型的模型也可以在建模方法中结合,从宏观上得到一个总量的大尺度的控制,由微观模型更加精细化的分配,从而使模型兼具宏观和微观的特征,提高模型的处理能力。




第二,进入为特定问题建立专用模型的阶段。经过了十几年的发展,我们有了一定规模的数据库进行选取我们所需要的工具。这个例子是我所在的剑桥大学跨学科空间分析实验室做的多主体模型。




第三,需要应对快速提高的城市复杂性。


在这个问题上大数据的出现可以为解决这个问题提供更多的数据基础,同时,和大数据相关的信息技术也可以提供更多在城市系统里面进行小范围实验的机会。


这样一个在城市系统里进行实验在以前几乎是不可能的,但是因为现在我们有很多随身携带的智能设备,手机应用的出现,这样一个实验方式成为了一种可能性。


UCL正在通过伦敦的地铁运行情况的实时手机应用,能够实时通知伦敦地铁的延误者是关闭的情况,这个在北京比较少,但是在伦敦是经常发生,每天都可能有地铁的延误者是关闭。


通过这个手机应用他们可以获得人们在面对交通系统临时变化时候的反应。从而可以将这种反应输入到模型中,对模型的结果进行一个检验和校准,这也有助于提高模型应对城市中人们复杂移动的能力。




第四,尝试对一个问题从不同角度构建多种模型,从而应对不确定性问题。


对多个模型之间的模拟结果进行一个比较,这样一个建模思路来自于宏观经济学领域,宏观经济学上对于重大模型往往是要对同一个问题建多个模型,提供给决策者由他来进行决策。


建造多个模型的方式也是目前模型方法中应对不确定性一个比较可行的思路。现在我们很多在座的学者都有参与制作这些大数据的搜集和可视化的工作,我们已经可以搜集到多种类型的大数据,大数据的丰富性也可以从不同角度构建多个模型提供数据支持。让这种建模方式提高他的可行性。



大数据时代的城市模型研究还有哪些特殊的特征?


首先是多个领域学者的共同关注,现在不只是来自于城市规划领域、来自于地理、计算机领域的学者都在积极的将大数据的技术应用于城市研究,这是城市数据派网站做的中国城市规划与大数据研究人群画像。


在这个画像中可以看到来自于计算机、地理领域、城市规划领域出现了三分天下的局面。第二的特征是基于大数据的研究趋于片段化,很少有面面俱到的、综合的针对城市系统的分析,这和大数据的特性是非常相关的。


因为大数据是数量大、来源广,但是它的维度往往少于传统的调研数据。在一条微博数据的背后,我们很难知道发微博的人的社会经济的属性。


第三,大数据的算法趋于简单化,通过对大量数据的简单处理,也许通过可视化就可以获得很多有用的信息,甚至有观点声称,数据就是模型。


第四,更加侧重于对城市的现状评价,而非对于未来的预测,因为越是精细化的模型针对的具体特定问题,在发展的过程中会遇到更多的不确定性,越不适合对人群进行判断。


这个特征一部分的原因在于我们目前搜集到的大数据更多是截面性的、某一个时间节点的数据。随着五年、十年的积累,可以通过这些数据获得更长时间段内同时发展的更多信息。这样一个功能也可能在我们以后长时间的研究中发生变化。




下面举一个我们正在研究的简单的例子,虽然这个研究既不是一个城市模型,也不是严格意义上的大数据,但是可以体现出应用海量数据进行处理的情况。这个图上的每一个区块是交通分析小区,每一个线代表从一个小区到另外一个小区的出行联系,线越多代表出行的次数越多。


通过简单的人群出行交通数据的可视化,我们可以大致的看出北京各个交通小区之间的联系,通过解读进一步判断整个北京的城市功能布局的合理性,也可以进一步细化看到二十四小时的情况。


大数据为我们提供了一个给复杂城市系统拍一张X光片的可能性,通过拍这个X光片,我们可以获得在没有这些数据的情况下不能获得的信息,从而让规划司在对城市问题进行诊断、治疗的时候能够获得更加准确的把握。


城市模型的角色,无论它的技术怎么样发展,数据来源怎样的丰富,它始终是手段,不能目的。它的根本目的还是为了解决城市中存在的问题。


我们对于模型的希望更应该是一个情景分析的工具,用它来评价不同的发展方向造成的发展结果,而不是指望它能够得出一个准确的正确的确定无疑的预测结果。


我们规划师思维在听到模型这个词的时候,往往认为它是给你一个预测结果,让你按照结果做方案,更理想的模型是能够融入到规划者的工作中,激发规划师的思维,提供一个要素。我们规划中的价值判断、利益协商是不能被替代的,仍然是需要我们每一个人之间的交流去完成。


原文发布时间为:2017-03-07

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
10月前
|
数据采集 机器学习/深度学习 人工智能
面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布
2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。
|
4月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
868 1
|
5月前
|
存储 并行计算 算法
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
267 4
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
222 0
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
6月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)
本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。
|
6月前
|
机器学习/深度学习 搜索推荐 数据可视化
Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用(217)
本文探讨 Java 大数据与机器学习在电商用户流失预测与留存策略中的应用。通过构建高精度预测模型与动态分层策略,助力企业提前识别流失用户、精准触达,实现用户留存率与商业价值双提升,为电商应对用户流失提供技术新思路。
|
6月前
|
机器学习/深度学习 存储 分布式计算
Java 大视界 --Java 大数据机器学习模型在金融风险压力测试中的应用与验证(211)
本文探讨了Java大数据与机器学习模型在金融风险压力测试中的创新应用。通过多源数据采集、模型构建与优化,结合随机森林、LSTM等算法,实现信用风险动态评估、市场极端场景模拟与操作风险预警。案例分析展示了花旗银行与蚂蚁集团的智能风控实践,验证了技术在提升风险识别效率与降低金融风险损失方面的显著成效。
|
6月前
|
机器学习/深度学习 自然语言处理 算法
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的对抗训练与鲁棒性提升(205)
本文探讨Java大数据与机器学习在自然语言处理中的对抗训练与鲁棒性提升,分析对抗攻击原理,结合Java技术构建对抗样本、优化训练策略,并通过智能客服等案例展示实际应用效果。