看见新力量四-No.13 专访大地量子联合创始人吕童

简介: 看见新力量四


从天上到人间,让卫星数据造福社会

 

遥感卫星——这个国人常常在课本和新闻中听到的词汇,往往属于深耕科学前沿的探索者或者保卫网络安全的信息专家。然而,你可曾想过卫星数据也可以不再“高冷”,可以返回地面,走入社会,走向商用,造福人间。

 

第四十四期《看见新力量》采访了2021阿里巴巴诸神之战“数字经济赛道”全球总决赛优胜奖获得者——大地量子,请联合创始人吕童谈谈如何将卫星数据变得“触手可得”。

 

大地量子成立于2017年,是一家非常年轻的初创公司,但有一支强劲的成员队伍。2016年,也就是创业前一年,大地量子联合创始人吕童才刚刚在卡耐基梅隆大学拿到博士学位。CEO王驰与吕童是大学本科同学,博士学历,具有深厚的研究背景。大地量子的核心团队,从研发、业务到内部管理,都由国内外顶尖高校的人才或在相关领域有任职工作或学习经历的经验者组成。

image.png

大地量子的主营业务是把全球遥感卫星采集到的海量粗糙原始数据进行工程化、结构化的整合,以自主开发的 AI 深度学习算法进行数据挖掘和分析,形成高质量的数据产品后,以 S a a S、P a a S等形式为不同行业用户提供服务,最终赋能各行各业的转型升级。

 

一、 让60万米高空的数据变得触手可及

 

对于绝大多数普通人来说,“空间数据”是个离自己生活很远的概念。对于商业企业来说,使用遥感卫星数据是一件价值模糊的事情,总觉得“成本一定是非常高的”。但实际上,全球商业遥感卫星和开源卫星每年产生的数据量有几千万GB,是一笔巨大的数据资源。可以说,在遥感卫星数据和社会市场中间,存在着厚厚的认知和实践壁垒。

 

因此,如何让60万米高空的数据变得触手可及,如何在高性价比的基础上、让卫星遥感切实地帮助解决生活或者业务中遇到的种种问题,成为大地量子所关注的根本问题。

 

在吕童看来,技术既是护城河,也是挖掘机。要同步打破人们对卫星数据认知和实践上的双重壁垒,只有依靠技术创新降低使用门槛,创造认知环境,市场才会被开掘出来。

 

吕童介绍,目前结合一整套高性能的数据工程化手段,大地量子在数据的服务能力有非常大的飞跃。当对海量数据的整合生产能力发生飞跃,下游具体行业对卫星数据的使用能力将同步飞跃,认知也将有很大进步。在数据生产技术之外,大地量子团队还在数据产品的交接环节做了许多设计,以降低时空数据应用在具体场景中的技术门槛。详见图片。

image.png

 

总结而言,海量卫星数据高效处理和低应用门槛,是大地量子核心的两点产品价值。

 

目前,大地量子的努力已初见成效。“大多数客户或者合作伙伴对于遥感卫星数据的认知已经发生了很大的变化,他们越来越知道能解决什么问题,能力边界在哪。”吕童说。

 

迄今,大地量子的业务场景已经涵盖农业、林业、生态环境、防灾减灾、能源设施、基础设施等领域,且都有非常成功的案例。

 

二、 将“大地”之上的物理空间数据化

 

正如大地量子这个名字所表示的,要把“大地”之上的物理空间进行彻底的量化,通过数据的整理、再生产和有序构造,最终形成面向市场的数据,绝对是说起来容易做起来难的一件事。

 

“各种工作最核心的都是围绕数据体量这个点。”吕童介绍,在PB级别的数据尺度上进行遥感卫星数据的下载、预处理、数据融合和管理、正式处理乃至形成低门槛产品交付下游企业,这整个过程需要对AI深度学习、数据中心平台、超算等多个技术方面大力投入,才会有算力、效率等突破。

 

目前,大地量子自建了猛犸超算中心,并建立起Ocean Storm 集群数据计算调度平台,能灵活调度数百台服务器CPU、GPU完成计算任务,数百亿数据点生产速度达到小时级,这相当于在10米尺度计算一次云南全省的森林分布。他们还开发出独家GPU训练与推理引擎Poseidon,通过分布式训练与大规模数据生产,对深度学习模型全生命周期进行持续集成与部署。

 

短短5年内,大地量子已经取得了32项专利,团队中超过80%都是研发人员。

 

三、 产品精准化分层化设计 争做环境保卫者

 

大地量子虽然是一家专注技术研发的公司,但他们并不售卖技术,而是卖PaaS服务,推动时空大数据产品的商业化。

 

而要建立平台式服务,就意味着大地量子要对下游及众多应用场景花费很大精力和时间进行抽象和总结,最终形成自己多样化的产品设计和业务模式设计。

 

吕童称,在to B业务线上,他们设计了三种交付形式,通过精准化、分层化的产品设计,使得时空数据产品更容易被各行各业所接受。

 

第一种模式是,提供标准化空间数据SaaS服务,空间数据使用者通过简单的登录即可查看各类产品,并使用大地量子设计的各种功能。

 

第二种模式是,提供数据的同时,也提供前端组件的SDK。这种模式适合于客户自己有一个功能更丰富、整体更复杂的平台,且需要在这个平台里面集成时空数据服务模块。这种模式可以将数据可视化功能便捷地整合进客户的平台中去。

 

第三种模式是关于图层瓦片的接口服务。如果用户对于地理信息系统具备丰富的开发经验,就可以直接通过API接口的形式获取各种数据,进行二次开发,做更多应用。

 

随着进一步的产品开发及市场侧的推动,越来越多的客户了解到大地量子,并带着务实的需求找到他们。大地量子目前正在推进的合作伙伴有近百家。

image.png

 

阿里云创新中心也为他们提供了和地方政府、相关业务部门对接的机会。吕童介绍,在阿里巴巴诸神之战大赛现场路演完成后,就有一些负责农业的领导找来了解,如何将大地量子的技术运用于农业,帮助监测当地环境的水污染情况。

 

四、 打造地球的数字百科

 

吕童对公司的未来境况有相当充足的信心,他希望带领这支充满战斗力的团队实现两个目标。

 

市场方面,大地量子正在向农业、林业、生态环境保护、双碳、基础设施等领域的合作伙伴提供他们需要的时空数据和标准化服务组件,未来希望能够在重点领域的快速迭代中逐渐建立时空数据产品的标准。

 

技术创造方面,吕童希望大地量子成为时空数据基础建设的引领者。“未来的遥感时空数据服务,或许会成为如自来水和交流电一般的基础设施。一系列科学和技术的创新让地球的数据可以被搜索、被索引,甚至被预测,我们希望逐步打造出地球的数字百科。”

相关文章
|
缓存 监控 Unix
vmstat命令详解
`vmstat` 是类 Unix 系统的监控工具,显示虚拟内存、物理内存、CPU、I/O 和系统中断等资源使用情况。基本用法是 `vmstat [interval [count]]`,可按指定时间间隔输出系统状态。主要字段包括进程(r/b)、内存(swpd/free/buff/cache)、交换(si/so)、I/O(bi/bo)、系统(in/cs)和CPU(us/sy/id/wa/st)的统计。使用 `-s`, `-a`, `-m`, `-d`, `-p` 等选项可获取不同类型的统计信息。详细信息可通过 `man vmstat` 查看。
531 3
|
Python
python自动生成含样式的Excel表格数据案例
python自动生成含样式的Excel表格数据案例
669 1
|
JavaScript 前端开发
js中模糊搜索 模糊匹配如何实现?
js中模糊搜索 模糊匹配如何实现?
|
11月前
|
监控 搜索推荐 应用服务中间件
301重定向:原理、应用与SEO最佳实践
301重定向是HTTP协议中的永久性重定向状态码,用于告知资源已永久移动到新位置。相比302临时重定向,301可将搜索引擎权重完全转移至新URL,适用于网站改版迁移、网址规范化、失效内容处理及营销活动归档等场景。实现方式包括Apache服务器(.htaccess)、Nginx配置和PHP代码等。SEO优化需注意权重传递测试、避免链式重定向、移动端适配及使用监控工具,同时规避常见误区并进行性能优化。
279 24
|
机器学习/深度学习 人工智能 并行计算
【AI系统】AI轻量化与并行策略
本文探讨了AI计算模式对芯片设计的重要性,重点介绍了轻量化网络模型和大模型分布式并行两大主题。轻量化模型旨在减少参数量和计算量,适合资源受限的设备;大模型分布式并行则针对高性能计算需求,通过数据并行、模型并行等技术提高训练效率。文中详细解析了轻量化设计的方法及分布式并行的实现机制,为AI芯片设计提供了理论依据和技术指导。
697 2
|
存储
子网划分问题(实战超详解)_主机分配地址
本文详细介绍了子网划分的核心思想及步骤,通过实例演示如何根据所需主机数量借位生成子网,并确定每个子网的网络地址、广播地址及可用 IP 范围。以一个自治系统的具体需求为例,展示了子网划分的实际应用过程。
1226 13
|
Kubernetes API 虚拟化
centos之k8s
centos之k8s
|
数据采集 监控 算法
阿里云百炼模型训练评测
【7月更文挑战第1天】阿里云百炼提供一站式的模型开发服务,包括大模型训练、调用与部署。用户可查看剩余调用次数,点击开通服务以使用模型。计费基于调用量,涵盖推理、训练和部署。开通服务需同意协议,成功后将收到短信通知。评测显示,平台功能丰富,易用性强,能显著提升模型效果,且模型部署简便。建议优化数据预处理工具并增加实例教程。
|
缓存 程序员 开发工具
手把手教学,如何解决 git 冲突?
手把手教学,如何解决 git 冲突?
454 0
|
编解码 C#
基于C#的ArcEngine二次开发教程(17):获取栅格属性的接口及代码实现
基于C#的ArcEngine二次开发教程(17):获取栅格属性的接口及代码实现
基于C#的ArcEngine二次开发教程(17):获取栅格属性的接口及代码实现