让基础设施研究变得更可见--- 清华大学数据科学研究院大数据基础设施研究中心成立

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已经成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。然而,相对于金融、医疗领域的火爆发展,大数据基础设施的建设往往会遭到忽视。为提高社会对大数据基础设施的认知、推动数据基础设施建设、促进数据开放共享,2017年8月17日,在清华大学FIT楼多功能厅举办了大数据基础设施认知RONG论坛暨大数据基础设施研究中心(以下简称“中心”)成立仪式。

北京龙腾佳讯科技股份公司(以下简称“龙腾佳讯”)支持清华大学大数据相关领域的教师研究及学生奖励,为数据院及附属机构捐赠网络资源及服务,数据院执行副院长韩亦舜和龙腾佳讯董事长兼总经理曾光签署了中心合作协议。中心主任徐葳、中心副主任赵强、UC伯克利大学教授宋晓东、中证资本市场运行统计监测中心数据技术开发部总监李刚、清数大数据产业联盟秘书长王霞出席并见证了这一重要时刻。

数据院执行副院长韩亦舜在论坛致辞中表示,大数据基础设施研究中心的建设应充分发挥清华学科综合优势,促进跨学科研究合作,实现“更创新”。中心将对大数据基础设施建设领域进行研究,还将与数据院已有的工业大数据、经济金融数据、智慧城市大数据等研究方向的科研中心进行横向合作,孵化社会化大规模数据实验室,加快社会数据融合和资源整合,实现“更合作”。

龙腾佳讯

中心成立签约仪式

从左到右:中心主任徐葳,数据院执行副院长韩亦舜,龙腾佳讯董事长兼总经理曾光,中心副主任赵强

会后,中心主任徐葳、中心副主任赵强、龙腾佳讯董事长兼总经理曾光接受了51CTO记者的采访。

让任何人都看不见基础设施,同时让基础设施研究变得更可见

在问到清华大数据基础设施研究中心的目标时,中心主任徐葳用一句很有深意的话来总结:清华大数据基础设施研究中心的目标是:让任何人都看不见基础设施,但同时让基础设施的研究变得更可见,让有志者加入进来。徐葳详细解释说,用户看不见基础设施,是因为基础设施好用易用,变成一种公共服务(utility),就像自来水一样,谁也不会关注水是怎么来的,后边有多么庞杂的一套系统。

另外一方面,国内对于计算机系统的研究基础比较薄弱(相比机器学习方向),愿意研究这方面的学生也相对比较少。清华希望通过这一中心,让更多人意识到这一领域中有趣的技术和科学问题,以及科研和商业前景,让更多人投入到这一方向中来。这就是所谓的:希望基础设施研究变得更可见。

说到对中心的期许,徐葳表示,希望推出一系列开源开放的基础架构管理软件和方案,提升业界对于基础架构的管理自动化水平。同时培养一批具有管理新型基础设施能力的系统管理人才。

得到产业最真实的一线需求

中心副主任赵强在采访时表示,中心比较倾向于由产业倒逼学术研究的模型,希望得到产业里最真实的一线需求,同时也希望把所谓的最新成果真正的部署到产业当中去。在赵强看来,大数据不是基础学科,而是一个偏应用的学科,只有和实际相结合才能得到真正的有用的研究。

据赵强透露,中心也在特聘专家研究员。这些特聘研究员是一线产业的专家从业人员、基础设施相关大企业的架构师或者CTO。他们把在产业里遇到的实际问题反馈到学术界,大家密切合作,推进产学融合。

产学融合,互惠互利

龙腾佳讯董事长兼总经理曾光表示,龙腾佳讯是清数大数据产业联盟的成员,几年来参与了很多数据院的活动和项目。当今,在基础设施方面的很多短板和问题已经成为大数据项目和产业发展的障碍,急需解决。经过沟通,公司决定投入资源支持中心的研究。

未来中心的科研课题,龙腾佳讯能够提供广泛的产业联系和背景。同时,公司覆盖全国的运营网络、服务网络可以为中心提供很好的研发、测试环境,支持国内外分布式技术、SDN、自动运维等领域的持续创新。当然龙腾佳讯也希望近水楼台,能更快更好地把新技术应用在生产实践中,为客户产生价值。 


本文作者:赵立京

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
23天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
181 7
|
23天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
37 2
|
1月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
78 1
|
2月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
51 3
|
20天前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
24 4
|
1月前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
55 3
|
1月前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
61 2
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
84 2
|
1月前
|
数据采集 分布式计算 大数据
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第27天】在数字化时代,数据治理对于确保数据资产的保值增值至关重要。本文探讨了大数据平台的搭建和数据质量管理的重要性及实践方法。大数据平台应包括数据存储、处理、分析和展示等功能,常用工具如Hadoop、Apache Spark和Flink。数据质量管理则涉及数据的准确性、一致性和完整性,通过建立数据质量评估和监控体系,确保数据分析结果的可靠性。企业应设立数据治理委员会,投资相关工具和技术,提升数据治理的效率和效果。
82 2