《大数据系统基础》课程实践项目中期答辩顺利举行,清华持续探索大数据人才教育创新之路

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

2017年11月15日,清华大学大数据能力提升项目之《大数据系统基础》课程实践项目中期答辩在清华大学六号教学楼顺利举行。160余名同学分为21组,向任课老师和企业导师汇报了各组实践项目的进展情况,任课老师和企业导师根据同学们的汇报表现逐一进行了点评和指导。据悉,本次答辩项目来自于国家发改委、百度、国美等政府机构和知名大数据企业等。项目需求和数据涉及多个行业领域,如“建设工程造价指数”、“餐饮行业白皮书周报”、“基于语义分析的泛娱乐改编研究”等,学生们经过近2个月的实战锻炼,在今天给学校和企业交上了一份令人满意的答卷。

9026a75251e48e36ab91cbc130fc798a1d55c2c2

各小组代表答辩中

 

本次中期答辩主要从文献调研、需求沟通、数据获取及了解、技术路线、预期目标等多方面进行评估,形成任课老师、企业导师评价和学生互评相结合的机制。答辩由任课老师徐葳主持,10位企业导师、助教团队和现场160余位学生作为评委,参与提问和评分。针对学生在开展项目过程中遇到的困难,以及所选择的大数据工具是否恰当等问题,授课老师和企业导师给出了引导和建设性的意见。徐葳表示:“同学们都为此次答辩做了认真的准备,我非常高兴。对于做项目过程中尚未实现和有困难的部分,希望同学们找出问题所在,努力把它实现!”

数据科学研究院始终致力于突破传统的教学方式,在《大数据系统基础》课中引入来自业界的真实数据和项目正是成功探索之一。本课程将信息类和非信息类学科的同学组队,以团队的形式做项目,使得跨学科的学生在组内进行充分交流、互相学习、各自发挥专长。课程引入20多个丰富又真实的数据并让学生和用户进行交流,使学生在进入职场之前就有机会了解社会和企业对大数据技术解决问题的需求。其项目数量之多、社会力量支持力度之大,是全国乃至世界少见的教学模式探索,收效颇丰。

来自医学院的韩旭同学表示:“我所在的‘基于手机通讯录的欺诈检验’项目组,组内六位同学分别来自医学院、美术学院、软件学院和信息学院。这种院系跨度交叉的组合是同学们在之前的学习经历中从未体验过的,同学们表示来自不同学院和专业领域的组合打破了学科间的壁垒,在一起做项目锻炼了我们的沟通协作能力和团队凝聚力。” 来自工业工程系的王明哲同学说:“数据院为我们学生组织了这么多真实的项目,同学们都非常珍惜,因为这样的锻炼机会很难得,为数据院点赞!”

c664ef66b4dd3c667b58bd926beebb8bb87ee53c

企业导师和任课老师认证听取汇报

从之前的主动向企业要项目,到今年企业纷纷“毛遂自荐”甚至需要在开课伊始组织“企业答辩”,请企业导师向学生们介绍提供的项目来供学生挑选。这种转变折射出创新性大数据人才培养模式逐渐受到了企业的认可和支持。来自百度的企业导师表示:“学生能够非常积极有效地与我们沟通,针对我们多维度探究移动互联网下的用户形态的需求,同学们给出了自己解决问题的思路和技术方案,我们很期待最终同学们的研究报告。”

11a75a5a6fb193f83fe3416b1b7775f36ea49704

答辩现场

《大数据系统基础A/B》课程简介:

本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。使得学生熟悉典型大数据工具与平台的特性,掌握大数据处理的基本开发方式,巩固和加深大数据分析的基础知识。本课程的主要内容包括:大数据软件栈、虚拟化、系统管理、数据清洗、数据存储、处理框架、内存计算、文档数据、NoSQL/NewSQL数据库、图数据、流数据、分析框架、数据分割、以及一致性。

本门课程主要希望通过对一系列与大数据相关的计算机系统知识的学习和动手实践,让学生理解大数据分析系统的软硬件架构,了解目前可用的工具和技术上存在的挑战。考虑到A班学生群体中有相当多的经管、社科及公共管理专业学生,A课程注重讲授大数据系统工具的概念、应用场景以及商业价值。B班学生群体以信息类专业学生为主,注重讲授大数据系统的原理、开发及实现。在介绍典型系统工具使用的基础上,通过分析其实现原理与设计理论,增强学生大数据平台与工具的应用与开发能力。培养学生在工作中应用与选择适合大数据工具的能力,同时也为有志于继续深入学习大数据专业课程的学生创造基础。


原文发布时间为:2017-11-16

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8天前
|
机器学习/深度学习 搜索推荐 大数据
大数据与教育:学生表现分析的工具
【10月更文挑战第31天】在数字化时代,大数据成为改善教育质量的重要工具。本文探讨了大数据在学生表现分析中的应用,介绍学习管理系统、智能评估系统、情感分析技术和学习路径优化等工具,帮助教育者更好地理解学生需求,制定个性化教学策略,提升教学效果。尽管面临数据隐私等挑战,大数据仍为教育创新带来巨大机遇。
|
5月前
|
数据采集 大数据
大数据实战项目之电商数仓(二)
大数据实战项目之电商数仓(二)
122 0
|
6月前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3月前
|
机器学习/深度学习 设计模式 人工智能
面向对象方法在AIGC和大数据集成项目中的应用
【8月更文第12天】随着人工智能生成内容(AIGC)和大数据技术的快速发展,企业面临着前所未有的挑战和机遇。AIGC技术能够自动产生高质量的内容,而大数据技术则能提供海量数据的支持,两者的结合为企业提供了强大的竞争优势。然而,要充分利用这些技术,就需要构建一个既能处理大规模数据又能高效集成机器学习模型的集成框架。面向对象编程(OOP)以其封装性、继承性和多态性等特点,在构建这样的复杂系统中扮演着至关重要的角色。
65 3
|
3月前
|
监控 Java 开发者
揭秘Struts 2性能监控:选对工具与方法,让你的应用跑得更快,赢在起跑线上!
【8月更文挑战第31天】在企业级应用开发中,性能监控对系统的稳定运行至关重要。针对流行的Java EE框架Struts 2,本文探讨了性能监控的工具与方法,包括商用的JProfiler、免费的VisualVM以及Struts 2自带的性能监控插件。通过示例代码展示了如何在实际项目中实施这些监控手段,帮助开发者发现和解决性能瓶颈,确保应用在高并发、高负载环境下稳定运行。选择合适的监控工具需综合考虑项目需求、成本、易用性和可扩展性等因素。
43 0
|
3月前
|
SQL 大数据 分布式数据库
SQL与大数据的神秘力量:如何用高效SQL处理海量数据,让你的项目一鸣惊人?
【8月更文挑战第31天】在现代软件开发中,处理海量数据是关键挑战之一。本文探讨了SQL与大数据结合的方法,包括数据类型优化、索引优化、分区优化及分布式数据库应用,并通过示例代码展示了如何实施这些策略。通过遵循最佳实践,如了解查询模式、使用性能工具及定期维护索引,开发者可以更高效地利用SQL处理大规模数据集。随着SQL技术的发展,其在软件开发中的作用将愈发重要。
95 0
|
4月前
|
弹性计算 分布式计算 大数据
MaxCompute产品使用合集之如何将用户A从项目空间A申请的表权限需要改为用户B
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4月前
|
分布式计算 运维 DataWorks
MaxCompute操作报错合集之用户已在DataWorks项目中,并有项目的开发和运维权限,下载数据时遇到报错,该如何解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
4月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何查询MaxCompute项目中的所有表及其字段信息
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
4月前
|
数据可视化 前端开发 大数据
商场智能导视系统深度解析,AR与大数据融合创新商业运营模式
**商场智能导视系统提升购物体验:** 通过三维电子地图、AR导航、AR营销、VR全景导购及可视化数据,解决顾客寻路困扰,增强店铺曝光,简化招商流程,优化商场管理,借助科技创新驱动顾客满意度、品牌曝光度及运营效率的全面提升。
114 0
商场智能导视系统深度解析,AR与大数据融合创新商业运营模式
下一篇
无影云桌面