复旦大学产学合作实践:面向新工科的机器学习混合课程建设

简介: 从认知论的角度而言,人类获得新知识的过程往往是从大量的个案和具体的问题入手,通过抽取其共性,形成了相关的概念和认识,然后在应用到个案中。在机器学习建设过程中,通过课前引入具体的应用领域背景,揭示其中要解决的问题,增加在线课程的趣味性和吸引力。在此基础上,从现实领域问题的视野,突出其中关键的步骤,然后再介绍相关的概念和算法等理论知识,并给出具体的解题过程。之后还要通过自建案例库的实验探讨其中的关键问题,从而能使学生的认知达到一定的深度。这个从应用中学习的过程也是深度学习的要求。

复旦大学产学合作实践:面向新工科的机器学习混合课程建设
来源:环球网

2021-11-25 16:31

一、案例实施的工作基础

在传统的机器学习课程教学的过程中,常常拘泥于理论知识的学习,而忽视了实践技能的培养。现阶段高校的机器学习课程普遍以介绍算法为主,大多数学生都是被动地接受知识,对于书本上的内容或者课堂上的知识进行简单理解,将相关概念和算法作为一个个知识点,对于其深度含义以及具体应用场景却了解不多。在传统教学中,虽然有实验课程,需要学生练习算法使用,但教学实验的内容往往是理想化的情境,使用的数据也是处理后比较干净的二手数据,学生仅需进行规范的实验就能取得预定的结果。

深度学习的重要特征之一就是解决真实情境的问题,不能孤零零地学机器学习知识,要与一些实际问题绑在一起。在真实复杂的情境中实践所学的算法。学生需要从深层意义上了解机器学习相关知识,做到真正理解算法理论,而不是简单复现应用。我们根据深度学习方法的要求,使用实际数据解决真实问题。通过实际项目实践,不仅可以检验理论知识的掌握情况,而且可以加深理论知识的理解,弥补学习中的缺漏。尤其是体会数据分析过程中书本上难得看到的技能和技巧,并在应用中举一反三。如此反复,不断提高机器学习的应用能力。

从认知论的角度而言,人类获得新知识的过程往往是从大量的个案和具体的问题入手,通过抽取其共性,形成了相关的概念和认识,然后在应用到个案中。在机器学习建设过程中,通过课前引入具体的应用领域背景,揭示其中要解决的问题,增加在线课程的趣味性和吸引力。在此基础上,从现实领域问题的视野,突出其中关键的步骤,然后再介绍相关的概念和算法等理论知识,并给出具体的解题过程。之后还要通过自建案例库的实验探讨其中的关键问题,从而能使学生的认知达到一定的深度。这个从应用中学习的过程也是深度学习的要求。

二、案例改革思路及举措

(1) 提出并实践了项目沉浸式教学改革

课程积极开展深度学习方式的教学方式改革:

1)领域问题驱动式启发:在线教学开始通过引入真实的应用情景,激发学生的兴趣,从中抽取课程要解决的问题。然后再引入概念、算法和思路,便于在短时间内理解。

2)通过相似的新应用情景,通过对领域问题的讨论也可以了解学生对概念和算法的理论薄弱点,确定课程的难点和偏重点,检验理论知识的掌握情况以及深层应用。

(2) 建立了比较丰富的一手机器学习案例库

近几年来,我们在与20多家企业合作的横向课题以及多项教育部产学合作协同育人项目的基础上,利用主流的机器学习开源框架和工具,开发了40多个一手的机器学习和深度学习案例,并在此基础上出版了《机器学习》《机器学习案例实战(第2版)》《Python机器学习实战案例》等比较完整的实验和实训教材。这些案例经过几十所院校和数万学员的使用,反馈良好,有效地支撑了机器学习在线和线下教学的开展。

(3) 有效地实现了混合教学模式

采用混合教学,受到了大多数学生的欢迎和接受,通过多种形式的交互,学生的课程参与度提升很大。通过混合课程的教学优化,学生能在应用中深入理解机器学习的方法、算法以及工具,使理论教学与应用融为一体,对实际问题有一定深度的分析。

1)理论知识与应用场景认知培养

由于机器学习的相关知识在实际应用中是灵活多变的,需要根据特定场景对算法进行调整和优化,对多种经典算法进行取舍。因此,实际工作对算法本身的理解提出了更高的要求,需要在理论基础上引导实践,从而在实践中加深对理论的理解。

2)实践项目的验证

为了使学生更好地适应新工科培养的需要,我们在直接接触企业实际项目前,对学生进行实践项目的验证与设计两个环节的培养。在学生理解算法原理的基础上,培养学生对实际应用场景的认知。以企业实际项目为驱动,结合案例程序展示其应用,该项目作为设计实验项目的原型,学生可访问、分析其思路、代码并测试其效果。随后,以此为基础做扩展实践,通过创新自主设计并实现一个相对完整的项目分析,提高灵活的应用知识能力和创新能力。

3)完成企业仿真实践项目

我们与企业联合组建合作项目和教学团队,结合企业需求,开展各种形式的培训和实践,不断完善实践教学内容。真实的企业实践项目能够将学生所学知识应用于解决实际问题,形成一个完整处理问题的思路。

三、案例实施成果及成效

(1)深度实践了深度教学

掌握机器学习的最好方法就是从应用中学习,使用实际数据,引入真实问题,而不是直接介绍概念和算法。通过实际问题求解过程的分析,引入相关的概念和算法,探索其中可能存在的关键问题,这可以加深理论知识的理解,弥补理论学习中的缺漏。

(2)推出了有一定影响力的在线机器学习课程

申请人已经在中国大学MOOC多次开设了深度学习及其应用在线课程,至今6次开课,共有6万多学员选修,课程入选CMOOC联盟线上线下混合式教学改革项目和优秀课程。

机器学习课程内容比较多,很多算法也有一定的难度。本课程参阅了大量文献资料,结合过去多年的数据分析研究以及与20多家企业的实战合作项目实践,深入浅出,通过300道原创的选择题、填空和判断题检验和巩固学员对基本知识的理解。还有40多个实战案例供学生实验和实训。

四、案例的创新点及特色

根据新工科建设对较强工程应用技能人才的培养需求以及较强工程应用能力师资的要求,通过与企业广泛数据分析项目,形成了稳定的师资和工程师团队,深入探讨深度教学的有效实施方法,经过数年的努力,建设了有效支撑深度教学和学习的实战案例库及其平台。

我们与京东、江苏中天、上海图书馆等多个企业合作过机器学习、深度学习项目,与主流的业界企业有多年的合作,了解实际项目的开展过程以及所需的能力。我们在以往与企业合作的项目成果应用于课程教学和实训项目,积累了比较扎实的经验。

为便于实战案例教学和学生实验、实训,我们与阿里云等公司合作,经过数年的努力,共同建设了实验平台,可以一站式支撑数据分析课程基本实验、面向具体行业的实训,不仅有效地支撑了实践沉浸式教学,还在兄弟院校产生了积极的影响和带头作用。

在教育部最近几年的新工科建设相关文件多次提到,要把教学更多地面向生产实际,同时还要培养具有较强的工程实践能力强的师资团队。我们通过深入企业实际分析项目,与阿里云等公司等相关实战型企业建立了长期的合作关系,通过相互学习,共同开展20多家客户企业的数据分析项目,积累了丰富的实践经验。并且把这些经验引入课程,提升教师对实际问题的理解和技能提升,探索了一条适应新工科教学的师资培养之路。

五、案例应用及推广情况

深度学习及其应用在线课程有几百所高校的学生选修,形成了良好的口碑,目前中国大学MOOC深度学习及其应用课程的评价分数为4.9。其中淮阴工学院、华侨大学、常州工学院、河南理工大学、南京航空航天大学、湖北工业大学、广西大学、东北财经大学等几十所学校和单位选做教材并把在线课程作为学分课程,在同类课程中有比较大的影响。因为课程突出的表现,已经被IBM、SAP、华为、滴滴、新大陆、全国人工智能教育联盟等公司作为示范课程在兄弟院校推荐使用。出版的三本教材因为提供丰富的实战案例,包括数据、Python程序以及其他配套资源,出版2年来印刷7次多,销量超过3万册,已经被国内60多所兄弟院校使用。其中《机器学习》入选十四五工信部规划教材。

近几年学校推广的基于领域案例深度教学方法的机器学习课程实践每年有各类研究生有300多人参加,并得到了多个合作企业的大力支持和肯定,教学团队的教学内容和教学方式每年有10多次在合作企业等主办的教学交流会议中面向全国兄弟院校推广,受到了广泛的关注。这种教学方法也已经向全院其他专业课程推广使用。

(作者:复旦大学 赵卫东)

目录
相关文章
|
24天前
|
人工智能 JSON 算法
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式、 AI Native 的大模型与 AIGC 工程平台,为开发者和企业客户提供了 Qwen2.5-Coder 系列模型的全链路最佳实践。本文以Qwen2.5-Coder-32B为例,详细介绍在 PAI-QuickStart 完成 Qwen2.5-Coder 的训练、评测和快速部署。
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
|
8天前
|
编解码 机器人 测试技术
技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人
Qwen2-VL是一款具备高级图像和视频理解能力的多模态模型,支持多种语言,适用于多模态应用开发。通过PAI和LLaMA Factory框架,用户可以轻松微调Qwen2-VL模型,快速构建文旅领域的知识问答机器人。本教程详细介绍了从模型部署、微调到对话测试的全过程,帮助开发者高效实现定制化多模态应用。
|
17天前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
36 12
|
17天前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
48 4
|
1月前
|
人工智能 边缘计算 JSON
DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
本文详细介绍在 PAI 平台使用 DistilQwen2 蒸馏小模型的全链路最佳实践。
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
探索机器学习:从理论到实践
在这篇文章中,我们将深入探讨机器学习的世界。我们将首先了解机器学习的基本概念和原理,然后通过一个简单的代码示例,展示如何实现一个基本的线性回归模型。无论你是初学者还是有经验的开发者,这篇文章都将帮助你更好地理解和应用机器学习。
|
1月前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
47 2
|
1月前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到实践
【10月更文挑战第35天】在这篇文章中,我们将深入探讨机器学习的世界。我们将从基础理论开始,然后逐步过渡到实际应用,最后通过代码示例来展示如何实现一个简单的机器学习模型。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的信息和见解。
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
机器学习中空间和时间自相关的分析:从理论基础到实践应用
空间和时间自相关是数据分析中的重要概念,揭示了现象在空间和时间维度上的相互依赖关系。本文探讨了这些概念的理论基础,并通过野火风险预测的实际案例,展示了如何利用随机森林模型捕捉时空依赖性,提高预测准确性。
101 0
机器学习中空间和时间自相关的分析:从理论基础到实践应用
|
2月前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到实践
【10月更文挑战第8天】在这篇文章中,我们将一起踏上一段旅程,探索机器学习的奥秘。我们首先会了解机器学习的基本概念,然后深入其理论基础,最后通过代码示例,将理论应用于实践。无论你是初学者还是有经验的开发者,这篇文章都将为你提供新的视角和深入的理解。
51 0
下一篇
DataWorks