复旦大学产学合作实践:面向新工科的机器学习混合课程建设

简介: 从认知论的角度而言,人类获得新知识的过程往往是从大量的个案和具体的问题入手,通过抽取其共性,形成了相关的概念和认识,然后在应用到个案中。在机器学习建设过程中,通过课前引入具体的应用领域背景,揭示其中要解决的问题,增加在线课程的趣味性和吸引力。在此基础上,从现实领域问题的视野,突出其中关键的步骤,然后再介绍相关的概念和算法等理论知识,并给出具体的解题过程。之后还要通过自建案例库的实验探讨其中的关键问题,从而能使学生的认知达到一定的深度。这个从应用中学习的过程也是深度学习的要求。

复旦大学产学合作实践:面向新工科的机器学习混合课程建设
来源:环球网

2021-11-25 16:31

一、案例实施的工作基础

在传统的机器学习课程教学的过程中,常常拘泥于理论知识的学习,而忽视了实践技能的培养。现阶段高校的机器学习课程普遍以介绍算法为主,大多数学生都是被动地接受知识,对于书本上的内容或者课堂上的知识进行简单理解,将相关概念和算法作为一个个知识点,对于其深度含义以及具体应用场景却了解不多。在传统教学中,虽然有实验课程,需要学生练习算法使用,但教学实验的内容往往是理想化的情境,使用的数据也是处理后比较干净的二手数据,学生仅需进行规范的实验就能取得预定的结果。

深度学习的重要特征之一就是解决真实情境的问题,不能孤零零地学机器学习知识,要与一些实际问题绑在一起。在真实复杂的情境中实践所学的算法。学生需要从深层意义上了解机器学习相关知识,做到真正理解算法理论,而不是简单复现应用。我们根据深度学习方法的要求,使用实际数据解决真实问题。通过实际项目实践,不仅可以检验理论知识的掌握情况,而且可以加深理论知识的理解,弥补学习中的缺漏。尤其是体会数据分析过程中书本上难得看到的技能和技巧,并在应用中举一反三。如此反复,不断提高机器学习的应用能力。

从认知论的角度而言,人类获得新知识的过程往往是从大量的个案和具体的问题入手,通过抽取其共性,形成了相关的概念和认识,然后在应用到个案中。在机器学习建设过程中,通过课前引入具体的应用领域背景,揭示其中要解决的问题,增加在线课程的趣味性和吸引力。在此基础上,从现实领域问题的视野,突出其中关键的步骤,然后再介绍相关的概念和算法等理论知识,并给出具体的解题过程。之后还要通过自建案例库的实验探讨其中的关键问题,从而能使学生的认知达到一定的深度。这个从应用中学习的过程也是深度学习的要求。

二、案例改革思路及举措

(1) 提出并实践了项目沉浸式教学改革

课程积极开展深度学习方式的教学方式改革:

1)领域问题驱动式启发:在线教学开始通过引入真实的应用情景,激发学生的兴趣,从中抽取课程要解决的问题。然后再引入概念、算法和思路,便于在短时间内理解。

2)通过相似的新应用情景,通过对领域问题的讨论也可以了解学生对概念和算法的理论薄弱点,确定课程的难点和偏重点,检验理论知识的掌握情况以及深层应用。

(2) 建立了比较丰富的一手机器学习案例库

近几年来,我们在与20多家企业合作的横向课题以及多项教育部产学合作协同育人项目的基础上,利用主流的机器学习开源框架和工具,开发了40多个一手的机器学习和深度学习案例,并在此基础上出版了《机器学习》《机器学习案例实战(第2版)》《Python机器学习实战案例》等比较完整的实验和实训教材。这些案例经过几十所院校和数万学员的使用,反馈良好,有效地支撑了机器学习在线和线下教学的开展。

(3) 有效地实现了混合教学模式

采用混合教学,受到了大多数学生的欢迎和接受,通过多种形式的交互,学生的课程参与度提升很大。通过混合课程的教学优化,学生能在应用中深入理解机器学习的方法、算法以及工具,使理论教学与应用融为一体,对实际问题有一定深度的分析。

1)理论知识与应用场景认知培养

由于机器学习的相关知识在实际应用中是灵活多变的,需要根据特定场景对算法进行调整和优化,对多种经典算法进行取舍。因此,实际工作对算法本身的理解提出了更高的要求,需要在理论基础上引导实践,从而在实践中加深对理论的理解。

2)实践项目的验证

为了使学生更好地适应新工科培养的需要,我们在直接接触企业实际项目前,对学生进行实践项目的验证与设计两个环节的培养。在学生理解算法原理的基础上,培养学生对实际应用场景的认知。以企业实际项目为驱动,结合案例程序展示其应用,该项目作为设计实验项目的原型,学生可访问、分析其思路、代码并测试其效果。随后,以此为基础做扩展实践,通过创新自主设计并实现一个相对完整的项目分析,提高灵活的应用知识能力和创新能力。

3)完成企业仿真实践项目

我们与企业联合组建合作项目和教学团队,结合企业需求,开展各种形式的培训和实践,不断完善实践教学内容。真实的企业实践项目能够将学生所学知识应用于解决实际问题,形成一个完整处理问题的思路。

三、案例实施成果及成效

(1)深度实践了深度教学

掌握机器学习的最好方法就是从应用中学习,使用实际数据,引入真实问题,而不是直接介绍概念和算法。通过实际问题求解过程的分析,引入相关的概念和算法,探索其中可能存在的关键问题,这可以加深理论知识的理解,弥补理论学习中的缺漏。

(2)推出了有一定影响力的在线机器学习课程

申请人已经在中国大学MOOC多次开设了深度学习及其应用在线课程,至今6次开课,共有6万多学员选修,课程入选CMOOC联盟线上线下混合式教学改革项目和优秀课程。

机器学习课程内容比较多,很多算法也有一定的难度。本课程参阅了大量文献资料,结合过去多年的数据分析研究以及与20多家企业的实战合作项目实践,深入浅出,通过300道原创的选择题、填空和判断题检验和巩固学员对基本知识的理解。还有40多个实战案例供学生实验和实训。

四、案例的创新点及特色

根据新工科建设对较强工程应用技能人才的培养需求以及较强工程应用能力师资的要求,通过与企业广泛数据分析项目,形成了稳定的师资和工程师团队,深入探讨深度教学的有效实施方法,经过数年的努力,建设了有效支撑深度教学和学习的实战案例库及其平台。

我们与京东、江苏中天、上海图书馆等多个企业合作过机器学习、深度学习项目,与主流的业界企业有多年的合作,了解实际项目的开展过程以及所需的能力。我们在以往与企业合作的项目成果应用于课程教学和实训项目,积累了比较扎实的经验。

为便于实战案例教学和学生实验、实训,我们与阿里云等公司合作,经过数年的努力,共同建设了实验平台,可以一站式支撑数据分析课程基本实验、面向具体行业的实训,不仅有效地支撑了实践沉浸式教学,还在兄弟院校产生了积极的影响和带头作用。

在教育部最近几年的新工科建设相关文件多次提到,要把教学更多地面向生产实际,同时还要培养具有较强的工程实践能力强的师资团队。我们通过深入企业实际分析项目,与阿里云等公司等相关实战型企业建立了长期的合作关系,通过相互学习,共同开展20多家客户企业的数据分析项目,积累了丰富的实践经验。并且把这些经验引入课程,提升教师对实际问题的理解和技能提升,探索了一条适应新工科教学的师资培养之路。

五、案例应用及推广情况

深度学习及其应用在线课程有几百所高校的学生选修,形成了良好的口碑,目前中国大学MOOC深度学习及其应用课程的评价分数为4.9。其中淮阴工学院、华侨大学、常州工学院、河南理工大学、南京航空航天大学、湖北工业大学、广西大学、东北财经大学等几十所学校和单位选做教材并把在线课程作为学分课程,在同类课程中有比较大的影响。因为课程突出的表现,已经被IBM、SAP、华为、滴滴、新大陆、全国人工智能教育联盟等公司作为示范课程在兄弟院校推荐使用。出版的三本教材因为提供丰富的实战案例,包括数据、Python程序以及其他配套资源,出版2年来印刷7次多,销量超过3万册,已经被国内60多所兄弟院校使用。其中《机器学习》入选十四五工信部规划教材。

近几年学校推广的基于领域案例深度教学方法的机器学习课程实践每年有各类研究生有300多人参加,并得到了多个合作企业的大力支持和肯定,教学团队的教学内容和教学方式每年有10多次在合作企业等主办的教学交流会议中面向全国兄弟院校推广,受到了广泛的关注。这种教学方法也已经向全院其他专业课程推广使用。

(作者:复旦大学 赵卫东)

目录
相关文章
|
12天前
|
机器学习/深度学习 数据采集 自然语言处理
构建高效机器学习模型的策略与实践
【4月更文挑战第30天】 在数据驱动的时代,机器学习(ML)作为一项核心技术,其应用范围和影响力日益扩大。然而,构建一个既高效又准确的机器学习模型并非易事。本文将探讨一系列实用的策略和技术,用于优化机器学习的工作流程,包括数据预处理、特征工程、模型选择、超参数调优以及模型评估等方面。通过这些策略,读者可以提升模型的性能,确保在实际应用中达到预期的准确度和效率。
|
22天前
|
机器学习/深度学习 数据采集 Python
Python机器学习面试:Scikit-learn基础与实践
【4月更文挑战第16天】本文探讨了Python机器学习面试中Scikit-learn的相关重点,包括数据预处理(特征缩放、缺失值处理、特征选择)、模型训练与评估、超参数调优(网格搜索、随机搜索)以及集成学习(Bagging、Boosting、Stacking)。同时,指出了常见错误及避免策略,如忽视数据预处理、盲目追求高精度、滥用集成学习等。掌握这些知识点和代码示例,能帮助你在面试中展现优秀的Scikit-learn技能。
33 5
|
3天前
|
机器学习/深度学习 算法 异构计算
构建高效机器学习模型的策略与实践
【5月更文挑战第8天】 随着数据科学领域的不断进步,机器学习(ML)已成为解决复杂问题的重要工具。然而,构建一个既高效又准确的ML模型并非易事。本文将详细探讨在设计和训练机器学习模型时可以采用的一系列策略,以优化其性能和效率。我们将讨论特征工程的重要性、选择合适的算法、调整参数以及评估模型的有效性。通过这些策略,读者将能够更好地理解如何提升模型的预测能力并避免常见的陷阱。
|
11天前
|
机器学习/深度学习 人工智能 算法
【Python 机器学习专栏】强化学习在游戏 AI 中的实践
【4月更文挑战第30天】强化学习在游戏AI中展现巨大潜力,通过与环境交互和奖励信号学习最优策略。适应性强,能自主探索,挖掘出惊人策略。应用包括策略、动作和竞速游戏,如AlphaGo。Python是实现强化学习的常用工具。尽管面临训练时间长和环境复杂性等挑战,但未来强化学习将与其他技术融合,推动游戏AI发展,创造更智能的游戏体验。
|
11天前
|
机器学习/深度学习 运维 算法
【Python机器学习专栏】异常检测算法在Python中的实践
【4月更文挑战第30天】本文介绍了异常检测的重要性和在不同领域的应用,如欺诈检测和网络安全。文章概述了四种常见异常检测算法:基于统计、距离、密度和模型的方法。在Python实践中,使用scikit-learn库展示了如何实现这些算法,包括正态分布拟合、K-means聚类、局部异常因子(LOF)和孤立森林(Isolation Forest)。通过计算概率密度、距离、LOF值和数据点的平均路径长度来识别异常值。
|
11天前
|
机器学习/深度学习 数据采集 算法
【Python机器学习专栏】支持向量机(SVM)在Python中的实践
【4月更文挑战第30天】SVM是一种高效的监督学习算法,适用于分类和回归,尤其擅长处理高维和非线性问题。通过寻找最大边际超平面来分隔数据,SVM具有高效性、鲁棒性、灵活性和稀疏性等特点。
|
11天前
|
机器学习/深度学习 数据采集 算法
【Python机器学习专栏】自动化特征选择与优化的实践
【4月更文挑战第30天】特征选择在机器学习中至关重要,能降低模型复杂度,提高泛化能力和避免过拟合。本文介绍了自动化特征选择的三种方法:过滤法(如SelectKBest)、包装法(如RFE)和嵌入法(如随机森林)。通过结合这些方法,可实现特征优化,包括数据预处理、初步筛选、模型训练与评估、特征优化和结果验证。自动化特征选择能提升模型性能,适应不同数据集和任务需求,为机器学习项目提供坚实基础。
|
12天前
|
机器学习/深度学习 Cloud Native 持续交付
构建高效机器学习模型的策略与实践构建未来:云原生技术在企业数字化转型中的关键作用
【4月更文挑战第30天】 在机器学习领域,构建一个高效的模型不仅需要深厚的理论基础,还需结合先进的技术手段和策略。本文将探讨一系列提升模型性能的方法,包括数据预处理、特征选择、模型调参以及集成学习等。通过具体案例分析,揭示这些方法如何在实际问题中得以应用,并讨论它们对模型性能的影响。文中还将涉及最新的研究进展,为读者提供前瞻性的指导意义。 【4月更文挑战第30天】随着企业加速其数字化转型之旅,云原生技术已成为推动创新和灵活性的核心。本文深入探讨了云原生架构的原则,包括微服务、容器化、持续集成/持续部署(CI/CD)、以及声明式APIs。分析了这些技术如何共同促进可伸缩性、敏捷性和容错性,同时
|
12天前
|
机器学习/深度学习 数据采集 自然语言处理
构建高效机器学习模型的策略与实践
【4月更文挑战第30天】 在机器学习领域,构建一个高效的模型不仅需要深厚的理论基础,还需结合先进的技术手段和策略。本文将探讨一系列提升模型性能的方法,包括数据预处理、特征选择、模型调参以及集成学习等。通过具体案例分析,揭示这些方法如何在实际问题中得以应用,并讨论它们对模型性能的影响。文中还将涉及最新的研究进展,为读者提供前瞻性的指导意义。
|
12天前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型的策略与实践
【4月更文挑战第30天】本文针对机器学习领域内模型构建的核心问题,提出了一系列创新性策略。首先,通过分析数据预处理的重要性,探讨了特征工程对模型性能的影响;其次,介绍了几种先进的算法选择方法,以及如何根据具体问题进行调优;最后,本文还讨论了模型评估和验证的关键技术,确保所构建模型的泛化能力和实用性。这些内容构成了一个全面的方法论框架,旨在指导读者构建出既高效又稳定的机器学习模型。

热门文章

最新文章