CIO时代APP微讲座:成都信息工程大学舒红平谈应用大数据技术深化教育信息资源

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:


2月13日,成都信息工程大学软件工程学院院长、教授舒红平在CIO时代APP微讲座栏目作了题为《运用大数据技术深化教育信息资源应用》的主题分享,他对自己在教育领域的思考和想法作出了分享。



2016年起,经研究,大数据应用是一个起点高、投入大、普惠难的场景。教育信息化从建设数字化校园进入到信息技术与教育融合创新的阶段,为下一步建设智能化教育提供了支撑。

一、教育信息资源的定义

教育信息资源是指经过数字化处理、可以在计算机或网络环境下运行的多媒体信息材料。广义的教育信息资源是指在教学过程中学生和老师所接触、获得的经过加工处理的一切教育信息来源;狭义的教育信息资源是指以电子化、数字化、网络化为技术特征的教育信息资源。

二、数字化校园对教育信息资源应用存在“六大不足”

1.总体规划有度,实施路径不明。

总体规划是面向未来的、方向性的。如何利用现有的教育信息数据、教学运行和管理数据、教育行业数据,通过实施路径分阶段、分批次实现规划目标,其路径是不够明确的。究其原因是由于不具备对教育信息资源建设和应用的过程路径,效益评估缺乏。

对策:深化大数据应用第一步是整合现有的多源数据,采用自上而下的数据思路,规划教学资源发展关键管控场景及指标,通过前置机、物联设备等,建立指标对应观测点数据、常规和实时采集渠道。交给存储、加工、计算形成发展指标和汇总计算及整体态势感知,从而周期性地或实时地对教学质量进行监控。

通过建立教育信息资源大数据平台,以成都信息工程大学卓越人才、能力达成度和监控项目为例,集成整合教务、学生、教师、考试及就业等方面的数据,以学生成长成才目标进行各年级各阶段目标分解,将专业认证和审核性评估中的数据对应知识、能力及素质要求,以指标的方式分解到教学计划、教学大纲、课程及授课环节进行管理,学生学习效果对应知识、能力、素质达成等级进行动态评估和监管,从而有效提高教学质量。

教育信息资源大数据平台的总体架构

2.交汇循规蹈矩,独占滋生权杖。

具体是指缺乏数据交换的平台和工具,使各个教学部门的业务数据难以及时分割、统一调度、有效共享,长期聚集的数据为滋生数据官僚提供了温床。

对策:建立统一的数据资源目录和交换平台,根据成熟的数据交换标准建立跨部门的数据交换共享服务,采用分布式数据存储实现对面向服务的部门数据资源共享和交换。以教育信息资源大数据平台交换的经验和策略性介绍,需要建立目录接口规范、教育信息资源分类规范、元数据标准、教育信息资源标识符、编目规范、目录体系技术管理规范、异构数据库接口规范等等。资源目录需要建立信息资源主题目录、教育信息资源部门目录、教育信息资源交换目录,交换制度需要建立信息资源接入制度、资源共享奖励制度、信息资源查询制度、信息资源安全保密制度等相应的制度。

基于可配的多种类数据源信息接入

建立标准的数据资源目录和交换平台

3.及时存储易行,整合计算难得。

数字化校园面向职能的电子化和数字化,很好地解决了业务数据及时存储和信息资源灵活拓展问题,但进行专题的全局数据业务分析时,因缺乏灵活适配的计算模型,对多元数据的重组能力、分布式计算量大、多个业务计算模型组合难,成为应用起点高的突出表现。

对策:通过大数据开源技术可实现分布式计算,但关键是应用计算模型是一个持续改进和优化的过程,可以通过试探性地构建分析模型、分析模型如何快速适配、分析模型如何叠加和优化等问题,提供具有共性特征的领域模型来降低整合难度。例如课程群的设置合理性和教学质量影响着因果关系分析:首先,判断课程群设置的合理性是否为教学质量原因的因果判断;其次,当判断出教学质量变化是由课程群设置的合理性引起后,再进一步分析教学计划设计是否影响教学质量,主要包括课程群的科目设置是否合理、课程群的先后关系设置是否合理。通过对“Linux体系和编程”这门课的教学质量分析,我们发现一般“操作系统原理”这门课学习比较好的学生其“Linux体系和编程”的成绩也是比较好。利用这个模型在“某课程的上课对象是不同学生群体时教学效果的变化”、“某课程由不同教师群体担任造成的教学质量的变化”两个应用中进行快速适配、优化。

软件工程学院课程群

软件工程学院具有强相关关系的课程群网络

4.专注部门精准,全局关联迷失。

从学校全局角度讲,各部门和单元都有自己的一套数据分析工具或手段,单从某一视角,如从某个维度、线索对数据进行重构或再检索,甚至引入一系列数据的观测和采集,这必然引发追加IT投入,造成大的投入困境。

对策:全局专题分析即是大数据明显的优势,又是大数据前期应用的短板,维持有必要以专题应用为导向,向全局大数据架构分析平台发展,以支持众多以专题分析、规模化应用的角度提升IT应用的产出比。以学生跨画像专题为例,需强调专题应用开发的特点、专题应用如何引导专题数据架构、专题应用如何验证IT投入,学生画像专题应用通过数据整合、分析挖掘出每个学生学习及生活状态,其中学习状态下涵盖专业课、选修课、体育课、自习、借书等为多,生活状态下涵盖吃饭时间、锻炼情况、经济情况、消费情况、同学关系等为多。建立学生在排名、预测方面的内容。

5.人机查询丰富,学习机制简单。

数字化校园中的系统大多是事务处理系统和管理信息系统,决策支持和管理系统少,系统的学习机制侧重于个性化服务。随着大数据应用的规模化推广,尤其是对某群体资源包、历史数据进行策略提取时,学习机制变得复杂化。

对策:机器学习和可视化技术成为场景知识表达的利器,关注问题的表达和结构的可视化,将对教育资源的深度利用和体验为重点。以评教模型的优化为例,通过建立学生课程评教、问卷调查及同行评教的多模式评教方法,当评教模型面临的决策冲突、个案冲突反映的模型缺陷,通过机器学习机制,规避这种缺陷引起对评价模型的不信任。

问卷调查评教

学生课程评教

6.数据挖掘有余,场景开发不足。

以业务为中心的数字化校园建设很重视对历史数据的挖掘分析,但这些分析多侧重于决策参考与知识发现,数据多来自于数据局势、多维数据分析角度。随着教育科学化、规模化管理的日益增强,教育管理的决策点也在不断增加和更替,动态提供面向不同决策场景的支持工具。

对策:提供众创微服务开发工具和平台,使开发成为解释和洞察数据的工作。以互联开放大数据众创平台经验为例,需做以下几方面的工作:通过微服务提供微决策的支持;微服务开发中的构件化、可视化、服务化开发模式,代码自动生成、实施加载动态运行;微开发中场景的应用、用户的参与都是需要关注的。

微服务平台架构

三、总结

深化教育信息资源的应用需要在深化管控、深化交汇、深化模型、深化专题、深化交互、深化规模上进行教育资源的应用。其中在深化管控方面进行统一规划、分步实施,标准化执行;在深化交汇方面建立统一数据资源目录和交换平台;在深化模型方面重视共性特征的领域模型;在深化专题方面以专题应用方式引导大数据平台总体架构;在深化交互方面关注于问题表达和结果可视化;在深化规模方面以微服务开发方式提供微决策支持。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
81 2
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
1月前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
2月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
134 4
|
2月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
2月前
|
SQL 存储 大数据
单机顶集群的大数据技术来了
大数据时代,分布式数仓如MPP成为热门技术,但其高昂的成本让人望而却步。对于多数任务,数据量并未达到PB级,单体数据库即可胜任。然而,由于SQL语法的局限性和计算任务的复杂性,分布式解决方案显得更为必要。esProc SPL作为一种开源轻量级计算引擎,通过高效的算法和存储机制,实现了单机性能超越集群的效果,为低成本、高效能的数据处理提供了新选择。
|
3月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
572 7
|
2月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
70 2
|
15天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试

热门文章

最新文章