前段时间,蚂蚁金服AI技术在清华经管学院的“商务分析整合实践”课堂上亮相了!这堂课由滴滴高级数据科学家高梓尧老师教授,他在清华大学-哥伦比亚大学商务分析双硕士学位项目的课堂上,给同学们做了精彩介绍,主角就是蚂蚁在2019年开发的SQLFlow。
高梓尧老师在清华经管课堂上介绍SQLFlow
清华经管最具挑战的课程之一
清华经管学院自2018年春季以来推出“商务分析整合实践”课,这门课由清华经管学院副院长、管理科学与工程系徐心教授、刘登攀教授及王纯教授共同担任任课教师。
通过老师们在开课时的详细介绍,我们了解到这门课程的设立旨在通过指导学生参与企业所主导的商务分析项目使其获得真实的业界工作体验,从而加深同学们对商务分析知识的理解,提高其解决实际商务分析问题的能力。
老师们通过让大家参与真实企业项目的形式,采取企业+校园相结合的模式,从而调动大家的主观能动性,促进积极思考,在一边学习一边工作的过程中提升逻辑思维能力,同时体验和感受真实的一线商务分析场景。
课程结束后,这门课程将能够帮助学生增强系统全面地解决实际商务分析问题的能力,使其熟练使用现代企业所常用的商务分析工具,熟悉企业真实的商务分析场景,加强团队合作能力。
这门课程通过小组作业形式,在两个月内共八次的课程中,与多个企业合作,由每组完成一项企业真实项目的课题研究,授课方式是由课程导师+企业导师+小组搭档互评的方式多方位来考核课程成绩,因此不论从时间,还是能力上都充满挑战,有学生称“这是学院最具有挑战的课程之一”。
为什么是SQLFlow
SQLFlow是蚂蚁金服于2019年4月推出的开源项目,简单理解的话,SQLFlow = SQL + AI,你可以把SQLFlow看做一个编译器,它可以把经过扩展的SQL语句翻译成AI引擎能够运行的代码。
SQLFlow的愿景是:推进人工智能大众化、普及化,也就是只要懂商业逻辑就能用上人工智能, 让最懂业务的人也能够自由地使用人工智能。
自开源以来,SQLFlow引起了国内外的广泛关注,并在GitHub上收获超过3600个Star,这在AI领域的开源项目中已经是难能可贵的了。欢迎在GitHub上关注(https://github.com/sql-machine-learning/sqlflow)。
滴滴出行和蚂蚁金服于2019年7月份开始合作进行开源共建。滴滴在商业智能场景里应用了SQLFlow,并给该项目提供了多个高价值模型。本次课程也是在滴滴的这套商业智能系统上完成的。
正因为SQLFlow是滴滴出行在AI应用领域的最新成果之一,而SQLFlow本身“不用很懂编程就能完成人工智能项目”、“产品经理也可以直接建模完成产品需求”、“实现提取数据到建模的一体化”、“SQLFlow可以实现人工智能的大众化和普及化”等理念,让它可以无缝对接大学课堂,让学生们也能领略到最新的企业实践和最前沿的AI技术,因此,SQLFlow很荣幸的入选到课程当中。
SQLFlow的神奇之处
在这次实践课程中,学生们在前期基于传统的机器方法进行建模,算下来从理论知识学习到实操数据处理和建模等环节,整个约占了6天的时间(整个课程一共8天的时间),这其中可以刨去我们理解该业务模型的背景逻辑之外所需要的时间约1-2天,即在学习理论知识、学习Python编程建模、学习机器学习模型基础知识等等一共花费了约5-6天的时间。
而在后期基于SQLFlow的建模仅仅花费半天左右的时间,完成了从了解SQLFlow的语法规则到基于我们的实际需求进行建模。
因此,我们可以很清楚地看到,SQLFlow对于数据分析师来说,可以在短时间内完成一个数据分析项目,降低了学习门槛,提高了工作效率。
除此以外,SQL语法直观并且容易理解,极大地降低了AI算法编程的门槛,用户不需要是精通算法的数据科学家,甚至可以完全不擅长编程,或者对于编程初学者而言,书写代码时耗时耗力,存在篇幅较长又不一定功能正确的问题。
SQLFlow赋能于那些有着业务逻辑但是机器学习建模基础薄弱的人,通过简洁的SQL语法就帮助解决了建模这一痛点。此外,SQLFlow的应用降低了不同职能部门之间沟通的成本。
参加课程的同学们表示,他们在日常完成数据分析任务时所遇到的最大问题是怎样通过正确简明的代码完成复杂模型的构建。这其中会遇到许多算法逻辑和代码语法问题,而解决这些问题需要补充数据结构等一系列算法编程知识,对于有时间限制的完整分析建模项目来说时间与学习成本很高。
而SQLFlow的出现则可以在模型构建上帮助他们简化了很多繁琐的代码过程,极大提高了工作效率。
项目全体成员的合影
经过两个月共八天的项目课程,同学们顺利完成学业,不仅通关了具备挑战性的课程,成功收获学分,也见识了在实际生产中,企业是如何思考和实践的。相信对于他们来说,这将是一段难得的回忆~