深度学习框架向下接壤底层芯片,向上承接软件应用,是推动人工智能应用大规模落地的关键力量,也在人工智能技术体系中占据了重要地位。在国家“十四五”规划中,深度学习框架被列入“新一代人工智能”领域,成为国家重点支持的前沿创新技术。
2022 年 4 月 11 日的《极客有约》邀请到了华为昇腾开源生态总监、OpenI 启智社区技术委员会委员黄之鹏老师,以深度学习框架为切入点,探讨人工智能领域的技术应用与突破这一主题。黄老师目前担任华为昇腾开源生态总监,负责昇思 MindSpore 开源社区的建设,同时担任 OpenI 社区、LFAI 基金会、私密计算论坛等开源组织的技术委员会的委员职务,是 Kubernetes Policy 工作组以及 CNCF 基金会安全兴趣组中 Policy 团队负责人、OpenStack Cyborg 项目创始人,并带领团队参与 ONNX、Kubeflow、Akraino 等开源社区。本期访谈中,黄老师分享了国产深度学习框架的相关信息,并对人工智能开源社区的发展与未来方向做了评论。
从通信技术到人工智能基础开源事业
对于很多 IT 从业者来说,人工智能是一个充满挑战的未知领域,向这一领域探索的过程往往令人生畏。黄老师本人是研究通信技术出身,但在最初接触人工智能技术后他意识到,很多人工智能的基础算法和理论与通信技术涉及的算法在数学上是非常相似的。例如通信行业常用的滤波器算法就与人工智能研究中的常用算法相近。正是由于这个契机,黄老师开始了他的人工智能研究事业。
黄老师的工作主要集中在人工智能的上游开源社区上,整体偏向于人工智能领域的基础软件层面。在探索人工智能技术的过程中,他为希望了解这一行业的小伙伴们推荐《GEB》和《我是个怪圈》这两本著作(作者均为侯世达),希望这两本书能够帮助大家了解这个行业。
在从事人工智能开源事业的这些年间,黄老师也见证了很多值得纪念的时刻,收获了许多有价值的经历。让他感触最深的就是开源社区有很多可爱的小伙伴,在河南水灾、上海疫情等期间站出来贡献自己的知识和能力,展现出了社区有爱、有担当的开源文化。与追求明确目标的商业行为不同,开源的灵魂在于行动本身。开源的道路上充满着不确定性,但只要从业者发自内心地做对一件又一件事情,那么开源成果就会水到渠成。面对不确定的未来,从业者更多会依赖感性、直观的判断,遵从自己内心的指引来走出一条前景广阔的道路。
刚刚接触开源社区时,另一件事情也让黄老师记忆犹新。很多国人对美国人有着生性懒惰的刻板印象,但黄老师却发现国外的开源从业者在实际工作中像华人一样非常努力。他们为了更好地与来自全球的同事与合作伙伴协作,尽量克服时差的影响,每天都会晚睡早起,尽快答复来自中、印、日等国家开发者的提问。这种忘我的协作精神是开源社区非常普遍的,也是有志于开源事业的技术人需要学习和坚持的。
对于刚刚接触开源领域的开发者来说,正确选择自己的第一个入门项目是非常重要的,对此黄老师也给出了自己的建议。黄老师认为,新人应该选择自己最熟悉的、最擅长的领域来挑选入门项目,然后研究相关的论文、跟随项目进展,逐渐融入项目的开发工作,就可以自然而然地迈过这一门槛。
除此之外,新入行的开发者要锻炼自己阅读论文的能力,具备人工智能学习必备的一些数学技能,为自己的入门打好知识基础。找好工具也是很重要的,黄老师推荐了昇思 MindSpore 社区的 TinyMS 高阶 API 套件,该套件位于昇思 MindSpore 框架上,提供了六七个接口,让初入行的开发者也能很简单地写出一个神经网络,做到快速入门。
最后,黄老师也建议新人尽快参与到人工智能的开源社区,与社区中的专家、小白多多交流,这样就能尽快熟悉人工智能技术,让自身的能力得到快速提升。
深度学习领域的技术应用与突破
在国家“十四五”规划中,“深度学习框架”被列入到“新一代人工智能”领域,成为国家重点支持的前沿创新技术。那么要选择一个得心应手的深度学习框架需要从哪几方面去衡量?目前主流的开源深度学习框架有哪些?针对这两个问题,黄老师给出了自己的答案。
今天的深度学习框架已经经过了三代发展,最新一代的代表能力就是人工智能与科学计算。优秀的深度学习框架必备的技能就是很好地支撑人工智能与科学计算的结合应用。与此同时,新一代框架应该能够支持泛化能力很强的大规模基础模型。最后,高水平的深度学习框架还要具备全场景的应用能力,从云端大规模训练到智能边缘、嵌入式场景都能一站式提供解决方案。值得一提的是,昇思 MindSpore 深度学习框架就是具备以上三方面的能力,拥有顶级生产能力的深度学习框架代表之一,也是国产深度学习框架中的佼佼者,在全球的影响力都在日益增长。
很多人认为,开源事业是帮助国产深度学习框架等技术实现跨越式发展,缩小与国际先进水平差距的一种捷径,对此黄老师有着不同的看法。黄老师认为,前沿技术的发展根本仍在于技术创新,在于技术人员踏踏实实的研究和实践。开源是帮助创新的最佳方式,但并不是实现跨越式发展的捷径。开源最重要的是不确定性,用开源的方式帮助核心技术去发展生态时,带来的最大好处就是不确定性。我们不知道通过开源的方式能吸引来什么样背景的专家加入,不知道他们会提出哪些非常好的建议。
昇思 MindSpore 的发展故事就是国产开源项目的典型成功案例。昇思 MindSpore 发展两年来,每一个版本都在不断添加新内容,尽量从完全原创的角度实现一个个特性,从 0 到 1 缓慢而坚定地构建框架的技术基础。与其他开源深度学习框架相比,昇思 MindSpore 最核心的不同点就是后者优化的对象是华为自主研发的昇腾 AI 硬件平台。昇思 MindSpore 支持主流 CPU、GPU,对昇腾有深度优化,所以在昇腾平台上跑同类任务有着最优的表现。昇思 MindSpore 还是一个非常通用的全场景框架,可以在各个领域都有很好的应用能力,这也是它的核心优势之一。
开源项目的治理经验
截至目前,昇思 MindSpore 框架的用户下载量已突破 140 万, 服务 5000 多家企业, 码云和 Github 上的总 Stars 数已达 1.7 万+,社区贡献者有 4000 多名。从项目启动到今天这样繁荣活跃的生态过程中,黄老师也积累了很多开源项目的治理经验。
首先,开源社区的治理可以分为三个纬度。最重要的纬度是开放性。昇思 MindSpoer 社区诞生时,是企业推动开源框架中第一个采用开放模式的。昇思 MindSpore 社区有一套公开章程,对整个社区的结构都有无微不至的规范,社区所有的机构都是按照这个章程运作。社区技术委员会组建的第一天起就是全球性的,14 名代表来自中国、欧洲、美国,这是一个开放治理的社区,很多事情都会通过投票解决,并有很多机制来收集大家的意见。
第二个纬度叫多样性。昇思 MindSpore 有很多手段来保障社区的多样性,首先是 MindSpore Study Group(MSG),通过它将不同城市、企业、高校的开发者组织起来,参与到平等的社区中进行各种活动。其次,社区会组织很多专题活动,做得最有特色的是 WomenTag,专注于科技从业女性这一主题。这一活动的宗旨在于帮助科技行业女性从业者通过作坊的形式分享职场与生活中遇到的问题,交流各种经验。
最后一个维度叫可信性。企业需要对开源软件具备充分的信任才会去使用,昇思 MindSpore 会与很多标准组织、产业组织合作推动开源社区的信任标准建设,帮助社区在企业界建立信任度。这三个纬度构成了昇思 MindSpoer 社区整体构建、社区治理的主要框架。
OpenI 启智社区介绍
昇思 MindSpore 和 OpenI 启智社区的合作是非常紧密的。黄老师参与启智社区的时间比昇思 MindSpore 都更久一些,因此对启智社区也有很深的了解。
启智社区是国内第一个是专注于人工智能的开源社区,成立之初就设计了非常完备的社区章程。启智社区非常重视开源和知识产权的结合,探索出了很多符合国情的开源知识产权管理方法,很好地帮助了更多科研院校和企业放心地应用开源、贡献开源。
启智社区的另一大特点是项目种类极多,对人工智能各个领域感兴趣的从业者都可以在启智社区中找到自己非常喜欢、非常感兴趣的项目。启智社区还会组织很多项目宣讲会,还会举办启智集结号活动。在集结号活动中,很多高校的学生可以在放假时集中到一起,完成组织者设计的一些任务,了解人工智能开源领域的前沿进展。类似的活动还能帮助国内很多关注开源事业的老师熟悉开源项目的运作机制,让他们能够更好地发起开源项目、锻炼自己的组织能力。
开源社区的年轻化趋势
参与启智社区集结号活动的主要是高校学生,昇思 MindSpore 社区的布道师、开发者也有很多都是在校本科生、研究生,博士生。针对这一现象,黄老师认为年轻人更愿意讲述自己的故事,更愿意分享、协作,有更多朝气与活力。另外,人工智能现在还属于朝阳产业,越来越多的高校会开设人工智能专业,越来越多的年轻人正在踏入人工智能行业。这是一个很好的现象。
但年轻化趋势也带来一个挑战,就是商业人群很难严肃地看待人工智能的开源事业。他们会有偏见,认为这只是花钱带小孩子搞活动。但实际上专业开源社区建设是非常严肃的工作,日常活动非常枯燥。它与生产线上做产品没有任何区别,社区的每一个服务都是一个精心打造的产品,也需要交付、迭代、不断复盘。所以黄老师希望大家能消除这种偏见,意识到这是年轻人做的一件专业、严肃的事情。