解码 AI 开源的技术应用与未来趋势

简介: 深度学习框架向下接壤底层芯片,向上承接软件应用,是推动人工智能应用大规模落地的关键力量,也在人工智能技术体系中占据了重要地位。在国家“十四五”规划中,深度学习框架被列入“新一代人工智能”领域,成为国家重点支持的前沿创新技术。

深度学习框架向下接壤底层芯片,向上承接软件应用,是推动人工智能应用大规模落地的关键力量,也在人工智能技术体系中占据了重要地位。在国家“十四五”规划中,深度学习框架被列入“新一代人工智能”领域,成为国家重点支持的前沿创新技术。

2022 年 4 月 11 日的《极客有约》邀请到了华为昇腾开源生态总监、OpenI 启智社区技术委员会委员黄之鹏老师,以深度学习框架为切入点,探讨人工智能领域的技术应用与突破这一主题。黄老师目前担任华为昇腾开源生态总监,负责昇思 MindSpore 开源社区的建设,同时担任 OpenI 社区、LFAI 基金会、私密计算论坛等开源组织的技术委员会的委员职务,是 Kubernetes Policy 工作组以及 CNCF 基金会安全兴趣组中 Policy 团队负责人、OpenStack Cyborg 项目创始人,并带领团队参与 ONNX、Kubeflow、Akraino 等开源社区。本期访谈中,黄老师分享了国产深度学习框架的相关信息,并对人工智能开源社区的发展与未来方向做了评论。

从通信技术到人工智能基础开源事业

对于很多 IT 从业者来说,人工智能是一个充满挑战的未知领域,向这一领域探索的过程往往令人生畏。黄老师本人是研究通信技术出身,但在最初接触人工智能技术后他意识到,很多人工智能的基础算法和理论与通信技术涉及的算法在数学上是非常相似的。例如通信行业常用的滤波器算法就与人工智能研究中的常用算法相近。正是由于这个契机,黄老师开始了他的人工智能研究事业。

黄老师的工作主要集中在人工智能的上游开源社区上,整体偏向于人工智能领域的基础软件层面。在探索人工智能技术的过程中,他为希望了解这一行业的小伙伴们推荐《GEB》和《我是个怪圈》这两本著作(作者均为侯世达),希望这两本书能够帮助大家了解这个行业。

在从事人工智能开源事业的这些年间,黄老师也见证了很多值得纪念的时刻,收获了许多有价值的经历。让他感触最深的就是开源社区有很多可爱的小伙伴,在河南水灾、上海疫情等期间站出来贡献自己的知识和能力,展现出了社区有爱、有担当的开源文化。与追求明确目标的商业行为不同,开源的灵魂在于行动本身。开源的道路上充满着不确定性,但只要从业者发自内心地做对一件又一件事情,那么开源成果就会水到渠成。面对不确定的未来,从业者更多会依赖感性、直观的判断,遵从自己内心的指引来走出一条前景广阔的道路。

刚刚接触开源社区时,另一件事情也让黄老师记忆犹新。很多国人对美国人有着生性懒惰的刻板印象,但黄老师却发现国外的开源从业者在实际工作中像华人一样非常努力。他们为了更好地与来自全球的同事与合作伙伴协作,尽量克服时差的影响,每天都会晚睡早起,尽快答复来自中、印、日等国家开发者的提问。这种忘我的协作精神是开源社区非常普遍的,也是有志于开源事业的技术人需要学习和坚持的。

对于刚刚接触开源领域的开发者来说,正确选择自己的第一个入门项目是非常重要的,对此黄老师也给出了自己的建议。黄老师认为,新人应该选择自己最熟悉的、最擅长的领域来挑选入门项目,然后研究相关的论文、跟随项目进展,逐渐融入项目的开发工作,就可以自然而然地迈过这一门槛。

除此之外,新入行的开发者要锻炼自己阅读论文的能力,具备人工智能学习必备的一些数学技能,为自己的入门打好知识基础。找好工具也是很重要的,黄老师推荐了昇思 MindSpore 社区的 TinyMS 高阶 API 套件,该套件位于昇思 MindSpore 框架上,提供了六七个接口,让初入行的开发者也能很简单地写出一个神经网络,做到快速入门。

最后,黄老师也建议新人尽快参与到人工智能的开源社区,与社区中的专家、小白多多交流,这样就能尽快熟悉人工智能技术,让自身的能力得到快速提升。

深度学习领域的技术应用与突破

在国家“十四五”规划中,“深度学习框架”被列入到“新一代人工智能”领域,成为国家重点支持的前沿创新技术。那么要选择一个得心应手的深度学习框架需要从哪几方面去衡量?目前主流的开源深度学习框架有哪些?针对这两个问题,黄老师给出了自己的答案。

今天的深度学习框架已经经过了三代发展,最新一代的代表能力就是人工智能与科学计算。优秀的深度学习框架必备的技能就是很好地支撑人工智能与科学计算的结合应用。与此同时,新一代框架应该能够支持泛化能力很强的大规模基础模型。最后,高水平的深度学习框架还要具备全场景的应用能力,从云端大规模训练到智能边缘、嵌入式场景都能一站式提供解决方案。值得一提的是,昇思 MindSpore 深度学习框架就是具备以上三方面的能力,拥有顶级生产能力的深度学习框架代表之一,也是国产深度学习框架中的佼佼者,在全球的影响力都在日益增长。

很多人认为,开源事业是帮助国产深度学习框架等技术实现跨越式发展,缩小与国际先进水平差距的一种捷径,对此黄老师有着不同的看法。黄老师认为,前沿技术的发展根本仍在于技术创新,在于技术人员踏踏实实的研究和实践。开源是帮助创新的最佳方式,但并不是实现跨越式发展的捷径。开源最重要的是不确定性,用开源的方式帮助核心技术去发展生态时,带来的最大好处就是不确定性。我们不知道通过开源的方式能吸引来什么样背景的专家加入,不知道他们会提出哪些非常好的建议。

昇思 MindSpore 的发展故事就是国产开源项目的典型成功案例。昇思 MindSpore 发展两年来,每一个版本都在不断添加新内容,尽量从完全原创的角度实现一个个特性,从 0 到 1 缓慢而坚定地构建框架的技术基础。与其他开源深度学习框架相比,昇思 MindSpore 最核心的不同点就是后者优化的对象是华为自主研发的昇腾 AI 硬件平台。昇思 MindSpore 支持主流 CPU、GPU,对昇腾有深度优化,所以在昇腾平台上跑同类任务有着最优的表现。昇思 MindSpore 还是一个非常通用的全场景框架,可以在各个领域都有很好的应用能力,这也是它的核心优势之一。

开源项目的治理经验

截至目前,昇思 MindSpore 框架的用户下载量已突破 140 万, 服务 5000 多家企业, 码云和 Github 上的总 Stars 数已达 1.7 万+,社区贡献者有 4000 多名。从项目启动到今天这样繁荣活跃的生态过程中,黄老师也积累了很多开源项目的治理经验。

首先,开源社区的治理可以分为三个纬度。最重要的纬度是开放性。昇思 MindSpoer 社区诞生时,是企业推动开源框架中第一个采用开放模式的。昇思 MindSpore 社区有一套公开章程,对整个社区的结构都有无微不至的规范,社区所有的机构都是按照这个章程运作。社区技术委员会组建的第一天起就是全球性的,14 名代表来自中国、欧洲、美国,这是一个开放治理的社区,很多事情都会通过投票解决,并有很多机制来收集大家的意见。

第二个纬度叫多样性。昇思 MindSpore 有很多手段来保障社区的多样性,首先是 MindSpore Study Group(MSG),通过它将不同城市、企业、高校的开发者组织起来,参与到平等的社区中进行各种活动。其次,社区会组织很多专题活动,做得最有特色的是 WomenTag,专注于科技从业女性这一主题。这一活动的宗旨在于帮助科技行业女性从业者通过作坊的形式分享职场与生活中遇到的问题,交流各种经验。

最后一个维度叫可信性。企业需要对开源软件具备充分的信任才会去使用,昇思 MindSpore 会与很多标准组织、产业组织合作推动开源社区的信任标准建设,帮助社区在企业界建立信任度。这三个纬度构成了昇思 MindSpoer 社区整体构建、社区治理的主要框架。

OpenI 启智社区介绍

昇思 MindSpore 和 OpenI 启智社区的合作是非常紧密的。黄老师参与启智社区的时间比昇思 MindSpore 都更久一些,因此对启智社区也有很深的了解。

启智社区是国内第一个是专注于人工智能的开源社区,成立之初就设计了非常完备的社区章程。启智社区非常重视开源和知识产权的结合,探索出了很多符合国情的开源知识产权管理方法,很好地帮助了更多科研院校和企业放心地应用开源、贡献开源。

启智社区的另一大特点是项目种类极多,对人工智能各个领域感兴趣的从业者都可以在启智社区中找到自己非常喜欢、非常感兴趣的项目。启智社区还会组织很多项目宣讲会,还会举办启智集结号活动。在集结号活动中,很多高校的学生可以在放假时集中到一起,完成组织者设计的一些任务,了解人工智能开源领域的前沿进展。类似的活动还能帮助国内很多关注开源事业的老师熟悉开源项目的运作机制,让他们能够更好地发起开源项目、锻炼自己的组织能力。

开源社区的年轻化趋势

参与启智社区集结号活动的主要是高校学生,昇思 MindSpore 社区的布道师、开发者也有很多都是在校本科生、研究生,博士生。针对这一现象,黄老师认为年轻人更愿意讲述自己的故事,更愿意分享、协作,有更多朝气与活力。另外,人工智能现在还属于朝阳产业,越来越多的高校会开设人工智能专业,越来越多的年轻人正在踏入人工智能行业。这是一个很好的现象。

但年轻化趋势也带来一个挑战,就是商业人群很难严肃地看待人工智能的开源事业。他们会有偏见,认为这只是花钱带小孩子搞活动。但实际上专业开源社区建设是非常严肃的工作,日常活动非常枯燥。它与生产线上做产品没有任何区别,社区的每一个服务都是一个精心打造的产品,也需要交付、迭代、不断复盘。所以黄老师希望大家能消除这种偏见,意识到这是年轻人做的一件专业、严肃的事情。

目录
相关文章
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
52 10
|
1天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
30 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
4天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
38 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
3天前
|
人工智能 安全 算法
深度剖析 打造大模型时代的可信AI:技术创新与安全治理并重
2024年12月11日,由中国计算机学会计算机视觉专委会主办的“打造大模型时代的可信AI”论坛在上海举行。论坛汇聚了来自多家知名学术机构和企业的顶尖专家,围绕AI的技术风险与治理挑战,探讨如何在大模型时代确保AI的安全性和可信度,推动技术创新与安全治理并行。论坛重点关注计算机视觉领域的最新进展,提出了多项技术手段和治理框架,为AI的健康发展提供了有力支持。
26 8
深度剖析 打造大模型时代的可信AI:技术创新与安全治理并重
|
5天前
|
机器学习/深度学习 人工智能 算法
探索AI在医疗诊断中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状与面临的挑战,旨在为读者提供一个全面的视角,了解AI如何改变传统医疗模式,以及这一变革过程中所伴随的技术、伦理和法律问题。通过分析AI技术的优势和局限性,本文旨在促进对AI在医疗领域应用的更深层次理解和讨论。
|
2天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
22 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
3天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在自然语言处理中的突破:从理论到应用
AI在自然语言处理中的突破:从理论到应用
33 17
|
2天前
|
机器学习/深度学习 传感器 人工智能
AI视频监控系统在养老院中的技术实现
AI视频监控系统在养老院的应用,结合了计算机视觉、深度学习和传感器融合技术,实现了对老人体征、摔倒和异常行为的实时监控与分析。系统通过高清摄像头和算法模型,能够准确识别老人的动作和健康状况,并及时向护理人员发出警报,提高护理质量和安全性。
28 14
|
1天前
|
人工智能 Serverless API
尽享红利,Serverless构建企业AI应用方案与实践
本次课程由阿里云云原生架构师计缘分享,主题为“尽享红利,Serverless构建企业AI应用方案与实践”。课程分为四个部分:1) Serverless技术价值,介绍其发展趋势及优势;2) Serverless函数计算与AI的结合,探讨两者融合的应用场景;3) Serverless函数计算AIGC应用方案,展示具体的技术实现和客户案例;4) 业务初期如何降低使用门槛,提供新用户权益和免费资源。通过这些内容,帮助企业和开发者快速构建高效、低成本的AI应用。
32 12
下一篇
DataWorks