专访 MindSpore 黄之鹏:社区治理与商业创新的开源双重奏

简介: 专访 MindSpore 黄之鹏:社区治理与商业创新的开源双重奏

吐槽大会你一定听说过,但你参加过 AI 开源吐槽大会吗?

一年多前,MindSpore 正式开源,自此之后,各类别出心裁的运营活动 —— 吐槽大会、Women In Tech 层出不穷……

开发者们不再为 AI 应用开发门槛太高而踌躇,不再被枯燥无味的文档拒之门外,MindSpore 依靠其在深度学习框架领域的积累和形式多样的开发者活动,聚集了一批中国 AI 新生代力量。

今年的 OSCAR 开源产业大会,也设置了开源社区治理与运营分论坛,在会前我们特别采访了在这一领域极具特点的开源项目代表 ——华为昇腾开源生态总监, MindSpore 开源社区运营负责人,黄之鹏。

深度学习框架正在进入全场景 AI 计算框架新时代

思否什么是 MindSpore?

黄之鹏:MindSpore 是华为开源的一款全场景 AI 计算框架,旨在提供友好设计、高效运行、简捷部署的开发体验,目前应用于医疗、金融、科研等多个领域,提供面向端边云多种场景的主流硬件支持,并针对昇腾硬件平台提供深度优化能力。

思否谈竞争 — 热门的 AI 领域,MindSpore 竞争力何在?

黄之鹏:我们认为应该用发展的眼光看问题,深度学习框架的发展经历了浅层框架时代和通用框架时代,Caffe、Theano 以及 Tensorflow、PyTorch 分别是前后两个时代的典型代表。深度学习框架目前正在进入以 MindSpore 为代表的全场景 AI 计算框架的新时代

MindSpore 社区将通过开源协作,以社区的力量共同努力解决这个新时代的许多新问题,相信也会有大量的业界专家与新一代开发者会深入地参与到这个伟大的变革之中,成为 MindSpore 生态的主力军。

MindSpore 自身提供的极佳的 AI+科学计算能力,包括自动微分能力、能够支撑千亿稠密模型的自动并行能力、高阶优化能力、图算融合能力、全场景协同能力、AI 可信能力等等。

目前开源仅一年多时间,MindSpore 下载量已接近 60 万,2600+ 社区贡献者,服务企业数量超过 5000 家,高校授课、众智、科研合作超过 100 家,ModelZoo 中已有 170+主流网络模型实现。

Community>Code:完整运营方法论、立足中国的国际化社区

思否作为国内第一个采用开放社区治理的深度学习开源框架,目前社区治理框架是否已经完善?取得了哪些成绩?

黄之鹏:开源社区的治理框架同代码一样,也是处于持续的演进之中。

MindSpore 社区目前对社区治理的理解由三个部分组成:开放性、可信性、多样性

开放性:MindSpore 目前拥有来自欧洲、亚洲、美洲的14 名技术专家的技术治理委员会(TSC),由开发者组织的兴趣小组(SIG)工作组(WG)。社区所有组织的会议都要求公开、透明,会前有预告会后有录屏,这保证了开发者对 MindSpore 社区的开放性的信任,反过来也推动了 MindSpore 社区的快速成长。

可信性:MindSpore 社区积极参与 OSCAR 社区及信通院牵头组织的开源可信工作,分享了社区开发者体验 SIG 的大量优秀实践,成为全国首批获得可信开源社区评估证书中的唯一一个 AI 开源项目,并成为可信开源社区的发起成员之一。

多样性:我们在国内和海外,通过组织面向本地开发者、高校师生、上下游企业的社群MindSpore Study Group, 将来自不同文化、习俗、族群、专业、行业的 AI 爱好者,都纳入到社区大家庭中。比如最具特色的 MSG·Women In Tech 活动,在北京上海深圳等地都组织了当地女性开发者社区,更好的推动社区对多样性的支持,弘扬包容的社区文化。

思否看到 MindSpore 举办的线上线下活动皆受到了广泛关注,吐槽大会等创新形式一片好评,有哪些方法论可以和我们分享?

黄之鹏:非常感谢对社区运营工作的认可!我们的社区运营工作有一整套的方法论和制度保证。

在形而上的层面,提出价值框架理论,以价值主义和框架主义的观点,统领我们的具体工作

在具体实施层面,社区运营工作分为四大层面:运营平台、社区治理、开源合作以及基础设施

  • 其中运营平台作为重中之重,以模型的思维和产品迭代的思路,打造集品牌营销、内容制作与传播、社群活动、技术培训等服务能力的平台化产品;
  • 社区治理则通过引入开放治理架构、打造可信开源社区、弘扬性多样性包容文化,来推动开放协作创新;
  • 开源合作侧重于面向业界现有主流开源社区及基金会的广泛合作,比如与 CNCF 基金会的 Kubeflow 和 Volcano 项目这样的技术合作,也有和开放原子基金会合作的开源运营手册这样把社区运营都开源出来的运营合作;
  • 基础设施包括大量的 CI 机器人、开发者体验机器人、同步机器人、CI 集群、数据化运营面板的构造。
  • yy.png
  • 思否:MindSpore 在国际接轨上如何考虑?在国际化市场中有怎样的战略和策略?

黄之鹏:MindSpore 从初始就秉承打造立足中国的全球化开源社区的理念,与全世界的深度学习开发者一起构筑生态。我们选择国内的代码托管平台作为主仓正是立足中国的体现,但同时也通过打造实时同步机器人等社区工程化手段,在 GitHub 维护可以进行开发和接受贡献的镜像仓库,方便世界其他地方的开发者参与社区。

开源社区内生就是国际化的开发者共享、共建、共治的生态圈,因此不存在特定的国际化战略和国内、国外市场不同策略的概念。但是社区非常重视各个地区在文化上、制度上等方面的特异性,因此社区通过发起面向本地开发者的 MindSpore Study Group 社群,尽可能通过去中心化的自组织行为,繁荣所在地的开发者生态,并合规的开展社区活动。我们也通过与 Eclipse 基金会、Linux 基金会等全球性重量级基金会的合作,在 AICE Lab、LFAI、Confidential Computing Consortium 等领域扩展全球开发者生态。

思否:未来一年 MindSpore 在技术和社区上有什么发展规划和目标?

黄之鹏:在技术整体层面上,MindSpore 仍然会持续推动全场景 AI 计算框架这个新时代的发展,具体的技术方向上,则会由社区的各个组织,按照 3 个月的版本周期,来依据规章决策和推动。

MindSpore 开源社区将持续尝试更多有益的尝试,在世界上更多的地方发展我们的开发者生态,并加大制度创新的推动,力争成为最为专业和体系化运作管理的开源社区。

开源助力商业成功,商业生态是开源大生态的价值组成

思否:如何看待开源与商业化之间的矛盾与联系?MindSpore 在商业化上目前进展如何?

黄之鹏:开源与商业并不存在矛盾,在微观的层面上,开源运营是助力商业成功的一个有效手段,而在更宏观的层面上,商业生态则是开源大生态的一个不可或缺价值组成部分

MindSpore 目前在最主要的国计民生行业都有很多的解决方案,一些实际案例比如携手宝德打造的 AI 质检一体机方案,与立得空间在高精度地图生产软件方面的合作等等。

相关文章
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(上)
大模型与数据分析:探索Text-to-SQL(上)
5814 0
|
5月前
|
SQL 人工智能 安全
MCP 的 AI 好搭档
本文介绍了MCP(模型上下文协议)及其在AI领域的应用前景。MCP由Anthropic公司推出,通过标准化通信协议实现AI与数据源间的安全隔离,解决了传统AI应用中的数据隐私和安全问题。文章探讨了从LLM到MCP的进化过程,并分析了其面临的挑战,如算力不足和开放性需求。Serverless技术被提出作为解决这些问题的方案,提供弹性算力和支持安全沙箱环境。最后,文章提供了如何一键部署热门MCP Server的教程,帮助开发者快速上手并体验该协议的实际应用效果。
579 111
|
5月前
|
数据采集 JavaScript 前端开发
Pyppeteer实战:基于Python的无头浏览器控制新选择
本文详细讲解了如何使用 Pyppeteer 结合爬虫代理高效采集小红书热点推荐信息。通过设置代理 IP、Cookie 和自定义 User-Agent,突破目标网站的反爬机制,实现标题、内容和评论的数据提取。文章结合代码示例与技术关系图谱,清晰展示从数据采集到分析的全流程,为复杂网站的数据获取提供参考。读者可在此基础上优化异常处理、并发抓取等功能,提升爬虫性能。
317 8
|
11月前
|
数据可视化 Python
Visdom可视化学习笔记(一):通过visdom画曲线和显示图片总结
关于如何使用Visdom进行数据可视化的教程,包括画曲线、显示图片和文本等操作。
318 0
Visdom可视化学习笔记(一):通过visdom画曲线和显示图片总结
|
IDE Android开发 iOS开发
Android VS iOS:哪个操作系统更适合开发者?**
**在移动应用开发领域,Android和iOS是两大主流操作系统,它们各自拥有独特的特点和优势。本文探讨了Android和iOS操作系统在开发者视角下的差异与优劣,分析了它们在开发环境、用户群体、市场前景等方面的比较,帮助开发者选择最适合他们需求的平台。
291 29
|
9月前
|
存储 缓存 物联网
MNN推理框架将大模型放进移动端设备,并达到SOTA推理性能!
随着移动端(手机/平板等)算力、内存、磁盘空间的不断增长,在移动端部署大模型逐渐成为可能。在端侧运行大模型,可以有一系列好处:去除网络延迟,加快响应速度;降低算力成本,便于大规模应用;不需数据上传,保护用户稳私。
1511 13
MNN推理框架将大模型放进移动端设备,并达到SOTA推理性能!
|
11月前
|
运维 监控 网络协议
|
机器学习/深度学习 PyTorch 算法框架/工具
数据平衡与采样:使用 DataLoader 解决类别不平衡问题
【8月更文第29天】在机器学习项目中,类别不平衡问题非常常见,特别是在二分类或多分类任务中。当数据集中某个类别的样本远少于其他类别时,模型可能会偏向于预测样本数较多的类别,导致少数类别的预测性能较差。为了解决这个问题,可以采用不同的策略来平衡数据集,包括过采样(oversampling)、欠采样(undersampling)以及合成样本生成等方法。本文将介绍如何利用 PyTorch 的 `DataLoader` 来处理类别不平衡问题,并给出具体的代码示例。
2437 2
|
算法 PyTorch 算法框架/工具
论文解读:LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions
论文解读:LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions
1253 0
|
缓存 监控 架构师
Linux 性能分析工具汇总
Linux 性能分析工具汇总
311 0