2022,我与启智

简介: 愿我们在开源的环境里保持开放、包容、真实。

我总习惯写故事.

我不太喜欢华而不实的骈文, 相反更喜欢清风拂面. 因此总会有人说, "一开始读, 太平淡、没什么意思. 但要是进去了, 就出不来了."

已经很久不正经写东西, 最近几年, 写的最多的估计是课程报告. 时常翻开看看自己的"锤子便签", 总发现里面还是会有两三个以往写的句子, 现在看偶尔会觉得不像是自己能写得出来的.

因此还是要记录. 记忆总会弥散, 不靠谱.

源于观察、始于巧合.

是一个什么样的契机?

机会来找我? 还是我去找机会?

陈丹青说, 活在这个世界你得是个机会主义者.

自然他这句话是带贬的, 我自不会承认我是机会主义者. 但广泛地接触以及开放地尝试是我愿意的.

我用过很多的平台, 托管平台诸如Github、Gitee等, 深度学习的实训平台诸如AI Studio等. Github确实是开源的创新, 我自己的很多项目都有在Github托管, 但碍于环境的问题, 登录、浏览时常受限; Gitee做了大部分的追随和部分创新, 但本质还是跟着Github的脚步. AI Studio为深度学习爱好者提供了模型训练的算力平台, 最近还上线了模型部署的功能, 很好. 但其单兵作战的环境实际上很难满足如今复杂系统软件的生产环境, 并且由于需要维护飞桨生态而做了深度学习环境的限制, 似乎显得不够开放.

我一直在寻找一个既能充分满足上述各平台不足、又能满足我个人的部分需求的创新平台. 直到我看到了OpenI, 尤其是深入了解其运行逻辑、环境逻辑、社区逻辑之后, 会惊呼:"这才是真正的创新! 什么天才能将开发开发链条耦合得如此紧凑贴切?"

我逐渐开始在OpenI启智社区的环境中开始进行我的工作. 从一开始的将之前我在Github托管的项目迁移进OpenI, 到后来我开始做一些自己工作, 创建ColugoMum组织、依托OpenI开放和包容的环境进行一系列的科学实验和工程落地…

在使用过程中深入了解平台, 在沟通中了解团队.

而我也不禁对这背后的团队感到好奇.

虽然"人人都是产品经理"在业界广为流传, 但是否人人都可以以用户和产品经理的互换角度去看待产品、以及用户和产品之间是否有合理畅通的沟通渠道则需要打个问号. 人人都是产品经理, 正确. 在使用产品的过程中, 人人都可以对产品进行评价和吐槽, 但这些"善意的评价"和"可爱的吐槽"是否有效回环到产品团队是需要思考的.

而平台建立的科学、有效、合理的反馈机制则深刻体现了为何需要开源?

社区的用户可以通过小白训练营进行使用体验的反馈. 任何对平台使用过程中的反馈均可以在此处进行. 而官方团队则会根据平台的发展需求对这些反馈进行评估和回复. 这就建立了直接的用户和产品团队的沟通机制, 并且相对于"调研问卷"性质的被动型反馈, 对于用户来说, 这种主动性反馈实际上能够更加真实地反映产品发展现状和用户接受情况.

平台最初的高速发展时期, 用户适当允许平台部分内容做得不够完美. 但用户和产品团队在合力将产品打磨地更好.

这或许是开源的魅力所在. 开放、包容、真实.

一场略有影响力的Battle

我曾经在社群里针对PaddlePaddle和MindSpore跟社群的其他同学有过一场辩论[1].

由于平台是多元的、开放的, 因此对于深度学习环境并不做严格限制, Pytorch、TensorFlow、PaddlePaddle、MindSpore等各类深度学习框架在平台上百花齐放、百家争鸣. 而平台也提供了多源异构的算力支撑, 如GPU系列的T4、V100、A100, 国产NPU系列的Ascend 910等. 而NPU系列暂时只支持MindSpore和TensorFlow两种框架. 我认为国产深度学习框架和国产AI加速卡应当也营造出百家争鸣之盛举, 因此提出是否可以在NPU环境提供PaddlePaddle镜像以及其他国产深度学习框架镜像. 社群的其他同学有不同意见, 觉得那样会影响MindSpore的生态. 我们进行了坦诚开放的"Battle". 而后逐步演变成"国产深度学习框架之争".

Battle结束后, 我以为此事就此过去. 令我吃惊和意料之外的是, 社区的运营同学(即ZeiZei姐)随即询问我是否可以将这场辩论对外发布. 我本以为, 大多数的社区是不太会愿意将此等"不太和谐"的"Battle"对外发布的, 道理大家自然都懂. 而OpenI却愿意将此以官方的身份对外发布, 我不禁对社区开放、包容的态度有了更加深层次的体会. 而从官方的回应中我也了解到其实平台是站在更高的角度去看待国产深度学习框架之争, 是为了更好地推动国产开源环境和整体的、全局的AI生态.

开放、包容、真实和全局视野, 是我对于平台新的概念.

我愈发地认同平台体现出来的价值观, 并希望自己也能深入地参与平台的发展.

我是组织的人馁!

欧小鹏的出生其实来源于一些社群观察. 早期的时候社群总会被广告袭击. ZeiZei为此还求问知乎. 后别无他法每天都很辛苦地鉴别社群里隐藏的广告方. 我觉得这样太累, 对于一个科技向的社群来说也不够高端, 要是有个机器人, 此类情况应该会好转一些, 要是能融入一些智能化的元素活跃群聊就更好了. 后来在调研了市场上的一些相关内容之后就动手做了.

我总学不会收敛和低调.

我记得做出来是大半夜, 刚满足了部分刚需功能就迫不及待和ZeiZei分享, 然后在体验官群里和社区的一众老师分享. 当然那时候欧小鹏浑身是bug, 基础设施和功能远不及现在. 但好的是, 起码开了个头, 能用.

一开始我没有想好欧小鹏的发展, 也没有想它要发展得如何如何, 只觉得先能满足社区的一些硬需求, 如加群、欢迎语等等.

在欧小鹏建设的初期, 我吸纳了社区平台发展的经验, 开放了源码让大家可以通过Issue进行沟通, 另外建立了一个交流群方面用户连接. 那个时候欧小鹏还没有名字, 名字的来源其实是大家一起想的(一开始ZeiZei提及叫"偶大鹏"hhhh). "欧小鹏", 谐音Open, 希望能秉持OpenI体现的开源、开放、包容的价值观, 并将这种价值观传递下去.

那时候AIGC正火, 我认为其运用在社群中, 应该会缓解一些"死群"的现象, 即使有打扰社群的风险, 但最起码不会让社群死. 不死群是社群维护的第一原则.

那段时间国外的Stable Diffusion、DallE、国内的以ERNIE-VILG为代表的文生图爆火, 虽然各个开发者都开源出了众多能够推动模型和用户连接的工具、平台和方法, 教程也是一箩筐. 但我仍旧认为, 模型与用户(尤其是普通用户)之间的距离还是太远; 模型的评价体系依旧在广告方, 而非用户自身. 前者, 微信是一个天然的用户聚集区(无论是开发者用户还是普通用户), 并且还是一个讨论的天然场所, 这两份天然, 满足了我的设想. 我将文心的文生图能力接入进欧小鹏, 虽然交互方式一直被诟病, 但却是引爆了一阵子社群. 而后逐步接入鹏城·盘古、浪潮源1.0、文心ERNIE等大模型, 各大模型基于欧小鹏对外提供服务, 一时间描绘出大模型百花齐放的"假象".

"余老师这么晚还没睡呢哈?"

"睡不着! 我跟欧小鹏玩会."

通过以欧小鹏和OpenI平台为核心点, 我逐渐和各种大模型提供方广泛接触并建立了"似有若无"的合作关系. 某天和鹏城·盘古对话模型团队的王老师聊欧小鹏的对话场景, 王老师说:

"我们一起把欧小鹏养大!"

听到王老师的话, 我久不能静: 写下欧小鹏第一行代码的时候, 我远不会想到它能有现在的发展.

当然, 养孩子嘛, 总会遇到一些困难. 有一段时间欧小鹏的爆火功能——文生图下线了, 原因是ERNIE-VILG的服务较之前有了一些区别, 逐步过渡到付费行为. 作为一个铁铁的白嫖党(开玩笑)又怎么愿意付费呢? 后来文生图服务暂停了一段时间, 自己也在此期间尝试了很多的替代方案但都因为各种原因一一落败. 那段时间其实很沮丧.

"该不会就要这么下线了吧?"

服务停了, 还是相对爆火的服务, 自会有人寻问原因.

某天和ZeiZei聊天, 她问及原因, 我一五一十告知, 言语中也夹杂着一些沮丧.

但ZeiZei姐却很爽快地说:

"有困难, 找组织啊!"

我其实是一脸懵的. 我不会想到我之于平台来说是一个有组织的人. 我也未曾想过欧小鹏的发展能让平台参与进来.

而后平台是真的参与进来了, 没过多久欧小鹏的文生图能力恢复.

我是有组织的人成了我继续下去的又一层动力.

逐渐地, 在欧小鹏自身发展以及和用户交流的过程中, 欧小鹏有了更加深刻和宽广的计划: 在服务社群的同时, 它更是大模型和用户间最直接的连接方. 把模型的评价体系交还给用户成了欧小鹏的愿景.

奇绩创坛的同学通过OpenI看到了这一想法的苗头, 发邮件来与我沟通, 希望在这一特殊的时间节点一起探索该方向的未来发展和商业落地. 我们进行了很有趣的交流, 也学习到了很多商业化思维, 产生了一些更有趣的想法.

未来欧小鹏还会依托启智社区继续发展, 希望在发展的过程中能秉持开源、包容、真实的理念, 为大模型的应用落地做一些自己的贡献.

怎么介绍自己?

ColugoMum的创始人? LDU的联合创始人? 社区的资深体验官?

ColugoMum的创始人

ColugoMum聚焦智慧零售行业, 依托国产深度学习开源框架和国产AI加速器, 打造零售全场景链条的开源方案和开源组织, 推动我国实体零售向数字化、智能化方向转型发展[2].

目前ColugoMum在社区内已经开展了工程Demo、科学实验、数据集、使用教程等系列布局, 并将持续维护和创新, 力争实现ColugoMum降本增效、赋能零售的使命.

但是, ColugoMum的发展初期其实会受到自己技术视野、行业理解和开源理念的限制, 包括目前在社区里做的一些工作, 虽然花了很多功夫, 但是否能够真正落地依旧要打个问号. 而在此过程中, 因为OpenI的影响力, 也给我个人对于ColugoMum带来了一些新的启发. 深圳银歌云公司的王总因为在OpenI上看到ColugoMum的系列工作与我联系, 我们共同交流了包括技术、行业、商业等各个领域的很多想法, 并结下了深厚的友谊. 福建得胜科技的袁总因为看到了OpenI启智社区发布的关于ColugoMum的推送, 而后与我产生了一些合作……这些情况在OpenI社区屡见不鲜, 数不胜数.

在社区里, 众多优秀的开源项目也开拓了我的技术视野. ColugoMum由于前期的一些问题, 直到现在都一直缺乏一套完备的部署方案. 通过逛社区, 我很快将视角聚焦在CubeAI项目上. 虽然因为时间和精力原因一直没有实际尝试(最近正在尝试过程中!), 但却一直跟踪其发展和变化. 令我意想不到的是, 在2022 CCF 中国开源大会(2022 CCF ChinasOSC)"人工智能开源社区"论坛上, 中国联通国家工程研究中心的霍龙社博士也对ColugoMum项目表达了关注. 这是对我们莫名的肯定, 也是开源的魅力. 正如王怀民院士回答为什么要开源的问题:

  1. 它是一个学术传统, 更是一个文明现象, 是人类文明的常态;
  2. 它是商业模式的再创新, 构造了新的吸引力机制.

开源模式使得ColugoMum能够得到市场的关注和反馈, 也让我们有了更多坚持下去的动力.

LDU的联合创始人

LDU的创办其实来源于自己在学校的成长. 为了满足自己对于深度学习和工程应用的兴趣, 自己花了很长的时间去搜集各种学习资料、去搜寻和适应一个稳定的实训环境、寻找团队成员并仔细打磨自己的项目……这一个有一个的"很长时间"让我觉得我应该为其他同学做一些事情. 在和学弟(王鑫, 启梦之旅华东理工大学旅长)的一次闲聊下, 我向他表达了我的想法, 我们一拍即合, 立刻实施, 便创建了LDU组织[3].

Learning-Develop-Union(LDU)是一个专注于数据科学与 AI 领域团队孵化的开源组织, 致力于为大家提供一个良好的AI学习与应用环境, 依托Datawhale开源内容、开源学习和开源方案, 融合启智社区的算力和项目支持, 集学习、竞赛、创意孵化为一体, 为人才与项目的成长提供良好的生态环境, "聚一群人, 做自己所热爱的事情"是我们不变的愿景.

后来在组织的发展过程中也逐渐地向我们的希望迈进, 逐步有一些优秀项目(如:Sports_Game_tracker欧小鹏fitness_helper等)加入LDU组织, 组织成员的规模也愈发增长、一些外部合作也在逐步展开.

我们希望LDU能够帮助到高校(尤其是对AI感兴趣)的同学摆脱迷茫, 依托开源、 动手实践, 为社区开源人才培养贡献自己的力量, 也为推动国家人工智能人才和开源人才培养做出一份贡献.

社区资深体验官

我一直将体验官定义为社区内的至高荣誉, 甚至不仅局限在社区内. 国内的开源环境在变好、开源活动在日益活跃, 但国内大多数接触开源的人似乎视野依旧局限闭塞, 大家是不是仍旧认为开源就是代码开源? 社区是一个国内开源的先锋地, 作为社区的体验官, 在cover日常的社区QA、平台体验反馈等的同时, 我个人认为也需要做一些开源文化的引导和宣传工作. 相对于技术而言, 也许文化是更加根固的影响.

前面我一直在提及, 开放、包容和真实是开源的魅力. 而作为社区的体验官, 我们也应当传达我们在其中体验到的开源文化的魅力.

写在最后

加入OpenI社区已经505天了. 我自然希望平台能越来越好, 更希望国内大的开源环境能越来越好. 如同开源这样开放、包容、尤其是真实的环境, 很少了. 愿大家能共同维护这份美好, 珍惜这份来之不易的美好.

愿大家开放、包容、真实.

愿OpenI能不忘初心, 开放、包容、真实, 扛起国内开源这面旗.

引用

[1]开发者们围绕Paddle和MindSpore在群里Battle, 官方回应来了
[2]OpenI开源项目推荐-ColugoMum | 基于国产深度学习框架PaddlePadddle开源的零售行业解决方案
[3]好兄弟不仅要一起上榜, 更要有远大的志向
[4]连续4周上榜的这位开发者, 活出了当代大学生该有的样子
[5]【首批体验官亮相, 惊呼王牌福利爱死了】积极的人像太阳, 走到哪里都是光

相关文章
|
16天前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
|
19天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
10天前
|
并行计算 前端开发 物联网
全网首发!真·从0到1!万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调
2024年11月12日,阿里云通义大模型团队正式开源通义千问代码模型全系列,包括6款Qwen2.5-Coder模型,每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩,成为全球最强开源代码模型,多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点,通过持续训练,结合源代码、文本代码混合数据及合成数据,显著提升了代码生成、推理和修复等核心任务的性能。此外,该模型还支持多种编程语言,并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创,阿里云社区首发,未经同意不得转载。
|
9天前
|
人工智能 自然语言处理 前端开发
什么?!通义千问也可以在线开发应用了?!
阿里巴巴推出的通义千问,是一个超大规模语言模型,旨在高效处理信息和生成创意内容。它不仅能在创意文案、办公助理、学习助手等领域提供丰富交互体验,还支持定制化解决方案。近日,通义千问推出代码模式,基于Qwen2.5-Coder模型,用户即使不懂编程也能用自然语言生成应用,如个人简历、2048小游戏等。该模式通过预置模板和灵活的自定义选项,极大简化了应用开发过程,助力用户快速实现创意。
|
23天前
|
缓存 监控 Linux
Python 实时获取Linux服务器信息
Python 实时获取Linux服务器信息
|
4天前
|
人工智能 自然语言处理 前端开发
100个降噪蓝牙耳机免费领,用通义灵码从 0 开始打造一个完整APP
打开手机,录制下你完成的代码效果,发布到你的社交媒体,前 100 个@玺哥超Carry、@通义灵码的粉丝,可以免费获得一个降噪蓝牙耳机。
1023 8
|
8天前
|
云安全 人工智能 自然语言处理
|
5天前
|
人工智能 C++ iOS开发
ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码
本文介绍在Apple M4 MacOS环境下搭建Ollama和qwen2.5-coder模型的过程。首先通过官网或Brew安装Ollama,然后下载qwen2.5-coder模型,可通过终端命令`ollama run qwen2.5-coder`启动模型进行测试。最后,在VS Code中安装Continue插件,并配置qwen2.5-coder模型用于代码开发辅助。
402 4
|
5天前
|
云安全 存储 弹性计算
|
5天前
|
缓存 Linux Docker
【最新版正确姿势】Docker安装教程(简单几步即可完成)
之前的老版本Docker安装教程已经发生了变化,本文分享了Docker最新版安装教程,其他操作系统版本也可以参考官 方的其他安装版本文档。
【最新版正确姿势】Docker安装教程(简单几步即可完成)