2022,我与启智

简介: 愿我们在开源的环境里保持开放、包容、真实。

我总习惯写故事.

我不太喜欢华而不实的骈文, 相反更喜欢清风拂面. 因此总会有人说, "一开始读, 太平淡、没什么意思. 但要是进去了, 就出不来了."

已经很久不正经写东西, 最近几年, 写的最多的估计是课程报告. 时常翻开看看自己的"锤子便签", 总发现里面还是会有两三个以往写的句子, 现在看偶尔会觉得不像是自己能写得出来的.

因此还是要记录. 记忆总会弥散, 不靠谱.

源于观察、始于巧合.

是一个什么样的契机?

机会来找我? 还是我去找机会?

陈丹青说, 活在这个世界你得是个机会主义者.

自然他这句话是带贬的, 我自不会承认我是机会主义者. 但广泛地接触以及开放地尝试是我愿意的.

我用过很多的平台, 托管平台诸如Github、Gitee等, 深度学习的实训平台诸如AI Studio等. Github确实是开源的创新, 我自己的很多项目都有在Github托管, 但碍于环境的问题, 登录、浏览时常受限; Gitee做了大部分的追随和部分创新, 但本质还是跟着Github的脚步. AI Studio为深度学习爱好者提供了模型训练的算力平台, 最近还上线了模型部署的功能, 很好. 但其单兵作战的环境实际上很难满足如今复杂系统软件的生产环境, 并且由于需要维护飞桨生态而做了深度学习环境的限制, 似乎显得不够开放.

我一直在寻找一个既能充分满足上述各平台不足、又能满足我个人的部分需求的创新平台. 直到我看到了OpenI, 尤其是深入了解其运行逻辑、环境逻辑、社区逻辑之后, 会惊呼:"这才是真正的创新! 什么天才能将开发开发链条耦合得如此紧凑贴切?"

我逐渐开始在OpenI启智社区的环境中开始进行我的工作. 从一开始的将之前我在Github托管的项目迁移进OpenI, 到后来我开始做一些自己工作, 创建ColugoMum组织、依托OpenI开放和包容的环境进行一系列的科学实验和工程落地…

在使用过程中深入了解平台, 在沟通中了解团队.

而我也不禁对这背后的团队感到好奇.

虽然"人人都是产品经理"在业界广为流传, 但是否人人都可以以用户和产品经理的互换角度去看待产品、以及用户和产品之间是否有合理畅通的沟通渠道则需要打个问号. 人人都是产品经理, 正确. 在使用产品的过程中, 人人都可以对产品进行评价和吐槽, 但这些"善意的评价"和"可爱的吐槽"是否有效回环到产品团队是需要思考的.

而平台建立的科学、有效、合理的反馈机制则深刻体现了为何需要开源?

社区的用户可以通过小白训练营进行使用体验的反馈. 任何对平台使用过程中的反馈均可以在此处进行. 而官方团队则会根据平台的发展需求对这些反馈进行评估和回复. 这就建立了直接的用户和产品团队的沟通机制, 并且相对于"调研问卷"性质的被动型反馈, 对于用户来说, 这种主动性反馈实际上能够更加真实地反映产品发展现状和用户接受情况.

平台最初的高速发展时期, 用户适当允许平台部分内容做得不够完美. 但用户和产品团队在合力将产品打磨地更好.

这或许是开源的魅力所在. 开放、包容、真实.

一场略有影响力的Battle

我曾经在社群里针对PaddlePaddle和MindSpore跟社群的其他同学有过一场辩论[1].

由于平台是多元的、开放的, 因此对于深度学习环境并不做严格限制, Pytorch、TensorFlow、PaddlePaddle、MindSpore等各类深度学习框架在平台上百花齐放、百家争鸣. 而平台也提供了多源异构的算力支撑, 如GPU系列的T4、V100、A100, 国产NPU系列的Ascend 910等. 而NPU系列暂时只支持MindSpore和TensorFlow两种框架. 我认为国产深度学习框架和国产AI加速卡应当也营造出百家争鸣之盛举, 因此提出是否可以在NPU环境提供PaddlePaddle镜像以及其他国产深度学习框架镜像. 社群的其他同学有不同意见, 觉得那样会影响MindSpore的生态. 我们进行了坦诚开放的"Battle". 而后逐步演变成"国产深度学习框架之争".

Battle结束后, 我以为此事就此过去. 令我吃惊和意料之外的是, 社区的运营同学(即ZeiZei姐)随即询问我是否可以将这场辩论对外发布. 我本以为, 大多数的社区是不太会愿意将此等"不太和谐"的"Battle"对外发布的, 道理大家自然都懂. 而OpenI却愿意将此以官方的身份对外发布, 我不禁对社区开放、包容的态度有了更加深层次的体会. 而从官方的回应中我也了解到其实平台是站在更高的角度去看待国产深度学习框架之争, 是为了更好地推动国产开源环境和整体的、全局的AI生态.

开放、包容、真实和全局视野, 是我对于平台新的概念.

我愈发地认同平台体现出来的价值观, 并希望自己也能深入地参与平台的发展.

我是组织的人馁!

欧小鹏的出生其实来源于一些社群观察. 早期的时候社群总会被广告袭击. ZeiZei为此还求问知乎. 后别无他法每天都很辛苦地鉴别社群里隐藏的广告方. 我觉得这样太累, 对于一个科技向的社群来说也不够高端, 要是有个机器人, 此类情况应该会好转一些, 要是能融入一些智能化的元素活跃群聊就更好了. 后来在调研了市场上的一些相关内容之后就动手做了.

我总学不会收敛和低调.

我记得做出来是大半夜, 刚满足了部分刚需功能就迫不及待和ZeiZei分享, 然后在体验官群里和社区的一众老师分享. 当然那时候欧小鹏浑身是bug, 基础设施和功能远不及现在. 但好的是, 起码开了个头, 能用.

一开始我没有想好欧小鹏的发展, 也没有想它要发展得如何如何, 只觉得先能满足社区的一些硬需求, 如加群、欢迎语等等.

在欧小鹏建设的初期, 我吸纳了社区平台发展的经验, 开放了源码让大家可以通过Issue进行沟通, 另外建立了一个交流群方面用户连接. 那个时候欧小鹏还没有名字, 名字的来源其实是大家一起想的(一开始ZeiZei提及叫"偶大鹏"hhhh). "欧小鹏", 谐音Open, 希望能秉持OpenI体现的开源、开放、包容的价值观, 并将这种价值观传递下去.

那时候AIGC正火, 我认为其运用在社群中, 应该会缓解一些"死群"的现象, 即使有打扰社群的风险, 但最起码不会让社群死. 不死群是社群维护的第一原则.

那段时间国外的Stable Diffusion、DallE、国内的以ERNIE-VILG为代表的文生图爆火, 虽然各个开发者都开源出了众多能够推动模型和用户连接的工具、平台和方法, 教程也是一箩筐. 但我仍旧认为, 模型与用户(尤其是普通用户)之间的距离还是太远; 模型的评价体系依旧在广告方, 而非用户自身. 前者, 微信是一个天然的用户聚集区(无论是开发者用户还是普通用户), 并且还是一个讨论的天然场所, 这两份天然, 满足了我的设想. 我将文心的文生图能力接入进欧小鹏, 虽然交互方式一直被诟病, 但却是引爆了一阵子社群. 而后逐步接入鹏城·盘古、浪潮源1.0、文心ERNIE等大模型, 各大模型基于欧小鹏对外提供服务, 一时间描绘出大模型百花齐放的"假象".

"余老师这么晚还没睡呢哈?"

"睡不着! 我跟欧小鹏玩会."

通过以欧小鹏和OpenI平台为核心点, 我逐渐和各种大模型提供方广泛接触并建立了"似有若无"的合作关系. 某天和鹏城·盘古对话模型团队的王老师聊欧小鹏的对话场景, 王老师说:

"我们一起把欧小鹏养大!"

听到王老师的话, 我久不能静: 写下欧小鹏第一行代码的时候, 我远不会想到它能有现在的发展.

当然, 养孩子嘛, 总会遇到一些困难. 有一段时间欧小鹏的爆火功能——文生图下线了, 原因是ERNIE-VILG的服务较之前有了一些区别, 逐步过渡到付费行为. 作为一个铁铁的白嫖党(开玩笑)又怎么愿意付费呢? 后来文生图服务暂停了一段时间, 自己也在此期间尝试了很多的替代方案但都因为各种原因一一落败. 那段时间其实很沮丧.

"该不会就要这么下线了吧?"

服务停了, 还是相对爆火的服务, 自会有人寻问原因.

某天和ZeiZei聊天, 她问及原因, 我一五一十告知, 言语中也夹杂着一些沮丧.

但ZeiZei姐却很爽快地说:

"有困难, 找组织啊!"

我其实是一脸懵的. 我不会想到我之于平台来说是一个有组织的人. 我也未曾想过欧小鹏的发展能让平台参与进来.

而后平台是真的参与进来了, 没过多久欧小鹏的文生图能力恢复.

我是有组织的人成了我继续下去的又一层动力.

逐渐地, 在欧小鹏自身发展以及和用户交流的过程中, 欧小鹏有了更加深刻和宽广的计划: 在服务社群的同时, 它更是大模型和用户间最直接的连接方. 把模型的评价体系交还给用户成了欧小鹏的愿景.

奇绩创坛的同学通过OpenI看到了这一想法的苗头, 发邮件来与我沟通, 希望在这一特殊的时间节点一起探索该方向的未来发展和商业落地. 我们进行了很有趣的交流, 也学习到了很多商业化思维, 产生了一些更有趣的想法.

未来欧小鹏还会依托启智社区继续发展, 希望在发展的过程中能秉持开源、包容、真实的理念, 为大模型的应用落地做一些自己的贡献.

怎么介绍自己?

ColugoMum的创始人? LDU的联合创始人? 社区的资深体验官?

ColugoMum的创始人

ColugoMum聚焦智慧零售行业, 依托国产深度学习开源框架和国产AI加速器, 打造零售全场景链条的开源方案和开源组织, 推动我国实体零售向数字化、智能化方向转型发展[2].

目前ColugoMum在社区内已经开展了工程Demo、科学实验、数据集、使用教程等系列布局, 并将持续维护和创新, 力争实现ColugoMum降本增效、赋能零售的使命.

但是, ColugoMum的发展初期其实会受到自己技术视野、行业理解和开源理念的限制, 包括目前在社区里做的一些工作, 虽然花了很多功夫, 但是否能够真正落地依旧要打个问号. 而在此过程中, 因为OpenI的影响力, 也给我个人对于ColugoMum带来了一些新的启发. 深圳银歌云公司的王总因为在OpenI上看到ColugoMum的系列工作与我联系, 我们共同交流了包括技术、行业、商业等各个领域的很多想法, 并结下了深厚的友谊. 福建得胜科技的袁总因为看到了OpenI启智社区发布的关于ColugoMum的推送, 而后与我产生了一些合作……这些情况在OpenI社区屡见不鲜, 数不胜数.

在社区里, 众多优秀的开源项目也开拓了我的技术视野. ColugoMum由于前期的一些问题, 直到现在都一直缺乏一套完备的部署方案. 通过逛社区, 我很快将视角聚焦在CubeAI项目上. 虽然因为时间和精力原因一直没有实际尝试(最近正在尝试过程中!), 但却一直跟踪其发展和变化. 令我意想不到的是, 在2022 CCF 中国开源大会(2022 CCF ChinasOSC)"人工智能开源社区"论坛上, 中国联通国家工程研究中心的霍龙社博士也对ColugoMum项目表达了关注. 这是对我们莫名的肯定, 也是开源的魅力. 正如王怀民院士回答为什么要开源的问题:

  1. 它是一个学术传统, 更是一个文明现象, 是人类文明的常态;
  2. 它是商业模式的再创新, 构造了新的吸引力机制.

开源模式使得ColugoMum能够得到市场的关注和反馈, 也让我们有了更多坚持下去的动力.

LDU的联合创始人

LDU的创办其实来源于自己在学校的成长. 为了满足自己对于深度学习和工程应用的兴趣, 自己花了很长的时间去搜集各种学习资料、去搜寻和适应一个稳定的实训环境、寻找团队成员并仔细打磨自己的项目……这一个有一个的"很长时间"让我觉得我应该为其他同学做一些事情. 在和学弟(王鑫, 启梦之旅华东理工大学旅长)的一次闲聊下, 我向他表达了我的想法, 我们一拍即合, 立刻实施, 便创建了LDU组织[3].

Learning-Develop-Union(LDU)是一个专注于数据科学与 AI 领域团队孵化的开源组织, 致力于为大家提供一个良好的AI学习与应用环境, 依托Datawhale开源内容、开源学习和开源方案, 融合启智社区的算力和项目支持, 集学习、竞赛、创意孵化为一体, 为人才与项目的成长提供良好的生态环境, "聚一群人, 做自己所热爱的事情"是我们不变的愿景.

后来在组织的发展过程中也逐渐地向我们的希望迈进, 逐步有一些优秀项目(如:Sports_Game_tracker欧小鹏fitness_helper等)加入LDU组织, 组织成员的规模也愈发增长、一些外部合作也在逐步展开.

我们希望LDU能够帮助到高校(尤其是对AI感兴趣)的同学摆脱迷茫, 依托开源、 动手实践, 为社区开源人才培养贡献自己的力量, 也为推动国家人工智能人才和开源人才培养做出一份贡献.

社区资深体验官

我一直将体验官定义为社区内的至高荣誉, 甚至不仅局限在社区内. 国内的开源环境在变好、开源活动在日益活跃, 但国内大多数接触开源的人似乎视野依旧局限闭塞, 大家是不是仍旧认为开源就是代码开源? 社区是一个国内开源的先锋地, 作为社区的体验官, 在cover日常的社区QA、平台体验反馈等的同时, 我个人认为也需要做一些开源文化的引导和宣传工作. 相对于技术而言, 也许文化是更加根固的影响.

前面我一直在提及, 开放、包容和真实是开源的魅力. 而作为社区的体验官, 我们也应当传达我们在其中体验到的开源文化的魅力.

写在最后

加入OpenI社区已经505天了. 我自然希望平台能越来越好, 更希望国内大的开源环境能越来越好. 如同开源这样开放、包容、尤其是真实的环境, 很少了. 愿大家能共同维护这份美好, 珍惜这份来之不易的美好.

愿大家开放、包容、真实.

愿OpenI能不忘初心, 开放、包容、真实, 扛起国内开源这面旗.

引用

[1]开发者们围绕Paddle和MindSpore在群里Battle, 官方回应来了
[2]OpenI开源项目推荐-ColugoMum | 基于国产深度学习框架PaddlePadddle开源的零售行业解决方案
[3]好兄弟不仅要一起上榜, 更要有远大的志向
[4]连续4周上榜的这位开发者, 活出了当代大学生该有的样子
[5]【首批体验官亮相, 惊呼王牌福利爱死了】积极的人像太阳, 走到哪里都是光

相关文章
|
7天前
|
弹性计算 双11 开发者
阿里云ECS“99套餐”再升级!双11一站式满足全年算力需求
11月1日,阿里云弹性计算ECS双11活动全面开启,在延续火爆的云服务器“99套餐”外,CPU、GPU及容器等算力产品均迎来了全年最低价。同时,阿里云全新推出简捷版控制台ECS Lite及专属宝塔面板,大幅降低企业和开发者使用ECS云服务器门槛。
|
3天前
|
存储 人工智能 弹性计算
对话阿里云吴结生:AI时代,云上高性能计算的创新发展
在阿里云智能集团副总裁,弹性计算产品线负责人、存储产品线负责人 吴结生看来,如今已经有很多行业应用了高性能计算,且高性能计算的负载正呈现出多样化发展的趋势,“当下,很多基础模型的预训练、自动驾驶、生命科学,以及工业制造、半导体芯片等行业和领域都应用了高性能计算。”吴结生指出。
|
7天前
|
人工智能 弹性计算 文字识别
基于阿里云文档智能和RAG快速构建企业"第二大脑"
在数字化转型的背景下,企业面临海量文档管理的挑战。传统的文档管理方式效率低下,难以满足业务需求。阿里云推出的文档智能(Document Mind)与检索增强生成(RAG)技术,通过自动化解析和智能检索,极大地提升了文档管理的效率和信息利用的价值。本文介绍了如何利用阿里云的解决方案,快速构建企业专属的“第二大脑”,助力企业在竞争中占据优势。
|
5天前
|
人工智能 自然语言处理 安全
创新不设限,灵码赋新能:通义灵码新功能深度评测
自从2023年通义灵码发布以来,这款基于阿里云通义大模型的AI编码助手迅速成为开发者心中的“明星产品”。它不仅为个人开发者提供强大支持,还帮助企业团队提升研发效率,推动软件开发行业的创新发展。本文将深入探讨通义灵码最新版本的三大新功能:@workspace、@terminal 和 #team docs,分享这些功能如何在实际工作中提高效率的具体案例。
|
9天前
|
自然语言处理 数据可视化 前端开发
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
合合信息的智能文档处理“百宝箱”涵盖文档解析、向量化模型、测评工具等,解决了复杂文档解析、大模型问答幻觉、文档解析效果评估、知识库搭建、多语言文档翻译等问题。通过可视化解析工具 TextIn ParseX、向量化模型 acge-embedding 和文档解析测评工具 markdown_tester,百宝箱提升了文档处理的效率和精确度,适用于多种文档格式和语言环境,助力企业实现高效的信息管理和业务支持。
3917 2
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
|
11天前
|
负载均衡 算法 网络安全
阿里云WoSign SSL证书申请指南_沃通SSL技术文档
阿里云平台WoSign品牌SSL证书是由阿里云合作伙伴沃通CA提供,上线阿里云平台以来,成为阿里云平台热销的国产品牌证书产品,用户在阿里云平台https://www.aliyun.com/product/cas 可直接下单购买WoSign SSL证书,快捷部署到阿里云产品中。
2191 6
阿里云WoSign SSL证书申请指南_沃通SSL技术文档
|
4天前
|
安全 数据建模 网络安全
2024阿里云双11,WoSign SSL证书优惠券使用攻略
2024阿里云“11.11金秋云创季”活动主会场,阿里云用户通过完成个人或企业实名认证,可以领取不同额度的满减优惠券,叠加折扣优惠。用户购买WoSign SSL证书,如何叠加才能更加优惠呢?
840 2
|
2天前
|
算法 数据建模 网络安全
阿里云SSL证书2024双11优惠,WoSign DV证书220元/年起
2024阿里云11.11金秋云创季火热进行中,活动月期间(2024年11月01日至11月30日),阿里云SSL证书限时优惠,部分证书产品新老同享75折起;通过优惠折扣、叠加满减优惠券等多种方式,阿里云WoSign SSL证书将实现优惠价格新低,DV SSL证书220元/年起。
535 4
|
2天前
|
存储 分布式计算 流计算
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。
458 8
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
|
23天前
|
编解码 Java 程序员
写代码还有专业的编程显示器?
写代码已经十个年头了, 一直都是习惯直接用一台Mac电脑写代码 偶尔接一个显示器, 但是可能因为公司配的显示器不怎么样, 还要接转接头 搞得桌面杂乱无章,分辨率也低,感觉屏幕还是Mac自带的看着舒服