自动写代码?别闹了!

简介: 自动写代码?别闹了!

大家好,我是良许。这几天,GitHub 上有个很火的插件在抖音刷屏了——Copilot。这个神器有啥用呢?简单来讲,它就是一款由人工智能打造的编程辅助工具。我们来看看它有啥用。首先就是代码补全功能,你只要给出函数名和参数,Copilot 就会自动帮你补全代码。

微信图片_20220420102756.gif

image.gif第二个功能,就是它可以根据注释来写代码。也就是说,你只要把注释写好,它就会自动帮你生成对应的代码,吓人吧~

微信图片_20220420102800.gif

除此之外,它还可以自动生成重复性代码、自动生成测试代码,同时也可以生成多套代码方案供你选择。目前支持多种开发语言,包括 Python, JavaScript, TypeScript, Ruby, Java, Go等等,支持VS Code,Neovim,JetBrains 等 IDE。目前还没有完全开放,处于邀请制状态。前几天我看到了这个插件并申请了,但是目前还没通过,所以想看演示的话大家可以上 B 站,很多大佬做了测评。看到这个插件这么强大的功能,很多程序员已经吓傻了,这么强大,AI 都已经可以帮你写代码了,程序员是不是要下岗了?但在我看来,这个插件目前还只是个高级的玩具而已。

1. 只是帮你百度一下

这个插件的本质是利用人工智能,通过开源社区里的大量代码进行训练,从而实现自动写代码的效果。所以,对于通用性的代码,它的生成准确性还是比较高的。比如,我们在写两个日期之间的天数,你写来写去,无非就是这样写(以 Python 为例):

defdays(str1,str2):
   date1=datetime.datetime.strptime(str1[0:10],"%Y-%m-%d")
   date2=datetime.datetime.strptime(str2[0:10],"%Y-%m-%d")
   num=(date1-date2).days
   return num

这种代码说白了其实没有多少创造性,写熟练了可能根本都不需要经过大脑,都形成肌肉记忆了,无非就是函数名、变量不太一样,其余的几乎都一样。类似的,我们还有一些算法(比如冒泡排序)、工具(比如哈希校验),其实也都是重复性非常高的代码,它也可以帮你完成得很好。重复性的工作,都有可能被替代的。在这种情况下,Copilot 的作用就相当于帮你百度一下,然后再帮你 CV 一下。如果没有这个插件,我们一样也能做,只是花点时间而已。

2. 业务代码质量不高

Copilot 自己也承认,他们会尝试了解程序员的意图,并「尽可能」生成最好的代码,但生成的代码并不总是有效,有时甚至还没有意义。毕竟训练集来自公共代码,良莠不齐,甚至完全没有意义。这点在 B 站大神的测试下也得到了印证,有时候确实也生成了一堆不知所云的代码。毕竟,我们的业务需求一直都是复杂多变的,有时我们自己都不太能实现一些功能需求,还指望机器帮你写?别太幻想了!而且,它自动补全业务代码的前提是,你已经需要有一定的代码量供它参考,它才可以去猜测你接下来准备写什么。也就是说,你还是需要写一些代码,有这些代码了它才会写得更准确一些。而且你提供的代码量越少,它的推荐就越不准确。也有人说了,它会根据注释写代码啊。但是,实际上,注释你都写好了,你自己其实也已经差不多把代码都写好了。再说了,程序员都知道,读别人的代码是一件很痛苦的事情,Copilot 帮你写好了代码,你敢直接就用吗?你阅读并理解它的代码的时间,也许自己早就写完了。所以,你说它会完全帮你写代码吗?肯定不行,至少目前不会。就算能帮你写部分业务代码,也不一定写得好。

3. 有一定的安全问题

Copilot 它的原理就是利用大量的代码进行训练,样本越多自然就越准确。那么问题来了,他们自己宣称这些样本是来自开源的社区,但你使用了它们的插件,你敢保证你写的代码不会成为他们的样本?而且,如果它们生成的代码不合你的要求,你手动修改了,它更加理解了你的意图,这对 Copilot 的训练简直是神助啊,他们难道真的不会考虑利用一下使用者的免费劳动力?凡是使用第三方插件,而且还是不开源的,谁都无法保证你的数据是否真的没有被泄漏出去。自己练习的代码肯定是无所谓了,但是如果涉及到公司的商业机密,那就可能会有法律问题了。而且,更可怕的是,Copilot 生成的代码,有 0.1% 的概率会原封不动复制训练集的样本。如果这些样本没版权也没事,但要是有版权,有可能也会吃官司。之前已有新闻报道过,Copilot 原样复制了经典射击游戏《雷神之锤》里的代码,而这些代码是受法律保护的,使用者也因此受到了一些麻烦。所以,现在不少公司已经明确规定,禁止使用 Copilot 插件!

4. 照相机的出现不会让画家下岗

照相机被发明出来的时候,曾经一度也有人开始唱衰画家这样的岗位。但时过境迁,这么多年过去了,画家的岗位消失了吗?不仅没消失,反而现在技术精湛的画家身价一涨再涨。相机,只是把画家的一部分重复性工作取代了,比如画肖像、风景,等等。它只会机械地,一比一还原现实。而现在的画家,更多是作为艺术创作,这部分相机短时间内是无法取代的。(现在也有 AI 艺术创作,但还很难说取代)Copilot 何其不是这样的存在呢?我大胆预测,Copilot 只会取代部分基础的、重复性的编程工作,说它会让程序员下岗,我觉得这肯定是天大的笑话。相机再智能,你也需要具备一定的美术、审美基础,才能拍出好看的照片。微信图片_20220420102804.jpg同样的,Copilot 帮你写了一堆代码,你如果没有一定的编程基础的话,你连改都不会改。

5. 展望

我还是那句话,Copilot 的出现不会让程序员下岗,只会取代部分工作而已。工具的出现只是会让我们从重复性的劳动中解放出来,从而让我们的大脑有更多时间思考。但思考和创作本身,很难被取代。我个人是非常欢迎 Copilot 这样的工具出现,可以让我们减少很多不必要的工作。作为程序员都知道,我们每天都需要花费很多时间在百度/谷歌上面,并且各种搬运轮子。这种工作就是机械的重复性工作,如果能有工具让我们从这样的工作中解放出来,肯定会为我们节约很多时间。而且,Copilot 这个单词本身也明确了自己的定位,那就是「副驾驶」,人家已经很明确自己的位置,根本就没想着成为主驾驶。所以,Copilot的出现,大家不要如临大敌,而是要合理利用工具,善于利用工具,让工具真正为我们所服务。

目录
相关文章
|
机器学习/深度学习 人工智能 算法
机器学习是什么?
机器学习是什么?
549 4
|
关系型数据库 MySQL API
Flink CDC产品常见问题之读取不到或读取不全消息如何解决
Flink CDC(Change Data Capture)是一个基于Apache Flink的实时数据变更捕获库,用于实现数据库的实时同步和变更流的处理;在本汇总中,我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答,目的是辅助用户更好地理解和应用这一技术,优化实时数据处理流程。
|
3天前
|
存储 消息中间件 人工智能
实时计算 Flink 全新升级 - 全栈流处理平台助力实时智能
阿里云实时计算Flink版十年磨一剑,全面升级计算与存储能力。创新推出增量计算与流存储Fluss,实现湖流一体、成本降低86%。深度融合AI,支持实时推理与大模型调用,赋能风控、推荐、智能客服等场景,开启实时智能新时代。
实时计算 Flink 全新升级 - 全栈流处理平台助力实时智能
|
8月前
|
数据采集 存储 SQL
数据炼金术:从原始数据到商业洞察的五个关键步骤
数据炼金术:从原始数据到商业洞察的五个关键步骤
144 8
|
1月前
|
数据采集 数据可视化 物联网
数据工程师必看:10大主流数据清洗工具全方位功能对比
面对杂乱数据,高效清洗是分析关键。本文盘点10款主流工具:从企业级Informatica、Talend,到业务友好的Alteryx、Tableau Prep,技术向的Python、Nifi,再到轻量级Excel+Power Query,覆盖各类场景。帮你选对工具,提升效率,告别无效加班。
数据工程师必看:10大主流数据清洗工具全方位功能对比
|
6月前
|
存储 SQL 运维
中国联通网络资源湖仓一体应用实践
本文分享了中国联通技术专家李晓昱在Flink Forward Asia 2024上的演讲,介绍如何借助Flink+Paimon湖仓一体架构解决传统数仓处理百亿级数据的瓶颈。内容涵盖网络资源中心概况、现有挑战、新架构设计及实施效果。新方案实现了数据一致性100%,同步延迟从3小时降至3分钟,存储成本降低50%,为通信行业提供了高效的数据管理范例。未来将深化流式数仓与智能运维融合,推动数字化升级。
275 0
中国联通网络资源湖仓一体应用实践
|
前端开发 应用服务中间件 API
|
安全 Android开发 数据安全/隐私保护
深入理解安卓与iOS的安全性差异
本文将深入探讨安卓和iOS两个主流操作系统在安全性方面的差异。通过分析两者的安全机制、隐私保护措施以及常见的安全漏洞,帮助开发者和用户更好地理解如何选择和保护自己的设备。同时,我们将提供一些实用的安全建议,以提升设备的安全性和隐私保护能力。