开发者评测|操作系统智能助手OS Copilot

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: OS Copilot 是阿里云针对Linux操作系统推出的一款智能助手,它利用大模型技术提供自然语言问答、辅助命令执行和系统运维调优等功能,旨在提高Alibaba Cloud Linux的使用效率。OS Copilot在新人上手时并不简单,文档指引不够清晰,存在一些步骤无法顺利执行的问题,比如环境配置和命令执行。此外,产品目前仅支持Alibaba Cloud Linux,限制了其应用范围。虽然OS Copilot在一些基本功能上表现尚可,如解答问题和编写简单脚本,但在处理复杂任务或自动化运维时显得不足。总体而言,OS Copilot对新手和阿里云环境有一定的帮助,但功能和使用体验仍有改进空间。

1. 智能助手OS Copilot产品简介

OS Copilot是Alibaba Cloud Linux基于大模型构建的操作系统智能助手,支持自然语言问答、辅助命令执行、系统运维调优等功能,帮助您更好地使用Alibaba Cloud Linux,提高Alibaba Cloud Linux的使用效率。

1.1 产品优势

  • 智能
    OS Copilot通过不断学习您的使用习惯,提高准确性并做出预测。
  • 专业
    OS Copilot可以专业地帮助您回答操作系统相关问题。
  • 高效
    OS Copilot可以帮助您在系统诊断、调优、编程等场景进行相关问题处理。
  • 协作
    通过OS Copilot管理您在阿里云上的资源,享受到阿里云上一体化的服务。


1.2 功能介绍

  • 命令行自然语言问答
    通过命令行自然语言问答,OS Copilot可以让用户直接在OS的命令行中输入在使用中的自然语言表述的问题,帮助用户回答日常及操作系统领域相关信息,简化用户需要切换到浏览器搜索的步骤,降低OS使用成本及使用连贯性,提高日常OS使用效率和用户体验。OS Copilot通过后端的LLM大模型,可以让用户轻松地接触到阿里云操作系统团队多年积累的系统领域知识,让用户可以更精准地搜索到操作系统相关信息,特别是对于阿里云自研操作系统Alibaba Cloud Linux及阿里云主导开源社区龙蜥操作系统AnolisOS的相关知识。
  • 辅助命令执行
    不同于Windows可视化的桌面操作系统,Linux操作系统主要通过命令行来进行操作系统日常的使用及维护等操作。而复杂繁多的命令行,对于Linux小白用户来说是入门Linux的第一道门槛。OS Copilot提供辅助命令执行功能,让Linux的小白用户也能迅速上手简单的Linux的使用。
  • 阿里云CLI调用
    阿里云CLI(Command Line Interface)是基于阿里云开放API建立的管理工具。借助此工具,您可以通过调用阿里云开放API来管理阿里云产品。OS Copilot支持让用户在操作系统内完成阿里云CLI的调用,通过命令行简单进行ECS信息及实例ID等查询。
  • 系统运维和调优
    在操作系统使用中的重要场景是系统的运维和调优,操作系统的表现对于业务有着非常大的影响。虽然市面上有很多的相关运维和调优产品,但是系统的运维和调优需要相关人员有相关Linux内核专业知识的积累及长期的问题处理经验,而具备相关能力的人才是非常有限的。Copilot可以通过自然语言调用相关系统运维及调优工具,特别是阿里云自研的系统工具,帮助用户轻松使用系统工具定位系统问题,提升系统性能表现。


2、OS Copilot 产品体验评测

1)您的角色是什么?开发、运维、学生?如果使用OS Copilot,您的使用场景是什么?


我是一个开发人员, 可能会使用copilot来辅助进行代码编写. 同时我也需要经常面对各种各样的国产化环境, 协助运维人员完成软件产品在各种不同cpu架构, 不同操作系统上的软件部署. 我希望coplilot能够简化服务器的运维工作, 屏弊这些因底层cpu和操作系统等的不同, 带来的运维复杂性. 最好是能够协助运维自主编写一些自动化的脚本, 以提升运维效率.


2)你觉得 OS Copilot 在新人上手方面是否简单、指引文档是否清晰、是否存在什么阻碍?


我觉得OS Copilot在新人上手方面没有那么简单, 指引文档还行, 但是产品文档上的步骤不够具体, 所给的例子, 有不少是无法正常执行完毕的. 一小时的体验中, 并不顺畅, 不停地在卡壳, 很难受. 尽管如此, 我还是在不到一小时的时间里, 完成了对我自己所关心的内容的测试. 以下一一说明.


首先, 我想聊一聊OS Copilot的定位问题. 他到底是一个服务于Alibaba Cloud Linux 操作系统的专用智能助手, 还是一个准备赋能所有Linux操作系统的普惠的智能助手? 如果是前者, 那基本上会劝退一大波人. 这个问题很重要, 定位如果不一样, 他的受众也是完全不一样的, 所需要考虑的产品功能也是完全不一样的. Linux的发版行众多,大致包括Ubuntu, Debian, RHEL, Fedora, Centos, openSUSE, Arch Linux, Oracle Linux, Alpine Linux等等等等, 还有国产的UOS, 麒麟, Deepin, 红旗, openEuler等, Alibaba Cloud Linux可能只是linux众多发行版大家庭中的一员. 仅局限于此的话, 可能只会变成一个用于提升阿里云销售额的一个亮点功能. 会失去一大批可能存在的潜在用户. 他未来的成就, 就是一个Alibaba Cloud Linux 操作系统的小挂件. 只谈对阿里云的销售贡献上来讲, 在阿里云上, 安装其他操作系统的ECS我相信也是不在少数.

     

来看看Copilot的自白, 他可没有说是仅仅服务于Alibaba Cloud Linux的

image.png

然而我们也应该看到, 目前可以体验OS Copilot的操作系统只有Alibaba Cloud Linux. 入门难, 就我个人来说, 我从来没有使用过Alibaba Cloud Linux. 如果他真的很惊艳, 可能会在业余时间用用. 但如果没有对国产化的操作系统进行支持, 那大批的政企是无法使用的, 意味着包括我在内的一大批服务于政务业务的企业人员, 可能就无法享受他带来的便利. 我认为定位就落了下乘.

当然, 我也充分理解支持范围不同, 产品实现的难度和复杂性也完全不同.


目前体验方式有二, 一是在线上实验环境体验, 二是在现有安装了Alibaba Cloud Linux 操作系统的ecs上安装体验. 本质是一样的, 都必须有阿里云的ecs, 且安装了Alibaba Cloud Linux 操作系统. 限制太强了. 线上体验还必须先充值, 有几个人愿意吃这个螃蟹. 不管怎么样, 趁着本次评测活动的机会, 我开始了本次OS Copilot的体验. 我是一个对细节要求比较高的人, 所以可能会对产品体验有着吹毛求瑕的要求. 如果提出了过分的看法, 还请谅解.


先说环境配置, 作为一个新人, 我足足花费了20分钟, 才把copilot的使用环境搭建好.


第一步是创建实验环境, 需要先注册阿里云账号, 使用支付宝完成实名认证, 充值100元. 然后点击https://developer.aliyun.com/adc/scenario/311000500000 进入实验环境创建页面.


image.png

勾选两个选项, 点击开始实操后, 即可开始创建实验环境. 在此我需要作一个自我反醒, 我完全没有看到左侧指引教程的下一页按钮. 以致于我还一直纳闷, 这所谓的场景简介和背景知识就是指引手册了? 怎么这么不走心呢. 最后是根据产品文档去操作的. 所以某种意义上来讲, 我的操作并没有根据指引文档进行. 就此评价指引文档有失公允. 我的操作是根据产品文档进行的,并在此之后进行了自由发挥, 更像是自由评测. 当然, 从另一个角度讲, 是不是把下一页的交互做得更醒目一些, 就能避免我这种眼神不好的用户掉坑里.


资源创建耗时, 不到1分钟, 如下图:

image.png


资源创建完之后傻眼了, 我还以为会自动进入实验环境. 然后找了一圈发现了远程连接的按钮.


image.png

继续傻眼, 因为没有给默认密码, 还好有重置按钮.

image.png

连接上环境后, 继续傻眼. 作为一个实验环境, 实验对象竟然不是默认安装好的, 还需要自己手工安装.

image.png

根据产品文档进行了安装, 后发现需要配置环境变量AK和SK, 折腾了好久. 先去RAM控制台创建了用户, 然后给用户授予了Copilot的权限. 对于从来没有使用过这些功能的用户来说, 理解和使用起来还挺费劲的.

image.png

image.png

image.png

配置环境变量的时候还发现, 居然无法用鼠标完成复制操作, 能急死人, 好在 Ctrl+CV能正常用.

image.png

从配置环境变量的过程不难看出, 这些什么ak, sk,授权啥的, 都是和阿里云深度绑定的. 非云环境如何使用考虑过吗?

或者非阿里云环境如何使用考虑过吗? 当然我能理解这些操作都是出于安全的目的进行的考虑, 但是别人家软件的权限控制也都是这样做的吗? 可能大家会讲云原生, 那非云环境不考虑了是吗?


终于弄好了环境, 我虽然不快, 但也不是最慢的

1720232227566.png

当然, 这里面的好多坑, 其实指引文档上都写了步骤. 所以原罪是眼神和下一页...


接下去开始实验Copilot的功能. 恩, 我是参考产品文档进行的, 没几个进行顺利的. 产品文档如下图:

image.png image.png

总觉得这里的自说自话傻傻的, 且多余.

image.png

这个回复里的第1点, 是在响应什么问题, 我没有看懂. 是答非所问吗?

下面还提示一个有语法错误的命令出来...

执行这条错误的指令, 也没有定位到哪里错了, 也没有明确的提示

image.png

下一个查询实例名称对应实例id的测试, 也是没有通过

image.png

按照推荐的命令执行,也不行. 不知道他所说的模拟环境指什么?在我看来,这个实验环境不就是一个真实的ecs吗 image.png

再来看下一个问题

image.png

nginx都没有安装,谈何性能优化呢

image.png

下一个问题

image.png

image.png

缺少软件包后, 我尝试等待他自动安装, 然而, 并不会. 我只能让他帮我安装.

image.png

这个安装软件包的简单任务算是在交互下顺利完成了. 然后我尝试让他重新运行之前的命令. 然而上轮对话还运行的命令, 此论对话已经不行了. 多轮对话的能力稍稍显弱.

image.png

并且他给出的四个指令, 如果有逻辑先后顺序的, 为什么不能按照顺序去执行, 而要n选1?

我还是不死心, 给他编写好他自己生成的代码, 结果发现是无法运行的.

image.png

尝试让他解释代码, 还行

image.png

查看网卡信息, 成功

image.png

使用查到的网信信息, 修改他写的监控脚本,运行后结果明显有问题

image.png

我还特意另启了一个窗口去执行下载任务,所谓的流量监控,完全没有效果.


下面测试了一些我关心的基本能力, 此部分表现尚可.

image.png

已经给出了我所需要的答案, 这是惊喜的. 对用户来说就是需要这些直观的信息. 下面的命令执行我认为是多余的.

image.png

刚夸过, 马上就罢工了.

image.png

查看硬盘信息, 没有惊喜

image.png

磁盘性能测试, 也没有惊喜

image.png

查看系统的详细信息, 这边列出的命令还是较多的. 有些是我之前没有用过的. 遗憾的是, 第6个命令无法运行

image.png

最后测试了一下他写代码的能力, 初步来看, 能懂题意, 能写出主要的逻辑. 时间关系, 没有进行运行测试, 和代码纠错测试.

image.png

image.png

总得来说, copilot具备一般LLM所具有的通用能力, 同时学习了一部分linux的运维知识, 和阿里云云原生相关的知识. 适合linux新手使用, 还不足以胜任稍微复杂一点的任务. 作为一个知识库或者指令查询器的效果可能还不错.

3)OS Copilot 是否对您的工作有帮助?如果有帮助的话,帮助程度1-10分,能够打几分?


对工作显然是有帮助的, 尤其是在知识面的广度上来讲, 可能会比任何人都要更强. 也能胜任一些简单的指令任务. 对新手来说用处更大. 但如果要进行复杂任务, 还是稍显稚嫩, 并且很多操作没有权限或者要人工确认,对自动化运维的帮助还不大. 我觉得可以打6分.

4)您愿意向周边朋友/工作伙伴推荐OS Copilot吗?如果OS Copilot开源,是否有意愿共同参与开发?包括参与OS领域大模型的训练等。


目前阶段来说, 我肯定不会推荐的, 因为我的工作环境, 根本没有人使用Alibaba Cloud Linux, 推荐了也只有学习的意义. 而且能力也还太弱了. 如果开源, 我主观上当然愿意共同参与开发, 只是可能能力上不太够格.


3、OS Copilot 产品功能反馈

1)您体验了哪些功能?对OS Copilot的哪些功能最感兴趣(知识问答、辅助编程、辅助命令执行等),为什么?


我对知识问答, 辅助编程, 辅助命令执行都很感兴趣.

对于知识问答来说, LLM的知识广度远远超过人类, 你永远可以向LLM学习, 不管是通用的LLM还是领域专用的LLM, 只要有需要, 都值得成为学习的对象

对于辅助编程来说, 他可以节省大量的编码时间, 即使LLM无法给出直接能运行的代码,也可以在此基础上进行修改完善. 不过对于这个领域, 我更希望使用专门的code大模型. 当然, 与运维结合的方面, 可能Copilot会更有优势.

对于辅助命令执行方面, 可能是现阶段Copilot能提供的相对于其他大模型最有特色的地方. 人的记忆是有限的, 特别是针对种类繁多, 语法各异的各种指令来说, 难免会忘记, Copilot能在特定系统上提供精准指令的话, 就能提升不少工作效率.


2)您有体验过其他类型的产品吗?对比其他产品OS Copilot有什么优缺点?


没有体验过其他类型的产品. Copilot的优点,在运维方面的话, 显然是能"理解语义"了. 但在执行复杂任务和指令的精准性上, 可能还有待加强.


3)您希望OS Copilot能够扩展其他哪些功能呢?比如,支持更多的操作系统、自动命令报错原因分析、系统错误排查,或其他任何您想到的功能。


我希望他能不要局限于阿里云, 能更开放,能支持更多的cpu架构, 如arm, 龙芯等国产化的cpu; 能支持更多的操作系统, 尤其是国产化的uos, 麒麟, 欧拉等等; 自动命令报错分析当然是必不可少的, 我始终认为, 解决实际问题的能力, 才是核心竞争力.


4)OS Copilot与其他产品联动组合的体验以及可能,如ACK智能助手、ECS、Workbench等,您也可以展开列举组合的实际应用场景。


我觉得copilot应该要多关注自动化领域的集成, 解放双手才能更好地帮助用户提升效率.

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
存储 人工智能 运维
|
9天前
|
数据可视化 关系型数据库 MySQL
阿里云开发者社区12月更文特别活动分享:🌍PolarDB、🧹OS Copilot和🧰云效Flow深度体验
本文深入探讨了阿里云的三款核心产品:PolarDB MySQL、OS Copilot和云效Flow,分别聚焦于云数据库、系统运维和DevOps流程管理的功能、表现及优化建议。通过多场景评测与实验,展示了这些产品在提高效率、简化操作和增强系统稳定性方面的显著优势。
|
1月前
|
存储 人工智能 自然语言处理
OS Copilot"作为一款操作系统辅助软件应运而生,旨在提升用户使用电脑的效率
随着AI技术的发展,"OS Copilot"作为一款操作系统辅助软件应运而生,旨在提升用户使用电脑的效率。它具备智能命令建议、代码片段生成、文件管理助手及任务自动化等功能,适合日常办公与专业开发。安装简便,上手容易,能显著提高工作效率。
31 3
|
1月前
|
安全 Linux 数据安全/隐私保护
Vanilla OS:下一代安全 Linux 发行版
【10月更文挑战第30天】
58 0
Vanilla OS:下一代安全 Linux 发行版
|
1月前
|
NoSQL Linux PHP
如何在不同操作系统上安装 Redis 服务器,包括 Linux 和 Windows 的具体步骤
本文介绍了如何在不同操作系统上安装 Redis 服务器,包括 Linux 和 Windows 的具体步骤。接着,对比了两种常用的 PHP Redis 客户端扩展:PhpRedis 和 Predis,详细说明了它们的安装方法及优缺点。最后,提供了使用 PhpRedis 和 Predis 在 PHP 中连接 Redis 服务器及进行字符串、列表、集合和哈希等数据类型的基本操作示例。
57 4
|
1月前
|
人工智能 安全 Linux
|
5月前
|
安全 Linux 网络安全
部署07--远程连接Linux系统,利用FinalShell可以远程连接到我们的操作系统上
部署07--远程连接Linux系统,利用FinalShell可以远程连接到我们的操作系统上
|
2月前
|
Unix 物联网 大数据
操作系统的演化与比较:从Unix到Linux
本文将探讨操作系统的历史发展,重点关注Unix和Linux两个主要的操作系统分支。通过分析它们的起源、设计哲学、技术特点以及在现代计算中的影响,我们可以更好地理解操作系统在计算机科学中的核心地位及其未来发展趋势。
|
4月前
|
编解码 安全 Linux
基于arm64架构国产操作系统|Linux下的RTMP|RTSP低延时直播播放器开发探究
这段内容讲述了国产操作系统背景下,大牛直播SDK针对国产操作系统与Linux平台发布的RTMP/RTSP直播播放SDK。此SDK支持arm64架构,基于X协议输出视频,采用PulseAudio和Alsa Lib处理音频,具备实时静音、快照、缓冲时间设定等功能,并支持H.265编码格式。此外,提供了示例代码展示如何实现多实例播放器的创建与管理,包括窗口布局调整、事件监听、视频分辨率变化和实时快照回调等关键功能。这一技术实现有助于提高直播服务的稳定性和响应速度,适应国产操作系统在各行业中的应用需求。
141 3
下一篇
DataWorks