OS Copilot 是否做好准备大干一场了?实测体验

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
视觉智能开放平台,图像资源包5000点
NLP自然语言处理_基础版,每接口每天50万次
简介: **OS Copilot测评摘要:**智能运维助手OS Copilot展现出优雅的命令停止功能和对话记忆,但存在不足。Markdown渲染在终端中不理想,且在生成脚本后误导用户执行未创建的文件。模型有时产生幻觉,误认为已完成任务。此外,对codesum等特定功能理解不足。建议加强代码高亮、系统集成、思维链透明度、疑难命令处理及提供API。测评包括一键创建实例、修改密码、设置安全组、创建AccessKey及安装步骤。

[TOC]

使用测评

image-20240705160324964.png

这是一张使用截图,像在做自我介绍一样。这就是今天我尝试使用的智能运维助手,OS Copilot。

身为运维,天天和系统和命令和脚本打交道,CO 是专门在这个场景中,借助大模型能力增加工作效率的工具。今天我按着他的指引文档,一步步试用操作了一下,整个过程用下来还算顺畅,总体来看 CO 确实有了智能助手的影子,但实际能力离真正帮忙,还有一些距离,我把优缺点记录了下来,测试步骤放在了最后,供有兴趣的人参考。测评问题总结放在最后。

惊艳之处

  • 停止命令很优雅,做了样式

image-20240705155224750.png

  • 交互模式的对话做了对话记忆功能。

image-20240705160117302.png

不足之处

  • markdown 语法在终端中有些多次一举,阻碍阅读。
  • 生成脚本后推荐了可执行命令,当我选择执行命令时,则报错没有文件,然后我才发现 CO 只生成了代码,而确实没有生成文件。所以接下来供用户执行的选择有点画蛇添足,因为既然没有文件也没办法执行,则不要这样提示为好。

image-20240705155156172.png

  • 仍有模型幻觉,以下面例子为例,我进一步让他保存代码文件,暂且不提 CO 是否具备了调用系统接口做创建文件的动作,但是他自己没有否认自己有这个能力,于是做了如下输出,可以看到,他认为自己已经完成了任务,保存了文件,但实际什么也没有,所以模型幻觉让人存在,很容易触发。

image-20240705155818559.png

  • 模型语料中对自身的知识有些不足,比如我问他交互模式中的 codesum 是怎么用的,但是 CO 并没有给出一个合格的答案

image-20240705160033801.png

产品建议

  • 如果能在终端中,代码生成时加上代码高亮的功能,那将非常炫酷
  • 如果 CO 可以调用系统接口,创建文件,写入文件,读取文件,真正做到和系统相结合使用,那将是一个质的提升。
  • 希望 CO 在执行任务时,也可以选择打印出自己的思维链,比如这一步骤做了什么,下一步骤做什么,这样当出现幻觉或者回答错误时,使用者也容易知道是哪一环节出了问题,导致模型错误输出。
  • 如果 CO 可以提供接口,供其他工具调用,那将大大扩展自己的舞台。
  • 希望 CO 训练数据不要太着重于简单常见命令,这些命令都是大家手到擒来的,真正让人头疼,不得不去搜索查阅资料的是一些疑难或者长命令,如果 CO 模型能加强这部分的训练,那一定很有帮助。

环境准备步骤

一键创建实例

image-20240705153407201.png

修改服务器密码

image-20240705153658095.png

设置安全组

image-20240705153740819.png

创建AccessKey

image-20240705153929829.png

安装 OS Copilot

image-20240705154651027.png

测评问题

1、OS Copilot 产品体验评测
1)您的角色是什么?开发、运维、学生?如果使用OS Copilot,您的使用场景是什么?
运维,工作维护集群,检查集群,维护服务
2)你觉得 OS Copilot 在新人上手方面是否简单、指引文档是否清晰、是否存在什么阻碍?
清晰无阻碍
3)OS Copilot 是否对您的工作有帮助?如果有帮助的话,帮助程度1-10分,能够打几分?
7分,具体原因见文中不足之处的分析
4)您愿意向周边朋友/工作伙伴推荐OS Copilot吗?如果OS Copilot开源,是否有意愿共同参与开发?包括参与OS领域大模型的训练等。
愿意

2、OS Copilot 产品功能反馈
1)您体验了哪些功能?对OS Copilot的哪些功能最感兴趣(知识问答、辅助编程、辅助命令执行等),为什么?
代码生成,辅助命令执行都不错,具体使用情况上文使用测评
2)您有体验过其他类型的产品吗?对比其他产品OS Copilot有什么优缺点?
体验过 copilot,相较于纯代码辅助的 copilot,OS Copilot 更专注操作系统的运维,对系统命令解释的详细,尤其对中文内容很友好。缺点就是模型能力还不够强大,幻觉问题时常出现。详情见文中不足之处的分析。
3)您希望OS Copilot能够扩展其他哪些功能呢?比如,支持更多的操作系统、自动命令报错原因分析、系统错误排查,或其他任何您想到的功能。
对于功能建议已经在文中产品建议模块给出。再补充一些,比如我希望 CO 能多平台,能个性化,支持配置。
4)OS Copilot与其他产品联动组合的体验以及可能,如ACK智能助手、ECS、Workbench等,您也可以展开列举组合的实际应用场景。
与 p8s,alertmanager 等告警组件,组合成巡检告警系统。

相关文章
|
6天前
|
存储 弹性计算 运维
云端问道 7 期实践教学-使用操作系统智能助手 OS Copilot 轻松运维与编程
使用操作系统智能助手 OS Copilot 轻松运维与编程
31 14
|
1天前
|
弹性计算 运维 自然语言处理
操作系统智能助手OS Copilot新功能
作为一名运维工程师,我体验了OS Copilot的-t/-f/管道功能。通过安装组件并运行`co`命令,顺利测试了系统健康度评估、复杂任务处理和配置文件解析等功能。-t参数可快速进入agent模式,-f参数能高效执行复杂任务,管道功能则帮助理解系统配置。建议增加平台支持、明确提示、更多自定义选项及优化自然语言处理能力。OS Copilot极大提升了Linux系统的使用效率,未来有望成为更多用户的得力助手。
|
2天前
|
弹性计算 运维 网络安全
评测报告:阿里云操作系统智能助手OS Copilot体验
评测报告:阿里云操作系统智能助手OS Copilot体验
14 3
|
2天前
|
弹性计算 JSON 运维
OS Copilot评测报告
我是一位开发工程师,平时工作中经常涉及云资源的运维和管理。在本次评测中,我顺利使用了OS Copilot的-t、-f以及管道功能,整体体验非常不错。
13 3
|
19小时前
|
弹性计算 自然语言处理 Linux
Os Copilot功能测评
作为一名开发工程师,我在工作中偶尔涉及云资源的运维和管理。本文记录了我使用OS Copilot的-t/-f/管道功能的体验及遇到的问题。通过阿里云ECS下单、密钥配置、镜像选择等步骤成功登录服务器后,根据文档安装OS Copilot并测试其功能。-t参数可快速获取系统健康度结论;-f参数支持自然语言处理文件需求;管道功能帮助理解配置文件内容。这些功能极大提升了工作效率,但仍存在上下文记忆不足的问题。
|
20小时前
|
自然语言处理 运维 Ubuntu
操作系统智能助手OS Copilot新功能评测
OS Copilot是阿里云基于大模型构建的操作系统智能助手,支持自然语言问答、辅助命令执行、系统运维调优等功能,帮助用户更高效地使用Linux系统。主要优势包括智能学习、专业解答、高效协作和便捷的阿里云CLI调用。支持的操作系统有Alibaba Cloud Linux、Ubuntu、Anolis OS和CentOS等。通过简单的命令行操作,用户可以轻松安装、升级或卸载OS Copilot,并利用其多种功能提升工作效率。具体使用方法包括单命令模式、交互模式及问号指令,适用于不同场景下的需求。
14 0
|
28天前
|
数据可视化 关系型数据库 MySQL
阿里云开发者社区12月更文特别活动分享:🌍PolarDB、🧹OS Copilot和🧰云效Flow深度体验
本文深入探讨了阿里云的三款核心产品:PolarDB MySQL、OS Copilot和云效Flow,分别聚焦于云数据库、系统运维和DevOps流程管理的功能、表现及优化建议。通过多场景评测与实验,展示了这些产品在提高效率、简化操作和增强系统稳定性方面的显著优势。
|
2月前
|
存储 人工智能 自然语言处理
OS Copilot"作为一款操作系统辅助软件应运而生,旨在提升用户使用电脑的效率
随着AI技术的发展,"OS Copilot"作为一款操作系统辅助软件应运而生,旨在提升用户使用电脑的效率。它具备智能命令建议、代码片段生成、文件管理助手及任务自动化等功能,适合日常办公与专业开发。安装简便,上手容易,能显著提高工作效率。
41 3
|
3月前
|
存储 人工智能 自然语言处理
“OS Copilot”的操作系统辅助软件
【10月更文挑战第7天】随着AI技术的发展,"OS Copilot"作为一款操作系统辅助软件,通过智能命令建议、代码片段生成、文件管理助手及任务自动化等功能,极大提升了用户的工作效率,无论是日常办公还是专业开发都提供了强有力的支持。其简洁的安装流程、友好的用户界面和强大的搜索能力,使得这款软件成为提升生产力的得力助手。
51 2
下一篇
开通oss服务