今天,Claude发布了Computer Use的新功能,可以让AI像人一样使用电脑!
在官方提供的填写表格的例子中,涉及到的数据分散在了电脑不同的位置,如果人工挨个寻找费时费力。
现在,你只需要跟Claude说一声需求,它就会先“看”屏幕,发现所需要的数据不在这份表格里,马上掉头去CRM搜索所需数据。找到匹配的信息之后,Claude就会自己滚动网页,最后把对应的数据填写到相应的表格栏中。
而整个演示的过程,无需人类任何的参与!让大家感受到了什么叫做“生产力的极大提升”!但也有一线开发者热评:
让我们也来顺势回顾一下Mobile-agent:
通义NLP实验室联合魔搭社区在今年2月份推出了Mobile-Agent框架(开源地址:https://github.com/X-PLUG/MobileAgent),在手机端和PC端实现了高级的RPA(Robotic Process Automation)功能。Mobile-Agent通过纯视觉方案,利用视觉感知工具和操作工具,实现了智能体在手机上的自动化操作,无需依赖系统级别的UI文件,展现了即插即用的能力。Mobile-Agent的推出,迅速在AI领域和手机制造商中引起了广泛关注。让我们看下官方和开发者出的一些demo:
案例1:PC端自主化操作
- 通过浏览器访问网页并下载保存文件
- 在Microsoft Word中创建新文档、编辑文本及保存文件
- 通过浏览器访问网页并复制文字发送消息给阿里钉
好的标题可以获得更多的推荐及关注者
案例2:一句指令操作手机
- 帮你点奶茶
- 帮你打微信视频电话
- 帮你搜索旅游攻略并发给自己微信好友
好的标题可以获得更多的推荐及关注者
案例3:智能抓药机械臂
它可以通过语音对话了解用户病症并思考合适的药品,通过视觉理解模型识别不同药品,然后驱动机械臂抓取药物到指定的盘子。
好的标题可以获得更多的推荐及关注者
在大模型加持下,AI硬件正当时。
成熟终端手机、汽车、电脑等正加装AI能力作为新卖点,同时,新的硬件形态层出不穷,如Meta-Ray Glass、Rabbit R1、Plaud Note的先行者已创造销量奇迹;AI玩具、AI穿戴设备、AI教育工具、AI机器人各个赛道也是群雄角逐。
中国电子产业链成熟,加上AI能力后更显生机勃勃。在此节点,魔搭社区、阿里云、英特尔共同发起「2024 AI+硬件创新大赛」,一起推动AI硬件的创新创业,孵化和助力下一个现象级AI+硬件产品。奖金池总共50万!欢迎各位开发者组队参与这次比赛!
比赛详情:https://startup.aliyun.com/aihackathon/ai3c
One More Thing
如果想跟Mobile-Agent作者团队面对面沟通,还可以报名参加上海场沙龙~
往期回顾
点击链接👇,查看比赛详情!