微软推出Copilot Vision AI助手赋能网页浏览与决策

简介: 微软推出Copilot Vision AI助手赋能网页浏览与决策

来源:企业网D1net


微软近日宣布,其AI助手Copilot已新增“视觉”功能,允许用户与网页内容进行更直观的交互,该功能目前正面向部分Pro订阅用户预览,用户可在Edge浏览器上触发Copilot Vision,与其就网页内容进行互动。Copilot Vision能扫描、分析网页,帮助用户快速获取信息并做出决策,极大提升工作效率。微软强调,该功能重视用户隐私与版权,会话结束后所有信息将被删除。未来,Copilot Vision或将扩展至微软生态系统中的其他产品,如OneDrive和Excel,助力企业用户更轻松工作。此举也标志着微软在代理式AI领域的进一步布局,与Salesforce、Anthropic等竞争对手同台竞技。


微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。


虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。


该功能仍处于开发的早期阶段,且相当受限,但一旦完全成熟,对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时,帮助他们进行分析和决策。


从长远来看,观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理,以跨不同供应商的应用程序进行查看、推理和采取行动。


Copilot Vision能带来什么?


当用户打开一个网站时,他们可能有一个明确的目标,也可能没有,但是,当他们有目标时,比如为学术论文进行研究,执行所需任务的过程就包括浏览网站、阅读所有内容,然后做出决定(比如是否将网站内容作为论文的参考),同样的道理也适用于其他日常网络任务,如购物。


通过全新的Copilot Vision体验,微软旨在简化整个流程。本质上,用户现在拥有了一个助手,它位于浏览器的底部,可以随时被调用以阅读网站内容,包括所有文本和图像,并帮助用户进行决策。


它能够立即扫描、分析并提供所有所需信息,同时考虑到用户的既定目标——就像另一双眼睛一样。


这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容,它也具有重大影响,然而,微软已保证,一旦Vision会话关闭,用户共享的所有上下文和信息都将被删除。它还指出,网站数据不会被捕获/存储用于训练底层模型。


“简而言之,我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。


基于反馈进行扩展


目前,美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入,这意味着用户不必担心AI一直在读取他们的屏幕。


此外,在这一阶段,该功能将仅适用于部分网站。微软表示,它将根据早期用户的反馈逐步改进该功能,并扩大对更多Pro用户和其他网站的支持。


从长远来看,该公司甚至可能将这些功能扩展到其生态系统中的其他产品,如OneDrive和Excel,从而让企业用户能够更轻松地工作和做出决策,然而,目前尚无官方确认。更不用说,鉴于此处所表明的谨慎态度,这可能需要一些时间才能实现。


微软推出Copilot Vision预览之际,正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce,以实现跨销售、营销和服务等领域的工作流程自动化。


与此同时,Anthropic推出了“Computer Use”,允许开发者整合Claude以与计算机桌面环境进行交互,执行以前仅由人类工作者处理的任务,如打开应用程序、与界面互动和填写表单。

相关文章
|
16天前
|
人工智能 自然语言处理 安全
在线使用:Poe Ai网页版_pc版_poe ai中文官网入口
幸运的是,如今国内用户也可以轻松享受Poe AI的强大功能,突破网络屏障,开启属于自己的AI创作之旅!
68 7
在线使用:Poe Ai网页版_pc版_poe ai中文官网入口
|
7天前
|
人工智能 安全 API
OpenHands:能自主检索外部知识的 AI 编程工具,自动执行命令、网页浏览和生成代码等操作
OpenHands 是一款基于 AI 的编程工具,支持多智能体协作,能够自动生成代码、执行命令、浏览网页等,显著提升开发效率。
87 26
OpenHands:能自主检索外部知识的 AI 编程工具,自动执行命令、网页浏览和生成代码等操作
|
5天前
|
人工智能 自然语言处理 调度
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
Casevo 是中国传媒大学推出的开源社会传播模拟系统,结合大语言模型和多智能体技术,支持复杂社会网络建模与动态交互,适用于新闻传播、社会计算等领域。
52 22
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
|
6天前
|
人工智能 搜索推荐 前端开发
MiniPerplx:基于 Grok 2.0 的开源 AI 搜索引擎,支持网页、学术、视频搜索
MiniPerplx 是一款基于 Grok 2.0 模型的开源 AI 搜索引擎,支持网页、学术论文、YouTube 视频等多种内容搜索,提供代码解释、天气预报等功能。
64 17
MiniPerplx:基于 Grok 2.0 的开源 AI 搜索引擎,支持网页、学术、视频搜索
|
6天前
|
人工智能 运维 Prometheus
AIOpsLab:云服务自动化运维 AI,微软开源云服务 AI 框架,覆盖整个生命周期
AIOpsLab 是微软等机构推出的开源框架,支持云服务自动化运维,涵盖故障检测、根本原因分析等完整生命周期。
66 13
AIOpsLab:云服务自动化运维 AI,微软开源云服务 AI 框架,覆盖整个生命周期
|
8天前
|
消息中间件 机器学习/深度学习 人工智能
AI赋能运维:实现运维任务的智能化自动分配
AI赋能运维:实现运维任务的智能化自动分配
77 23
|
11天前
|
人工智能 数据处理 C#
AI Dev Gallery:微软开源 Windows AI 模型本地运行工具包和示例库,助理开发者快速集成 AI 功能
微软推出的AI Dev Gallery,为Windows开发者提供开源AI工具包和示例库,支持本地运行AI模型,提升开发效率。
53 13
|
7天前
|
机器学习/深度学习 人工智能
微软华人领衔AI²BMD登Nature,AI生物分子模拟双突破!继AlphaFold后又一里程碑
AI²BMD(AI-driven Biomolecular Dynamics)是由微软华人科学家团队领衔的研究,发表于《自然》杂志。该方法通过将蛋白质分解为21种常见单元,并利用机器学习模型预测其相互作用,实现高效精准的生物分子模拟。相比传统方法,AI²BMD在能量和力预测上精度更高,计算速度提升数个数量级,尤其适用于大规模蛋白质模拟,为药物设计等领域提供了有力工具。未来研究将扩展至更多生物分子类型并优化效率。论文地址:https://www.nature.com/articles/s41586-024-08127-z
32 8
|
16天前
|
机器学习/深度学习 数据采集 人工智能
AI在用户行为分析中的应用:实现精准洞察与决策优化
AI在用户行为分析中的应用:实现精准洞察与决策优化
77 15
|
16天前
|
机器学习/深度学习 人工智能 安全
阿里云先知安全沙龙(武汉站) ——AI赋能软件漏洞检测,机遇, 挑战与展望
本文介绍了漏洞检测的发展历程、现状及未来展望。2023年全球披露的漏洞数量达26447个,同比增长5.2%,其中超过7000个具有利用代码,115个已被广泛利用,涉及多个知名软件和系统。文章探讨了从人工审计到AI技术的应用,强调了数据集质量对模型性能的重要性,并展示了不同检测模型的工作原理与实现方法。此外,还讨论了对抗攻击对模型的影响及提高模型可解释性的多种方法,展望了未来通过任务大模型实现自动化漏洞检测与修复的趋势。

热门文章

最新文章