微软推出Copilot Vision AI助手赋能网页浏览与决策

简介: 微软推出Copilot Vision AI助手赋能网页浏览与决策

来源:企业网D1net


微软近日宣布,其AI助手Copilot已新增“视觉”功能,允许用户与网页内容进行更直观的交互,该功能目前正面向部分Pro订阅用户预览,用户可在Edge浏览器上触发Copilot Vision,与其就网页内容进行互动。Copilot Vision能扫描、分析网页,帮助用户快速获取信息并做出决策,极大提升工作效率。微软强调,该功能重视用户隐私与版权,会话结束后所有信息将被删除。未来,Copilot Vision或将扩展至微软生态系统中的其他产品,如OneDrive和Excel,助力企业用户更轻松工作。此举也标志着微软在代理式AI领域的进一步布局,与Salesforce、Anthropic等竞争对手同台竞技。


微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。


虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。


该功能仍处于开发的早期阶段,且相当受限,但一旦完全成熟,对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时,帮助他们进行分析和决策。


从长远来看,观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理,以跨不同供应商的应用程序进行查看、推理和采取行动。


Copilot Vision能带来什么?


当用户打开一个网站时,他们可能有一个明确的目标,也可能没有,但是,当他们有目标时,比如为学术论文进行研究,执行所需任务的过程就包括浏览网站、阅读所有内容,然后做出决定(比如是否将网站内容作为论文的参考),同样的道理也适用于其他日常网络任务,如购物。


通过全新的Copilot Vision体验,微软旨在简化整个流程。本质上,用户现在拥有了一个助手,它位于浏览器的底部,可以随时被调用以阅读网站内容,包括所有文本和图像,并帮助用户进行决策。


它能够立即扫描、分析并提供所有所需信息,同时考虑到用户的既定目标——就像另一双眼睛一样。


这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容,它也具有重大影响,然而,微软已保证,一旦Vision会话关闭,用户共享的所有上下文和信息都将被删除。它还指出,网站数据不会被捕获/存储用于训练底层模型。


“简而言之,我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。


基于反馈进行扩展


目前,美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入,这意味着用户不必担心AI一直在读取他们的屏幕。


此外,在这一阶段,该功能将仅适用于部分网站。微软表示,它将根据早期用户的反馈逐步改进该功能,并扩大对更多Pro用户和其他网站的支持。


从长远来看,该公司甚至可能将这些功能扩展到其生态系统中的其他产品,如OneDrive和Excel,从而让企业用户能够更轻松地工作和做出决策,然而,目前尚无官方确认。更不用说,鉴于此处所表明的谨慎态度,这可能需要一些时间才能实现。


微软推出Copilot Vision预览之际,正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce,以实现跨销售、营销和服务等领域的工作流程自动化。


与此同时,Anthropic推出了“Computer Use”,允许开发者整合Claude以与计算机桌面环境进行交互,执行以前仅由人类工作者处理的任务,如打开应用程序、与界面互动和填写表单。

相关文章
|
6月前
|
人工智能 新制造 云栖大会
TsingtaoAI亮相云栖大会,AI大模型赋能传统制造业焕新升级
2025年9月24日,杭州云栖小镇,2025云栖大会盛大开幕。作为全球AI技术与产业融合的重要平台,本届大会以“AI驱动产业变革”为主题,集中展示大模型技术在各领域的创新应用。 其中,由西湖区商务局牵头组织的“AI大模型应用与产业融合”专场论坛成为大会亮点之一,吸引了来自政府、企业及投资机构的百余名代表参与。 在论坛上,TsingtaoAI作为制造业智能化转型的代表企业,分享了在具身智能-制造企业的AI应用实践。
399 1
|
7月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
455 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
6月前
|
存储 人工智能 前端开发
超越问答:深入理解并构建自主决策的AI智能体(Agent)
如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。
1235 6
|
6月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
399 7
|
6月前
|
人工智能 监控 Java
Java与AI智能体:构建自主决策与工具调用的智能系统
随着AI智能体技术的快速发展,构建能够自主理解任务、制定计划并执行复杂操作的智能系统已成为新的技术前沿。本文深入探讨如何在Java生态中构建具备工具调用、记忆管理和自主决策能力的AI智能体系统。我们将完整展示从智能体架构设计、工具生态系统、记忆机制到多智能体协作的全流程,为Java开发者提供构建下一代自主智能系统的完整技术方案。
799 4
|
7月前
|
机器学习/深度学习 人工智能 编解码
古籍版面分析新SOTA:HisDoc-DETR如何助力AI赋能古籍数字化难题
HisDoc-DETR是面向历史文献版面分析的创新模型,融合语义学习与多尺度特征融合,有效应对古籍中复杂布局、稀疏文字与破损模糊等挑战,实现高精度元素识别与结构解析,推动文化遗产数字化与学术研究发展。
|
7月前
|
Web App开发 人工智能 自然语言处理
快速搞定Dify+Chrome MCP:打造能操作网页的AI助手
用Dify+Chrome MCP,3分钟打造能“动手”操作网页的AI助手!无需编程,通过自然语言指令实现自动填表、数据抓取、网页点击等自动化任务。本地部署简单,支持搜索、登录、监控等场景,让AI成为你的7×24小时数字员工,高效处理重复性网页工作。
|
6月前
|
机器学习/深度学习 人工智能 监控
拔俗AI智能营运分析助手软件系统:企业决策的"数据军师",让经营从"拍脑袋"变"精准导航"
AI智能营运分析助手打破数据孤岛,实时整合ERP、CRM等系统数据,自动生成报表、智能预警与可视化决策建议,助力企业从“经验驱动”迈向“数据驱动”,提升决策效率,降低运营成本,精准把握市场先机。(238字)
202 0
|
6月前
|
存储 人工智能 自然语言处理
拔俗AI自动化评价分析系统:让数据说话,让决策更智能
在用户体验为核心的时代,传统评价分析面临效率低、洞察浅等痛点。本文基于阿里云AI与大数据技术,构建“数据-算法-应用”三层智能分析体系,实现多源数据实时接入、情感与主题精准识别、跨模态融合分析及实时预警,助力企业提升运营效率、加速产品迭代、优化服务质量,并已在头部电商平台成功落地,显著提升用户满意度与商业转化。
575 0