微软推出Copilot Vision AI助手赋能网页浏览与决策

简介: 微软推出Copilot Vision AI助手赋能网页浏览与决策

来源:企业网D1net


微软近日宣布,其AI助手Copilot已新增“视觉”功能,允许用户与网页内容进行更直观的交互,该功能目前正面向部分Pro订阅用户预览,用户可在Edge浏览器上触发Copilot Vision,与其就网页内容进行互动。Copilot Vision能扫描、分析网页,帮助用户快速获取信息并做出决策,极大提升工作效率。微软强调,该功能重视用户隐私与版权,会话结束后所有信息将被删除。未来,Copilot Vision或将扩展至微软生态系统中的其他产品,如OneDrive和Excel,助力企业用户更轻松工作。此举也标志着微软在代理式AI领域的进一步布局,与Salesforce、Anthropic等竞争对手同台竞技。


微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。


虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。


该功能仍处于开发的早期阶段,且相当受限,但一旦完全成熟,对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时,帮助他们进行分析和决策。


从长远来看,观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理,以跨不同供应商的应用程序进行查看、推理和采取行动。


Copilot Vision能带来什么?


当用户打开一个网站时,他们可能有一个明确的目标,也可能没有,但是,当他们有目标时,比如为学术论文进行研究,执行所需任务的过程就包括浏览网站、阅读所有内容,然后做出决定(比如是否将网站内容作为论文的参考),同样的道理也适用于其他日常网络任务,如购物。


通过全新的Copilot Vision体验,微软旨在简化整个流程。本质上,用户现在拥有了一个助手,它位于浏览器的底部,可以随时被调用以阅读网站内容,包括所有文本和图像,并帮助用户进行决策。


它能够立即扫描、分析并提供所有所需信息,同时考虑到用户的既定目标——就像另一双眼睛一样。


这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容,它也具有重大影响,然而,微软已保证,一旦Vision会话关闭,用户共享的所有上下文和信息都将被删除。它还指出,网站数据不会被捕获/存储用于训练底层模型。


“简而言之,我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。


基于反馈进行扩展


目前,美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入,这意味着用户不必担心AI一直在读取他们的屏幕。


此外,在这一阶段,该功能将仅适用于部分网站。微软表示,它将根据早期用户的反馈逐步改进该功能,并扩大对更多Pro用户和其他网站的支持。


从长远来看,该公司甚至可能将这些功能扩展到其生态系统中的其他产品,如OneDrive和Excel,从而让企业用户能够更轻松地工作和做出决策,然而,目前尚无官方确认。更不用说,鉴于此处所表明的谨慎态度,这可能需要一些时间才能实现。


微软推出Copilot Vision预览之际,正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce,以实现跨销售、营销和服务等领域的工作流程自动化。


与此同时,Anthropic推出了“Computer Use”,允许开发者整合Claude以与计算机桌面环境进行交互,执行以前仅由人类工作者处理的任务,如打开应用程序、与界面互动和填写表单。

相关文章
vue3.5接入deepseek-v3网页版ai流式多轮聊天问答助手
vue3-deepseek-webai:原创新作vite6+vue3.5+deepseek-v3+arco-design实战一款高颜值网页版ai多轮输出对话小助手。
98 14
从 DeepSeek 到 AI 工具箱:Websoft9 应用托管平台赋能高校教学与科研
Websoft9应用托管平台整合DeepSeek大模型与主流AI工具,助力高校教学与科研智能化转型。平台解决环境部署碎片化、资源利用低效及技术应用孤岛化等挑战,通过智能内核层、工具矩阵层和资源调度层实现高效技术融合。实际案例显示,平台显著提升教学精准度与科研协作效率,同时遵循开放兼容、安全可控等原则,推动认知增强型课堂与虚实联动实验空间的构建,为高等教育带来可持续发展的智能化基座。
56 1
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研
Qlib是微软亚洲研究院推出的开源AI量化投资平台,提供从数据处理、模型训练到组合管理的全流程支持,内置高性能数据基础设施和多种机器学习模型。
73 19
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研
Amazon Nova Act:网页操作全自动!亚马逊黑科技把浏览器变AI机器人,请假/订餐/写邮件一键搞定
Amazon Nova Act是亚马逊AGI实验室推出的通用AI代理系统,通过原子化分解网页操作任务并配合Playwright实现高可靠性浏览器自动化,其配套SDK支持开发者快速构建智能体应用原型。
45 13
Amazon Nova Act:网页操作全自动!亚马逊黑科技把浏览器变AI机器人,请假/订餐/写邮件一键搞定
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
OpenDeepSearch是基于开源推理模型的深度搜索工具,通过语义重排和多源整合优化检索效果,支持与AI代理无缝集成,提供快速和专业两种搜索模式。
80 10
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
AI时代的流量博弈:代理IP如何赋能智能应用突围
在AI时代,流量获取成为互联网发展的关键挑战。本文探讨代理IP技术如何助力AI应用突破流量困境。从身份伪装、地域突破到并发采集,代理IP为数据收集与智能应用提供支持。同时,文章分析不同类型代理IP的特点及应用场景,并强调合规使用的重要性。未来,边缘计算和AI将与代理IP深度融合,推动更高效的数据流通模式,助力AI应用实现增长突破。
45 7
AI时代的流量博弈:代理IP如何赋能智能应用突围
HarmonyOS Next~鸿蒙AI功能开发:Core Speech Kit与Core Vision Kit的技术解析与实践
本文深入解析鸿蒙操作系统(HarmonyOS)中的Core Speech Kit与Core Vision Kit,探讨其在AI功能开发中的核心能力与实践方法。Core Speech Kit聚焦语音交互,提供语音识别、合成等功能,支持多场景应用;Core Vision Kit专注视觉处理,涵盖人脸检测、OCR等技术。文章还分析了两者的协同应用及生态发展趋势,展望未来AI技术与鸿蒙系统结合带来的智能交互新阶段。
69 31
AI浪潮下的青年觉醒:生成式人工智能(GAI)认证赋能未来竞争力与人文担当
人工智能正深刻改变生活与工作,青年面临前所未有的机遇与挑战。文章探讨了青年在AI时代的觉醒、核心竞争力的培养及技术伦理参与的重要性,并强调生成式人工智能(GAI)认证的意义,助力青年提升技能与就业竞争力,推动科学教育与技术创新融合。青年应保持好奇心、坚持人文关怀,引领未来社会发展方向,在AI浪潮中创造价值与美好未来。
AI赋能:高质量发展新引擎与生成式人工智能(GAI)认证的兴起
人工智能(AI)正成为推动高质量发展的核心动力,从智能制造到智慧城市,应用场景日益丰富。内蒙古等地抢抓AI发展机遇,通过智慧矿山、城市大脑等项目实现产业升级。生成式人工智能(GAI)认证的引入,填补了AI技能培养的空白,为企业和求职者提供了科学规范的标准。未来,需进一步融合AI赋能与GAI认证,加强人才培养与政策支持,推动经济社会持续健康发展。
AI赋能教育评价改革:生成式人工智能(GAI)认证的角色与影响
本文探讨了人工智能(AI)技术在教育评价改革中的作用及生成式人工智能(GAI)认证的影响。随着数字化时代的到来,AI为教育评价提供了新工具与手段,能够优化评价过程、提升质量并促进个性化发展。GAI认证不仅提升了教育工作者的技能与竞争力,还推动了教育评价的标准化与规范化。文章强调需加强AI技术应用研究、推广GAI认证,并注重评价的个性化与差异化,以助力学生全面发展。AI赋能教育评价改革是未来趋势,将为教育事业注入更多智慧与力量。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等