【通义】AI视界|谷歌推出AI搜索功能“问照片”,照片一问即得……

简介: 本文汇总了AI领域的最新动态,包括谷歌推出的“问照片”功能,使用户能用自然语言检索Google Photos;OpenAI的商业用户激增及ChatGPT的广泛应用;Anthropic发布的企业级AI助手Claude Enterprise;美英欧盟首个人工智能法律约束条约;OpenAI前首席科学家新公司获巨额融资;以及比尔·盖茨对AI前景的乐观展望与安全建议。

本文内容均由【通义】自动生成,打开通义官网,更多能力等你体验~

24小时精选 ✦

  1. 谷歌推出AI搜索功能“问照片”,照片一问即得
  2. OpenAI付费商业用户破百万,ChatGPT免费用户超2亿
  3. Anthropic 推出企业版 AI 助手 Claude Enterprise
  4. 美英国欧盟签署首份关于人工智能的 “具有法律约束力” 的条约
  5. OpenAI 前首席科学家新公司融资10亿美元
  6. 比尔・盖茨谈对AI的看法,可能被滥用但整体对社会有益

01 谷歌推出AI搜索功能“问照片”,照片一问即得

Google Photos 的最新功能 “Ask Photos”正在逐步向用户推出。这一新功能利用了谷歌的 Gemini AI 技术,允许用户通过自然语言查询来查找他们的照片。这意味着用户可以像与真人对话一样询问 Google Photos 关于照片的具体信息,比如“我在纽约拍的照片在哪里?”或者“给我看去年夏天我们在海滩上的照片”。


这项功能旨在简化用户查找特定照片的过程,使得用户无需依赖关键词标签或手动分类即可快速定位所需的图像。 “Ask Photos”功能同时支持 iOS 和 Android 用户。

02 OpenAI付费商业用户破百万,ChatGPT免费用户超2亿

OpenAI 于 2024 年 9 月 5 日宣布付费商业用户总和已超过 100 万。尽管竞争激烈,但企业对其聊天机器人的需求仍在增长。4 月OpenAI 拥有 60 万企业 ChatGPT 用户,短短几个月便实现了大幅增长。此外,自今年7月推出 GPT4o mini 以来,其 API 的使用量翻了一番。


OpenAI的快速发展体现AI在企业合作、小模型发展方面的巨大潜力。据悉公司高层计划针对一些新发布的大型语言模型推出更高价位的订阅服务,如解决著名的 “Strawberry”有几个“r”的草莓难题。

03 Anthropic 推出企业版 AI 助手 Claude Enterprise

企业版拥有50万 tokens的上下文窗口,这意味着它能够处理和理解海量信息,而不需要频繁地分段或拆解数据。同时GitHub 集成功能允许Claude Enterprise同步企业的 GitHub仓库,从而直接在Claude的上下文中直接引用代码。


此外,Claude Enterprise 还具有更高的使用量以及强调保护客户数据(不会使用用户的对话或内容训练 AI)等特点。多家公司如GitLab、Midjourney和Menlo Ventures等已经是Claude Enterprise的早期客户。

04 美英国欧盟签署首份关于人工智能的 “具有法律约束力” 的条约

美国、英国和欧盟签署了首份关于人工智能的 “具有法律约束力” 的条约,《人工智能框架公约》。该公约列出了人工智能系统必须遵循的关键原则,主要内容包括:要求签署国对人工智能系统产生的任何有害和歧视性结果负责;此类系统的输出要尊重平等权和隐私权;为人工智能相关侵权行为的受害者赋予法律追索权。


这也标志着全球在 AI 监管方面的合作迈出重要一步,然而也有批评人士指出,该公约虽然具有法律约束力,但没有罚款等制裁措施,主要通过监测来衡量遵守情况,是一种相对较弱的执行形式。

05 OpenAI 前首席科学家新公司融资10亿美元

前 OpenAI 大神 Ilya Sutskever 新公司 SSI 融资 10 亿美元,三个月估值达 50 亿美元。SSI 公司的主要方向是开发安全、强大的通用人工智能(AGI)系统,将安全放在首位,致力于通过革命性突破实现 “安全超级智能”。


随着人工智能的快速发展,人们对 AI 可能带来的潜在风险日益关注,SSI 专注于基础 AI 研究且重视安全,吸引了投资者巨额押注,尽管短期内难以盈利,但展现出巨大的发展潜力和市场关注度。

06 比尔・盖茨谈对AI的看法,可能被滥用但整体对社会有益

比尔・盖茨在接受《The Verge》采访时分享了他对人工智能未来的一些看法。他极度看好人工智能的未来,认为这项技术将在未来五年内极大地改变每个人的生活。预言耳机和智能眼镜将成为 AI 硬件的两个重点领域。除了帮助人们极大地提高工作效率,盖茨还认为人工智能将 “加速创新管道”,在资源有限的世界里,创新是最大限度利用每一分钱的关键,而人工智能将以前所未有的速度加快新发现的速度。


盖茨指出AI安全关键是设立 AI 发展和指导方针,把负面影响降到最低。对于 AI 在选举方面的风险,他似乎并不担心,认为需让 AI 生成的内容被打上标记,以便人们确认新闻的真假。


本文内容均由【通义】自动生成,打开通义官网,更多能力等你体验~

相关文章
|
1天前
|
存储 人工智能 编解码
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
Pippo 是 Meta 推出的图像到视频生成模型,能够从单张照片生成 1K 分辨率的多视角高清人像视频,支持全身、面部或头部的生成。
42 9
|
9天前
|
人工智能 自然语言处理 API
OpenDeepResearcher:开源 AI 研究工具,自动完成搜索、评估、提取和生成报告
OpenDeepResearcher 是一款开源 AI 研究工具,支持异步处理、去重功能和 LLM 驱动的决策,帮助用户高效完成复杂的信息查询和分析任务。
142 18
OpenDeepResearcher:开源 AI 研究工具,自动完成搜索、评估、提取和生成报告
|
7天前
|
人工智能 开发框架 机器人
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
1951 13
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
|
4天前
|
人工智能 搜索推荐 程序员
通义灵码全新上线模型选择功能,新增支持 DeepSeek-V3 和 DeepSeek-R1 模型
阿里云百炼平台推出DeepSeek-V3、DeepSeek-R1等6款新模型,丰富AI模型矩阵。通义灵码随之升级,支持Qwen2.5、DeepSeek-V3和R1系列模型选择,助力AI编程。开发者可通过VS Code和JetBrains IDE轻松切换模型,实现复杂编码任务的自动化处理,进一步降低AI编程门槛,提供个性化服务。
277 19
|
2天前
|
人工智能 搜索推荐 测试技术
通义灵码 2.0 智能编码功能评测:Deepseek 加持下的 Python 开发体验
通义灵码 2.0 智能编码功能评测:Deepseek 加持下的 Python 开发体验
38 10
|
25天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
157 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
26天前
|
人工智能 自然语言处理 搜索推荐
GLM-Realtime:智谱推出多模态交互AI模型,融入清唱功能,支持视频和语音交互
GLM-Realtime 是智谱推出的端到端多模态模型,具备低延迟的视频理解与语音交互能力,支持清唱功能、2分钟内容记忆及灵活调用外部工具,适用于多种智能场景。
56 4
GLM-Realtime:智谱推出多模态交互AI模型,融入清唱功能,支持视频和语音交互
|
11天前
|
人工智能 IDE 程序员
与1.0 相比,通义灵码 2.0 AI 程序员有哪些功能、亮点、优势、场景?
通义灵码2.0相比1.0新增了工程级编码任务、单元测试生成和图片多模态问答等功能,支持多文件代码修改、批量生成单元测试及根据图片内容生成代码建议。亮点包括支持主流IDE、垂直智能体覆盖更多场景、企业级检索增强和灵活对话交互体验。技术优势涵盖多模态上下文感知、快速推理、企业数据个性化及一流代码生成效果。典型应用场景有新功能开发、跨语言编程、单元测试自动生成和错误排查修复。
218 7
|
1月前
|
人工智能 自然语言处理 搜索推荐
云端问道12期实操教学-构建基于Elasticsearch的企业级AI搜索应用
本文介绍了构建基于Elasticsearch的企业级AI搜索应用,涵盖了从传统关键词匹配到对话式问答的搜索形态演变。阿里云的AI搜索产品依托自研和开源(如Elasticsearch)引擎,提供高性能检索服务,支持千亿级数据毫秒响应。文章重点描述了AI搜索的三个核心关键点:精准结果、语义理解、高性能引擎,并展示了架构升级和典型应用场景,包括智能问答、电商导购、多模态图书及商品搜索等。通过实验部分,详细演示了如何使用阿里云ES搭建AI语义搜索Demo,涵盖模型创建、Pipeline配置、数据写入与检索测试等步骤,同时介绍了相关的计费模式。
|
28天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
189 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备

热门文章

最新文章