备案控制台登录注册

开发者社区人工智能文章正文

谷歌宣布下一代AI图像识别技术Google Lens

2017-05-02 1587

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

图像搜索，任选一个服务类型 1个月

简介：

谷歌宣布下一代AI图像识别技术Google Lens

在今日凌晨的2017谷歌I/O大会中，谷歌宣布了下一代图像识别技术Google Lens，能够允许人工智能识别图片中的对象和定位等，以及利用AI做到一些非常酷的事情。通过其知识图谱，谷歌不仅能识别图片或视频中的对象，还能识别面部表情和其周边的事物。

谷歌甚至声称利用其图像识别算法的识别率甚至高于人类的水平，有趣的应用包括：谷歌能够识别在弱光环境中手机拍摄的照片，如果谷歌系统已经识别过图中的对象并存有数据，能够自动利用对象的特征为弱光图片调整色彩，增加对象细节等等。

Google Lens是谷歌在图像识别领域中的努力集大成者，其将会首先集成在Google Assistant和Photos应用，做到许多有趣的事情。谷歌的“人工智能”优先策略表明其在AI和机器深度学习的深耕已经进入应用普及阶段。

本文来自合作伙伴“阿里聚安全”，发表于2017年05月18日 15:49.

文章标签：

图像识别

人工智能

机器学习/深度学习

算法

知识图谱

安全

关键词：

AI技术

谷歌AI

谷歌AI技术

AI谷歌

google ai

美人迟暮

+关注

1003文章 212问答

目录

打赏

0

0

0

0

19

相关文章

Deephub

|

17天前

|

机器学习/深度学习人工智能数据可视化

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

本文系统对比了扩散模型与Flow Matching两种生成模型技术。扩散模型通过逐步添加噪声再逆转过程生成数据，类比为沙堡的侵蚀与重建；Flow Matching构建分布间连续路径的速度场，如同矢量导航系统。两者在数学原理、训练动态及应用上各有优劣：扩散模型适合复杂数据，Flow Matching采样效率更高。文章结合实例解析两者的差异与联系，并探讨其在图像、音频等领域的实际应用，为生成建模提供了全面视角。

Deephub

84 1 1

Echo_Wish

|

15天前

|

传感器人工智能物联网

健康监测设备的技术革命：AI+物联网如何让你随时掌握健康数据？

健康监测设备的技术革命：AI+物联网如何让你随时掌握健康数据？

Echo_Wish

124 19 20

Deephub

|

8天前

|

机器学习/深度学习人工智能自然语言处理

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

近年来，多模态表示学习在人工智能领域取得显著进展，CLIP和SigLIP成为里程碑式模型。CLIP由OpenAI提出，通过对比学习对齐图像与文本嵌入空间，具备强大零样本学习能力；SigLIP由Google开发，采用sigmoid损失函数优化训练效率与可扩展性。两者推动了多模态大型语言模型（MLLMs）的发展，如LLaVA、BLIP-2和Flamingo等，实现了视觉问答、图像描述生成等复杂任务。这些模型不仅拓展了理论边界，还为医疗、教育等领域释放技术潜力，标志着多模态智能系统的重要进步。

Deephub

71 13 13

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

bruce_xiaowei

|

12天前

|

人工智能 API 语音技术

HarmonyOS Next～鸿蒙AI功能开发：Core Speech Kit与Core Vision Kit的技术解析与实践

本文深入解析鸿蒙操作系统（HarmonyOS）中的Core Speech Kit与Core Vision Kit，探讨其在AI功能开发中的核心能力与实践方法。Core Speech Kit聚焦语音交互，提供语音识别、合成等功能，支持多场景应用；Core Vision Kit专注视觉处理，涵盖人脸检测、OCR等技术。文章还分析了两者的协同应用及生态发展趋势，展望未来AI技术与鸿蒙系统结合带来的智能交互新阶段。

bruce_xiaowei

69 31 31

杖雍皓

|

25天前

|

机器学习/深度学习人工智能自然语言处理

QwQ-32B为襄阳职业技术学院拥抱强化学习的AI力量

信息技术学院大数据专业学生团队与UNHub平台合作，利用QwQ-32B模型开启AI教育新范式。通过强化学习驱动，构建职业教育智能化实践平台，支持从算法开发到应用的全链路教学。QwQ-32B具备320亿参数，优化数学、编程及复杂逻辑任务处理能力，提供智能教学助手、科研加速器和产教融合桥梁等应用场景，推动职业教育模式创新。项目已进入关键训练阶段，计划于2025年夏季上线公测。

杖雍皓

86 10 10

QwQ-32B为襄阳职业技术学院拥抱强化学习的AI力量

全干程序员demo

|

4天前

|

人工智能 Java 程序员

Java程序员在AI时代必会的技术：Spring AI

在AI时代，Java程序员需掌握Spring AI技术以提升竞争力。Spring AI是Spring框架在AI领域的延伸，支持自然语言处理、机器学习集成与自动化决策等场景。它简化开发流程，无缝集成Spring生态，并提供对多种AI服务（如OpenAI、阿里云通义千问）的支持。本文介绍Spring AI核心概念、应用场景及开发步骤，含代码示例，助你快速入门并构建智能化应用，把握AI时代的机遇。

全干程序员demo

82 4 4

音视频牛哥

|

13天前

|

人工智能监控算法

Python下的毫秒级延迟RTSP|RTMP播放器技术探究和AI视觉算法对接

本文深入解析了基于Python实现的RTSP/RTMP播放器，探讨其代码结构、实现原理及优化策略。播放器通过大牛直播SDK提供的接口，支持低延迟播放，适用于实时监控、视频会议和智能分析等场景。文章详细介绍了播放控制、硬件解码、录像与截图功能，并分析了回调机制和UI设计。此外，还讨论了性能优化方法（如硬件加速、异步处理）和功能扩展（如音量调节、多格式支持）。针对AI视觉算法对接，文章提供了YUV/RGB数据处理示例，便于开发者在Python环境下进行算法集成。最终，播放器凭借低延迟、高兼容性和灵活扩展性，为实时交互场景提供了高效解决方案。

音视频牛哥

85 4 4

阿里云-云栖战略参考

|

11天前

|

传感器数据采集机器学习/深度学习

AI战略丨从探索到突破，全面解读智实融合关键技术

关键技术的发展水平直接决定了智实融合的深度与广度，是其应用进一步拓展的关键因素。

阿里云-云栖战略参考

60 1 1

nefelibata

|

18天前

|

机器学习/深度学习人工智能自然语言处理

AI技术如何重塑客服系统？解析合力亿捷AI智能客服系统实践案例

本文探讨了人工智能技术在客服系统中的应用，涵盖技术架构、关键技术和优化策略。通过感知层、认知层、决策层和执行层的协同工作，结合自然语言处理、知识库构建和多模态交互技术，合力亿捷客服系统实现了智能化服务。文章还提出了用户体验优化、服务质量提升和系统性能改进的方法，并展望了未来发展方向，强调其在客户服务领域的核心价值与潜力。

nefelibata

70 6 6

1046642597444485

|

3天前

|

机器学习/深度学习人工智能自然语言处理

技术创新领域，AI(AIGC)是否会让TRIZ“下岗”？

法思诺创新直播间探讨了AI(AIGC)是否将取代TRIZ的问题。专家赵敏认为，AI与TRIZ在技术创新领域具有互补性，结合两者更务实。TRIZ提供结构化分析框架，AI加速数据处理和方案生成。DeepSeek、Gemini等AI也指出，二者各有优劣，应在复杂创新中协同使用。企业应建立双轨知识库，重构人机混合创新流程，实现全面升级。结论显示，AI与TRIZ互补远超竞争，结合二者是未来技术创新的关键。

1046642597444485

16 0 0

热门文章

最新文章

通义灵码2.0 - AI 程序员： AI 编程新时代的卓越助力

利用通义灵码AI在VS Code中快速开发扫雷游戏：Qwen2.5-Max模型的应用实例

Agent TARS：一键让AI托管电脑！字节开源PC端多模态AI助手，无缝集成浏览器与系统操作

Heygem：开源数字人克隆神器！1秒视频生成4K超高清AI形象，1080Ti显卡也能轻松跑

AI时代创作何为？AI如何重塑IT行业格局

对话即服务：Spring Boot整合MCP让你的CRUD系统秒变AI助手

还在蹲Manus的邀请码？别等了！开源版Manus为你快速创建AI工位，给AI一台电脑，然后你就玩去吧！

Botgroup.chat：超有趣的开源 AI 聊天室！多个 AI 在线互怼，一键搭建你的专属 AI 社群

Browser Use：40.7K Star！一句话让AI完全接管浏览器！自动规划完成任务，多标签页同时管理

Manus再遭复刻！开源多智能体协作工具，实时查看每个AI员工的"脑回路"

基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能

让小程序拥有“视觉之眼“：DeepSeek图像识别实战指南

基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

拍立淘API是基于图像识别技术的服务接口，支持淘宝、1688和义乌购平台。

机器学习在图像识别中的应用：解锁视觉世界的钥匙

探索深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的革命性应用####

深度学习在图像识别中的应用与挑战

相关课程

更多

通义灵码2.0 AI 编码训练营

AI应用开发

基于Gradio的AI应用搭建实践课

AI通识课-人工智能通识基础

使用Higress AI网关优化AI调用成本

基于通义灵码实现高效 AI 编码

相关电子书

更多

阿里云Data+AI：开启数据智能新时代

人人懂AI之从机器学习到大模型

Serverless+AI 轻松玩转高频 AIGC 场景

相关实验场景

更多

基于ECS部署DeepSeek个人专属AI网站

通过云原生API网关进行AI缓存

通过云原生API网关进行AI应用防护

体育赛事！零代码生成运动风格AI写真。

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

使用容器计算服务 ACS 算力快速搭建生成式 AI 会话应用

推荐镜像

更多

google-chrome

libreoffice

os-copilot

下一篇

阿里云oss简介和如何对接使用

目录

谷歌宣布下一代AI图像识别技术Google Lens

目录

你好，我是AI助理

可以解答问题、推荐解决方案等