计算机在识别图像时“看到”了什么?

简介: 计算机在识别图像时“看到”了什么?

图像识别技术近来进步飞速。去年,微软和谷歌展示了能比人类更准确地识别图像的系统。


这些进步得益于一个叫做深度学习的技术,它涉及将数据通过模拟神经元的网络,以培养该网络在未来过滤数据(更多信息见“Teaching Machines to Understand Us”)。深度学习就是你可以使用关键字搜索存储在谷歌的照片(更多信息),Facebook 能识别你照片中你朋友的原因。 在图像识别上使用深度学习也使得机器人和自动驾驶汽车更有可行性,它甚至可以彻底改变医学(更多信息)。

DDDDDDDDDD.jpg

图像识别技术的能力和灵活性来自于, 当人工神经网络收到很多图像和图像类别的信息时,它可以自动计算出来重要的视觉特征。在深度学习中使用的神经网络被布置成不同的层,数据一层一层根据顺序通过。在训练过程中,在神经网络中的不同的层成为专门识别不同类型的视觉特征的网络层。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。


“这些神经网络相比传统的计算机视觉方法,是一个巨大的飞跃,因为它们直接从数据中得出结果。”马修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在内的公司组织和搜索照片和视频的服务) 的 CEO 说。程序员们曾经需要写出寻找视觉特征所需的数学程序,然而这些程序并不能创造出很多有用的产品。


当蔡勒还是一个研究生的时候, 他在纽约大学与罗博·宏泰合作开发了一种可视化神经网络运作的方法。在这个链接中的幻灯片中的图像将带你来到这个深度学习网络的内部,这个用了130万张照片训练过,打败了人类的图像识别神经网络。该网络识别了 1000 个截然不同的物件,包括蚊帐和蚊子,而幻灯片上显示了每个图像中最强烈的激活神经元网络的一个网络层的视觉特征。

相关文章
|
机器学习/深度学习 传感器 人工智能
图像识别算法汇总
图像识别算法汇总
2730 0
|
5天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
4014 10
|
15天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
11614 134
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
4天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
1415 7
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
5天前
|
人工智能 自然语言处理 数据挖掘
零基础30分钟搞定 Claude Code,这一步90%的人直接跳过了
本文直击Claude Code使用痛点,提供零基础30分钟上手指南:强调必须配置“工作上下文”(about-me.md+anti-ai-style.md)、采用Cowork/Code模式、建立标准文件结构、用提问式提示词驱动AI理解→规划→执行。附可复制模板与真实项目启动法,助你将Claude从聊天工具升级为高效执行系统。
|
5天前
|
人工智能 定位技术
Claude Code源码泄露:8大隐藏功能曝光
2026年3月,Anthropic因配置失误致Claude Code超51万行源码泄露,意外促成“被动开源”。代码中藏有8大未发布功能,揭示其向“超级智能体”演进的完整蓝图,引发AI编程领域震动。(239字)
2301 9

热门文章

最新文章