深度学习识别10000物种,手机上的@博物杂志

简介:


iNaturalist.org 推出了一个 Android 和 iOS 应用程序,可以在物种层面自动识别动物和植物。这个app使用 TensorFlow 进行训练,已经能够识别出超过10000种不同的物种,而且每1.7小时模型增加1个新的物种。

iNaturalist.org 是一个成立已久的受欢迎的网站,其使命是将专家和业余的“公民科学家”连接起来,激发人们对自然界的兴趣并鼓励参与自然世界,同时使用收集的数据帮助科学家检测生物多样性变化,甚至可以帮助发现新物种。网站由加州大学伯克利分校的学生成立于2008年,最近被加州科学馆收购,网站曾经依赖众包。当用户上传一张植物或动物的照片时,由科学家和博物学家进行识别。

iNaturalist 的联合主管斯科特·洛里(Scott Loarie)表示,众包的形式通常效果很好。用户上传的一半左右的神秘观察能在2天内被识别出来,假如上传的帖子就来自加利福尼亚州的话,识别的速度甚至更快,1小时就可以识别出来。这是因为iNaturalist的大量经验丰富的专家是以美国西海岸为基础的。但是,获得识别所需的平均时间是18天,这意味着一些用户需要等待很长时间才能知道自己拍摄的是什么物种。另一个问题是,随着网站越来越受欢迎,观察员(上传照片的用户)数量远远超过了鉴定员(告诉你照片中的生物是什么物种的志愿者专家)数量。

为了缓解志愿者专家的重担,iNaturalist 团队与康奈尔鸟类实验室(Cornell Lab of Ornithology),Merlin鸟类识别app的开发人员,以及Visipedia图像识别研究项目合作,使用机器学习技术更快地提供高质量的物种识别。

Visipedia 是 Visual Encyclopedia 的缩写,这是加州理工学院与康奈尔科技学院合作的一个项目,是一个人与机器联合的网络,旨在收集和处理视觉信息,并使任何人均可访问。

使用 TensorFlow 深度学习框架,Visipedia 团队对 iNaturalist 数据库上的专家社区标记过的图像训练神经网络模型。目前,iNaturalist拥有大约4,000,000可验证的观察结果,即具有所有必要的数据质量属性(例如照片,位置,非宠物,等等),并且已被专家审查,可以被认为是“研究级”的观察结果。这些观察结果代表了约100000的物种。


iNaturalist 的设计是,至少要有20个研究级的观察结果才能在其模型中包含1个物种。虽然上图显示有13730个物种,但这个数字可能是接近但还不到10000种,这是为了避免观察者的影响,必须确保每个物种有20个不同的观察者。

这个新的应用程序使用研究级的观察结果来对动物的物种给出自信的回答,并给出前10个可能的选项作为不确定建议。其最初给出的结果正确率是86%,在前10个建议项给出的结果正确率是77%。随着模型继续得到训练,这些正确率数字应该能提高,当然,这个应用程序本身对新的观察和新物种的识别也有帮助,平均每1.7小时能为模型增加1个新物种。


在demo中,app几秒内识别出牛科动物家族,虽然其识别的结果从濒危的蛮羊到大角羊都有。它给出的其他选项如下图:


右下方的是艾贝克斯山羊拉丁美洲亚种,西班牙东南部的北山羊,这似乎是完美契合的。App也会给出关于动物来源的信息,在上面的demo则是西班牙特有的野山羊。


iNaturalis 应用程序提供了一种快速简单的方式来以照片和GPS位置的方式记录用户观察到的动物和植物,并能够让世界各地的人访问其他人的观察,成为公民科学运动的一部分。


原文发布时间为: 2017-06-20

本文作者:Sue Gee 

本文来自云栖社区合作伙伴极市网,了解相关信息可以关注极市网。

相关文章
|
机器学习/深度学习 存储 Serverless
【动手学深度学习】深入浅出深度学习之利用神经网络识别螺旋状数据集
【动手学深度学习】深入浅出深度学习之利用神经网络识别螺旋状数据集
174 27
|
机器学习/深度学习 自然语言处理
利用深度学习技术改进自然语言处理中的命名实体识别
命名实体识别(Named Entity Recognition, NER)在自然语言处理领域扮演着重要角色,但传统方法在处理复杂语境和多样化实体时存在局限性。本文将探讨如何利用深度学习技术,特别是基于预训练模型的方法,来改进命名实体识别,提高其在现实场景中的性能和适用性。
|
机器学习/深度学习 计算机视觉 异构计算
构建高效图像分类器:深度学习在视觉识别中的应用
【5月更文挑战第30天】 在计算机视觉领域,图像分类任务是基础且关键的一环。随着深度学习技术的兴起,卷积神经网络(CNN)已成为图像识别的强有力工具。本文将探讨如何构建一个高效的图像分类器,着重分析CNN架构、训练技巧以及优化策略。通过实验对比和案例研究,我们揭示了深度学习模型在处理复杂视觉数据时的优势和挑战,并提出了改进方向,以期达到更高的准确率和更快的处理速度。
|
机器学习/深度学习 算法
深度学习在医学影像识别中的应用与挑战
传统的医学影像识别技术在面对复杂疾病和图像异常时存在一定局限性,而深度学习作为一种新兴的人工智能技术,为医学影像识别带来了革命性的变革。本文将介绍深度学习在医学影像识别中的应用现状,并探讨应用中面临的挑战和未来发展方向。
193 30
|
机器学习/深度学习 TensorFlow 数据处理
使用Python实现深度学习模型:医学影像识别与疾病预测
【7月更文挑战第24天】 使用Python实现深度学习模型:医学影像识别与疾病预测
186 4
|
机器学习/深度学习 数据安全/隐私保护
深度学习在医学影像识别中的应用与挑战
传统的医学影像识别方法在面对复杂的医学图像时存在一定局限性,而深度学习技术的快速发展为医学影像识别带来了新的希望。本文探讨了深度学习在医学影像识别中的应用现状,分析了其面临的挑战,并展望了未来发展的趋势。
|
机器学习/深度学习 算法 BI
基于深度学习网络的USB摄像头实时视频采集与手势检测识别matlab仿真
**摘要:** 本文介绍了使用MATLAB2022a实现的基于GoogLeNet的USB摄像头手势识别系统。系统通过摄像头捕获视频,利用深度学习的卷积神经网络进行手势检测与识别。GoogLeNet网络的Inception模块优化了计算效率,避免过拟合。手势检测涉及RPN生成候选框,送入网络进行分类。系统架构包括视频采集、手势检测与识别、以及决策反馈。通过GPU加速和模型优化保证实时性能,应用于智能家居等场景。
|
机器学习/深度学习 算法 数据可视化
基于深度学习网络的鞋子种类识别matlab仿真
使用GoogLeNet深度学习模型在matlab2022a中进行鞋子种类识别,利用Inception模块捕捉多尺度特征,提升分类精度。程序加载预训练模型`gnet.mat`,计算验证集的准确性并随机显示32个样本的预测结果及置信度。
|
机器学习/深度学习 算法 数据可视化
基于googlenet深度学习网络的睁眼闭眼识别算法matlab仿真
**算法预览图展示睁眼闭眼识别效果;使用Matlab2022a,基于GoogLeNet的CNN模型,对图像进行分类预测并可视化。核心代码包括图像分类及随机样本显示。理论概述中,GoogLeNet以高效Inception模块实现眼部状态的深度学习识别,确保准确性与计算效率。附带三张相关图像。**
|
机器学习/深度学习 算法 计算机视觉
基于yolov2深度学习网络的螺丝螺母识别算法matlab仿真
以下是内容的摘要: 该文介绍了使用YOLOv2深度学习模型进行螺丝螺母识别的算法,展示了在matlab2022a环境下运行的6张检测效果图。YOLOv2基于Darknet-19预训练网络,结合多任务损失函数和非极大值抑制技术,有效检测目标。为了适应任务,进行了数据集准备、模型微调、锚框选取等步骤。核心程序加载预训练模型,遍历图像并展示检测结果,通过调整阈值绘制检测框。

热门文章

最新文章