计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26052内容
解读Keras在ImageNet中的应用:详解5种主要的图像识别模型
自从2012年以来,CNN和其它深度学习技术就已经占据了图像识别的主流地位。本文以Keras为例,介绍了5种主要的图像识别模型,并通过实际案例进行详细介绍。
综述:DenseNet—Dense卷积网络(图像分类)
与 ResNet 和 Pre-Activation ResNet 相比,DenseNet 具有较少的参数和较高的精度。那么,让我们看看它是如何工作的。
实践:基于深度学习的卫星图像超分辨率处理技术(一)
Yann Lecun曾将无监督学习比作蛋糕,将监督学习比作蛋糕上的糖霜,声称我们仅懂得如何做糖霜却不知道怎样才能做出蛋糕。在本篇文章中,我们提供了一份训练无监督学习算法的“蛋糕”配方,用来增强卫星图像。
深度学习训练,选择P100就对了
本文使用NVCaffe、MXNet、TensorFlow三个主流开源深度学习框架对P100和P40做了图像分类场景的卷积神经网络模型训练的性能对比,并给出了详细分析,结论是P100比P40更适合深度学习训练场景。
| |
来自: 物联网
吃『派』那些事儿——阿里云物联网平台树莓派实战集锦
随着传统硬件开发到物联网开发的转型,小小的树莓派腾云驾雾,开始在各种物联网项目中崭露头角。它也成为了阿里云 IoT 开发者的常客,来自世界各地的开发者分享了他们基于树莓派和阿里云物联网平台的项目。
如何在视频里任意抠图?阿里工程师做到了!
现在的我们在手机上花费了越来越多的时间,其中,视频又格外地吸引我们的注意力。
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
免费试用