• 【独家】一文读懂文字识别(OCR)

    目前,文本图像的倾斜检测方法有许多种,主要可以划分为以下五类:基于投影图的方法,基于Houhg变换的方法,基于交叉相关性的方法,基于Fourier变换的方法和基于最近邻聚类方法。最简单的基于投影图的方法是将文本...
    文章 2017-05-01 5420浏览量
  • 玩转TensorFlow Lite:有道云笔记实操案例分享

    caffe2、TFLite 这类有为移动端优化过的神经网络框架则比较平衡,虽然初时会有算子不全的问题,但只要背后的团队不断支持推进框架的开发,这个问题未来会得到解决。优点:相对容易扩展 由于 TFLite 的代码(相对于 ...
    文章 2018-04-19 3601浏览量
  • 高德POI数据生产中的计算机视觉技术

    2012年之前,文字识别的主流算法都依赖于传统图像处理技术和统计机器学习方法实现。分为文本行检测、文字识别两部分。文本行检测,一般是先预处理,利用二值化、连通域分析、MSER显著性区域算子等算法,定位文字区域...
    文章 2021-03-23 357浏览量
  • 看图猜口袋妖怪属性,这个神经网络可能比你强!...

    图11:精灵妙蛙花在应用Sobel算子后的效果 卷积运算可以看作是卷积核在图像上的遍历。将内核的值按照逐个元素,乘以图像中的灰度值,并将结果相加即可得到该卷积的最终值。在应用中,我们可以使用垂直Sobel滤波器来...
    文章 2018-01-09 1075浏览量
  • 支付宝端智能化探索与实践|xMedia:多媒体端智能应用...

    它有些类似于AI引擎中的各种算子,不同的是AI引擎中的算子粒度非常细,而这里算子更加抽象,比如检测/分类算法、OCR 通用算法、图像识别能力等,它面向的是业务的开发者,而不是算法工程师。同时还有一个不同点,...
    文章 2020-01-20 1917浏览量
  • 支付宝端智能化探索与实践|xMedia:多媒体端智能应用...

    它有些类似于AI引擎中的各种算子,不同的是AI引擎中的算子粒度非常细,而这里算子更加抽象,比如检测/分类算法、OCR 通用算法、图像识别能力等,它面向的是业务的开发者,而不是算法工程师。同时还有一个不同点,...
    文章 2020-01-16 451浏览量
  • LeCun、Bengio、Hinton三巨头曾合体,Nature发文综述...

    深度卷积网络给图像、视频、语音与音频处理带来了极大突破,同时循环神经网络则给诸如文字语音的顺序数据研究带来了希望。机器学习在许多方面都造福了现代社会:从网页搜索到电商网站上基于社交网络内容筛选做出的...
    文章 2018-04-09 2629浏览量
  • 【Offer 5000-达摩院】-招聘职位详情

    5、熟悉常见的数字信号处理方法,熟悉常见的音视频码流的编码格式编解码方法6、具有团队领导能力,能带领一个小团队独立完成项目。7、优秀的团队合作能力。特殊要求base地点:上海、杭州投递简历 阿里云开发者社区...
    文章 2020-06-18 2448浏览量
  • Euler 今日问世!国内首个工业级的图深度学习开源框架...

    相比文本、语音和图像领域的数据比较容易处理成欧式空间的Grid-like类型,适合现有的深度学习模型处理,图是一种非欧空间下的数据,并不能直接应用现有方法,需要专门设计的图神经网络系统。1.1Euler的核心能力 1)...
    文章 2019-01-18 22621浏览量
  • 视觉Ai第二天学习心得

    当然这些都可以通过一些图像处理的技术帮他尽可能的还原,进而提高识别率。总的来说,单纯的印刷体识别在业界已经能做到很不错了,但说100%识别是肯定不可能的,但是说识别得不错那是没毛病。印刷体已经识别得不错了...
    文章 2020-09-25 406浏览量
  • Euler 今日问世!国内首个工业级的图深度学习开源框架...

    相比文本、语音和图像领域的数据比较容易处理成欧式空间的Grid-like类型,适合现有的深度学习模型处理,图是一种非欧空间下的数据,并不能直接应用现有方法,需要专门设计的图神经网络系统。1.1Euler的核心能力 1)...
    文章 2019-01-18 2592浏览量
  • 带你读《深入理解AutoML和AutoDL:构建自动化机器 ...

    我们试图找到方法让机器使用语言、形成抽象和概念、解决人类尚未解决的各类问题以及自我改进等。我们认为,一群经过精心挑选的科学家一起努力一个夏天,就可以在上述的一个甚至多个问题上取得重大进展。会议于1956年...
    文章 2019-11-01 1320浏览量
  • 《2019人工智能发展报告》!计算机视觉深度解读,文中...

    基于学习的视觉研究,文献中大体上分为二个阶段:本世纪初的以流形学习为代表的空间法和目前以深度学习为代表的视觉方法。物体表达是物体识别的核心问题,给定图像物体,如人脸图像,不同的表达,物体的分类和识别...
    文章 2019-12-26 2703浏览量
  • 《2019人工智能发展报告》!计算机视觉深度解读,文中...

    基于学习的视觉研究,文献中大体上分为二个阶段:本世纪初的以流形学习为代表的空间法和目前以深度学习为代表的视觉方法。物体表达是物体识别的核心问题,给定图像物体,如人脸图像,不同的表达,物体的分类和识别...
    文章 2019-12-26 1635浏览量
  • 深度学习在人脸识别中的应用——优图祖母模型的“进化...

    从上个世纪90年代开始到2010年左右,经过不断的摸索,研究人员们对每个任务都发现了一些比较有效的特征与方法的组合来解决问题如图7所示。然而由于研究人员需要根据每个任务本身的特点设计不同的特征,选择不同...
    文章 2017-08-01 1471浏览量
  • 应用、算法、芯片,“三位一体”浅析语音识别

    下文给出各个模型的原理、所解决问题及各自局限性,且给出了由模型的局限性而引起建模方式发展的脉络。1)高斯混合模型(GMM) 观测概率密度函数由高斯混合模型建模,训练中,不断迭代优化,以求取GMM中的加权系数...
    文章 2017-10-24 2149浏览量
  • 智能展示技术在淘宝封面图的应用

    用模型来学习这种比较偏主观的任务是比较难的,所以我们采取整图加patch分别打分的模式来判断清晰度,打分方法使用传统计算机视觉里的拉普拉斯算子。美观度模型我们尝试了NIMA中所使用的AVA数据集来进行美观度的学习...
    文章 2021-10-09 24浏览量
  • 人工智能:是风,是云,还是雨?

    在这个境界中,企业开发的技术能为行业带来不可替代的价值,为解决某些业务问题提供了良好的解决方法。3.无中生有: 因为某项AI技术的产生,从而衍生出相关的需求与业务。例如,手机的大屏,就是个很好的例子。用于...
    文章 2020-04-28 354浏览量
  • 独家|一文读懂深度学习

    下图(Figure 7)所示就是一种典型的CNN结构(LeNet-5),给定一张图片(一个训练样本)作为输入,通过多个卷积算子分别依次扫描输入图片,扫描结果经过激活函数激活得到特征图,然后再利用池化算子对特征图进行下...
    文章 2017-08-01 2237浏览量
  • 人工智能:是风,是云,还是雨?

    2.雪中送碳:在这个境界中,企业开发的技术能为行业带来不可替代的价值,为解决某些业务问题提供了良好的解决方法。3.无中生有:因为某项AI技术的产生,从而衍生出相关的需求与业务。例如,手机的大屏,就是个很好的...
    文章 2020-04-17 1147浏览量
  • 人工智能:是风,是云,还是雨?

    雪中送碳:在这个境界中,企业开发的技术能为行业带来不可替代的价值,为解决某些业务问题提供了良好的解决方法。无中生有:因为某项 AI 技术的产生,从而衍生出相关的需求与业务。例如,手机的大屏,就是个很好的...
    文章 2020-04-21 401浏览量
  • Flink 1.12 资源管理新特性回顾

    Flink 内置算子:包含批处理、Table SQL、DataSet API 等算子,每个算子有独立的资源预算,不会相互共享;Python 进程:用户使用 PyFlink,使用 Python 语言定义 UDF 时需要启动 Python 的虚拟机进程。2.Job Graph ...
    文章 2021-07-15 1398浏览量
  • 带你读《深入理解AutoML和AutoDL:构建自动化机器 ...

    AutoML作为一个新的AI研究方法,扩展了AI研究能够到达的边界,然后又在其上构建了AutoML的应用平台产品,让AI的应用得到了较为有效的扩展,让更多行业都可以用AI解决现实世界中的问题。2.3 现有AutoML平台产品 2....
    文章 2019-11-01 1513浏览量
  • Shift Left性能测试-不一样的测试方法

    每个地点都使用两个Load Generator的策略让我们对测试结果更有自信,也帮助我们定位及解决用户在配置上的不同。“基准值”允许我们在不同环境上执行测试,比如:系统集成、用户验收或预产品等环境,通过对比不同地点...
    文章 2017-07-03 1577浏览量
  • 小议车辆环境视觉基础前视感知

    现在虽然有基于单张图像的深度估计方法,但那个本质上是靠的训练所获得的先验,用作ADAS里的FCW啥的感觉还是精度不太够。3D姿态估计(3D pose estimation):高级点的前视感知对物体检测除了边界框,还会估计其姿态...
    文章 2019-11-25 1397浏览量
  • 人工智能,数字经济时代的新生产力

    处理器产业不断成熟导致力性能的明显提升。不同于前两次 AI‘春天’,深度学习网络在模型表现和商业应用都远远优于与之竞争的基于其他机器学习技术或手动设计功能的 AI 系统,亦称为了第三次 AI 浪潮发展最显著...
    文章 2020-03-19 466浏览量
  • 当搜索推荐遇到广告-三位一体的AI·OS技术新体系

    而汽车工业界解决这个问题方法,就是打造一个汽车平台,最有名就是大众的MQB平台,MQB平台对动力系统、操控系统这些汽车共有的部件进行沉淀,同时保留很强的可定制的能力。那么回到搜索和推荐的业务上来,我们同样...
    文章 2019-11-22 1807浏览量
  • 从现实世界的角度去理解计算机领域的知识

    ​ 而数据的形式也是多样化的,有结构化和非结构化之分,有文字、图像、文档、音频和视频等等,基于不同的数据形式,就会有不同的数据存储方式,也就有了各种各样的数据库和文件系统,以及处理这些数据的开发包,...
    文章 2020-09-15 513浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    当前能够匹配企业应用运维场景、可以用来解决实际运维问题的技术有面向海量实时指标数据的异常检测、发现异常后的关联根源问题定位、风险处理方案决策支持预防性维护的探伤检测等。4.1 异常检测&xff1a;筛选时间...
    文章 2021-07-06 441浏览量
  • 基于WebGL的仓储粮食温度可视化 ThingJS

    WebGL直接工作在计算机的显卡端,Three.js是基于WebGL的3D框架,这是一种在3D图形中简单、直观的建立常见模型的方法,能够高速利用许多最佳图形引擎实践技术,使用流程沿用一般三维世界的基本结构进行定义:设置场景...
    文章 2020-12-22 116浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化