图像文字识别(OCR)用什么算法小结
说明:主要考虑深度学习的方法,传统的方法不在考虑范围之内。
1.文字识别步骤
1.1detection:找到有文字的区域(proposal)。
1.2classification:识别区域中的文字。
2.文字检测
文字检测主要有两条线,两步法和一步法。
机器学习中,使用Scikit-Learn简单处理文本数据
机器学习中,我们总是要先将源数据处理成符合模型算法输入的形式,比如将文字、声音、图像转化成矩阵。对于文本数据首先要进行分词(tokenization),移除停止词(stop words),然后将词语转化成矩阵形式,然后再输入机器学习模型中,这个过程称为特征提取(feature extraction)或者向量化(vectorization)。
论文导读:面向卷积神经网络的卷积核冗余消除策略
本篇论文针对卷积神经网络在训练阶段所需的大量存储与计算资源,提出了一种改进的冗余卷积核消除策略,精简每个卷积层中冗余的卷积核,进而降低模型训练开销,使模型训练过程从云端转移至本地成为可能。
阿里云容器宣布开放支持Kubernetes托管服务
在刚刚结束的云栖大会上,阿里云宣布了飞天专有云敏捷版2.0,它带来了对Kubernetes框架的支持,10月31日,阿里云公共云容器服务宣布开放支持Kubernetes 1.8.1版本的托管服务,结合并发挥如云主机、负载均衡、分布式存储、异构计算等阿里云强大的IaaS能力,通过一键部署、控制台集成等,为用户提供了一个安全、稳定、易用的Kubernetes托管服务。