吴恩达《机器学习》课程总结(18)应用实例:图片文字识别

简介: 18.1问题描述和流程图(1)图像文字识别是从给定的一张图片中识别文字。(2)流程包括:1.文字侦测2.字符切分(现在不需要切分了)3.字符分类18.2滑动窗口在行人检测中,滑动窗口是首先训练一个固定尺寸输入的判断是否有行人的网络,然后在一张图片中裁该尺寸的图片,送入到网络中;然后不断移动裁剪区,重复以上过程,知道裁剪到最后,这时按比例放大裁剪区,然后将裁剪到的图片缩放到网络的输入,如此循环。

18.1问题描述和流程图

(1)图像文字识别是从给定的一张图片中识别文字。

(2)流程包括:

1.文字侦测

2.字符切分(现在不需要切分了)

3.字符分类

18.2滑动窗口

在行人检测中,滑动窗口是首先训练一个固定尺寸输入的判断是否有行人的网络,然后在一张图片中裁该尺寸的图片,送入到网络中;然后不断移动裁剪区,重复以上过程,知道裁剪到最后,这时按比例放大裁剪区,然后将裁剪到的图片缩放到网络的输入,如此循环。

首先滑动窗口同样用于文字识别,做字符与非字符区分,然后把字符区域适当扩展,然后合并重叠区域,按照高宽比进行过滤(认为长度大于高度),如下图所示:

然后进行文字的分割,通用训练一个模型,数据集如下:

分割出单个字符之后,利用神经网络、支持向量机或者逻辑回归训练一个分类器即可。

18.3获取大量数据和人工数据

(1)从网上下载字体,然后随机添加跟着背景创造实例;

(2)利用已有数据进行旋转、扭曲、模糊处理等产生新数据;

有关获取更多数据的方法:

(1)人工数据合成;

(2)手动收集、标记数据;

(3)众包;

18.4上限分析:哪部分管道该接下去做

如下下面的流程中,本来正确率为72%,如果提供完全正确的文字检测作为文字分割的输入,发现系统正确率提升到了89%,说明要下功夫在文字检测上了。

下表是每一步如果完全正确,会带来多大的提升,如果提升越大,说明越要花功夫在这一步上。下表首先要花功夫在文字检测上,然后是文字识别,而文字分割已经做得很好了。

相关文章
|
13天前
|
机器学习/深度学习 数据采集 自然语言处理
理解并应用机器学习算法:神经网络深度解析
【5月更文挑战第15天】本文深入解析了神经网络的基本原理和关键组成,包括神经元、层、权重、偏置及损失函数。介绍了神经网络在图像识别、NLP等领域的应用,并涵盖了从数据预处理、选择网络结构到训练与评估的实践流程。理解并掌握这些知识,有助于更好地运用神经网络解决实际问题。随着技术发展,神经网络未来潜力无限。
|
20小时前
|
机器学习/深度学习 监控 算法
探索机器学习在金融风控中的应用
【5月更文挑战第27天】 随着金融科技的迅猛发展,机器学习技术在金融行业尤其是在风险控制领域的应用日益增多。本文旨在探讨机器学习模型如何革新传统的金融风控方法,提升识别和预测潜在风险的效率与准确性。文章首先介绍了机器学习在金融风控中的基本概念与应用场景,随后深入分析了几种常见的机器学习算法及其在实际风控操作中的优势和挑战,最后通过案例分析,展现了机器学习在提高金融风险管理智能化水平方面的实际成效。
|
2天前
|
机器学习/深度学习 人工智能 算法
探索机器学习在金融领域的创新应用
【5月更文挑战第25天】本文深入探讨了机器学习技术在金融行业中的应用及其带来的革新。首先,概述了机器学习的基本原理与关键技术,包括监督学习、非监督学习以及强化学习。随后,详细分析了这些技术在金融领域不同场景下的具体应用,如信用评分、欺诈检测、算法交易等。最后,文章还讨论了机器学习面临的挑战和未来的发展趋势,旨在为金融专业人士提供一个关于机器学习当前及未来影响的全面视角。
|
2天前
|
机器学习/深度学习 人工智能 监控
探索机器学习在图像识别中的应用
【5月更文挑战第25天】 随着人工智能技术的飞速发展,机器学习已经成为了当今科技领域最热门的话题之一。尤其是在图像识别领域,机器学习技术的应用已经取得了显著的成果。本文将深入探讨机器学习在图像识别中的应用,包括基本原理、关键技术以及实际应用案例,以期为读者提供一个全面了解机器学习在图像识别领域的概述。
|
7天前
|
机器学习/深度学习 分布式计算 搜索推荐
探索机器学习在个性化推荐系统中的应用
【5月更文挑战第21天】 随着大数据时代的到来,个性化推荐系统在商业和用户体验中扮演着日益重要的角色。机器学习作为实现智能化推荐的核心技术之一,其算法与模型的发展直接影响着推荐系统的效能。本文将深入剖析机器学习技术在构建个性化推荐系统中的关键作用,探讨不同算法的优势与局限性,并提出创新性的优化策略以增强推荐的准确性和用户满意度。通过实例分析,揭示机器学习如何助力推荐系统更好地理解用户需求,进而推动个性化服务的发展。
15 3
|
8天前
|
机器学习/深度学习 数据采集 监控
探索机器学习在金融风控中的应用
【5月更文挑战第20天】 在金融领域,风险管理是确保系统稳定和可持续发展的关键。近年来,随着机器学习技术的不断进步,其在金融风险控制(风控)中扮演的角色日益重要。本文将深入探讨机器学习模型如何辅助金融机构在信贷评估、欺诈检测和市场风险分析等方面做出更精准的决策。我们将分析传统风控方法与基于机器学习的方法之间的差异,并讨论后者的优势以及实施过程中面临的挑战。通过案例研究和最新技术趋势的评述,文章旨在为金融行业专业人士提供一个关于机器学习在风控中应用的全面视角。
|
13天前
|
机器学习/深度学习 数据采集 搜索推荐
探索机器学习在推荐系统中的应用
【5月更文挑战第15天】本文探讨了机器学习在推荐系统中的应用,强调其在数据预处理、个性化建模、内容过滤及解决冷启动问题中的作用。协同过滤、矩阵分解、深度学习和强化学习是常用算法。尽管面临数据处理、准确性与多样性平衡、兴趣变化等挑战,但未来机器学习有望通过结合先进算法提升推荐系统性能,同时需关注隐私和伦理问题。
|
13天前
|
机器学习/深度学习 数据采集 算法
深入理解并应用机器学习算法:支持向量机(SVM)
【5月更文挑战第13天】支持向量机(SVM)是监督学习中的强分类算法,用于文本分类、图像识别等领域。它寻找超平面最大化间隔,支持向量是离超平面最近的样本点。SVM通过核函数处理非线性数据,软间隔和正则化避免过拟合。应用步骤包括数据预处理、选择核函数、训练模型、评估性能及应用预测。优点是高效、鲁棒和泛化能力强,但对参数敏感、不适合大规模数据集且对缺失数据敏感。理解SVM原理有助于优化实际问题的解决方案。
|
13天前
|
机器学习/深度学习 算法
理解并应用机器学习算法:决策树
【5月更文挑战第12天】决策树是直观的分类与回归机器学习算法,通过树状结构模拟决策过程。每个内部节点代表特征属性,分支代表属性取值,叶子节点代表类别。构建过程包括特征选择(如信息增益、基尼指数等)、决策树生成和剪枝(预剪枝和后剪枝)以防止过拟合。广泛应用在信贷风险评估、医疗诊断等领域。理解并掌握决策树有助于解决实际问题。
|
13天前
|
机器学习/深度学习 人工智能 算法
【机器学习】K-means聚类有哪些应用?
【5月更文挑战第11天】【机器学习】K-means聚类有哪些应用?

热门文章

最新文章