AI+时代,谈谈产品经理对图像识别技术的阈值控制

本文涉及的产品
图像搜索,7款服务类型 1个月
简介:

AI+时代,谈谈产品经理对图像识别技术的阈值控制

产品满足用户的需求有一个阈值,产品值低于阈值用户会觉得了无生趣,即产品一般般,也即产品经理做了功能经理。产品值等于阈值产品功能基本满足了用户的需求,而只有产品经理驾驭了需求,把产品做成作品,产品值才有可能高于阈值,任何时候产品经理应该学习到高于需求阈值的产品方法论。AI+时代图片识别技术就是起点!

撰写本篇的目的:

当下每天看的到一个词:AI,满眼皆是AI的阶段,我们产品经理应该如何了解到AI的技术脉络和市场需求大势。AI不是新的概念,再次起来是因为有新的突破。

创新工场的李开复博士说现在是技术从业者创新的时代,那么我们产品经理究竟知道AI的哪些技术呢,本篇着重分析一下AI+时代的图像识别技术。

在AI领域之中,图像识别技术占据着极为重要的地位,而随着计算机技术与信息技术的不断发展,AI中的图像识别技术的应用范围不断扩展,如LineLian所见过的IBM的Watson医疗诊断、各种指纹识别、及常用的支付宝的面部识别以及百度地图中全景卫星云图识别等都属于这一应用的典型,AI这一技术已经应用于日常生活之中,图像识别技术将来定会有着较为广泛的运用,而为了保证AI中的图像识别技术能够较好地服务于AI+时代的几个重要产品领域,正是本篇就AI中的图像识别技术展开具体研讨的目的所在。

图像识别概况:

为了较好完成产品经理理解AI中的图像识别技术的本源,我们首先需要深入了解图像识别技术。作为智能领域的重要组成部分,图像识别的发展先后经历了文字识别、数字图像处理与识别、物体识别三个发展阶段,而在AI+时代的图像识别技术中,其本身所具备的功能早已超过了人类的极限,这也是AI的图像识别技术能够在各个垂直产品领域实现较好应用并几乎成为标配的原因所在。

最开始产品经理要明白图像识别技术本身的原理并不算太过复杂,信息的处理是这一技术的关键点所在,由于应用计算机实现的图像识别技术本身与人眼识别并不存在着本质的差别,这就使得图像识别技术同样需要根据自身对图像的记忆完成具体的识别工作。

在人类进行图像识别的过程中,人类的大脑会将图像的特征进行提取,并结合大脑中以往对各类图像的认知判断自身是否对图像存在过印象,这就是人们能够在观看一张图片后快速对其识别的原因所在。结合人类识别图像的原理,在计算机进行的图像识别中,计算机首先就能够完成图像分类并选出重要信息、排除冗余信息,根据这一分类计算机就能够结合自身记忆存储结合相关要求进行图像的识别,这一过程本身与人脑识别图像并不存在着本质差别。

对于图像识别技术来说,其本身提取出的图像特征直接关系着图像识别能否取得较为满意的结果。值得注意的是,由于计算机归根结底不同于人类的大脑,所以计算机提取出的图像特征存在着不稳定性,这种不稳定性往往会因为计算机提取图像特征的明显与普通影响图像识别的效率与准确性,由此可见图像特征对于AI中图像识别技术的重要意义。

图像识别分析:

对于当下AI+时代的图像识别技术来说,神经网络的图像识别技术与非线性降维的图像识别技术是最为常见的两种图像识别技术,LineLian将对两种常见的AI图像识别技术进行详细分析。

一、神经网络的图像识别技术

想要深入了解非线性降维的图像识别技术,我们就必须理解何为神经网络,这里的神经网络全称人工神经网络,其本身指的是在现代神经生物学研究基础上提出的模拟生物过程以反映人脑某些特性的计算结构,虽然我们使用了模拟这一名词,但事实上神经网络本身并没有完全模仿人类的神经网络,其本身只是通过对人类神经网络的抽象、简化和模拟实现相关计算结构效率的提升。

对于神经网络的图像识别技术来说,其能够实现图像的识别主要得益于神经网络学习算法的运用,而在应用神经网络进行的图像识别中,我们首先需要对相关图像进行预处理,这一预处理主要包括真彩色图像转换为灰度图、灰度图像的旋转与放大、灰度图像的归一化等内容。为了保证神经网络能够较好地实现图像识别,我们还需要针对图像识别的领域与对象完成具体的神经网络设计,这一设计主要包括以下五方面:

  • 输入层设计

  • 隐含层设计

  • 输出层设计

  • 初始权值的选取

  • 期望误差的选取

在输入层设计中,我们需要根据图像识别对象的需要确定求解的问题与数据表示方式,而在本篇进行的研究中,为了我们产品经理理解,LineLian将输入层统一设计为16×16图像样本尺寸缩放大小,256 维网络输入需要;而在隐含层的设计中,我们需要确定隐含层的数目与隐含层单元数的选择,当下业界已经确定了隐含层神经元数目的增加能够保证误差精度的降低,所以适当时候增加隐层数目就能够较好地完成神经网络的设计,而在隐含层单元数的选择中,我们可以参考经验公式 L=√M+N +a,L=log2N,这样就能够有效避免神经网络泛化能力较弱,对于训练外样本识别率降低的问题出现,公式中的 M 代表的是输出层神经元数目,而 N 则代表输入层神经元数目。

值得注意的是,通过删除那些影响较小的隐含层单元能够较好地提高神经网络的自身性能,但结构选定花费时间较长是这一方法的缺陷所在;在输出层的设计中,一般会选择多输出型作为神经网络的设计;而在初始权值的选取中,为了满足神经网络在学习过程中的较好收敛,初始权值一般选为(-1,1)之间的随机数;而在期望误差的选取中,其本身需要参考训练时间与预期误差值,这里LineLian选择 0.001 作为期望误差值。

在完成神经网络的设计后,我们还需要进行神经网络的训练才能够保证其较好的满足图像识别需求,为了保证这一设计的较好实现,LineLian选择在 MATLAB7.0 中使用函数 newff创建一个两层网络,这一网络包括 1 个输出神经元、16×16 个输入、26 个单元的隐含层,学习函数则选择了 learngdm,初始学习速率为 0.01 ~ 0.6、训练性能函数“mse”、训练指标 0.001、训练最大循环 2500。

在完成上述提到的神经网络设计与训练后,我们就可以着手对其进行应用实验,在这一实验中笔者应用这一神经网络对 26 个手写英文字母的图片进行了识别,下表 为这一识别的识别结果,结合该表我们能够发现,不同节点数目会直接影响神经网络图像识别的识别率,而 26 个隐含层节点数能够较好满足图像识别的需求,下图为隐含层为 26 时神经网络训练的误差性能曲线及训练时间。

结合这一结果我们可以断定,神经网络识别技术能够较好满足手写字母的识别,其本身在这一识别的过程中体现了准确、快速、较强抗干扰能力等特点,这些特点使得其本身能够凭借着学习算法较好地应用到更多复杂的图像识别中,更好地为我们垂直领域的产品提供服务。

AI+时代,谈谈产品经理对图像识别技术的阈值控制

AI+时代,谈谈产品经理对图像识别技术的阈值控制

二、非线性降维的图像识别技术

除了神经网络的图像识别技术外,非线性降维的图像识别技术也是当下AI时代较为常用的图像识别技术形式。对于传统应用计算机实现的图像识别技术来说,其本身属于较为高维的识别技术,这种高维特性使得计算机往往在图像识别的过程中承担着很多不必要的负担,这种负担自然会影响图像识别的速度与质量,非线性降维的图像识别技术就是能够较好实现图像识别降维的技术形式。

在非线性降维的图像识别技术出现前,业界最常采用的是线性降维的图像识别技术,这种技术本身具备着简单易于理解的优点,但在实际应用中人们发现,线性降维的图像识别技术存在着计算复杂度高且占用相对较多的时间和空间特性,也使得线性降维的图像识别技术不能够较好地满足各产品领域图像识别的需要。对于非线性降维的图像识别技术来说,其本身能够在不破坏图像结构的前提下实现其自身的降维这就使得图像识别技术的识别速度与精度能够实现较好的提升。

例如在人脸识别系统中,以往受图像维度较高的影响,人类识别系统往往需要耗费大量的时间,计算机系统也往往会受到较大的“摧残”,这主要是由于人脸在高纬度空间中存在的分布不均匀特性所致,而在应用非线性降维的图像识别技术后,人脸图形就能够较好地实现自身的紧凑,这就使得人脸识别系统的工作效率大大提升,总的来说非线性降维的图像识别技术能够较好地为图像识

别提供辅助,上文中LineLian提到的神经网络的图像识别技术,也能够在非线性降维的图像识别技术的支持下更好地完成自身工作。

图像识别技术的对产品领域的应用

随着智能网络中的AI技术不断发展,其本身将在产品数据安全、AI+医疗产品、AI+直播产品、AI+社交产品等垂直领域产生重要的产品应用。

之前人机围棋大战,最终人类顶尖棋手李世石以 1:4 不敌 Google 出品的人工智能 AlphaGo。其核心原理采用了多层神经网络对图像进行分析,同时运用深度学习算法总结规律,最终得出战胜人类高手的棋招。

图像鉴别,10000 个场控都干不来互联网的开放不仅带来了自由,同样也成为垃圾信息的温床。最为人熟知的一个职位叫做“鉴黄师”,代表人物自然是“唐马儒”,但实际上“唐马儒”再多也满足不了现在对于图像鉴别和挖掘的需求。最好的例子就是前不久爆出的“直播造人”,视频和直播类内容的兴起使得对内容的鉴定需求呈几何倍数增长。

直播对于审核的实时性要求太高,同时在线的直播数量大,一不小心违规的东西就上线了。传统的解决方案是通过人力完成,所需要的人数会与主播成一个比例。通常都是好几百人坐在屏幕前面持续对闪过的画面进行筛选,如果发现不符合规定就进行人工处理。而AI+时代的产品趣向是利用AI图像识别技术。

另外在公共安全领域中,人脸识别产品的应用就能够较好的提高市场社会的安全性与便利性;而在医学领域中,心电图与 B 超的识别将大大促进用户医疗事业的便捷;而在农业领域中,种子识别科技产品与食品品质检测科技产品的应用将大大提高农产品的生产质量,例如我家种了几十亩葡萄 葡萄需要剪枝 修果 摘叶需要很多的劳动力, 感觉很多环节可以通过图像识别的机器来处理,粒径不同的果粒,大小不一的叶片,高度不同的枝条,我总觉得可以通过图像对比来区分,筛选,这样的AI图像识别机器人才是刚性需求。

在日常生活中图像识别技术在冰箱中的运用将大大提高用户生活的便利性,这一应用能够实现自动冰箱食品列表生成、食品保鲜状态的显示、食物最佳储存温度的判断等功能,这些将大大提高用户的生活品质。在未来科学技术的不断发展中,AI的图像识别技术还将实现更为长足的发展,而这一发展也将能够更好地接受图像识别技术产品所带来的服务,最终大大提高用户的生活质量。

作为一门科技含量较高的新兴技术,AI的图像识别技术已经与用户的生活紧密结合在一起,而为了保证其能够更好的为用户提供服务,对于科技网络从业紧密相关的产品技术人员就必须大力推进AI图像识别技术产品的不断学习与创新,这对于我们产品经理未来创造的很多产品息息相关并将提高产品效率和切中用户对产品的刚性需求。

产品思维是抓住机遇,需求一旦过气了或者被竞争对手超越了产品想胜出是是十分困难的,只能跟随市场的步伐去追市场的需求而迭代。而AI+时代的产品经理应该有的思维模式是作品思维,不仅仅是追随需求,更多的是锤炼过滤并真金不怕火炼般的引领需求的潮流。

雷锋网(公众号:雷锋网)按:本文由 @连诗路 前阿里产品专家原创发布于人人都是产品经理。未经许可,禁止转载。


本文作者:人人都是产品经理
本文转自雷锋网禁止二次转载, 原文链接

相关文章
|
13天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
62 3
|
23天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
129 59
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在医疗领域的应用####
本文探讨了人工智能(AI)技术在医疗领域的创新应用及其带来的革命性变化。通过分析AI在疾病诊断、个性化治疗、药物研发和患者管理等方面的具体案例,展示了AI如何提升医疗服务的效率和准确性。此外,文章还讨论了AI技术面临的挑战与伦理问题,并展望了未来的发展趋势。 ####
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在医疗领域的应用与前景####
本文探讨了人工智能(AI)在医疗领域的多方面应用,包括疾病诊断、个性化治疗、患者管理以及药物研发等。通过对现有技术的梳理和未来趋势的展望,旨在揭示AI如何推动医疗行业的变革,并提升医疗服务的质量和效率。 ####
29 5
|
12天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
14天前
|
机器学习/深度学习 算法 自动驾驶
深度学习中的图像识别技术
【10月更文挑战第37天】本文将深入探讨深度学习在图像识别领域的应用,通过解析神经网络模型的构建、训练和优化过程,揭示深度学习如何赋能计算机视觉。文章还将展示代码示例,帮助读者理解并实现自己的图像识别项目。
|
15天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的图像识别技术及其应用
【10月更文挑战第36天】在当今科技飞速发展的时代,深度学习已成为人工智能领域的一颗璀璨明珠。本文将深入探讨深度学习在图像识别方面的技术原理和应用实例,旨在为读者提供一个全面而深入的了解。我们将从基础理论出发,逐步揭示深度学习如何革新了我们对图像数据的处理和理解方式。
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
77 11
|
17天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
73 4
|
17天前
|
机器学习/深度学习 算法 TensorFlow
深度学习中的图像识别技术
【10月更文挑战第34天】本文将探讨深度学习在图像识别领域的应用,并介绍如何利用Python和TensorFlow库实现一个简单的图像分类模型。我们将从基本原理出发,逐步讲解数据准备、模型构建、训练过程以及结果评估等关键步骤。通过本文的学习,读者可以了解到深度学习在图像识别中的强大能力,并掌握如何使用现代工具和技术来解决实际问题。
43 2
下一篇
无影云桌面