人工智能项目的十条建议—概念篇

简介: 随着各行各业希望通过提高自动化来改善工作流程,以及产品和服务的交付,对采用更先进的人工智能能力和项目的需求不断增长。当然,只有在合适的前提下,深度学习和机器学习可以带来巨大的价值回报。在任何情况下,无论是从业务角度还是技术角度,人工智能项目都必须经历一些问题。为了让以后AI项目少踩坑,根据以往经验,我总结了“十条建议”,分为两篇:概念篇,指导篇,下文是概念篇的内容。

人工智能项目可以为公司带来难以置信的价值,但它们的设计必须符合核心指导原则,以确保获得最大回报。

介绍

随着各行各业希望通过提高自动化来改善工作流程,以及产品和服务的交付,对采用更先进的人工智能能力和项目的需求不断增长。

当然,只有在合适的前提下,深度学习和机器学习可以带来巨大的价值回报。在任何情况下,无论是从业务角度还是技术角度,人工智能项目都必须经历一些问题。为了让以后AI项目少踩坑,根据以往经验,我总结了“十条建议”,分为两篇:概念篇,指导篇,下文是概念篇的内容。

1. 定义问题--理解问题

在处理人工智能问题时,必须以最完整的术语定义问题。在项目开始时需要预留出时间。记录要解决的问题是什么,哪些数据可供您使用,以及需要什么样的解决方案。与最终用户重要问题陈述,以确保提供正确的解决方案。

在定义问题时,让问题变得具体才是关键。以欺诈检测模型为例。与其将问题定义为“减少欺诈”,后者设置了广泛的参数并且没有明确的起点和终点,而是更具体地指导您正确有效地解决问题。例如,将问题描述为“在付款完成之前标记信用卡购买的潜在欺诈交易并提醒客户”,这提供了有关需要预测什么、需要采取哪些行动以及适当的时间框架的信息。

2.不要根据你想要的方案来制造问题

从第一条开始。在不了解数据和问题陈述的情况下说“我想使用神经网络解决这个问题”,甚至说“我们将使用机器学习来解决这个问题”是很危险的。并非所有问题都需要机器学习,有些基于规则的方法通常就足够了,甚至更胜一筹。同样,并非所有机器学习问题都适合神经网络。有很多算法,每种算法都擅长做不同的事情。让解决方案来自问题——而不是相反。

这再次归结为仔细定义。不要跳到解决方案。例如,避免将您的解决方案定义为“我想使用深度学习来解决潜在的欺诈交易”。相反,请用更简单的术语来构建您的解决方案,例如“我想标记潜在的欺诈性交易”。

3.确保问题能够得到解决

明白定义问题和获取数据并不意味着问题可以得到解决。想想当前的解决方案,你有什么样的数据,以及想要的结果。在给定无限时间的情况下,人类能否使用相同的数据来解决这个问题?如果不是,则很可能无法使用机器学习来解决问题。如有疑问,请咨询同事。

在金融界,账户余额预测是一种经常被要求的解决方案,但没有人或电脑能告诉你未来几个月你的财务状况会怎样。想想大流行何时来袭;数百万人意外失去了工作。当房屋被盗并且需要更换物品时该怎么办?这些是人类和算法都无法预测的事情。

4.了解你的目标用户

任何问题的最终目标都是通过提供适当的解决方案来满足最终用户的需求。通过了解目标用户当前拥有什么、缺乏什么以及他们未来需要什么,您可以从一开始就瞄准最佳解决方案。用户想要聚合预测、分布还是单独的预测?他们希望如何呈现数据?API 可能更适合技术人员,但可视化仪表板更适合PM或管理人员的。一旦解决方案完成,这些思路可以减少繁琐的格式化,因此必须提前考虑。

5. 拥有与问题相关的良好数据

垃圾进垃圾出。这是AI行业流行的格言。不管有多少数据,如果不好,就无法进行数据分析。数据必须与问题相关,并且有足够量的有效记录。

如果任务需要数据标签而没有数据标签,则分类算法将无法工作。如果数据的结构不一致,那么未来的pipe将无法工作。不要仅仅为了有而建立一个垃圾模型。

6.有一个业务专家支持

如果不了解问题和数据,您将不可避免地犯下非常可避免的错误。

通过聘请业务专家,您可以提出有关数据的问题(例如,“当该字段为空时,这意味着什么?”)和问题(例如,“考虑此功能是否有意义?”)。通过与他们一起检查,您可以确保您的产品确实是一个可靠的解决方案。

7.注意你的预测和业务进度限制

业务目标几乎总是遵循进度表,因此请考虑模型的训练和预测允许多少时间和计算能力。有些情况需要立即进行预测,而其他情况可以在闲暇时分批完成。您可能有可用的大型计算集群,或者可能必须使用很少的内存快速训练模型。训练一个超级复杂的神经网络有可能并不是业务真正想要的

8. 预先了解存在哪些法律限制

在金融等受监管的行业中,可以使用哪些信息以及模型必须有多透明是有限制的。提前知道哪些数据可以自由使用。如果您想要的字段受到限制,请找出是否可以以某种方式对其进行存储或匿名化。同样重要的是,哪些机器学习模型可以用于任务,而不会影响监管标准。例如,决策树通常被认为是非常透明的,而神经网络则不是。为了满足法律要求,通常需要轻微的性能下降。

9. 了解部署方法

了解如何部署解决方案可以帮助您简化开发过程。需要考虑的几件事是数据格式、模型存储位置、时间和维护。这是托管模型吗?是否有您必须遵循标准公司流程?在设计的早期阶段意识到这些将节省大量时间和工作。

10. 不要重新发明轮子

也许,最重要的是,不要只花时间复制当前的解决方案。如果存在解决方案,请使用它。利用您的时间和计算能力来迭代和改进可用的方案,形成通用的工具,满足其他不同需求的业务使用

结论

所以你理解了这十条建议,可以为您的人工智能项目做好准备。无论您是在大型公司还是创业公司,都不要紧,遵循这些核心原则,您将永远不会偏离目标。

目录
相关文章
|
4月前
|
机器学习/深度学习 算法 TensorFlow
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现用户上传一张动物图片,识别其名称。
123 1
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
|
2月前
|
机器学习/深度学习 人工智能 自动驾驶
探索人工智能的无限可能:从基础概念到实际应用
【10月更文挑战第35天】在这篇文章中,我们将一起走进人工智能的世界,探索它的无限可能。从基础概念出发,我们将深入理解人工智能的定义、发展历程以及主要技术。然后,我们将通过具体的代码示例,展示如何利用Python和TensorFlow实现一个简单的人工智能模型。最后,我们将探讨人工智能在现实世界中的应用,包括自动驾驶、医疗健康、金融等领域,并思考其未来发展的可能性。让我们一起开启这场人工智能的奇妙之旅吧!
35 1
|
4月前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
154 22
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
4月前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
158 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
3月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
82 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
4月前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
126 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
4月前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
75 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
5月前
|
机器学习/深度学习 人工智能 数据处理
【人工智能】项目实践与案例分析:利用机器学习探测外太空中的系外行星
探测外太空中的系外行星是天文学和天体物理学的重要研究领域。随着望远镜观测技术的进步和大数据的积累,科学家们已经能够观测到大量恒星的光度变化,并尝试从中识别出由行星凌日(行星经过恒星前方时遮挡部分光线)引起的微小亮度变化。然而,由于数据量巨大且信号微弱,传统方法难以高效准确地识别所有行星信号。因此,本项目旨在利用机器学习技术,特别是深度学习,从海量的天文观测数据中自动识别和分类系外行星的信号。这要求设计一套高效的数据处理流程、构建适合的机器学习模型,并实现自动化的预测和验证系统。
91 1
【人工智能】项目实践与案例分析:利用机器学习探测外太空中的系外行星
|
5月前
|
机器学习/深度学习 人工智能 算法
【人工智能】传统语音识别算法概述,应用场景,项目实践及案例分析,附带代码示例
传统语音识别算法是将语音信号转化为文本形式的技术,它主要基于模式识别理论和数学统计学方法。以下是传统语音识别算法的基本概述
126 2
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】TensorFlow简介,应用场景,使用方法以及项目实践及案例分析,附带源代码
TensorFlow是由Google Brain团队开发的开源机器学习库,广泛用于各种复杂的数学计算,特别是涉及深度学习的计算。它提供了丰富的工具和资源,用于构建和训练机器学习模型。TensorFlow的核心是计算图(Computation Graph),这是一种用于表示计算流程的图结构,由节点(代表操作)和边(代表数据流)组成。
102 0