人工智能项目的十条建议—概念篇

简介: 随着各行各业希望通过提高自动化来改善工作流程,以及产品和服务的交付,对采用更先进的人工智能能力和项目的需求不断增长。当然,只有在合适的前提下,深度学习和机器学习可以带来巨大的价值回报。在任何情况下,无论是从业务角度还是技术角度,人工智能项目都必须经历一些问题。为了让以后AI项目少踩坑,根据以往经验,我总结了“十条建议”,分为两篇:概念篇,指导篇,下文是概念篇的内容。

人工智能项目可以为公司带来难以置信的价值,但它们的设计必须符合核心指导原则,以确保获得最大回报。

介绍

随着各行各业希望通过提高自动化来改善工作流程,以及产品和服务的交付,对采用更先进的人工智能能力和项目的需求不断增长。

当然,只有在合适的前提下,深度学习和机器学习可以带来巨大的价值回报。在任何情况下,无论是从业务角度还是技术角度,人工智能项目都必须经历一些问题。为了让以后AI项目少踩坑,根据以往经验,我总结了“十条建议”,分为两篇:概念篇,指导篇,下文是概念篇的内容。

1. 定义问题--理解问题

在处理人工智能问题时,必须以最完整的术语定义问题。在项目开始时需要预留出时间。记录要解决的问题是什么,哪些数据可供您使用,以及需要什么样的解决方案。与最终用户重要问题陈述,以确保提供正确的解决方案。

在定义问题时,让问题变得具体才是关键。以欺诈检测模型为例。与其将问题定义为“减少欺诈”,后者设置了广泛的参数并且没有明确的起点和终点,而是更具体地指导您正确有效地解决问题。例如,将问题描述为“在付款完成之前标记信用卡购买的潜在欺诈交易并提醒客户”,这提供了有关需要预测什么、需要采取哪些行动以及适当的时间框架的信息。

2.不要根据你想要的方案来制造问题

从第一条开始。在不了解数据和问题陈述的情况下说“我想使用神经网络解决这个问题”,甚至说“我们将使用机器学习来解决这个问题”是很危险的。并非所有问题都需要机器学习,有些基于规则的方法通常就足够了,甚至更胜一筹。同样,并非所有机器学习问题都适合神经网络。有很多算法,每种算法都擅长做不同的事情。让解决方案来自问题——而不是相反。

这再次归结为仔细定义。不要跳到解决方案。例如,避免将您的解决方案定义为“我想使用深度学习来解决潜在的欺诈交易”。相反,请用更简单的术语来构建您的解决方案,例如“我想标记潜在的欺诈性交易”。

3.确保问题能够得到解决

明白定义问题和获取数据并不意味着问题可以得到解决。想想当前的解决方案,你有什么样的数据,以及想要的结果。在给定无限时间的情况下,人类能否使用相同的数据来解决这个问题?如果不是,则很可能无法使用机器学习来解决问题。如有疑问,请咨询同事。

在金融界,账户余额预测是一种经常被要求的解决方案,但没有人或电脑能告诉你未来几个月你的财务状况会怎样。想想大流行何时来袭;数百万人意外失去了工作。当房屋被盗并且需要更换物品时该怎么办?这些是人类和算法都无法预测的事情。

4.了解你的目标用户

任何问题的最终目标都是通过提供适当的解决方案来满足最终用户的需求。通过了解目标用户当前拥有什么、缺乏什么以及他们未来需要什么,您可以从一开始就瞄准最佳解决方案。用户想要聚合预测、分布还是单独的预测?他们希望如何呈现数据?API 可能更适合技术人员,但可视化仪表板更适合PM或管理人员的。一旦解决方案完成,这些思路可以减少繁琐的格式化,因此必须提前考虑。

5. 拥有与问题相关的良好数据

垃圾进垃圾出。这是AI行业流行的格言。不管有多少数据,如果不好,就无法进行数据分析。数据必须与问题相关,并且有足够量的有效记录。

如果任务需要数据标签而没有数据标签,则分类算法将无法工作。如果数据的结构不一致,那么未来的pipe将无法工作。不要仅仅为了有而建立一个垃圾模型。

6.有一个业务专家支持

如果不了解问题和数据,您将不可避免地犯下非常可避免的错误。

通过聘请业务专家,您可以提出有关数据的问题(例如,“当该字段为空时,这意味着什么?”)和问题(例如,“考虑此功能是否有意义?”)。通过与他们一起检查,您可以确保您的产品确实是一个可靠的解决方案。

7.注意你的预测和业务进度限制

业务目标几乎总是遵循进度表,因此请考虑模型的训练和预测允许多少时间和计算能力。有些情况需要立即进行预测,而其他情况可以在闲暇时分批完成。您可能有可用的大型计算集群,或者可能必须使用很少的内存快速训练模型。训练一个超级复杂的神经网络有可能并不是业务真正想要的

8. 预先了解存在哪些法律限制

在金融等受监管的行业中,可以使用哪些信息以及模型必须有多透明是有限制的。提前知道哪些数据可以自由使用。如果您想要的字段受到限制,请找出是否可以以某种方式对其进行存储或匿名化。同样重要的是,哪些机器学习模型可以用于任务,而不会影响监管标准。例如,决策树通常被认为是非常透明的,而神经网络则不是。为了满足法律要求,通常需要轻微的性能下降。

9. 了解部署方法

了解如何部署解决方案可以帮助您简化开发过程。需要考虑的几件事是数据格式、模型存储位置、时间和维护。这是托管模型吗?是否有您必须遵循标准公司流程?在设计的早期阶段意识到这些将节省大量时间和工作。

10. 不要重新发明轮子

也许,最重要的是,不要只花时间复制当前的解决方案。如果存在解决方案,请使用它。利用您的时间和计算能力来迭代和改进可用的方案,形成通用的工具,满足其他不同需求的业务使用

结论

所以你理解了这十条建议,可以为您的人工智能项目做好准备。无论您是在大型公司还是创业公司,都不要紧,遵循这些核心原则,您将永远不会偏离目标。

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 开发工具
人工智能项目的python版本管理工具DVC
dvc即data version control, 是一种针对人工智能项目(机器学习或者深度学习)的数据版本管理工具。DVC的操作和GIT类似,可以认为为GIT的二次开发封装。结合GIT,DVC可以有效的管理人工智能项目的整个流程,包括代码,数据,训练配置,模型【2月更文挑战第12天】
78250 1
|
1月前
|
机器学习/深度学习 人工智能 算法
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
63 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能基本概念和原理
人工智能基本概念和原理
218 1
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南(NLP自然语言处理概念介绍)
【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南(NLP自然语言处理概念介绍)
63 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
详解人工智能(概念、发展、机遇与挑战)
详解人工智能(概念、发展、机遇与挑战)
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】第一部分:ChatGPT的基本概念和技术背景
【人工智能】第一部分:ChatGPT的基本概念和技术背景
17 6
|
4天前
|
缓存 人工智能 监控
集成人工智能到Spring Boot项目
集成人工智能到Spring Boot项目
20 1
|
10天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI操作报错合集之在ODPS的xxx_dev项目空间调用easyrec训练,需要访问yyy项目空间的OSS,出现报错,是什么导致的
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
1月前
|
机器学习/深度学习 人工智能 数据挖掘
Python人工智能基础知识:理解神经网络与机器学习的基本概念
Python人工智能基础知识:理解神经网络与机器学习的基本概念
33 1
|
1月前
|
存储 人工智能 Java
软件测试/人工智能|Python 变量解析:从基础概念到内存地址探究
软件测试/人工智能|Python 变量解析:从基础概念到内存地址探究
39 0

热门文章

最新文章