AI项目成功的4要素

简介: 如何确保你的项目保持在正轨上。如果你是产品经理,想要用机器学习来做一些事情,这里列出了 4 件最重要的事情

云栖号:https://yqh.aliyun.com

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

如何确保你的项目保持在正轨上。

如果你是产品经理,想要用机器学习来做一些事情,这里列出了 4 件最重要的事情:

  1. 优先考虑工程而不是数据科学


image

一个机器学习项目首先是一个软件项目。许多数据科学家在构建架构良好、可靠、易于部署的软件方面缺乏经验。当你构建一个生产系统时,这将成为一个问题。

根据经验,工程师掌握数据科学技能的速度要比数据科学家掌握工程经验的速度快。如果有疑问,请与拥有 5 年以上经验、对人工智能充满激情的 python 工程师合作,而不是首次尝试构建商业应用的数据科学博士。

  1. 保持高效
    尽早降低风险很重要。用具体的里程碑来组织你的项目:

完成原型:查看你的想法是否有希望在 1-2 周内完成

离线测试系统:对模型进行调优,并在 2-4 周内对现有数据进行严格测试

在线测试系统:最终确定模型并在 2-4 周内进行测试

上线:自动化数据更新、模型训练和代码部署 2-4 周

持续改进:(可选)12 个月

总时间:1-3 个月

一个有经验的团队应该能够为几乎所有的项目遵循这些时间表。让团队在 1-3 个月内建立一个实时系统。上线后,再决定是否值得进一步改进。

这些诱惑会不必要地延长你的项目:

等待完美的数据
使用错误的工具(太复杂或太慢)
可扩展性的过度工程化
无休止地玩弄算法(见下一点)

  1. 算法不重要


image


机器学习系统有很多有趣的按钮可以使用。不要这么干。
这些改进值得花时间(按重要性排序):

获取更多(相关)输入数据

对数据进行更好的预处理

选择正确的算法并进行正确的调优。

算法是最不重要的因素。简单地选择一个可行的算法。无休止地升级算法是很诱人的,但它可能不会提供你期望的结果。

  1. 交流,交流,交流


image

分享尽可能多的业务场景
一旦工程团队开始构建,他们必须做出许多选择。他们越了解你的轻重缓急,就越能做出正确的决定。至少,你应该告诉他们:

战略重点
这是一个关键的问题吗?它是否需要每天处理数百万个请求?这是不是一个未来产品的研究?

目前的问题
目前处理流程是否太长?是不是太不准确了?还是有很多数据没有机器学习就无法计算?

输入和输出
输入:你(作为一个人)将使用哪些数据来做出正确的决策?输出:谁将使用输出?使用的频率?它需要是实时的吗?

性能指标
最重要的指标是什么:点击率?销售?投资回报?假阳性?

预计精度
如果你想要优化转化率,那么它可能不值得再花 2 周的时间来获得 2%的准确率。如果你建立了医疗诊断系统,那么即使是 1%的假阴性也是不可接受的。

TL;DR
工程优先于数据科学。
通过精益来降低风险。
不要被算法分心。
与开发人员共享所有业务需求。

原文发布时间:2020-01-15

本文作者:datarevenue

本文来自阿里云云栖号合作伙伴“AI公园”,了解相关信息可以关注“AI公园

相关文章
|
11天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
18天前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
53 6
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
48 3
|
15天前
|
人工智能 Anolis 开发者
|
1月前
|
人工智能 自动驾驶 机器人
【通义】AI视界|苹果自动驾驶汽车项目画上句号:加州测试许可被取消
本文精选了24小时内的重要科技新闻,包括Waymo前CEO批评马斯克对自动驾驶的态度、AMD发布新款AI芯片但股价波动、苹果造车项目终止、Familia.AI推出家庭应用以及AI逆向绘画技术的进展。更多内容请访问通义官网体验。
|
2月前
|
数据采集 人工智能 安全
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
|
3月前
|
人工智能 PyTorch 算法框架/工具
Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
【8月更文挑战第6天】Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程
|
3月前
|
数据采集 存储 人工智能
利用AI技术改善数字化转型项目的九种方法
利用AI技术改善数字化转型项目的九种方法
|
3月前
|
机器学习/深度学习 人工智能 算法
面向对象设计在AI项目中的应用
【8月更文第11天】面向对象编程(Object-Oriented Programming, OOP)是一种广泛采用的编程范式,它通过将数据和操作这些数据的方法封装在一起形成“对象”来模拟现实世界。OOP 提供了一种自然的方式来组织和管理代码,使得程序更加模块化、可重用且易于维护。在人工智能项目中,OOP 的这些特性尤其有用,因为它可以帮助开发者处理复杂的系统,并以直观的方式建模智能体与环境。
98 5
|
3月前
|
人工智能 JSON API