《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.6 第5阶段:沟通结果

简介:

本节书摘来自异步社区《数据科学与大数据分析——数据的发现 分析 可视化与表示》一书中的第2章,第2.6节,作者【美】EMC Education Services(EMC教育服务团队),更多章节内容可以访问云栖社区“异步社区”公众号查看

2.6 第5阶段:沟通结果

在运行模型之后,团队需要将建模的成果和之前建立的成功与失败的衡量标准进行比较。在第5阶段中,如图2.7所示,团队需要考虑以何种最佳方式向团队成员和利益相关者阐述项目的发现和成果,包括警告、假设和结果的不足。因为项目演示常常面向整个组织机构,因此需要采用听众可以理解的方式来恰当地表达成果和定位发现。


ddd99021de6fbf2663f88804fa0f1d044baf8acf

在第5阶段,团队需要确定项目是否成功达到既定目标。许多时候,人们不愿意承认失败,但在这个情况下失败不应该被视为真正的失败,而是数据不能充分地验证或否定一个给定的假设。这听起来有些违背常理。但是,团队在确定数据是否会证明或否定在第1阶段中提到的假设时必须足够严谨。有时团队只做了一些肤浅的分析,其不足以验证或否定一个假设。有时团队做了深入的分析却试图展示并不存在的结果。在分析数据时要在这两个极端之间找到平衡,在展示实际结果时要实事求是。

当进行评估时,要确定结果是否有统计上的显著意义和有效性。如果是的话,要明确交流时需要突出哪些提供了显著发现的结果。如果结果是无效的,要考虑如何对模型进行改进和迭代以生成有效结果。在这一步中,要评估结果并确定哪些数据出人意料,哪些与第1阶段提出的假设一致。将实际结果与早期制定的想法相比较,可以产生额外的想法和见解。如果团队没有花时间来制定最初的假设,则将错过这些额外的想法和见解。

此时,团队应该已经确定哪种或哪些模型可以最佳地解决分析挑战。此外,团队应该已经对项目的某些发现有所认知。在这个阶段,一种最佳实践是记录所有的发现,然后选择三个最重要的发现分享给利益相关者。此外,团队需要反映这些发现的含义和评估其业务价值。取决于模型产生的结果,团队可能需要花费时间量化结果带来的业务影响,以帮助准备项目演示和展示发现的价值。Doug Hubbard的著作[6]为如何评估企业无形资产和量化看似不可预测的事物价值提供了见解。

既然团队已经运行了模型,完成了周密的发现阶段,并对数据集有了充分了解,就应该反思项目,思考项目遇到的阻碍和可以改进的方面。要为后续工作或现有过程的改进提供建议,还要考虑每一位团队成员和利益相关者需要怎样履行其个人职责。例如,项目发起人必须为项目提供支持,利益相关者必须理解模型如何影响流程(例如,如果团队创建了一个模型用于预测客户流失,市场营销团队必须理解如何在规划措施时使用这个模型)。生产工程师需要实施已经完成的工作。此外,在这个阶段要强调工作的商业价值,并开始在生产环境中实施项目成果。

这一阶段完成时,团队将会记录从分析中得出的重要发现和主要见解。这个阶段交付的成果对于利益相关者和赞助商来说将是最看得见的,所以要小心清楚地阐述结果、方法论和发现的商业价值。第12章将详细讲解数据可视化的工具和引用文献。

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
什么是神经元、神经网络、模型、调参、炼丹?
什么是神经元、神经网络、模型、调参、炼丹?
1017 0
Minecraft Forge部署以及部署时可能出现的问题以及解决方案
Minecraft Forge部署以及部署时可能出现的问题以及解决方案
1675 0
|
数据挖掘 数据处理 数据格式
R语言中使用readr与data.table导入数据的技术探索
【8月更文挑战第29天】`readr`和`data.table`都是R语言中非常优秀的数据导入工具,它们各有优势。`readr`提供了丰富的函数来读取各种格式的数据文件,并且支持在读取时指定列名和类型,非常适合处理小型到中型的数据集。而`data.table`的`fread`函数则以其高效的数据读取能力著称,尤其适合处理大型数据集。此外,`data.table`还提供了强大的数据处理功能,能够极大地提高数据分析的效率。 在实际应用中,我们可以根据数据的规模和格式选择合适的工具来导入数据,以便更好地进行后续的数据分析和建模工作。
|
存储 人工智能 监控
《鸿蒙NEXT——为人工智能应用中的用户数据保驾护航》
鸿蒙NEXT通过星盾安全架构,实现数据最小化授权与加密传输,确保用户隐私安全。用户可精准管理应用访问特定数据,避免过度收集;系统级文件加密和TLS等协议保障数据传输安全;隐私安全中心透明化管理应用行为,增强用户掌控权。鸿蒙NEXT为人工智能应用提供全方位数据安全保障,推动AI健康发展。
537 23
|
机器学习/深度学习 人工智能 机器人
何恺明新作出炉!异构预训练Transformer颠覆本体视觉学习范式,AI性能暴涨超20%
【10月更文挑战第29天】在机器人学习领域,训练通用模型面临数据异构性的挑战。近期研究“Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers”提出异构预训练Transformer(HPT),通过大规模预训练学习跨不同本体和任务的共享表示,显著提升了性能。实验结果显示,HPT在未见过的任务上表现优异,性能提升超过20%。
386 6
|
NoSQL 前端开发 MongoDB
Mock神器:Easy-Mock 私有化部署及使用介绍
Easy-Mock 是一个非常实用的模拟数据工具,尤其在前后端分离开发的场景中,可以极大地提高前端开发效率。通过将 Easy-Mock 部署为私有化服务,你可以完全掌控模拟数据的生成和管理,同时保障数据的安全性和隐私性。
836 44
HTML 标签简写及全称
本文列举了常见的HTML标签及其英文全称和中文解释,包括锚、缩写词、地址、粗体、区块引用、换行、段落、标题、水平尺、超文本引用等,帮助读者快速了解和使用这些标签。
|
机器学习/深度学习 数据采集 人工智能
GAN的主要介绍
【10月更文挑战第6天】
|
机器学习/深度学习 人工智能 自然语言处理
机器学习、深度学习和强化学习的关系和区别是什么?
众所周知,人工智能领域知识庞大且复杂,各种专业名词层出不穷,常常让初学者看得摸不着头脑。比如“机器学习”、“深度学习”、“强化学习”就属于这类名词。那么,针对这三者各自具体有哪些内容?三者是否有相关性?不同核心及侧重点是什么?以及各自的应用领域有哪些?应用的前景如何?等问题,本文根据百度百科等相关资料里的内容进行整理,形成了以下详细的阐述。
3510 0
|
人工智能 自然语言处理 数据可视化
体验评测报告:阿里云百炼平台——大模型应用构建的全方位工具箱
体验评测报告:阿里云百炼平台——大模型应用构建的全方位工具箱
1251 2

热门文章

最新文章