相关性分析单击左侧导航栏中的组件,拖拽统计分析 > 相关系数矩阵至右侧画布。 连线读数据表中ODPS源的输出和相关系数矩阵的输入。右键单击相关系数矩阵,选择从此处开始执行。待运行完成后,右键单击相关系数矩阵,选择查看分析报告。 如相关系数矩阵图所示,3个窃电漏电指标本身和最终是否为窃电用户的关系都不太明显,即用于判断用户是否为窃电用户的特征并不具有单一性。特征分析单击左侧导航栏中的组件,拖拽统计分析 > 数据视图至右侧画布。连线读数据表中ODPS源的输出和数据视图的输入。双击数据视图,选择右侧的字段设置 > 选择特征列,单击选择字段,并选择目标列为flag。在选择字段对话框中,选择trend、xiansun和warnindicator3个字段,单击确定。 右键单击 数据视图,选择从此处开始执行。执行完成后,选择查看分析报告,即可查看各个特征和标签列在数据分布上的关系。
https://help.aliyun.com/document_detail/130169.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。