开发者社区> 问答> 正文

如果对大数据量的可视化分析实现上比较困难,是否有其他可以替代的方案?

阿里在大数据分析后的可视化这块有什么好的解决方案,比如对超过1亿数据进行聚类操作后,对聚类结果如何进行可视化的显示和分析?如果对大数据量的可视化分析实现上比较困难,是否有其他可以替代的方案?

展开
收起
OSC开源社区 2024-05-29 15:29:26 9 0
1 条回答
写回答
取消 提交回答
  • 一般聚类算法后 每个类和类之间都会有一个 相似度 然后这个相似度矩阵是一个图 可以用来做 node-link graph, layout 用 force-direct 算法。类的大小表示类中数据的数目。类的颜色表示它们的属性等。node之间的 link 选 top k ,颜色用相似度标注,粗细也可以表示相似度。这种方式可以做启发式探索。

    没有可视化只有一个数据list 无法表达这种启发式信息,人只能接受聚类后的结果。而可视化的启发性在于,但不唯一,人可以通过可视化中node大小和远近发觉可能被merge的类和应该分的很开的类。这都是因为 聚类算法的结果并不唯一。参数变了 结果就变了。但有值得相信的地方。也会可能不对的地方。但人眼可以发现这种信息。因为人对聚类的概念很灵活。

    同时,阿里DT可视化团队也研发了一些聚类和关系图分布算法并应用到了阿里图计算架构之中,帮助用户更直观地了解图计算过程。

    2024-05-30 08:44:03
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载
大数据&AI实战派 第2期 立即下载