开发者学堂课程【高校精品课-北京理工大学-数据仓库与数据挖掘(上):Data mining process】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/921/detail/15623
Data mining process
继续学习数据仓库和数据挖掘,了解一下在数据挖掘中使用的数据首先看一下这张图,
这张图展示的是在数据挖掘中使用的事物数据,事物数据的每一行代表的是一次购物行为,或者是一个购物篮,每一列代表的是商品的名称,它的每一行代表的是用户购买的每一行商品。比如说第三行代表的就是在这次购物中,用户购买了薯片和香肠,数据挖掘在数据中往往用于推荐系统,或者关联分析。这张图展示的是在数据挖掘中使用到的社交网络数据,
这网络中的节点代表的是人物,节点和节点之间的边代表的是人物之间的关系,社交网络数据通常用于社团的发现等一些数据挖掘任务。这张图展现的是时间序列数据,
可以看到,在这张图的第一列记录的是每一次事物的发展时间,如果把这一列去掉,就是普通的购物数据,但是每一次购物都有一个时间记录,所以每一行的记录都是有先后顺序的,这就是在数据挖掘中经常使用到的时间序列数据。这张图展示的是生物序列数据,
序列数据是要记录实体之间先后关系的,这张图展示的是矢量格式的空间数据,
这张图展示的是山区格式的影像数据,
除了这些数据,在数据挖掘中还会用到各种各样的数据,比如说图像的数据,文本的数据或者是视频的数据。