《大数据分析原理与实践》一一第2章 大数据分析模型-阿里云开发者社区

开发者社区> 华章计算机> 正文

《大数据分析原理与实践》一一第2章 大数据分析模型

简介: 本节书摘来自华章出版社《大数据分析原理与实践》一 书中的第2章,第2.1节,作者:王宏志 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
+关注继续查看

**第2章
大数据分析模型**
大数据分析模型讨论的问题是从大数据中发现什么。尽管对大数据的分析方法林林总总,但面对一项具体应用,大数据分析非常依赖想象力。例如,对患者进行智能导诊,为患者选择合适的医院、合适的科室和合适的医生。可以通过患者对病症的描述建立模型而选择合适的科室;可以基于对患者位置、医院擅长病症的信息以及患者病症的紧急程度建立模型而确定位置合适的医院;还可以根据医院当前的队列信息建立模型进行推荐,如果队列较长则显示已挂号人数较少、等待时间较短的医生资料,如果队列较短则显示那些挂号费和治疗费较高但医术相对高明、经验相对丰富的医生资料。
这些分析离不开一系列基本的模型与方法。大数据分析模型用于描述数据之间的关系,我们经常听说的贝叶斯分类器、聚类、决策树都是大数据分析模型。
面向具体应用的大数据分析模型往往是这些分析方法的扩展或者叠加,例如我们可以结合支持向量机(SVM)和随机森林一起对心脏病病人的重新入院率做一个预测,对那些重新入院概率高的病人提供更加周到的住院期间的护理和出院后的跟踪护理。
大数据的分析模型有多种不同分类方法。例如,依据分析的数据类型,可以分类成面向结构化多维数据的多元分析、面向半结构化图数据的图分析以及面向非结构化文本数据的文本分析。根据分析过程中输出和输入的关系,又可以分类成回归分析、聚类分析、分类和关联规则分析等。根据输入的特征,可以分为监督学习、无监督学习和半监督学习等。
大数据分析是一个比较广的范畴,和统计分析、机器学习、数据挖掘、数据仓库等学科都存在关系,因而Michael I. Jordan建议用“数据科学”来覆盖整个领域。而大数据分析模型的建立是其中最基础也是最重要的步骤。
本章将对大数据分析模型进行概述,首先在2.1节介绍大数据分析模型建立方法,在接下来的两节中介绍两种从数据中发现规律的统计方法。一种是直接计算数据的统计量(见2.2节),另一种是利用数据来推断数据所描述对象的总体特征,即统计推断(见2.3节)。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《Spark与Hadoop大数据分析》——1.1 大数据分析以及 Hadoop 和 Spark 在其中承担的角色
本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第1章,第1.1节,作者 [美]文卡特·安卡姆(Venkat Ankam),译 吴今朝,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1207 0
大数据分析技术 大数据就业待遇如何?
大数据是眼下非常时髦的热词,同时也催生出了一些与大数据处理相关的职业,通过对数据的挖掘分析来影响企业的商业决策。随着大数据在国内的发展,大数据相关人才却出现了供不应求的状况,大数据分析师更是被媒体称为“未来最具发展潜力的职业之一”。
1600 0
HashSet及LinkedHashSet源码分析(基于JDK1.6)
Java容器类的用途是“保存对象”,分为两类:Map——存储“键值对”组成的对象;Collection——存储独立元素。Collection又可以分为List和Set两大块。List保持元素的顺序,而Set不能有重复的元素。
695 0
HashMap源码分析(基于JDK1.6)
在Java集合类中最常用的除了ArrayList外,就是HashMap了。本文尽自己所能,尽量详细的解释HashMap的源码。一山还有一山高,有不足之处请之处,定感谢指定并及时修正。     在看HashMap源码之前先复习一下数据结构。
474 0
数据分析必会的六大实用模型
对于刚刚接触数据分析的人来说,经常会有这样的困惑和疑问:数据分析究竟难不难?难的话难在哪?为什么有时候作分析不知道从何下手,只能眉毛胡子一把抓? 其实就连我这种已经在数据分析行业浸淫十几年的老油条,有时候做起分析来也会手忙脚乱,根本原因就在于没有抓住数据分析的本质,我们是为了用大量数据去分析、解释和预测基于数据的事实,你首先要明白自己做数据分析的目的是什么,是为了描述事件分析?还是为了预测?又或者是做规范性分析? 按照我的经验来说,掌握数据分析方法有一条好的捷径——套用分析模型,对新手来说几乎是百试百灵,只要掌握了下面几个分析模型,基本上可以应对工作中的所有业务分析场景。
1611 0
10059
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载