• 8.Spark MLlib(上)-机器学习SparkMLlib简介

  l 算法库:包含广义线性模型、推荐系统、聚类、决策树和评估的算法;l 实用程序:包括测试数据的生成、外部数据的读入等功能。3.1 MLlib的底层基础解析 底层基础部分主要包括向量接口和矩阵接口,这两种接口都会...
  文章 2017-11-15 1495浏览量
 • 8.Spark MLlib(上)-机器学习SparkMLlib简介

  l 算法库:包含广义线性模型、推荐系统、聚类、决策树和评估的算法;l 实用程序:包括测试数据的生成、外部数据的读入等功能。3.1 MLlib的底层基础解析 底层基础部分主要包括向量接口和矩阵接口,这两种接口都会...
  文章 2017-11-16 1601浏览量
 • 《推荐系统:技术、评估高效算法》一2.2 数据预...

  本节书摘来自华章出版社《推荐系统:技术...为了解决这个问题,我们设计了一个去噪方法,能够通过要求用户重新评价一些物品来提高精确度[5]。我们推断通过预处理步骤来提高精确度能够比复杂的算法优化效果要好得多。
  文章 2017-05-02 1672浏览量
 • 带你读《增强型分析:AI驱动的数据...大数据探索预处理

  不论数据的拥有方还是数据分析解决方案工具的提供方,其终极目标都是“通过数据分析,从数据中找出洞见并应用于实际场景中带来价值”。数据探索、数据预处理等工作是进行数据分析的首要工作。不论是采用大数据的...
  文章 2019-11-05 1667浏览量
 • 带你读《计算机网络原理》之二:网络体系结构

  分层“可将庞大而复杂的问题转化为若干较小的局部问题,而这些较小的局部问题就比较易于研究和处理。1974年,美国的IBM公司宣布了它研制的系统网络体系结构(System Network Architecture,SNA),它就是按照分层...
  文章 2019-11-07 1172浏览量
 • 因果推断:效应估计的常用方法及工具变量讨论

  但通常可对若干大城市进行适当的线性组合&xff0c;以构造一个更为优秀的“合成控制地区”(synthetic control region)&xff0c;并将“真实A市”与“合成A市”进行对比&xff0c;故名“合成控制法”。合成控制法能够克服在...
  文章 2022-04-11 75浏览量
 • 当代最伟大数学家讲述二十世纪的数学

  在微分方程中,真正关于非线性现象的研究已经处理了众多我们通过经典方法所看不到的新现象。在这里我只举两个例子,孤立子和混沌,这是微分方程理论两个非常不同的方面,在本世纪已经成为极度重要和非常著名的研究...
  文章 2017-05-31 963浏览量
 • 带你读《ONAP技术详解与应用实践》之三:ONAP架构设计

  1.常见模型常见模型包括业务模型、概念模型、数据模型、对象实例(物理数据模型)和元模型等,分别表示从现实世界到信息世界的不同层次的抽象。信息模型、业务模型、概念模型:可简略记成IM(Information Model,...
  文章 2019-11-07 2229浏览量
 • 以网游服务端的网络接入层设计为例,理解实时通信的...

  这种异步、非线性模型,极大地增加了编程难度,如nodeJs的常见的回调地狱问题。典型的采用IO复用模型的服务有Nginx、Netty。7.4)协程: 协程也称为轻量级线程,是一种协同的、非抢占式的多任务并发模型。协程运行...
  文章 2018-08-29 3324浏览量
 • 带你读《数据挖掘导论(原书第2版)》之二:数据

  为此,本章将讨论上面提到的4个问题,列举一些基本难点和标准解决方法。2.1 数据类型 通常,数据集可以看作数据对象的集合。数据对象有时也叫作记录、点、向量、模式、事件、案例、样本、实例、观测或实体。数据...
  文章 2019-11-18 4559浏览量
 • 浅谈系统实现层面稳定性保障

  做这一步决策就需要综合理解mysql,lindrom特性应用场景,lindorm与redis做为索引的差异化,以及opensearch的可靠性、延时性问题。数据库设计考虑不足,导致容量瓶颈。数据库的分库分表,则应该考虑未来5至10年的...
  文章 2021-09-23 196浏览量
 • 浅谈系统实现层面稳定性保障

  做这一步决策就需要综合理解mysql,lindrom特性应用场景,lindorm与redis做为索引的差异化,以及opensearch的可靠性、延时性问题。数据库设计考虑不足,导致容量瓶颈。数据库的分库分表,则应该考虑未来5至10年的...
  文章 2021-09-23 201浏览量
 • R语言数据挖掘

  本书提供了应用最流行的数据挖掘算法解决预测模型问题的可行策略,读者可以从中更好地理解主流的预测模型,也可以学习数据挖掘的实际经验。本书第1章介绍数据挖掘、机器学习和数据预处理的基本概念;第2章介绍频繁...
  文章 2017-05-02 4508浏览量
 • Ceph分布式存储实战.

  尤其是最后的生产环境应用案例,解了使用Ceph的技术人员的燃眉之急,给出了常见问题解决思路,造福于整个开源云存储界。无论是售前专家、开发架构师还是运维负责人,读一读Ceph中国社区编写的这本书,都可以细细地...
  文章 2017-05-02 9229浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化