• OLAP联机分析处理介绍

    了OLTP与OLAP之间的比较。OLTP OLAP 用户 操作人员,低层管理人员 决策人员,高级管理人员 功能 日常操作处理 分析决策 DB 设计 面向应用 面向主题 数据 当前的,最新的细节的,二维的分立的 历史的,聚集的...
    文章 2013-12-19 2204浏览量
  • Python数据挖掘与机器学习技术入门实战

    2.Python数据预处理实战 3.常见分类算法介绍 4.对鸢尾花进行分类案例实战 5.分类算法的选择思路与技巧 一、数据挖掘与机器学习技术简介 什么是数据挖掘?数据挖掘指的是对现有的一些数据进行相应的处理和分析,最终...
    文章 2018-03-26 6796浏览量
  • MySQL执行计划解析

    服务器对SQL进行解析、预处理,再由优化生成对象的执行计划 MySQL根据优化生成的执行计划,调用存储引擎API来执行查询 服务器将结果返回给客户端,同时缓存查询结果 执行计划 优化与执行 MySQL会解析查询,并...
    文章 2018-06-15 18794浏览量
  • 带你读《C#神经网络编程》之三:决策树和随机森林

    决策树以“是/否、真/假”的方式回答连续的问题。根据这些回答,决策树按照预定的路径实现它的目标。决策树是有向无环图的一个变种。最后,利用整个数据集和所有特征构建决策树。图3-1展示了一个决策树的例子。你...
    文章 2019-11-12 1175浏览量
  • 带你入门Python数据挖掘与机器学习(附代码、实例)

    数据预处理指的是对数据进行初步处理,把脏数据(即影响结果准确率的数据)处理掉,否则很容易影响最终的结果。常见的数据预处理方法如下图所示: 1、缺失值处理 缺失值是指在一组数据中,某行数据缺失的某个特征值...
    文章 2018-04-08 11500浏览量
  • 《数据挖掘:实用案例分析》——3.2 数据挖掘建模过程

    样本抽取完成并经预处理后,接下来要考虑的问题是:本次建模属于数据挖掘应用中的哪类问题(分类、聚类、关联规则或者时序模式),选用哪种算法进行模型构建?模型构建的前提是在样本数据集中发现模式,比如关联规则...
    文章 2017-08-01 3950浏览量
  • 带你读《数据挖掘导论(原书第2版)》之三:分类:...

    这种属性通常在预处理期间被丢弃。其余属性可能无法自行分类,因此必须与其他属性一起使用。例如,体温属性不足以区分哺乳动物和其他脊椎动物。当它与“胎生”一起使用时,哺乳动物的分类显著改善。但是,如果包含...
    文章 2019-11-18 952浏览量
  • CIO指南:如何使用SAP HANA平台处理大数据

    同时,本文档还将帮助解答一系列问题,比如哪种类型的数据应存储在内存、动态分层和 Hadoop 中,以及应采用哪款处理引擎执行指定的任务等等。 错误的决策可能导致企业采用了过于复杂、价格过高的解决方案,而且...
    文章 2016-12-27 2627浏览量
  • ACL2016最佳论文:CNN/日常邮件阅读理解任务的彻底...

    我们使用斯坦福神经网络依赖解析对文本或是问题进行解析,并且其他的特征都能在不使用额外工具的情况下提取出来。为训练我们的神经网络,我们仅保留最常使用的50k的单词(包括实体和占字符),并会标注其他所有的...
    文章 2017-08-01 855浏览量
  • MySQL 的 20+条最佳实践

    预处理语句默认情况下会过滤绑定到它的变量,这对于避免SQL注入攻击极为有效。当然你也可以指定要过滤的变量。但这些方法更容易出现人为错误,也更容易被程序员遗忘。这在使用框架或 ORM 的时候会出现一些问题。既然...
    文章 2016-11-29 793浏览量
  • 《推荐系统:技术、评估及高效算法》一2.3 分类

    在这种的环境中他们提出两个方法来使用朴素贝叶斯分类:数据转化模型假设所有的特征都是完全独立的,特征选择作为一个预处理步骤来实施。另一方面,稀疏数据模型假设只有已知的特征是对分类有益的信息。此外,当...
    文章 2017-05-02 2283浏览量
  • 中国兵棋工程总师胡晓峰少将演讲:指挥信息系统的智能...

    未来指挥所系统虽然很复杂,包括了各种传感、可视化、空间推理、仿真决策、数据库什么的,但他们觉得最需要的还是智能辅助决策的支持。这是“深绿”的简要情况,大家对此都比较了解,我就这里就不多说了。二、...
    文章 2017-08-02 2209浏览量
  • 论文Express|自然语言十项全能:转化为问答的多任务...

    我们发布了代码,用于获取和预处理数据集、训练和评估模型,以及通过基于decaScore的十项全能分数(decaScore)的排行榜跟踪进度。我们希望这些资源的结合能够促进多任务学习、迁移学习、通用嵌入和编码、架构搜索...
    文章 2018-06-26 1771浏览量
  • 初学者如何选择合适的机器学习算法(附算法速查

    机器学习算法速查可帮助你从大量算法之中筛选解决你的特定问题的算法,同时本文也将介绍如何使用该速查。由于该速查专门针对数据科学和机器学习的初学者,所以在探讨这些算法之时,我们做了一些简化的假设。...
    文章 2017-06-01 1240浏览量
  • 从零开始带你了解商业数据分析模型——2....

    数据预处理任何一个数据分析项目都躲不掉繁重的数据预处理工作,比如数据画像,数据清洗,数据集成,数据变换等等。通常从业人员会花费70%的时间在这一项工作中。因为在上一篇文章中,我们已经粗略介绍了Altair ...
    文章 2020-05-14 696浏览量
  • 快速选择合适的机器学习算法

    机器学习算法速查帮助你从各种机器学习算法中选择,以找到适合你的具体问题的算法。本文将引导你完成如何使用速查的过程。由于该速查是专为初学者数据科学家和分析师设计的,所以在讨论算法时,我们将作出一些...
    文章 2017-05-21 12081浏览量
  • 《精通软件性能测试与LoadRunner最佳实战》—第1章1.6...

    动作桩(Action Stub):列出问题规定可能采取的操作。这些操作的排列顺序没有约束。条件项(Condition Entry):列出针对它左列条件的取值。在所有可能情况下的真 假值。动作项(Action Entry):列出在条件项的...
    文章 2017-05-02 2161浏览量
  • 带你读《传感系统:基础及应用》之一:工程中的传感...

    2.智能传感,它内置信息预处理、推理、论证以提供基于高级知识的决策;多传感融合可以提供更可靠和准确的结果。3.网络传感,多个传感节点(SN)在分布式传感设备中相互通信;节点之间可能存在显著的地理上的...
    文章 2019-11-11 901浏览量
  • AI 时代,还不了解大数据?

    DW:数据仓库层,包含维度和事实,通过对源进行清洗后形成的数据宽,比如:城市、商品类目、后端埋点明细、前端埋点明细、用户宽、商品宽。DM:数据集市层,对数据进行了轻粒度的汇总,由各业务...
    文章 2020-04-20 2904浏览量
  • 带你读《增强型分析:AI驱动的数据分析、业务决策与...

    构建一个预测模型的实质其实是个包含很多任务的工作过程,其中最主要的工作除了确定样本、数据预处理等,还有一个过程就是选择一个算法来进行训练。选择的算法其实就是选择一个函数来拟合现实观察量的情况,比如针对...
    文章 2019-11-05 925浏览量
  • 双11数据大屏背后:大规模流式增量计算及应用(附资料...

    第三个场景就是有时实时计算除了使得之前提到的应用成为可能还有一种场景下就需要数据采集手段的提高,因为存在大量的实时数据不得不以流式地进行预处理做一些筛选,将真正重要的信息存储下来再去进行离线的更加深入...
    文章 2017-05-22 1677浏览量
  • Python数据可视化1.2 数据转换

    现在,我们了解了数据的定义,但问题是:为什么要收集数据?数据对于描述物质或社会现象以及进一步回答这些问题非常有用。出于这个原因,确保数据的无误、精确和完整是很重要的;否则,错误、不精确和不完整的数据将...
    文章 2017-05-02 1667浏览量
  • 带你读《移动传感与情境感知计算》之二:情境感知...

    例如,可以用一个微处理器来寻址、处理传感器中断/数据,同时利用高性能处理器进行全功能计算,并使用网络处理器来处理网络数据。对于多处理组件,软件需要能够动态控制某些模块的功率并对其进行选通,同时根据特定...
    文章 2019-11-12 648浏览量
  • 计算机视觉与图像处理、模式识别、机器学习学科之间的...

    又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦...
    文章 2014-07-07 1854浏览量
  • 双11数据大屏背后的秘密:大规模流式增量计算及应用

    第三个场景就是有时实时计算除了使得之前提到的应用成为可能还有一种场景下就需要数据采集手段的提高,因为存在大量的实时数据不得不以流式地进行预处理做一些筛选,将真正重要的信息存储下来再去进行离线的更加深入...
    文章 2017-03-13 6149浏览量
  • ITIL 2011-服务运营的5个流程简介

    事故处理的步骤会涉及到谁来处理以及顺序问题。这就涉及到了时间。时间可以表示特定事件应该发生的时间总量。在事故管理里,时间就表示了事故管理中每一个活动花费了多少时间来解决这个事故。时间需要遵循...
    文章 2018-09-12 2292浏览量
  • 历时四年,Dropbox 用 Rust 重写同步引擎核心代码

    或者服务器会有不稳定的情形,但条件是在最多 64 个辅助微处理器、内存为最大值是 512 Gigabyte,同时一万个用户上线时才会不稳定,这些都是边角案例。边角案例和边缘案例不同,边缘条件只是单一个变量为最大值或...
    文章 2020-04-13 664浏览量
  • 斯坦福深度学习课程第二弹:词向量内部和外部任务评价

    图5:针对词向量的分类问题,上图是一个二维词向量分类问题,用简单的线性分类,比如逻辑回归和支持向量机完成分类 对于这样的问题,我们一般有以下形式的训练集: 其中x(i)是用某种方法生成的d纬词向量。y(i)是...
    文章 2017-05-02 1394浏览量
  • 带你读《数据挖掘导论(原书第2版)》之一:绪论

    如图1.1所示,虽然数据挖掘最开始被认为是KDD框架中的一个中间过程,但是多年来它作为计算机科学的一个学术领域,关注着KDD的所有方面,包括数据预处理、数据挖掘和后处理。它的起源可以追溯到20世纪80年代末,当时...
    文章 2019-11-18 1396浏览量
  • 深入理解MySQL索引

    预处理:进一步检查解析树是否合法,如检查数据和列是否存在,验证用户权限等。优化SQL:决定使用哪个索引,或者在多个相关联的时候决定的连接顺序。紧接着,将SQL语句转成执行计划。1.4 将查询结果返回客户端...
    文章 2020-03-18 881浏览量
1 2 3 4 ... 9 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化