• 关于

    数据清洗怎么用

    的搜索结果
  • EXCEL数据缺失、混乱、重复怎么办?我用ETL带你走出困境

    在我们的日常工作中,数据清洗通常是一个非常复杂和繁琐的过程,特别在EXCEL里进行数据清洗会显得格外痛苦,例如对数据进行简单的合并、去重、分列都需要花费不少的时间和功夫。虽然微软推出了power query这个厉害的清洗组件,但是M语言的门槛相对较高,一般人不易掌握。因此选择一个简洁的ETL工具去...

    文章 游客26bi6rxq5pass 2021-01-05 28浏览量

  • 典型技术架构的分析和构建——《企业大数据实践路线》之四

    作者:阿里云MVP戚俊 本文系《MVP时间》视频课程《4节课看懂企业大数据实践路线》的文字版,视频请看MVP时间课程主页 视频课程直达 上期内容回顾解析业务数据的特征——《企业大数据实践路线》之三大数据在媒体行业的应用——《企业大数据实践路线》之二 今天我们主要来说一下典型技术架构的分析和构建。这...

    文章 MVP时间辰悠 2019-01-13 2815浏览量

  • 爬虫练习之数据清洗——基于Pandas

    本次以51Job上在东莞地区爬取的以Java为关键词的招聘数据 包括salary company time job_name address字段 当我把招聘网站上的数据爬下来的时候,内心是很开心的 爬下来的原始数据 但是! What?! 这是什么数据? 而且还不止一条!!! ...

    文章 fesoncn 2017-07-18 2233浏览量

  • Quick BI 数据可视化分析平台

    2020年入选全球Gartner ABI魔力象限,为中国首个且唯一入选BI产品

    广告

  • 5W1H(六何分析法)全景洞察大数据

    引言 5W1H(WWWWWH)分析法也叫六何分析法,是一种思考方法,也可以说是一种创造技法。我们也对大数据问些问题,相信这也是很多中小企业面临的现实问题。大数据这个词也是从12年开始慢慢热起来的,经过4年的发展,如今,很多企业已经开始有自己的大数据平台,但是对于更多的企业是没有的。笔者也在成都的云...

    文章 封神 2016-06-30 9708浏览量

  • 5W1H(六何分析法)全景洞察大数据

    大数据是什么? 这是一个很大的话题,大数据特点总结起来大约有5个,大量、高速、多样、价值、真实性。笔者也只能根据自己的看法,阐述一二。 大量,根据 中投顾问的数据,最近几年的数据增长为100%-200%左右,国内可使用的数据为ZB级别。一般中小企业的数据在TB到PB左右,后续会讲述,我们的数据...

    文章 hbase小能手 2018-11-05 1879浏览量

  • 选型宝访谈:怎样构建统一、共享的主数据平台,打造真正干净的数据治理能力?

    今天,商业环境瞬息万变,竞争日益加剧。 无论你是什么行业,你都无法回避的一个关键词是“数字化转型”。通过数字化转型,让企业变得敏捷,成为一种时代精神,也是我们这代IT人的使命。 然而,无论是业务层面的创新需求,还是决策层面的数据分析需求,都要干净、准确的业务数据作为支撑。只有拥有一个规范的、干净的...

    文章 选型宝 2019-08-14 1002浏览量

  • 学了这么久,你知道Python机器学习全流程是怎样的么?

    首先介绍一下机器学习的概念和地位,和其他的区别是? 机器学习的核心任务是? 机器学习的全流程是? 我们将上述流程拆解出来看: 1.需求来源是?需求天上来?被提需求到底是接还是不接? 2.老板说没有数据!还不舍得花钱买!让我自己想办法获取!还得谢谢老板点明方向,这可怎么办? 那你得会数据采...

    文章 技术小能手 2018-10-18 1077浏览量

  • 七周成为数据分析师—Excel实战篇

    本文是《七周成为数据分析师》的第三篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。 在Excel技巧和Excel函数后,今天这篇文章讲解实战,如何运用上两篇文章的知识进行分析。内容是新手向的基础教程。曾经有童鞋向我反应...

    文章 夏炙 2017-08-28 2791浏览量

  • 浅析阿里数据新能源技术架构(上)

    如果大家对阿里巴巴的新闻比较关注,最近可能会频繁听到阿里巴巴谈到“五新”这个词,“五新”中的其中一个概念是新能源。其实新能源就是大数据本身。技术、数据和算法三个方面结合在一起,才可以把数据真正用起来。 大家都知道,Google的数据量是很大的,但是它的数据源本身其实比较单一。以Google se...

    文章 技术小能手 2017-07-04 4161浏览量

  • 南弈:释放数据价值的「三个关键点」 | 数智加速度07课回顾

    大数据行业经历了十余年的快速发展,正式进入数据智能化阶段,数据驱动决策,驱动业务发展的企业新需求,实现数据价值最大化。 「大数据」概念在国内从2010年兴起,至2012年真正火爆起来,早些年也有许多大数据相关的故事,后来虽被证实「啤酒纸尿裤」的故事是杜撰的,但它的数据分析成果早已成为数据智能应用的...

    文章 startdtsms 2020-06-03 415浏览量

  • mysql插入数据的几个小技巧

    1.当表中已经存在大量数据,插入的新数据可能重复,对于重复的数据要忽略掉该怎么办? 答:用INSERT IGNORE语句搞定,例如: INSERT IGNORE INTO table VALUES (1, 1), (1, 2);  2.如果原表中没有记录就插入一条记录,如果有,就更新其中的某...

    文章 余二五 2017-11-22 821浏览量

  • Python爬虫知识点梳理

    学任何一门技术,都应该带着目标去学习,目标就像一座灯塔,指引你前进,很多人学着学着就学放弃了,很大部分原因是没有明确目标,所以,在你准备学爬虫前,先问问自己为什么要学习爬虫。有些人是为了一份工作,有些人是为了好玩,也有些人是为了实现某个黑科技功能。不过可以肯定的是,学会了爬虫能给你的工作提供很多便...

    文章 隐士2018 2018-02-07 8687浏览量

  • Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT)

    亲爱的各位同仁,各位同学,早上好。讲到大数据,就要问数据分析师应该做什么?所以我今天的标题是大数据分析师的卓越之道。这里不一定讲的对,讲的对的我也不一定懂,所以请大家以批评式的方式去理解。 这是一个典型的数据分析的场景,下面是基础设施,数据采集、存储到处理,左边是数据处理,右边价值输出。连接...

    文章 小旋风柴进 2017-05-02 1118浏览量

  • 什么是物联网数据分析?

    云栖号快速入门:【点击查看更多云产品快速入门】不知道怎么入门?这里分分钟解决新手入门等基础问题,可快速完成产品配置操作! 物联网数据分析LA(Link Analytics)是阿里云为物联网开发者提供的设备智能分析服务,全链路覆盖了设备数据采集、管理(存储)、清洗、分析等环节,有效降低了数据分析门槛...

    文章 小生生 2020-05-09 512浏览量

  • 小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习

    1. Python的数据科学快速入门指南 如果你刚入门Python,那么这张小抄表非常适合你。查看这份小抄表,你将获得循序渐进学习Python的指导。它提供了Python学习的必备包和一些有用的学习技巧等资源。 2. Python基础小抄表  这张由Datacamp制作的小抄表覆盖了所有P...

    文章 小旋风柴进 2017-05-22 5258浏览量

  • Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT珍藏版)

    亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不一定真懂了,所以请大家以批判的方式去理解。 这是一个典型的数据分析的场景,下面是基础设施,数据采集、存储到处理,左边是数据处理,右边价...

    文章 小旋风柴进 2017-05-02 1052浏览量

  • 黄志敏:数据新闻制作7步法,一张图抵3万字

    导读:9月12日,在由中国传媒大学国际传媒教育学院、财新数据可视化实验室、百度新闻实验室联合主办的“京华论道——2015可视化与数据新闻分享会”上,财新传媒首席技术官、财新数据可视化实验室负责人黄志敏带着案例与现场听众进行了分享。他根据自己从业的经验,将数据新闻的生产切割成七个步骤,庖丁解牛般地将...

    文章 小旋风柴进 2017-05-02 1516浏览量

  • 一场变美盛宴后面的大数据故事

    小红唇和阿里云大数据平台的牵手要从2016年5月份说起。随着小红唇业务的发展,用户量和内容量不断增加,迫切需要推出个性化功能,增加用户的使用时长和用户粘度。对于一个没有大数据/机器学习经验和技术储备,并且开发人员有限的年轻团队,在业务快速发展的情况下,如何在非常有限的开发资源和不影响正常业务开发的...

    文章 隐林 2017-07-14 4323浏览量

  • 莆田系医院清洗日记(科普小文)

    引子 一夜间,百度和莆田系的话题院占领了俺的朋友圈。 直到这几天我才幡然觉悟,从小的性病广告,到公交车站的整容广告,到各种一看就伪科学的网站广告,原来师出一派。 本人不善口诛笔伐和道德说教,但好歹也被医院坑过一次,花了800做了个其实应该免费的婚检,自此才知道『军』字打头的医院未必是个好鸟。 昨天...

    文章 野狩 2016-05-05 7850浏览量

  • 跨语言和跨编译器的那些坑(CPython vs IronPython)

    代码是宝贵的,世界上最郁闷的事情,便是写好的代码,还要在另外的平台上重写一次,或是同时维护功能相同的两套代码。所以才需要跨平台。 不仅如此,比如有人会吐槽Python的原生解释器CPython跑得太慢,或想让Python在.NET或JAVA虚拟机上运行,便开发了IronPython和Jython这...

    文章 沙漠之鹰123 2016-04-21 2745浏览量

  • 数据是企业未来新资产!你有,但你盘活了么?

    什么是数据资产? 不是所有的数据都能成为“资产”;或者说,什么样的数据才有资格列入“资产”呢?我们先来看看资产的定义,即指由企业过去经营交易或各项事项形成的,由企业拥有或控制的,预期会给企业带来经济利益的资源。以此类推,美数君给数据资产下的定义为:由企业在过去经营活动中产生、积累、沉淀的,能被企业...

    文章 泡泡浅眠 2017-07-04 1001浏览量

  • 数据是企业未来新资产!你有,但你盘活了么?

    什么是数据资产? 不是所有的数据都能成为“资产”;或者说,什么样的数据才有资格列入“资产”呢?我们先来看看资产的定义,即指由企业过去经营交易或各项事项形成的,由企业拥有或控制的,预期会给企业带来经济利益的资源。以此类推,美数君给数据资产下的定义为:由企业在过去经营活动中产生、积累、沉淀的,能被企业...

    文章 知与谁同 2017-08-01 664浏览量

  • 深度 | 两个案例,掌握AI在大数据领域的前沿应用

    近日,全球技术学习技术大会首次在京举行,阿里巴巴数据技术及产品部资深算法专家杨红霞(鸿侠)作为特邀嘉宾出席并发表主题演讲。鸿侠从什么是数据新能源说起,接着介绍了阿里目前比较成功的两款数据产品,一个是是自动化标签生产,另外一个是大规模分布式知识图谱,以及在此之上的一些重要应用。最后是她对机器学习和人...

    文章 技术小能手 2017-07-17 6351浏览量

  • 高峰对话:数据挖掘与可视化

    6月11日,北京国家会议中心,以“融合 开放 智能”为主题的2014地理信息开发者大会(WGDC2014)在此拉开帷幕。地理信息开发者大会自2012年起开始举办,三年时间里,伴随着中国地理信息产业的快速发展,已经成为地理信息领域最具影响力的技术创新盛会,与跨界融合、国际交流的重要平台。 在6月1...

    文章 小旋风柴进 2017-05-02 1057浏览量

  • 人工智能CC特征码防护及DDOS防护(防住+效果=真能防)

    有效防御大流量DDOS攻击+定制CC策略防护才等于真能防住 作者:锐速云阿龙 防DDOS攻击:为您提供IT出口防护解决您面对大流量攻击的问题.防CC攻击:为您提供自主研发CC防护策略,针对攻击实时调用相应策略来应对正在进行的CC防攻,已经应用在多个大型CC攻击用户中,体验效果好,误伤率可降为0。不...

    文章 along888 2018-04-13 1720浏览量

  • 大数据开发和大数据分析有什么不同?

    大数据分析工程师和大数据开发工程师分别能做什么? 有没有具体的项目案例之类 通俗解释开发和分析 非要把他俩分开的话,一个是偏向于数据,一个偏向于工程。好比要炒个菜,工程师是烧火、垫勺的那个,偏向于工具的使用。分析师是放调理、掌握火候的那个,偏向菜怎么做好吃。 数据影响生活 数据越来越多的影响并塑造...

    文章 小猪佩佩 2019-03-26 884浏览量

  • 当医疗健康加上大数据,会碰撞出什么火花?

    人有多大胆,地有多大产 小编引用某时代名言,这句话看起来有点荒唐,但随着科技在进步,又慢慢变成可能。624灵感咖啡之旅,给小编的感觉就是这样。没有你做不到的只有你想不到的。医疗行业神圣也同样充满社会的矛盾。现在的医疗技术,已超过你我的想象,现在的科技能让你心脏停止,就让你的心脏停止,能让你有心跳...

    文章 行者武松 2017-08-01 826浏览量

  • DataWorks:依赖上一周期(跨周期依赖)解析

    本文档均以修改xc_create节点的配置为案例。 DataWorks的三种跨周期依赖形式: ①一层子节点: 节点依赖关系:依赖当前节点的下游,例如 节点A存在下游节点B、C、D三个节点,依赖一层子节点是节点A依赖B、C、D三个节点的上一周期。 业务场景:本次任务运行依赖上一周期下游节点对本节...

    文章 DataWorks向翠 2019-04-08 1902浏览量

  • 大数据分析:找合适的瓶,酿新的酒

    为什么谈到大数据,传统企业表现出更多的困惑?其原因是,企业决策者并不清楚大数据能给业务带来哪些价值,也不知道如何学习、使用大数据分析工具。而这些大数据工具就摆在那里,谁能先一步学习使用,谁就占有先机。 算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了。也该是时候整理下一些感受,和大家分享...

    文章 小旋风柴进 2017-04-03 1024浏览量

  • BR-MLP基于spark+Hadoop分布式数据挖掘解决方案功能剖析

    分布式数据挖掘为何受到如此热议呢?在互联网发展中发挥着怎么样的作用呢? 大数据挖掘迅速地接纳了来源于其它科技领域的思想观念,涉及最优化方法、进化计算方法、信息论、数字信号处理、数据可视化和文本检索。大数据挖掘的任务包括是关联分析、聚类分析、分类管理、预测分析、时序模式和偏差具体分析。 BR-MLP...

    文章 sdydata 2019-06-19 614浏览量

1 2 3 4 ... 12 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT