• 餐饮行业怎么才能转大数据

    餐饮大数据怎么玩 要充分挖掘产生数据节点的决策过程,有一个最实用和简单的方式:将数据节点做更细的分类,找出决策过程中的次级数据节点。大众点评已经将原本简易的总体打分、平均消费、照片的评价体系做的越来越...
    文章 2017-07-03 1689浏览量
  • 七周成为数据分析师—Excel实战篇

    我们的分析也属于多维度,城市、工作年限、企业大小、企业领域等,利用不同维度形成一个直观的二位表格,而维度则是通过早期的数据清洗统一化标准化。这是一种很常见的分析技巧。后续的数据报告,涉及到可视化制作,...
    文章 2017-08-28 2918浏览量
  • 数据科学之路(上)

    数据清洗这件事重要到值得动用你的所有武器,从最原始的正则表达式,人肉修正脏数据,一直到最复杂的深度学习模型研究文本分类,再把文本中的词汇、语义、词性给提取出来变成新的feature,加入到特征库。所有这些都...
    文章 2017-08-01 1577浏览量
  • 如果EXCEL有段位,你会是什么水平?...

    虽然EXCEL在办公市场里占据着绝对的优势,但是功能较为单一,已经很难适应互联网时代的数据需求,所以微软在office2010后的版本里推出了扩展性的Power功能,主要的功能如下:数据清洗用Power Query,数据建模用Power...
    文章 2020-12-28 129浏览量
  • 数据的游戏:冰与火

    聪明的人在数据产生之前就定义好标准,并在数据产生之时就在干数据清洗的工作。一般的人是在数据产生并大量堆积之后,才来干这个事。另外,说一下Amazon的ASIN,这个事从十多年前就开始了,我在Amazon的内网里看到的...
    文章 2017-04-03 904浏览量
  • 数据和人工智能的关系,超全解析

    因为大数据平台能够使得多台机器一起干一个事儿,这个东西不是一般人能开发出来的,也不是一般人得转的,怎么也得雇个几十上百号人才能把这个起来。所以说就像数据库一样,其实还是需要有一帮专业的人来这个...
    文章 2019-03-29 1607浏览量
  • 数据的游戏:冰与火

    聪明的人在数据产生之前就定义好标准,并在数据产生之时就在干数据清洗的工作。一般的人是在数据产生并大量堆积之后,才来干这个事。另外,说一下Amazon的ASIN,这个事从十多年前就开始了,我在Amazon的内网里看到的...
    文章 2013-08-03 1520浏览量
  • 莆田系医院清洗日记(科普小文)

    清洗数据 问题来了,目前只有500个野鸡医院的名字,你要取得这500个医院的电话、省份、城市、地区、地址供研究,你会怎么做,是一个个去搜索吗?500个可以手动,如果是5000个呢,每次找到网站并刷出来需要15s,复制...
    文章 2016-05-05 8144浏览量
  • 数据创业需要跨过几道坎?

    原始的非结构化的数据,后面数据清洗需要太多的工序,数据存储也是很大的成本,这样的交易代价太高。我相信无论是企业用户也好,还是个人用户也好,大家更倾向于购买“拿来就能用”的大数据数据源。你说京东和腾讯...
    文章 2017-08-01 1827浏览量
  • 数据创业,数据哪里来?需要跨过几道坎?

    原始的非结构化的数据,后面数据清洗需要太多的工序,数据存储也是很大的成本,这样的交易代价太高。我相信无论是企业用户也好,还是个人用户也好,大家更倾向于购买“拿来就能用”的大数据数据源。你说京东和腾讯...
    文章 2017-08-01 1911浏览量
  • 数据建模没有你想象那么难!

    这让人怎么玩……第二次数据清洗开始,把这部分帖子也洗掉吧。其次,我们用发帖用户作为视角,输出一份用户的统计表格,里边包含每个用户的发帖数、求购次数、出售次数、交换次数、每一类主机/游戏的行为次数等等,...
    文章 2017-09-15 1753浏览量
  • Hadoop 怎么了,大数据路在何方

    数据工程师和数据科学家面临着数据发现、数据集成和数据清洗等大量复杂问题。为了解决这些问题,数据科学家需要花费大量时间去整理数据而不是分析数据。大量报到表明,数据科学家花费至少 70%以上的时间进行数据发现...
    文章 2020-05-12 1302浏览量
  • 数据分析流程这么长,产品经理如何一人搞定?

    走上了数据采集-处理-清洗-展现-分析-数据产品的道路。一个互联网公司要做好 Growth,就要做好产品体验。想要做好产品体验,产品经理第一需要的就是数据分析支持,有了数据才能开始Growth Hacker…此处省去10000字...
    文章 2017-08-01 1363浏览量
  • DataV首次实战分享:教你30分钟创建汽车大屏

    我喜欢钻研技术,也喜欢钻研汽车,最近研究了一下数据可视化,发现用datav可以出一些花样,这次就分享一下我做汽车数据大屏的经验。没数据是不行的,首先七拼八凑了一些汽车数据,然后. 清洗数据 我找到的数据是...
    文章 2016-07-18 66489浏览量
  • 从0到1构建大数据生态系列1:数据蛮荒中的拓荒之举

    数据这个鬼东西怎么在四五年前一下子就火得不行了,然后在这两年更是成了香馍馍,大批大批的传统IT从业人员,纷纷转行搞大数据。这是真的,近一年来,我面试的人里,很多都是从传统行业转型到大数据的,甚至有六到...
    文章 2017-05-15 3185浏览量
  • 医疗健康】美甲帮通过数加搭建大数据平台 针对百万...

    数据清洗、处理:使用大数据开发套件DataWorks把分布在多个数据源的数据集合一起,进行清洗和加工。数据分析挖掘:使用大数据开发套件DataWorks的定时任务调度功能,自动完成计算任务并将结果同步回传到数据库;IDE...
    文章 2020-03-16 1721浏览量
  • 袋鼠云数据中台专栏2.0|企业数字化建设三范式

    企业数据化建设的产出物是数据如果把企业数据化体系比作一个机器,那么这个机器输入的是从各种数据源抽取来的数据,数据没有进入机器之前我们称为「数据资源」,这些数据进入机器后,经过必要的数据清洗和整合被统一...
    文章 2019-05-13 2758浏览量
  • 数据浪潮下,前端工程师眼中的完整数据链图

    正如他说言,今天几乎所有的互联网公司背后都有一支规模庞大的数据团队和一整套数据解决方案作决策,这个时代已经不是只有硅谷巨头才玩数据的时代,是人人都在依赖着数据生存,可以说如今社会数据价值已经被推到...
    文章 2017-05-17 2696浏览量
  • 李德毅院士:再大的数据也能绕过那道弯

    各种媒体形态可随意碎片化,组织结构和挖掘程序要围着数据转,程序要碎片化,并可以随时虚拟重组,挖掘常常是人机交互环境下不同社区的发现以及社区中形成的群体智能,在非结构化数据挖掘中,会自然进行数据清洗和...
    文章 2017-05-02 1374浏览量
  • 以什么姿势进入DataMining会少走弯路?

    案例3:很多使用算法,甚至数据清洗方式的同学,更多是将知道的方法组合在一起,认为这就是数据挖掘?我想,这也许还是。网络课程给学习者带来的诟病吧!因为课程上已经千篇一律的讲述了数据挖掘的流程体系,所以学习...
    文章 2017-08-01 1357浏览量
  • 创业公司做数据分析(一)开篇

    数据处理层负责数据的抽取、清洗、建模,然后存入MongoDB与MySQL中,整个过程由Airflow任务调度管理系统来进行管理与监控;产出的数据最终提供给应用层使用。也许有人要说,连Hadoop都没用到,怎么号称自己在做数据...
    文章 2017-08-01 1394浏览量
  • 数据打造城市“智慧大脑”

    “利用大数据技术进行信息清洗和梳理分析,最终得到的是能够汇集各类活动的全部信息,作出相对全面、客观和及时的评价。这是以往抽样调查做不到的。西南财经大学工商管理学院教授寇纲告诉记者,“拿对城市经济运行...
    文章 2017-07-03 1177浏览量
  • 数据打造城市“智慧大脑”

    “利用大数据技术进行信息清洗和梳理分析,最终得到的是能够汇集各类活动的全部信息,作出相对全面、客观和及时的评价。这是以往抽样调查做不到的。西南财经大学工商管理学院教授寇纲告诉记者,“拿对城市经济运行...
    文章 2017-07-03 1247浏览量
  • 专家教你使用MaxCompute转大数据分析!

    因为拿到数据后,在数据处理之前会对数据进行清洗和预处理,处理完之后可以将这些数据交给机器学习平台,在机器学习平台中做一些深入的机器学习处理算法,比如可以将MaxCompute的结果作为训练的数据给机器学习平台...
    文章 2018-07-29 4625浏览量
  • 闲鱼把各种法做成了一个平台:哆啦A梦

    一个平台怎么也要有个名字,大家刚开始希望可以给力的解决闲鱼法中遇到的问题,所以起了一个黑土味的名字——奥利给,后面想了想法平台主要追逐的是法,哆啦A梦的口袋里面什么都可以变出来,与法平台刚好...
    文章 2020-10-20 3518浏览量
  • 创业公司如何做数据分析(一)开篇

    数据处理层负责数据的抽取、清洗、建模,然后存入MongoDB与MySQL中,整个过程由Airflow任务调度管理系统来进行管理与监控;产出的数据最终提供给应用层使用。也许有人要说,连Hadoop都没用到,怎么号称自己在做数据...
    文章 2017-04-10 7934浏览量
  • 业界丨身为数据科学家怎么能不掌握这四大技能!

    数据科学家必须有技术方面的扎实基本功,这包括编程、查询、数据清洗等。然而随着数据科学家的成长,他们需要更多地关注设计决策以及与管理者的沟通,这会大大增强经验丰富的数据科学家的影响力。他们可以做出更高...
    文章 2018-01-31 3583浏览量
  • 七周成为数据分析师!

    在获得埋点数据后,怎么利用Python/Pandas的shift()函数将其清洗为用户行为session,进而计算出用户在各页面的停留时间,后续如何转换成统计宽表,如何以此建立用户标签等。第一周:Excel学习掌握 如果Excel的顺溜...
    文章 2017-06-28 23829浏览量
  • 刚入职的数据分析师,上千数据指标,如何1周开发完?

    总结以上事件取自客户真实实战场景,某大型传媒公司通过Dataphin,半年时间完成了如下成果:•数据处理平台:基于业务全局的盘点,完成整体数据架构,打通了数据归集、清洗、计算及存储,定义了适合业务的数据维度、...
    文章 2019-11-13 2168浏览量
  • 十亿设备撑腰 TalkingData解读14年国内移动互联网

    一个是掌上生活,它是招行信用卡生活类应用,通过这个应用提高用户线上虚拟信用卡交易体验,另外一个是手机银行,它的背后都是基于TalkingData的系统,帮助招行在初期做运营的基础数据的采集、清洗、存储以及分析。...
    文章 2017-08-10 983浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化