• 大批量处理excel文件到ODPS中方案

    刚接到需求时特别的懵,不过工作还是要做的,首先通过查询dataworks中文档来看怎么实现该需求,通过文档了解到只支持csv、txt等格式进行单个上传,然后就开始着手做。方案一 1、首先按照excel文件内容创建表(下图...
    文章 2018-12-06 3422浏览量
  • 【云周刊】第133期:阿里云全球十四个节点评测分析及...

    怎么买最优惠?本文会为你逐一解答。点击查看 【逐云】Vol.1:将PostgreSQL的种子播至四海八荒——技术公益实践者德歌 深度:25张图看透阿里未来“新零售”的大局(附下载) 【阿里味儿】这瓶普普通通的六神花露水,...
    文章 2017-08-02 8964浏览量
  • 移动硬盘不能识别的常见7种解决方案~By 逆天经验

    这个有些人可能不太了解,额,怎么说呢,你原来8G的U盘用着用着(1~2年),然后格式化一下就发现我去,体积怎么缩水了?这个就是碎片化导致的,PC的硬盘也是有这个情况的,要么定期清理要么定期格式化下,不然当数据...
    文章 2016-11-16 769浏览量
  • 移动硬盘不能识别的常见7种解决方案~By 逆天经验

    这个有些人可能不太了解,额,怎么说呢,你原来8G的U盘用着用着(1~2年),然后格式化一下就发现我去,体积怎么缩水了?这个就是碎片化导致的,PC的硬盘也是有这个情况的,要么定期清理要么定期格式化下,不然当数据...
    文章 2016-09-23 782浏览量
  • 数据和人工智能的关系,超全解析

    非结构化的数据:现在非结构化的数据越来越多,就是不定长、无固定格式数据,例如网页,有时候非常长,有时候几句话就没了;例如语音,视频都是非结构化的数据。半结构化数据:是一些XML或者HTML的格式的,不从事...
    文章 2019-03-29 1607浏览量
  • 如何使用阿里云服务器

    不介绍阿里云服务器的购买等问题,如果关心怎么买阿里云服务器可以参考:阿里云服务器ECS购买流程。阿里云服务器的介绍可以参考我以前的文章:阿里云ECS服务器介绍。首先,既然要说怎么用,那就得先说说阿里云服务器...
    文章 2019-04-14 4479浏览量
  • 如何使用阿里云服务器

    不介绍阿里云服务器的购买等问题,如果关心怎么买阿里云服务器可以参考:阿里云服务器ECS购买流程。阿里云服务器的介绍可以参考我以前的文章:阿里云ECS服务器介绍。首先,既然要说怎么用,那就得先说说阿里云服务器...
    文章 2019-03-06 3235浏览量
  • 热议话题回顾:数据上云和迁移中可能会遇到哪些问题-...

    德哥:物联网可能包含大量的GIS类型,JSON格式数据。文件的方式存储,前端可能会有流式或OLTP,但是从原始文件进数据仓库应该是比较高效的方式,比从前端OLTP数据库再ETL来得快。idealities:物联网数据,是不是...
    文章 2016-11-21 2792浏览量
  • 大厂也在用的 6种 数据脱敏方案,严防泄露数据的...

    数据脱敏的应用在生活中是比较常见的,比如我们在淘宝东西订单详情中,商家账户信息会被用*遮挡,保障了商户隐私不泄露,这就是一种数据脱敏方式。数据脱敏又分为静态数据脱敏(SDM)和 动态数据脱敏(DDM): ...
    文章 2020-12-09 2964浏览量
  • 学了这么久,你知道Python机器学习全流程是怎样的么?

    数据分析报告一般包含哪些部分,具体怎么做,有哪些套路?原文发布时间为:2018-10-17 本文作者:小编 本文来自云栖社区合作伙伴“Python爱好者社区”,了解相关信息可以关注“Python爱好者社区”。
    文章 2018-10-18 1194浏览量
  • 吴甘沙:大数据的开放式创新

    从2013年开始关注数据与人的关系:对于数据科学家怎么做好分布式机器学习、特征工程与非监督学习,对于领域专家来说怎么做好交互式分析工具,对于终端用户怎么做好交互式可视化工具。英特尔研究院在美国卡内基梅隆...
    文章 2017-05-02 1026浏览量
  • 捷讯技术分析块存储、文件存储、对象存储的区别和应用...

    因为数据库需要存储裸盘映射给自己后,再根据自己的数据库文件系统来对裸盘进行格式化的,所以是不能够采用其他已经被格式化为某种文件系统的存储的。此类应用更适合使用块存储。2、对象存储的成本比起普通的文件...
    文章 2018-07-19 3761浏览量
  • 工业大数据之路探索分享

    但有几个关键点,从通用可以看到公有云的模式能不能在中国扎根的问题,公有云的标准在中国没有形成,所以我们和信通联手,希望把大量产生的数据格式化。由于工业连接,两类的标准特别多,一类来自OE,第二类是用户...
    文章 2017-08-01 1418浏览量
  • 数据环境下该如何优雅地设计数据分层

    日志存储方式:直接数据使用impala外表,parquet文件格式,canal合成数据为二次生成数据,建议使用内表,下面几层都是从impala生成的数据,建议都用内表+静态/动态分区。日志删除方式:长久存储。表schema:一般按天...
    文章 2017-08-02 812浏览量
  • 数据环境下该如何优雅地设计数据分层

    日志存储方式:直接数据使用impala外表,parquet文件格式,canal合成数据为二次生成数据,建议使用内表,下面几层都是从impala生成的数据,建议都用内表+静态/动态分区。日志删除方式:长久存储。表schema:一般按天...
    文章 2017-10-02 1205浏览量
  • 入门|做数据科学如烤蛋糕?不服来看

    弄清楚需要多少数据,以及数据的形式(或格式),就像做蛋糕你要方糖还是砂糖?真实世界的数据集通常以表格形式显示,例如.xls、.csv 或.json 等。有大量不同的算法可以帮助你进行数据清理和预处理。训练模型的数据...
    文章 2018-10-17 1198浏览量
  • 数据驱动的 SaaS 架构与背后的技术思考

    上一节粗略地描述了元数据驱动的多租户模型三大部分模型实体和基本作用,大家可能会比较疑惑,这么简单一个实体模型,怎么就起了这么个牛逼的名字,而且支撑了“一个云平台,无数个客户”。我们下面就对此模型的核心...
    文章 2021-01-12 3677浏览量
  • 数据环境下该如何优雅地设计数据分层

    日志存储方式:使用阿里云MaxCompute表,直接数据使用impala外表,parquet文件格式,canal合成数据为二次生成数据,建议使用内表,下面几层都是从impala生成的数据,建议都用内表+静态/动态分区。日志删除方式:长久...
    文章 2017-07-20 38433浏览量
  • 数据环境下该如何优雅地设计数据分层

    日志存储方式:直接数据使用impala外表,parquet文件格式,canal合成数据为二次生成数据,建议使用内表,下面几层都是从impala生成的数据,建议都用内表+静态/动态分区。日志删除方式:长久存储。表schema:一般按天...
    文章 2017-07-03 886浏览量
  • 【漫谈数据仓库】如何优雅地设计数据分层

    日志存储方式:直接数据使用impala外表,parquet文件格式,canal合成数据为二次生成数据,建议使用内表,下面几层都是从impala生成的数据,建议都用内表+静态/动态分区。日志删除方式:长久存储。表schema:一般按天...
    文章 2017-11-01 2465浏览量
  • 外贸狗教你WordPress从本地环境迁移到网站主机

    它提示我的编码格式有问题,打开数据库,把所有的“utf8mb4_unicode_520_ci”替换为“utf8_unicode_ci”(在建本地环境的时候我选的是“utf8_unicode_ci”的,但是不知道为啥是“utf8mb4_unicode_520_ci”) ...
    文章 2019-05-04 1930浏览量
  • 玩转大数据,你需要了解这8种项目类型!

    每个经销商提供格式各异的不同数据集。当然,从根本上说,这是一个带有BI/可视化前端的核心ETL/数据整合项目。但是,对许多公司而言,要真正了解交易的生命周期(从开始、进展到结束)比想象中要困难。你需要整合...
    文章 2016-05-30 1602浏览量
  • 数据库 GDB快速入门解析

    1.在图数据库控制台进行数据导入OSS授权,授权完成后,将Gremlin CSV格式数据文件上传到您的OSS Bucket中。2.完成步骤1后,调用图数据库SDK执行数据导入操作。具体使用可参考文档数据导入。本文来自 阿里云文档...
    文章 2020-05-08 614浏览量
  • 蒋勇|白话区块链技术栈与应用

    这是一个很有趣的数据格式,它将连续不断的发生的数据分成了一个 一个的数据块,这样每个区块就都有自己的数字编号,也可以有自己的身份证号(通过哈希算法计算得到),在下载同步这些数据的时候,可以并行的从各个...
    文章 2017-08-29 3812浏览量
  • 玩转大数据,你需要了解这8种项目类型!

    每个经销商提供格式各异的不同数据集。当然,从根本上说,这是一个带有BI/可视化前端的核心ETL/数据整合项目。但是,对许多公司而言,要真正了解交易的生命周期(从开始、进展到结束)比想象中要困难。你需要整合大量...
    文章 2017-07-03 1327浏览量
  • Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越...

    比如说数据并行的计算就用表或者是矩阵,如果是图并行,我就要选择网络和图的格式。最后,我想请大家关注UIMA(Unstructured Information Management Architecture),这个框架能够帮助你来保存各种各样数据表示,...
    文章 2017-05-02 1112浏览量
  • 阿里云服务器配置

    如果您的系统存在数据盘,且已格式数据盘,但没有挂载数据盘。一键安装包会将第一块数据盘挂载到/alidata目录下。5、怎么样卸载一键安装包?可以执行以下命令完成卸载:chmod 777-R sh-1.3.0/cd sh-1.3.0/./...
    文章 2019-03-04 1949浏览量
  • Redis内存分析方法

    数据导入以后,接下来想怎么分析就怎么分析了,举几个简单的例子: 查询key个数 sqlite>select count(*)from memory;查询总的内存占用 sqlite>select sum(size_in_bytes)from memory;查询内存占用最高的10个...
    文章 2016-11-07 18089浏览量
  • 怎么设置阿里云ECS服务器自定义脚本?

    首先来创建一个实例,没有服务器实例可以点击这里一个,需要注意的是,目前用户数据只支持VPC网络下的Linux系统。点我领取阿里云2000元代金券,(阿里云优惠券的作用:购买阿里云产品,最后支付结算的时候,阿里云...
    文章 2020-02-22 1672浏览量
  • 机器学习和数据挖掘的联系与区别

    数据预处理:原始数据会有噪声,格式化也不好,所以为了保证预测的准确性,需要进行数据的预处理。特征提取:特征提取是机器学习最重要、最耗时的一个阶段。模型构建:使用适当的算法,获取预期准确的值。模型评估:...
    文章 2017-08-01 2680浏览量
1 2 3 4 ... 22 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化