• 关于

    半结构化数据错误如何解决

    的搜索结果
  • 我被“非结构化数据包围了”,请求支援!

    阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%。换句话来说,就是我们都被“非结构化数据”包围了。由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使用成为了难点。如果说结构化数据用详实的方式记录了企业的生产交易活动,那么非结构化数据则是掌握企业命脉的关键内容,所反映...

    文章 技术小能手 2019-09-09 3777浏览量

  • 《企业大数据系统构建实战:技术、架构、实施与应用》一3.2 如何选择解决方案

    本节书摘来自华章出版社《企业大数据系统构建实战:技术、架构、实施与应用》一书中的第3章,第3.2节,作者吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区“华章计算机”公众号查看 3.2 如何选择解决方案 企业选择大数据解决方案时,需要综合企业外部环境、企业内部环境、需求规划、解决方案特...

    文章 华章计算机 2017-05-02 3115浏览量

  • 《机器人操作系统ROS原理与应用》——3.2 如何选择解决方案

    本节书摘来自华章出版社《企业大数据系统构建实战:技术、架构、实施与应用》一 书中的第3章,第3.2节,作者:吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 如何选择解决方案 企业选择大数据解决方案时,需要综合企业外部环境、企业内部环境、需求规划、解决...

    文章 华章计算机 2017-05-02 1418浏览量

  • Quick BI 数据可视化分析平台

    2020年入选全球Gartner ABI魔力象限,为中国首个且唯一入选BI产品

    广告

  • 新一代大数据引擎操作系统:DataWorks V2.0重磅来袭

    认识DataWorks:新一代大数据引擎操作系统 众所周知,MaxComput与Blink分别是阿里巴巴自主研发的离线计算、实时计算大数据计算引擎,不仅拥有多项国家专利技术,而且多项关键指标已远超业内开源引擎平均能力,名副其实地成为了阿里巴巴大数据之路上的领航者。 如果把阿里巴巴大数据计算引擎比作...

    文章 云攻略小攻 2018-09-04 4098浏览量

  • 《大数据管理概论》一2.6 大数据融合的驱动枢纽

    本节书摘来自华章出版社《大数据管理概论》一书中的第2章,第2.6节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.6 大数据融合的驱动枢纽 数据融合与知识融合是一个相互启发、相互协调、逐步融合的过程,两者之间需要一个纽带进行衔接,我们把这个衔接纽带叫做智能晶格。此外,数据...

    文章 华章计算机 2017-05-02 1740浏览量

  • 自底向上——知识图谱构建技术初探

    文/阿里安全 染青 “The world is not made of strings , but is made of things.” ——辛格博士,from Google. 知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到da...

    文章 华蒙 2018-06-22 5195浏览量

  • 一文揭秘!自底向上构建知识图谱全过程

    阿里妹导读:知识图谱的构建技术主要有自顶向下和自底向上两种。其中自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里。而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。 在本文中,笔者主要想...

    文章 技术小能手 2018-06-28 5757浏览量

  • 数据分析师面试常见的77个问题

      随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我...

    文章 小旋风柴进 2017-04-03 3105浏览量

  • 《大数据管理概论》一2.4 数据融合技术

    本节书摘来自华章出版社《大数据管理概论》一书中的第2章,第2.1节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.4 数据融合技术 数据融合需要用动态的方式统一不同的数据源,将离散的数据转化为统一的知识资源。另外,大数据的关联性使得融合步骤之间相互影响,传统的流水线式融合...

    文章 华章计算机 2017-05-02 2045浏览量

  • 什么是数据湖?有什么用?

    导读: 数据湖概念的诞生,源自企业面临的一些挑战,如数据应该以何种方式处理和存储。最开始,企业对种类庞杂的应用程序的管理都经历了一个比较自然的演化周期。 最开始的时候,每个应用程序会产生、存储大量数据,而这些数据并不能被其他应用程序使用,这种状况导致 数据孤岛 的产生。随后数据集市应运而生,应用程...

    文章 开源大数据EMR 2019-05-19 2096浏览量

  • 《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一2.2 基于事实的数据表示模型

    本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第2章,第2.2节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 基于事...

    文章 华章计算机 2017-05-02 1138浏览量

  • Redis、Memcache和MongoDB的区别

    1.Memcached Memcached的优点: Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key、value的字节大小以及服务器硬件性能,日常环境中QPS高峰大约在4-6w左右)。适用于最大程度扛量。 支持直接配置为session handle。Memc...

    文章 邴越 2016-05-05 13963浏览量

  • AIOps的七种武器:让IT基础设施实现“自动驾驶”

    2019阿里云上海峰会,由阿里云资深技术专家周琦带来以“基于AlOps的探索和最佳实践”为题的演讲。AIOps意味着智能、安全的管控平台,阿里巴巴经过十年的变革在AIOps上有重大探索,那么AIOps究竟能够为大家带来什么益处呢?接下来本文将对AIOps进行详细的介绍。视频直播回顾云原生专场PPT...

    文章 社区助手 2019-07-30 10264浏览量

  • 2017年12月19-20日 阿里云 飞天/智能 云栖大会-北京峰会 会议笔记

    2017年12月19-20日,在北京国家会议中心举办了云栖大会北京峰会,19日为Tech Insight,20日为主论坛和其他分论坛。场次很多,内容很丰富,自己的一些参会笔记整理如下: 20171219 上午 阿里云MVP Demo Show:快速定位问题,实现安全的及时监控 09:00 - 10...

    文章 笨笨的粽子妞 2017-12-21 2732浏览量

  • 《数据驱动安全:数据安全分析、可视化和仪表盘》一1.2.2 编程技能

    本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第1章 ,第1.2.2节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2.2 编...

    文章 华章计算机 2017-06-21 1198浏览量

  • “云+大数据”时代 中端存储如何选择

     云计算、大数据,随着这两个技术词汇在越来越多的映入我们眼帘的同时,一方面企业级IT基础架构也在随之在潜移默化的改变着。“云+大数据”时代,在很多人看来,首先想到的是,大数据和私有云存储是一个具有雄厚技术与经济实力的大型企业才有可能实现的。其实不然,与前几年的云雾笼罩不同,云计算正在为IT经理们越...

    文章 boxti 2017-08-09 949浏览量

  • Logtail从入门到精通(四):正则表达式Java日志采集实战

    前言 为简化日志接入门槛,我们提供了极简模式的日志解析方式(如[开启日志采集之旅]()中的介绍)。为了更好的对日志进行分析,我们还提供了其他解析方式,例如:分隔符模式、完整正则模式、JSON模式等。本文将为大家介绍如何使用完整正则解析模式。 日志解析介绍 日志采集最终目的还是为了分析,通常分析都要...

    文章 元乙 2018-05-12 5339浏览量

  • 独家 | 关于数据湖架构、战略和分析的8大错误认知(附链接)

    翻译:张玲 校对:丁楠雅 文章来源:微信公众号 数据派THU 本文打破有关数据湖的8个错误认知,错误认知包括3方面,还提出了5个小技巧,以构建一个灵活的、可交付业务价值的数据湖。 本文的目的是构建数据湖,并提供适应企业数据策略的背景信息。咨询公司和提供商提出的意见相互矛盾,因此,这些信息历来一直...

    文章 初商 2019-08-28 2110浏览量

  • Serverless :让「前端开发者」走向「应用研发者」

    技术的成熟度源自大规模的实践,在 Java 领域,阿里将自身的实践源源不断的反哺给微服务技术体系;在 Node.js 领域,阿里正掀起了前所未有的前端革命浪潮,将实践反哺给 Serverless 技术体系,并逐渐拓展到其他多语言体系和后端 BaaS上。 Serverless 云研发平台作为阿里巴...

    文章 淘系技术 2020-12-11 396浏览量

  • 开发者成功使用机器学习的十大诀窍

    在提供发现埋藏数据深层的模式的能力上,机器学习有着潜在的能力使得应用程序更加的强大并且更能响应用户的需求。精心调校好的算法能够从巨大的并且互不相同的数据源中提取价值,同时没有人类思考和分析的限制。对于开发者而言,机器学习为应用业务的关键分析提供了希望,从而实现从改善客户体验到提供产品推荐上升至超个...

    文章 小旋风柴进 2017-05-02 1110浏览量

  • KDD2016论文精品解读(一)

    联合编译:章敏,高斐,陈杨英杰 导读:KDD2016是首屈一指的跨学科会议,它聚集了数据科学,数据挖掘,知识发现,大规模数据分析和大数据方面的研究人员和从业人员。 论文一题目:稳定流体近似的卷积神经网络 摘要 在空气动力学相关设计、分析和优化问题方面,流场是通过使用计算流体动态学(CFD)求解器...

    文章 青衫无名 2017-08-01 1218浏览量

  • 如何为智能投顾打造对话系统?这有一份指南可供参考

    本文来自AI新媒体量子位(QbitAI) 作为人工智能和语言学的重要分支,自然语言处理(NLP)的相关研究一直充满魅力与挑战。 8月2日(上周三),量子位邀请到灵智优诺的CTO许可,他以“怎样为智能投顾打造一个对话系统”为题,分享了NLP在保险智能投顾中的应用和相关技术问题。 这次分享逻辑严密...

    文章 行者武松 2018-01-08 803浏览量

  • 带你读《企业数据湖》之二:数据湖概念概览

    点击这里查看第一章:数据导论 点击这里查看第三章:Lambda架构:一种数据湖实现模式 第2章数据湖概念概览 数据湖概念的诞生,源自企业面临的一些挑战,如数据应该以何种方式处理和存储。最开始,企业对种类庞杂的应用程序的管理都经历了一个比较自然的演化周期。最开始的时候,每个应用程序会产生、存储大量数...

    文章 云迹九州 2019-10-19 1033浏览量

  • 大数据的风险和现存问题

    “大数据”成为2012年的关键词汇,被认为将会带来生活、工作与思维的重大变革。谷歌、亚马逊等互联网企业在利用大数据方面所做的工作使数据行业看到了新的发展路径。大数据在教育、医疗、汽车、服务性行业的应用所彰显的能量使企业、研究者对大数据的未来充满信心。《连线》杂志主编克里斯?安德森甚至早在2008年...

    文章 小旋风柴进 2017-04-03 1555浏览量

  • 我在阿里巴巴做 Serverless 云研发平台

    作者 | 林昱(苏河) 技术的成熟度源自大规模的实践,在 Java 领域,阿里将自身的实践源源不断的反哺给微服务技术体系;在 Node.js 领域,阿里正掀起了前所未有的前端革命浪潮,将实践反哺给 Serverless 技术体系,并逐渐拓展到其他多语言体系和后端 BaaS上。 Serverles...

    文章 中间件小哥 2020-12-01 3082浏览量

  • 我在阿里巴巴做 Serverless 云研发平台

    作者 | 林昱(苏河)来源|阿里巴巴云原生公众号 技术的成熟度源自大规模的实践,在 Java 领域,阿里将自身的实践源源不断的反哺给微服务技术体系;在 Node.js 领域,阿里正掀起了前所未有的前端革命浪潮,将实践反哺给  Serverless 技术体系,并逐渐拓展到其他多语言体系和后端 Baa...

    文章 阿里巴巴云原生小助手 2020-12-04 825浏览量

  • 阿里靠什么支撑 EB 级计算力?

    作者 关涛 阿里云智能事业群 研究员导读:MaxCompute 是阿里EB级计算平台,经过十年磨砺,它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务。去年MaxCompute 做了哪些工作,这些工作背后的原因是什么?大数据市场进入普惠+红海的新阶段,如何与生态发展共赢?人工智能进入井喷...

    文章 晋恒 2019-04-18 3076浏览量

  • 我在阿里巴巴做 Serverless 云研发平台

    作者 | 林昱(苏河) 技术的成熟度源自大规模的实践,在 Java 领域,阿里将自身的实践源源不断的反哺给微服务技术体系;在 Node.js 领域,阿里正掀起了前所未有的前端革命浪潮,将实践反哺给 Serverless 技术体系,并逐渐拓展到其他多语言体系和后端 BaaS上。 Serverles...

    文章 温柔的养猫人 2020-12-11 88浏览量

  • 仁人帮探索大数据技术

    前两期小帮为大家介绍了仁人帮的大数据定义与大数据在仁人帮后台的应用。今天也不跟大家卖关子了,接下来,小帮为大家奉上的是大数据平台技术的探索。 大数据技术,小帮认为可以分成两个大的层面,大数据平台技术与大数据应用技术。要使用大数据,你先必须有计算能力,大数据平台技术包括了数据的采集,存储,流转,加工...

    文章 隐林 2017-10-10 3908浏览量

  • Spark Core组件:RDD、DataFrame和DataSet

    1. 介绍 spark生态系统中,Spark Core,包括各种Spark的各种核心组件,它们能够对内存和硬盘进行操作,或者调用CPU进行计算。 spark core定义了RDD、DataFrame和DataSet spark最初只有RDD,DataFrame在Spar...

    文章 wsc449 2018-01-17 1175浏览量

1 2 3 4 ... 15 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT