• 关于

    半结构化数据有什么用

    的搜索结果
  • 免费的Lucene 原理与代码分析完整版下载

    Lucene是一个基于Java的高效的全文检索库。那么什么是全文检索,为什么需要全文检索?目前人们生活中出现的数据总的来说分为两类:结构化数据和非结构化数据。很容易理解,结构化数据是有固定格式和结构的或者有限长度的数据,比如数据库,元数据等。非结构化数据则是不定长或者没有固定格式的数据,如图片,邮...

    文章 业余草 2017-08-23 1711浏览量

  • 我被“非结构化数据包围了”,请求支援!

    阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%。换句话来说,就是我们都被“非结构化数据”包围了。由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使用成为了难点。如果说结构化数据用详实的方式记录了企业的生产交易活动,那么非结构化数据则是掌握企业命脉的关键内容,所反映...

    文章 技术小能手 2019-09-09 3726浏览量

  • 袋鼠云数据中台专栏2.0 | 数据中台之数据源

    袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华自身的数据中台理论体系和实践方法论。希望通过后续文章的分享,与诸位读者交流,共同加快企业全面数据化进程。 本专栏每周更新1-2篇,敬请期待~ 数据中台之数据源...

    文章 琛琛轴子 2020-01-10 269浏览量

  • Quick BI 数据可视化分析平台

    2020年入选全球Gartner ABI魔力象限,为中国首个且唯一入选BI产品

    广告

  • 李德毅院士:再大的数据也能绕过那道弯

    中国电子学会云计算专家委员会名誉主任委员、中国大数据专家委员会顾问、中国工程院院士李德毅 在5月21日的第六届中国云计算大会上,李院士的演讲信息量极大,纵观科技发展几十年的历史,细数其中代表人物(居然其中还提到了歌星那英,WHY?)。演讲到底有多精彩?看看李院士演讲后,火爆的新书签售现场就知道...

    文章 小旋风柴进 2017-05-02 1293浏览量

  • hadoop随记(一)

        现在是一个大数据的年代,每天全球已电子方式存储数据的数据总量非常大。下面是部分例子:      1,facebook存储这约100亿张照片,越1PB存储容量      2,The Internet Archive(互联网档案馆)存储这约2PB数据,并以每月至少20TB的速度增长      ...

    文章 余二五 2017-11-15 734浏览量

  • DARTS 数据流图与数据词典

     1.数据流图   数据流图也称为Bubble Chart或data Flow Graph。是描述数据处理过程的工具。数据流图从数据传递和加工的角度,以图形的方式刻画数据流从输入到输出的移动变换过程。   (1)数据流图的主要图形元素   从数据流图中可知,数据流图的基本图形元素有4种。   数据...

    文章 cosnake 2009-07-22 998浏览量

  • Apache Flink 在实时金融数据湖的应用

    本文由中原银行大数据平台研发工程师白学余分享,主要介绍实时金融数据湖在中原银行的应用。主要内容包括: 1、背景概况 2、实时金融数据湖体系架构 3、场景实践 一、背景概况 首先简单介绍一下中原银行,它位于河南省郑州市,是河南省唯一的省级法人银行,是河南省最大的城市商业银行。2017 年 7 月 1...

    文章 阿里云实时计算Flink 2021-01-20 1411浏览量

  • HDInsight HBase的概述

    HDInsight HBase的概述 什么是HBase的? HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。它是仿照谷歌的BigTable是一个列面向家庭的数据库。数据被存储在一排内的表和数据的行是由列族分组...

    文章 杨振平 2014-12-16 1052浏览量

  • 清华韩亦舜:大数据革命与新经济分析

    ◆ ◆ ◆ 导读:本讲座为清华大学数据科学研究院执行副院长韩亦舜于2016年7月14日在首届中国大数据应用大会上所做的题为《大数据革命与新经济分析》的演讲。 ◆ ◆ ◆ 我们研究经济的时候,一定会放眼世界看更大的版图,因为今天的中国已经是世界第二大经济体了。看这张图的时候大家想一想,...

    文章 小旋风柴进 2017-05-02 1012浏览量

  • HBase数据模型剖析

    欢迎访问我的个人网站:http://wuyudong.com/ HBase 进行数据建模的方式和你熟悉的关系型数据库有些不同。关系型数据库围绕表、列和数据类型——数据的形态使用严格的规则。遵守这些严格规则的数据称为结构化 数据。HBase 设计上没有严格形态的数据。数据记录可能包含不一致的列、不...

    文章 wuyudong 2016-04-21 2616浏览量

  • 大数据和AI | 基于Spark的高性能向量化查询引擎

    嘉宾:范文臣Databricks 开源组技术主管,Apache Spark Committer、PMC成员,Spark开源社区核心开发之一。 视频地址:https://developer.aliyun.com/live/245461正文:Databricks最新开发的一款基于Spark的高性能向量...

    文章 阿里云E-MapReduce团队 2020-12-25 228浏览量

  • 阿里云李飞飞:传统数据库步履蹒跚,未来的机会在哪里?

    在采访中李飞飞表示,随着计算和数据上云的趋势快速发展,传统数据库步履蹒跚,云原生数据库和数据仓库利用云原生技术最大化的发挥池化的计算和存储资源弹性将是未来。同时随着AI技术的不断深入使用,数据库也将会越来越智能化,阿里云的目标是实现数据库的完全自动化和智能化。 “李飞飞,现任阿里巴巴集团副总裁、高...

    文章 Roin123 2020-03-19 1247浏览量

  • 带你读《企业数据湖》之一: 数据导论

    数据导论 点击这里查看第二章:数据湖概念概览点击这里查看第三章:Lambda架构:一种数据湖实现模式 企业数据湖Data Lake for Enterprises[印度] 汤姆斯·约翰(Tomcy John) 著潘卡·米斯拉(Pankaj Misra)张世武 李想 张浩林 译前言 对许多企业来说...

    文章 云迹九州 2019-10-19 1022浏览量

  • 为什么MongoDB敢说“做以前你从未能做的事”

    小编注:在MongoDB的网站上,它这样自我介绍:做以前你从未能做的事(Do What You Could Never Do Before)。为什么MongoDB敢这样说?它有什么长处与不足?今天我们给大家抛砖引玉。 一、 MongoDB是什么? “需求是创新之母。” 虽然这是句老话,但现在...

    文章 小旋风柴进 2017-05-02 1136浏览量

  • 360度解析企业智能数据湖平台

    本文根据DBAplus社群第86期线上分享整理而成。 讲师介绍  张扬 DaoCloud售前技术支持     负责面向企业用户的DaoCloud应用云平台整体解决方案交付。 曾任职IBM AICS云服务项目,熟悉Cloud Infra和DevOps相关工作。个人公众号:小张烤茄。   ...

    文章 稀奇古怪 2017-05-12 2112浏览量

  • 含PPT下载 | 李飞飞:如何看待数据库的未来?

    本文内容根据演讲嘉宾视频以及PPT整理而成,文末有直播全程的 PDF 下载链接。 视频地址:https://developer.aliyun.com/live/2031 本次分享将主要围绕以下四个方面展开: 云原生分布式数据库系统的发展历程 数据库系统架构的对比及趋势 云数据库技术高速发展的现...

    文章 开发者社区 2020-02-25 7542浏览量

  • 自底向上——知识图谱构建技术初探

    文/阿里安全 染青 “The world is not made of strings , but is made of things.” ——辛格博士,from Google. 知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到da...

    文章 华蒙 2018-06-22 5104浏览量

  • HBase常识及HBbse适合什么场景

        当我们对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用使用什么数据库?答案是什么,如果我们使用的传统数据库,肯定留有多余的字段,10个不行,20个,但是这个严重影响了质量。并且如果面对大数据库,pt级别的数据,这种浪费更是严重的,那么我们该使用是什么数据库?HBase...

    文章 技术小哥哥 2017-11-14 944浏览量

  • 一文揭秘!自底向上构建知识图谱全过程

    阿里妹导读:知识图谱的构建技术主要有自顶向下和自底向上两种。其中自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里。而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。 在本文中,笔者主要想...

    文章 技术小能手 2018-06-28 5671浏览量

  • JP摩根在金融衍生品交易系统中引入NoSQL数据库技术

    MarkLogic软件也将通过语义解析来识别市场操作 JP摩根通过将关系型数据库切换成NoSQL数据库系统,来降低其金融衍生品处理系统的复杂度, 以便于处理更多样性的数据并且满足日益增长的需求. 通过各类非常复杂的金融工具,该美国银行业巨头每日会产生成百上千的并且价值以亿计甚至兆计的金融衍生交...

    文章 小旋风柴进 2017-05-02 1216浏览量

  • 《大数据分析原理与实践》一一第2章 大数据分析模型

    第2章 大数据分析模型 大数据分析模型讨论的问题是从大数据中发现什么。尽管对大数据的分析方法林林总总,但面对一项具体应用,大数据分析非常依赖想象力。例如,对患者进行智能导诊,为患者选择合适的医院、合适的科室和合适的医生。可以通过患者对病症的描述建立模型而选择合适的科室;可以基于对患者位置、医院擅长...

    文章 华章计算机 2017-07-03 1193浏览量

  • 怎样才算大数据(之三)

    在本篇开始之前,首先就前文作一些补充说明:1. 大数据是一种新的数据形态和实践,它与当前主流的数据应用实践并存,而非取代。而且,它在相当长的时间内仍然是个新鲜事物,即使年复合增长率高达32%,到2016年全球大数据技术和服务市场总额也就是240亿美金左右(IDC在2012年底的预测)。不切实际、一...

    文章 小旋风柴进 2017-04-03 935浏览量

  • 基于OSS的EB级数据湖

    背景 随着数据量的爆发式增长,数字化转型成为整个IT行业的热点,数据也开始需要更深度的价值挖掘,因此需要确保数据中保留的原始信息不丢失,从而应对未来不断变化的需求。当前以oracle为代表的数据库中间件已经逐渐无法适应这样的需求,于是业界也不断的产生新的计算引擎,以便应对数据时代的到来。在此背景下...

    文章 阿里云E-MapReduce团队 2020-09-14 2082浏览量

  • [喵咪大数据]初识大数据

    大数据互联网时代下大家耳熟能详的名词,但是我们离大数据有多远呢?从2011Hadoop1.0问世到现在,渐渐地大数据解决方案已经趋向成熟,笔者觉得也是时间来学习接触一下大数据解决一些在工作中实际遇到的一些棘手的问题,今天开始笔者会带来一整套亲生在大数据里面探索的经验已经一些实践经验来与大家一同分享...

    文章 喵了个咪_ 2020-08-11 86浏览量

  • Redis、Memcache和MongoDB的区别

    1.Memcached Memcached的优点: Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key、value的字节大小以及服务器硬件性能,日常环境中QPS高峰大约在4-6w左右)。适用于最大程度扛量。 支持直接配置为session handle。Memc...

    文章 邴越 2016-05-05 13878浏览量

  • 《大数据分析原理与实践》——第2章 大数据分析模型

    第2章 大数据分析模型 大数据分析模型讨论的问题是从大数据中发现什么。尽管对大数据的分析方法林林总总,但面对一项具体应用,大数据分析非常依赖想象力。例如,对患者进行智能导诊,为患者选择合适的医院、合适的科室和合适的医生。可以通过患者对病症的描述建立模型而选择合适的科室;可以基于对患者位置、医院擅长...

    文章 华章计算机 2017-09-01 857浏览量

  • 【大数据100分】大数据架构及行业大数据应用(中级教程)

    【大数据100分】南大通用CTO武新:大数据架构及行业大数据应用〖大数据中级教程〗 主讲嘉宾:武新 主持人:中关村大数据产业联盟 副秘书长陈新河 承办:中关村大数据产业联盟 武新,南大通用高级副总裁兼CTO,法国奥尔良大学和法国国家科研中心博士;南大通用GBASE系列数据库产品的总设计师。在著名...

    文章 小旋风柴进 2017-04-03 2046浏览量

  • 《大数据分析原理与实践》一一第2章 大数据分析模型

    **第2章大数据分析模型**大数据分析模型讨论的问题是从大数据中发现什么。尽管对大数据的分析方法林林总总,但面对一项具体应用,大数据分析非常依赖想象力。例如,对患者进行智能导诊,为患者选择合适的医院、合适的科室和合适的医生。可以通过患者对病症的描述建立模型而选择合适的科室;可以基于对患者位置、医院...

    文章 华章计算机 2017-08-02 898浏览量

  • 企业如何选择Hadoop

    本文讨论Apache Hadoop大数据工具及技术,帮助有效管理实时的大数据,并讨论Apache Hadoop大数据分析的优缺点。帮助企业认识Hadoop,在选择Hadoop技术方案上做出抉择。 一、什么是大数据分析工具及技术 Hadoop是目前的处理和存储海量数据的最佳工具。Hadoop可以...

    文章 jieforest 2013-10-12 610浏览量

  • 自然语言处理技术及行业应用案例

    本文简单介绍了阿里云NLP技术平台中几个关键的点,如阿里目前正在做国际化,目前包含的语种从东南亚语种,西班牙语种,正扩展到欧洲语种。除此之外阿里NLP还在做行业级应用,包括在城市管理,医疗领域中已经推出了很多应用产品。 演讲嘉宾简介: 琳嫣,阿里云高级算法专家。博士毕业于德国萨尔大学,研究方向...

    文章 mongolguier 2018-06-25 7036浏览量

1 2 3 4 ... 46 >

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询