• 关于

    索引与文摘数据库可以做什么

    的搜索结果
  • 首席工程师揭秘:LinkedIn大数据后台是如何运作的

    ◆ ◆ ◆ “不懂得日志,你就不可能完全懂得数据库”Jay Kreps说道,Jay Kreps是LinkedIn公司首席工程师,本文介绍他本人对于日志的心得体会,包括日志是什么,如何在数据集成、实时处理和系统构建中使用日志等。 ◆ ◆ ◆ 我们最后要讨论的是在线数据系统设计中日志的...

    文章 小旋风柴进 2017-05-02 1086浏览量

  • 为什么MongoDB敢说“做以前你从未能做的事”

    小编注:在MongoDB的网站上,它这样自我介绍:做以前你从未能做的事(Do What You Could Never Do Before)。为什么MongoDB敢这样说?它有什么长处与不足?今天我们给大家抛砖引玉。 一、 MongoDB是什么? “需求是创新之母。” 虽然这是句老话,但现在...

    文章 小旋风柴进 2017-05-02 1146浏览量

  • 5大架构:细数数据平台的组成与扩展

    导读:One size does not fit all! 数据处理平台已不集中于传统关系型数据库,各种其他平台层出不穷,也各有其适用范围。 从哪些角度去理解各种数据处理平台的设计思想及发展演进呢?下面我们从几个角度讨论一下: 一、单机存储引擎设计(数据的位置) 从某种意义上说,当我们处理...

    文章 小旋风柴进 2017-05-02 1382浏览量

  • Quick BI 数据可视化分析平台

    2020年入选全球Gartner ABI魔力象限,为中国首个且唯一入选BI产品

    广告

  • 技术连载:LinkedIn大数据后台如何运作-1

    我在六年前的一个令人兴奋的时刻加入到LinkedIn公司。从那个时候开始我们就破解单一的、集中式数据库的限制,并且启动到特殊的分布式系统套件的转换。这是一件令人兴奋的事情:我们构建、部署,而且直到今天仍然在运行的分布式图形数据库、分布式搜索后端、Hadoop安装以及第一代和第二代键值数据存储。 ...

    文章 小旋风柴进 2017-04-03 862浏览量

  • 企业级搜索公司PureDiscovery获C轮融资1000万美元

      企业级搜索公司PureDiscovery不是依赖索引和关键词搜索,它专注于语义分析技术、学习公司文件内容中所指的内涵——通过创造一个语义大脑( semantic brain)指示用户需要的数据。 今天,PureDiscovery获C轮融资1000万美元,继在 e-discovery(民事或刑事...

    文章 小旋风柴进 2017-04-03 897浏览量

  • 大数据的真正价值在哪里?

    看一看所有与大数据相关的活动,我们应该问一个问题:究竟有多少大数据在实际上是有用的。根据常识稍微思考一下,我们就会发现只有一小部分。 我已经与数据打交道超过40年。在前互联网的时代,我们经历了所谓的数据过载(dataoverload)。结果后来我们发现数据本身其实是没有价值的,只有一小部分被证明...

    文章 小旋风柴进 2017-05-02 915浏览量

  • LinkedIn前数据专家解读日志与实时流处理

    编者注:本内容来自Jay Kreps所著的《我喜爱日志:事件数据、流计算处理和数据集成》一书的第三章。Jay Kreps是Confluent的联合创始人和CEO。在此之前,Jay是领英的主要架构师之一,专注于数据基础架构和数据驱动的产品。他是多个可扩展的数据系统空间的开源项目的作者之一,包括Vol...

    文章 小旋风柴进 2017-05-02 1147浏览量

  • 日志和实时流计算处理

    到目前为止,我还仅仅只是描述了一些把数据从一个地方拷贝到其他地方的多种的方法。然而,在存储系统间挪动字节并不是故事的结尾。实际上我们发现,“日志”是“流”的另外一种说法,而日志(的处理)是流计算处理的核心。 但是先等一下,到底什么是流计算处理? 如果你是上世纪九十年代末和二十一世纪初的数据库或者数...

    文章 小旋风柴进 2017-05-26 1367浏览量

  • Python入门之数据处理——12种有用的Pandas技巧

    引言 Python正迅速成为数据科学家偏爱的语言——这合情合理。它作为一种编程语言提供了更广阔的生态系统和深度的优秀科学计算库。 在科学计算库中,我发现Pandas对数据科学操作最为有用。Pandas,加上Scikit-learn提供了数据科学家所需的几乎全部的工具。本文旨在提供在Python...

    文章 小旋风柴进 2017-05-02 1335浏览量

  • 2013 Bossie评选:最佳开源大数据工具

    MapReduce的出现是为了突破数据库的局限。Giraph、Hama以及Impala等工具的出现则是为了突破MapReduce的局限。虽然上述方案的运行都需要以Hadoop为基础,但图形、文档、列式以及其它NoSQL数据库也是大数据当中不可或缺的组成部分。   哪款大数据工具能够满足您的需求?...

    文章 小旋风柴进 2017-04-03 1017浏览量

  • 讲给普通人听的分布式数据存储

    关系型数据库到底有什么问题? 正如你们中的很多人可能已经知道的,关系型数据库(RDB)技术自从1970年代就已经存在,直到1990年代末一直是结构化存储的事实标准。RDB几十年来很出色地支持了高度一致性事务的工作负载,并依然保持强劲。随着时间的推移,该项古老的技术为应对客户的需求获得了新的能力,比...

    文章 小旋风柴进 2017-05-02 1134浏览量

  • 【大数据100分】大数据架构及行业大数据应用(中级教程)

    【大数据100分】南大通用CTO武新:大数据架构及行业大数据应用〖大数据中级教程〗 主讲嘉宾:武新 主持人:中关村大数据产业联盟 副秘书长陈新河 承办:中关村大数据产业联盟 武新,南大通用高级副总裁兼CTO,法国奥尔良大学和法国国家科研中心博士;南大通用GBASE系列数据库产品的总设计师。在著名...

    文章 小旋风柴进 2017-04-03 2067浏览量

  • 大数据搜索与挖掘:知著-见微-晓意【大数据100分】

    感谢各位朋友的莅临,随着以微博、Twitter与Facebook等为代表的新型社交网络的迅猛发展,大数据已经成为了新一轮的科技革命,是信息技术发展的新趋势,对国家的经济与社会已经逐步产生重大影响。今天我的演讲包括四个部分:我对大数据的定义与理解;大数据应对之道:知著-见微-晓意;大数据搜索与挖掘的...

    文章 小旋风柴进 2017-05-02 1487浏览量

  • 手把手 | 如何用Python做自动化特征工程

    机器学习越来越多地从手动设计模型转变为使用H20,TPOT和auto-sklearn等工具来自动优化的渠道。这些库以及随机搜索等方法旨在通过查找数据集的最优模型来简化模型选择和转变机器学习的部分,几乎不需要人工干预。然而,特征工程几乎完全是人工,这无疑是机器学习管道中更有价值的方面。 特征工程也称...

    文章 技术小能手 2018-09-03 1604浏览量

  • 初学指南| 用Python进行网页抓取

    引言 从网页中提取信息的需求日益剧增,其重要性也越来越明显。每隔几周,我自己就想要到网页上提取一些信息。比如上周我们考虑建立一个有关各种数据科学在线课程的欢迎程度和意见的索引。我们不仅需要找出新的课程,还要抓取对课程的评论,对它们进行总结后建立一些衡量指标。这是一个问题或产品,其功效更多地取决于网...

    文章 小旋风柴进 2017-05-02 2104浏览量

  • 后Hadoop时代的大数据架构

    提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补充。我在知乎上也...

    文章 小旋风柴进 2017-05-02 9110浏览量

  • 小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习

    1. Python的数据科学快速入门指南 如果你刚入门Python,那么这张小抄表非常适合你。查看这份小抄表,你将获得循序渐进学习Python的指导。它提供了Python学习的必备包和一些有用的学习技巧等资源。 2. Python基础小抄表  这张由Datacamp制作的小抄表覆盖了所有P...

    文章 小旋风柴进 2017-05-22 5258浏览量

  • 怎样才算大数据(之三)

    在本篇开始之前,首先就前文作一些补充说明:1. 大数据是一种新的数据形态和实践,它与当前主流的数据应用实践并存,而非取代。而且,它在相当长的时间内仍然是个新鲜事物,即使年复合增长率高达32%,到2016年全球大数据技术和服务市场总额也就是240亿美金左右(IDC在2012年底的预测)。不切实际、一...

    文章 小旋风柴进 2017-04-03 942浏览量

  • NLP技术的应用及思考

    以下是精彩内容整理:背景介绍 阿里巴巴的生态系统下面有很多的计算平台,上面有各种各样的业务层,最中间是买家和卖家之间包括销售、支付等等之间的关系,外面建了一圈从娱乐到广告到金融到购物到物流等等各方面这样一个生态,中间有非常多的数据能够关联起来,所以对于阿里巴巴而言,这个图可以非常简练的概括我们在做...

    文章 杨琬祯 2019-09-16 337浏览量

  • 【深解读】什么是数据科学?如何把数据变成产品?

    未来属于那些知道如何把数据变成产品的企业和个人。     --麦克.罗克德斯(Mike Loukides) 据哈尔•瓦里安(Hal Varian)说,统计学家是下一个性感的工作。五年前,在《什么是Web 2.0》里蒂姆•奥莱利(Tim O’Reilly)说“数据是下一个Intel Inside”...

    文章 小旋风柴进 2017-05-02 1109浏览量

  • NLP技术的应用及思考

    云栖TechDay第33期,阿里巴巴iDST 自然语言处理部总监上乘带来题为“NLP技术的应用及思考”的演讲。本文主要从NLP背景开始谈起,重点介绍了AliNLP平台,接着分享了NLP相关的应用实例,最后对NLP的未来进行了思考。   以下是精彩内容整理: 背景介绍 阿里巴巴的生态系统下面有...

    文章 云栖小秘书 2017-05-04 14336浏览量

  • 对话Hadoop之父Doug Cutting|大数据和开源的未来

    前言 对中国大数据产业来说,2016年是从垂直领域野蛮生长到爆发全国范围关注热潮的一个转折点。不论是人山人海巨头云集的贵阳数博会,还是首次在华举办的全球顶级大数据会议Strata + Hadoop World,都揭示了中国大数据产业发展的澎湃动力。 在Hadoop生态领域,Cloudera是规...

    文章 小旋风柴进 2017-05-02 916浏览量

  • 数据科学工具包(万余字介绍几百种工具,经典收藏版!)

    本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享,提高数据科学人员素质。 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率...

    文章 小旋风柴进 2017-05-02 2459浏览量

  • 当区块链遇上数据基础设施

    大家好,我叫詹姆斯·史密斯,我是英国开放数据研究院创新实验室的负责人。开放数据研究院是一个非盈利的组织,它将全世界各地的人们连接起来,提供工具并启发大家利用数据来创新。尽管我们的主要工作是开放数据,但我们并非局限于此。我们着眼于整个数据光谱,不管是封闭数据、共享数据、开放数据、大数据、小数据、政府...

    文章 小旋风柴进 2017-05-02 1163浏览量

  • 大数据时代的五大商业分析技术趋势

    目前,趋势中心对如何应对分析挑战的关注力度并不亚于他们考虑在新商业视角中如何充分利用机遇的力度。例如,随着越来越多的公司开始不得不面对海量数据以及考虑如何利用这些数据,管理与分析大型不同数据集的技术开始出现。提前分析成本与性能趋势意味着公司能够提出比以前更为复杂的问题,提供更为有用的信息以 帮助他...

    文章 小旋风柴进 2017-04-03 940浏览量

  • 在Twitter“玩”数据科学是怎样一种体验

    ◆ ◆ ◆ 引子  2015年6月17日是我在Twitter工作两周年的纪念日。回想起来,两年间,数据科学在Twitter的应用方式和范围发生了很大变化: 许多Twitter的非机器学习主导的核心产品中,机器学习的比重正在不断增加(例如“While you were away” 功能——Tw...

    文章 小旋风柴进 2017-05-02 1229浏览量

  • 怎样才算大数据(之三)

    天下武功,唯快不破。这句话滥觞于《拳经》,经过雷军等人的演绎,几乎成了互联网时代商业致胜的不二法则。那么,大数据的快又从何说起呢? 话说道哥(Doug Laney)当年创立三V经,背景是电子商务:Velocity衡量的是用户“交互点”(Point-of-Interaction),如网站响应速度、...

    文章 小旋风柴进 2017-04-03 987浏览量

  • 别错过这张AI商用清单:你的生产难题可能被一个应用解决

    人工智能席卷各行各业早已是不争的事实。 一边是大把人担心AI抢走自己的饭碗,另一边又是人工智障事故频出、难在业界落地。 AI在业界的应用程度到底如何,恐怕还得从已有的商用AI看起。 今天,文摘菌就来盘点一下已实现产品化的商用AI,看看它们在业界都能搞出些什么名堂。 如果你真怕被AI抢走饭碗,所谓知...

    文章 技术小能手 2018-01-29 5255浏览量

  • 安利一则深度学习新手神器:不用部署深度学习环境了!也不用上传数据集了!

    深度学习的浪潮在五年前开始兴起。随着计算能力的爆炸型增长和几个成功的案例,深度学习引起了大肆宣传。深度学习技术可以用来驾驶车辆,在Atari游戏中进行人机对抗,以及诊断癌症。 开始学习神经网络时,我花了两周的时间进行探索,选择合适的工具,对比不同的云服务以及检索在线课程。但回想起来,我还是希望我...

    文章 技术小能手 2017-11-02 1696浏览量

  • 35个大数据投资并购案例(近2月,超15亿美金)

    做了个笨事, 整理了从9月下旬到现在差不多两个月的全球大数据方向的投资并购案例, 总共35个项目,超过15亿美元, 包括三起超过一亿美金的收购(Facebook 1.5亿美元收购移动数据分析服务Onavo, NoSQL数据库公司MongoDB获得1.5亿美元投资, Monsanto 9.3亿美元收...

    文章 小旋风柴进 2017-04-03 1537浏览量

1 2 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT