• 关于

    分布式检索怎么用

    的搜索结果
  • 《大型网站系统与Java中间件》读书笔记(上)

    前言 只有光头才能变强。 文本已收录至我的GitHub仓库,欢迎Star:https://github.com/ZhongFuCheng3y/3y 这本书买了一段时间了,之前在杭州没带过去,现在读完第三章,来做做笔记 这本书前三章都在科普和回顾中间件/分布式的基础,讲得非常通俗易懂。在之前已...

    文章 java3y 2019-06-10 4838浏览量

  • 阿里云 Elasticsearch 向量检索,轻松玩转人脸识别、搜索推荐等29个业务场景

    本文作者:清豆 — 阿里巴巴高级开发工程师 本文字数:2979阅读时间:3~6分钟 您将了解:1、开源向量检索库存在的问题2、源自阿里Proxima向量检索库的优势3、阿里云向量检索的技术原理4、阿里云向量检索的应用场景5、如何使用阿里云向量检索 【全链路云上Elastic Stack 全景...

    文章 工程师甲 2020-03-05 3259浏览量

  • 分布式锁的几种实现方式~

    目前几乎很多大型网站及应用都是分布式部署的,分布式场景中的数据一致性问题一直是一个比较重要的话题。分布式的CAP理论告诉我们“任何一个分布式系统都无法同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance),最多只能同时满足...

    文章 Hollis 2018-04-13 2341浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • BR-MLP基于spark+Hadoop分布式数据挖掘解决方案功能剖析

    分布式数据挖掘为何受到如此热议呢?在互联网发展中发挥着怎么样的作用呢? 大数据挖掘迅速地接纳了来源于其它科技领域的思想观念,涉及最优化方法、进化计算方法、信息论、数字信号处理、数据可视化和文本检索。大数据挖掘的任务包括是关联分析、聚类分析、分类管理、预测分析、时序模式和偏差具体分析。 BR-MLP...

    文章 sdydata 2019-06-19 619浏览量

  • hadoop随记(一)

        现在是一个大数据的年代,每天全球已电子方式存储数据的数据总量非常大。下面是部分例子:      1,facebook存储这约100亿张照片,越1PB存储容量      2,The Internet Archive(互联网档案馆)存储这约2PB数据,并以每月至少20TB的速度增长      ...

    文章 余二五 2017-11-15 757浏览量

  • 【阿里算法天才盖坤】解读阿里深度学习实践,CTR 预估、MLR 模型、兴趣分布网络等

    作为阿里妈妈精准展示技术部资深总监的盖坤在阿里的花名是靖世,被外界成为“算法天才”。2011 年,刚进阿里的盖坤提出了分片线性模型 MLR,这对当时主要使用简单线性模型做 CTR 预估的业界来说,因为极大地提高了 CTR 预估的准确性而颇具意义。几年来,MLR 模型已经被广泛应用在直通车定向和钻展...

    文章 技术小能手 2018-04-09 4158浏览量

  • 深度学习如何应用在广告、推荐及搜索业务?阿里妈妈实践案例解读

    靖世:非常高兴与大家进行“深度学习演进之路”的交流,阿里妈妈是阿里巴巴集团下的大数据营销平台,是负责阿里巴巴变现的一个事业部。我研究的方向是机器学习、计算机视觉、推荐系统和计算广告。我在清华大学读的本科和博士,专业是计算机视觉,毕业之后加入阿里巴巴广告技术部,后来组成阿里妈妈事业部,这个事业部负责...

    文章 技术小能手 2018-04-16 4682浏览量

  • 《从Lucene到Elasticsearch:全文检索实战》已出版!

    一、前言 决定在CSDN写博客的原因是想把自己解决过的问题、踩过的坑、总结出来的经验记录下来,作为编程之路的“笔记本”,同时也能给遇到同样问题的人提供参考、节省时间,写书的初衷也一样。 二、缘起 说一下写书的前因后果。中国科学院大学雁栖湖校区是很重要的一年,师资团队无可挑剔,每次上课去的...

    文章 姚攀 2017-12-05 1280浏览量

  • 云上个性化推荐——基于PAI和Hologres的个性化推荐最佳实践

    本文内容来自于由达摩院领航举办的3月20日向量检索专场Meetup讲师演讲内容讲师介绍天邑阿里云计算平台高级算法工程师。主要从事基于PAI平台的召回和排序算法研发,及基于云产品的推荐系统解决方案研发,赋能客户个性化推荐解决方案落地。内容简要:一、云上个性化推荐二、向量召回三、最佳实践01 云上个性...

    文章 安妮Annie 2021-04-13 129浏览量

  • 云上个性化推荐:基于PAI和Hologres的个性化推荐最佳实践

    简介:常见的个性化推荐系统包括日志收集、数据加工、召回、排序、离线/在线效果评估等诸多环节,对于中小客户存在技术门槛高、搭建周期长等问题,阿里巴巴计算平台基于PAI、Hologres、MaxCompute、DataWorks等产品帮助客户快速搭建个性化推荐解决方案。本文主要分享,从阿里巴巴计算平台...

    文章 May-Hologres 2021-04-12 244浏览量

  • Elasticsearch学习,请先看这一篇!(Elasticsearch教程01)|MVP讲堂

    作者:阿里云MVP 铭毅 上节内容:死磕 Elasticsearch 方法论:普通程序员高效精进的 10 大狠招!下节链接:Elasticsearch增、删、改、查操作深入详解(Elasticsearch教程02) 题记:Elasticsearch研究有一段时间了,现特将Elasticsearch...

    文章 MVP时间辰悠 2018-12-14 2426浏览量

  • 开发中常见的十种对缓存的错误使用

    简介 缓存那些频繁使用的很耗费资源的对象,就可以通过更加快速地加载使应用程序获得更快的响应。在并发请求时,缓存能够更好地扩展应用程序。但一些难以觉察的错误,可能让应用程序处于高负荷下,更不用说想让缓存有更好的表现了,特别是当你正在使用分布式缓存并且将缓存项存储在不同的缓存服务器或缓存应用程序中时...

    文章 nicenelly 2017-11-22 1091浏览量

  • Elasticsearch学习,请先看这一篇!

    0. 带着问题上路——ES是如何产生的? (1)思考:大规模数据如何检索? 如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(mysql、sybase、oracle、达梦、神通、mongodb、hbase…) 2)如何解决单点故...

    文章 开发者社区 2019-07-01 1521浏览量

  • TensorFlow在工程项目中的应用 公开课视频+文字转录(下) | AI 研习社

    本周四,雷锋网 AI 研习社邀请了跨国 IT 巨头 ThoughtWorks 的资深数据架构师白发川,主讲线上公开课,为大家讲解 TensorFlow 在工程项目中的应用。 讲师 白发川:自我介绍一下,我是 ThoughtWorks 白发川,之前一直从事大数据,后来我们开始做人工智能方向的一些尝试...

    文章 玄学酱 2017-08-02 1715浏览量

  • 万向集团要在区块链上构建智慧城市,这将如何实现?

    智慧城市是一块看起来很美味的蛋糕,许多官方非官方机构进来做蛋糕,但不算很成功。正如上海社科院城市与人口发展研究所副所长屠启宇所言,目前全球智慧城市从概念和模型阶段发展到了规划和建设阶段,仍处于探索期。区块链也是一个处于探索阶段的风口技术,众多人蜂拥而上。而现在的万向集团,似乎想在风口上做蛋糕。 2...

    文章 行者武松 2017-07-03 1148浏览量

  • [转载]聊聊Greenplum的那些事

    原文   http://dbaplus.cn/news-21-341-1.html 聊聊Greenplum的那些事 李巍 2016-04-01 14:15:00 1024   开卷有益——作者的话    有时候真的感叹人生岁月匆匆,特别是当一个IT人沉浸于某个技术领域十来年后,蓦然回首,...

    文章 德哥 2016-07-11 6956浏览量

  • 把ElasticSearch当成是NoSQL数据库

    Elasticsearch 可以被当成一个 "NoSQL"-数据库来使用么? NoSQL 意味着在不同的环境下存在不同的东西, 而erestingly 它并不是真的跟 SQL 有啥关系. 我们开始只会觉得 "可能"而已, 所以细细研究了 Elasticsearch 的各种属性,包括它已经为了成就最...

    文章 微wx笑 2017-08-17 1069浏览量

  • 三角兽首席科学家分享实录:基于对抗学习的生成式对话模型

    本文来自AI新媒体量子位(QbitAI) 对抗学习和对话系统都是近年来的新热点。今年7月,三角兽研究组与哈工大ITNLP实验室合作完成的论文被自然语言领域顶级会议EMNLP录取。 上周三(8月9日)晚,量子位邀请到三角兽首席科学家王宝勋,与大家分享了论文中基于对抗学习的生成对话模型内容。 这...

    文章 行者武松 2018-01-15 830浏览量

  • 用TiKV存储时序数据与InfluxDB对比

    TiDB是目前当红的NewSQL数据库,在提供高性能读写的同时又兼容传统的RDBMS,其底层的存储是TiKV。这里我们看一下如果用TiKV存储时序数据,其底层数据组织形式是怎么样的,与InfluxDB的数据存储模式相比有何优缺点。 时序数据库与传统数据库对比 首先从上层应用的角度对比一下时序数据库...

    文章 灵圣 2019-11-24 2524浏览量

  • 数据库相关岗位面试准备建议

    标签 PostgreSQL , 数据库 , 面试准备 背景 本文同时适合用人方、闯关应聘方。 注意通过面试问题,发掘小伙伴的极限。找准小伙伴层级定位。 类目 至少应该包含如下,每一项应该包含范围,考察目的,评判标准,不同等级的差异化,对应的深度、广度。 外围能力考察 操作系统 比如 为...

    文章 德哥 2018-10-05 2143浏览量

  • 高维向量检索技术在PG中的设计与实践 ——杨文(缁尘)

    目录一、 背景介绍二、 向量检索算法/PG自定义索引三、 PASE设计与实现四、 ASE使用实践  一、背景介绍什么是向量检索(近似最近邻检索/ANN)向量检索是从一堆已知的点中,找出给定P点的最相邻的K个点的过程。这些点可以是:1维点、2维...

    文章 开发者小助手 2021-03-25 333浏览量

  • HBase全网最佳学习资料汇总

    前言 HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是my...

    文章 hbase小能手 2018-11-05 4780浏览量

  • HBase二级索引

    我们会经常谈及二级索引,这是对全表数据进行另外一种方式的组织存储,是针对table级别的。如果要为HBase上的表实现一个强一致性的二级索引,那么就无法逃避分布式事务,而这一直是用户最期待的功能。 而即使只需要保证最终一致性,这个索引也并不好实现,因为你需要额外的表以存储过程数据,需要解决宕机恢复...

    文章 漏船载酒 2017-11-04 3696浏览量

  • HBase全网最佳学习资料汇总

    前言 HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是my...

    文章 封神 2017-08-13 24893浏览量

  • 弃用数据库自增ID,曝光一下我自己用到的解决方法 (转发)

    在平时的项目开发中,我相信有很大一批人都在用这个数据库自增ID,用数据库自增ID有利也有弊。     优点:节省时间,根本不用考虑怎么来标识唯一记录,写程序也简单了,数据库帮我们维护着这一批ID号。     缺点:for example, 在做分布式数据库时,要求数据同步时,这种自增ID就会出现...

    文章 天伟 2011-01-19 547浏览量

  • 数据科学工具包(万余字介绍几百种工具,经典收藏版!)

    本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享,提高数据科学人员素质。 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率...

    文章 小旋风柴进 2017-05-02 2477浏览量

  • 搜索背后的奥秘——浅谈语义主题计算

    摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出...

    文章 jiacai2050 2012-08-17 1167浏览量

  • 人机对话这件事为什么难?| 清华x-lab人工智能研习社

    “目前市面上人机交互的智能硬件,距离真正的自然交互依然有很长的一段路要走。” 在清华x-lab主办的人工智能研习社第五讲,三角兽的创始人、COO马宇驰如此描述当前的人机交互产品。 在同日举办的百度2017世界大会上,李彦宏的观点与马不谋而合:“我们现在看到很多智能音箱,虽然不需要按住,但是需要一个...

    文章 技术小能手 2017-11-20 4412浏览量

  • 阿里内部分享:大数据业务平台两年发展历程

          这篇文章来自一个公司内部的分享,是自己所服务的业务中数据平台的发展历程,已经讲了有几个月了,最近打算挑几个点拿出来用文章的形式写出来。是自己进入公司以来参与过或者接触过的数据型项目的情况。基本包含了业务数据分析的整个流程。这篇文章纯文字描述,没有任何图呵呵。所以看我需要耐心。 1、最早...

    文章 小旋风柴进 2017-04-03 1814浏览量

  • HBase全网最佳学习资料汇总

    大数据 监控 阿里云 hbase HTTPS Apache http 互联网 阿里巴巴 集群 aliyun 物联网 报表html 存储 摘要: HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、百度、腾讯、京东、小米都有数千台的HBase集群,中国电...

    文章 云hbase+spark 2017-09-20 6203浏览量

1 2 3 4 ... 9 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT