• 关于

    检索变元是什么

    的搜索结果
  • 免费的Lucene 原理与代码分析完整版下载

    Lucene是一个基于Java的高效的全文检索库。那么什么是全文检索,为什么需要全文检索?目前人们生活中出现的数据总的来说分为两类:结构化数据和非结构化数据。很容易理解,结构化数据是有固定格式和结构的或者有限长度的数据,比如数据库,元数据等。非结构化数据则是不定长或者没有固定格式的数据,如图片,邮...

    文章 业余草 2017-08-23 1685浏览量

  • 搜索引擎solr和elasticsearch

    版权声明:本文为博主原创文章,转载注明出处http://blog.csdn.net/u013142781 目录(?)[+] 刚开始接触搜索引擎,网上收集了一些资料,在这里整理了一下分享给大家。 一、关于搜索引擎 搜索引擎(Search Engine)是指根据一定的策略、运用特定的计...

    文章 ghost丶桃子 2016-05-26 2539浏览量

  • 1万属性,100亿数据,每秒10万吞吐,架构如何设计?

    一、背景描述及业务介绍 什么是58最核心的数据? 58是一个信息平台,有很多垂直品类:招聘、房产、二手物品、二手车、黄页等等,每个品类又有很多子品类,不管哪个品类,最核心的数据都是“帖子信息”。 画外音:像不像一个大论坛?  各分类帖子的信息有什么特点? 逛过58的朋友很容易了解到,这里的帖子信息...

    文章 云起君 2020-02-05 543浏览量

  • 《大规模元搜索引擎技(1)》一2.3 挑战环境

    本节书摘来自华章出版社《大规模元搜索引擎技(1)》一书中的第2章,第2.3节,作者[美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校於德(Clement T.Yu)伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.3 挑战环境 大多数情况下,元搜索引擎使用...

    文章 华章计算机 2017-05-02 657浏览量

  • 100亿数据1万属性数据架构设计

    一分钟系列之《啥,又要为表增加一列属性?》分享了两种数据库属性扩展思路,被喷得厉害。第二天补充了一篇《这才是真正的表扩展方案》,分享了互联网大数据高并发情况下,数据库属性扩容的成熟工具及思路。 对于version + ext方案,还是有很多朋友质疑“线上不可能这么用”。本篇将讲述一下58同城最核心...

    文章 初商 2019-08-14 826浏览量

  • 【新智元干货】计算机视觉必读:目标跟踪、网络压缩、图像分类、人脸识别等

    网络压缩(network compression) 尽管深度神经网络取得了优异的性能,但巨大的计算和存储开销成为其部署在实际应用中的挑战。有研究表明,神经网络中的参数存在大量的冗余。因此,有许多工作致力于在保证准确率的同时降低网路复杂度。 低秩近似 用低秩矩阵近似原有权重矩阵。例如,可以用SVD得...

    文章 技术小能手 2018-03-28 6165浏览量

  • 《大规模元搜索引擎技》——2.3 挑战环境

    本节书摘来自华章出版社《大规模元搜索引擎技》一书中的第2章,第2.3节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3 挑战环境 大多数情况下,元搜索...

    文章 华章计算机 2017-05-02 934浏览量

  • 精选26个Python实用技巧,想秀技能先Get这份技术列表!

    出品 | AI科技大本营 本文整理了 26 个 Python 有用的技巧,将按照首字母从 A~Z 的顺序分享其中一些内容。 all 或 any 人们经常开玩笑说 Python 是“可执行的伪代码”,但是当你可以这样编写代码时,你就很难反驳了。 1x = [True, True, False] 2...

    文章 初商 2019-09-02 2149浏览量

  • [Python]学习基础篇:列表(List)的浅解

    列表 首先先说明中python中数组下标的使用,在java,c或者c++中,每个数组的下标必须是正数,不能出现负数,如在java,c或者c++中使用a[-1],编辑器会报错,而在python中数组的访问时可以出现负数下标,表示倒数第几个元素。 list列表的定义  Python中列表的定义比较简...

    文章 科技探索者 2017-11-07 923浏览量

  • 日志系统之基于Zookeeper的分布式协同设计

    最近这段时间在设计和实现日志系统,在整个日志系统系统中Zookeeper的作用非常重要——它用于协调各个分布式组件并提供必要的配置信息和元数据。这篇文章主要分享一下Zookeeper的使用场景。这里主要涉及到Zookeeper在日志系统中的使用,但其实它在我们的消息总线和搜索模块中也同样非常重要。...

    文章 nicenelly 2017-11-21 947浏览量

  • 探究 | Elasticsearch不支持事务有什么好的弥补方案吗?

    1、事务的核心概念 如果一个数据库声称支持事务的操作,那么该数据库必须要具备以下ACID四个特性: 原子性(Atomicity) 原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚, 一致性(Consistency) 一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就...

    文章 开发者社区 2019-07-03 285浏览量

  • TableStore发布多元索引功能,打造统一的在线数据平台

    什么是NoSQL “NoSQL”一词最早出现在1998年,距今刚好二十年。站在今天回头看的话,很少有人能想到在关系型数据库成熟发展了三十年,已经在数据存储领域占据了不可动摇的的地位后,NoSQL数据库尽然还可以快速地异军突起,并且以多点开花、多路并进的方式高速发展。“NoSQL”最早的意思是“no...

    文章 少强 2018-09-18 6601浏览量

  • 1对多业务,数据库水平切分架构一次搞定 | 架构师之路

    本文将以“帖子中心”为例,介绍“1对多”类业务,随着数据量的逐步增大,数据库性能显著降低,数据库水平切分相关的架构实践: 如何来实施水平切分 水平切分后常见的问题 典型问题的优化思路及实践 一、什么是1对多关系 所谓的“1对1”,“1对多”,“多对多”,来自数据库设计中的“实体-关系”ER模型,用...

    文章 初商 2019-08-11 292浏览量

  • MySQL数据库优化技巧大全

    MySQL优化三大方向① 优化MySQL所在服务器内核(此优化一般由运维人员完成)。② 对MySQL配置参数进行优化(my.cnf)此优化需要进行压力测试来进行参数调整。③ 对SQL语句以及表优化。MySQL参数优化1:MySQL 默认的最大连接数为 100,可以在 mysql 客户端使用以下命令...

    文章 阿里云小秘 2020-06-30 108浏览量

  • [雪峰磁针石博客]接口测试面试题

    文最新更新体现在pdf文档:接口测试面试题.pdf 什么是API? API是(Application Programming Interface)首字母缩略词,即应用程序编程接口。 API是一组用于构建软件应用程序的规程,协议和工具。API充当软件应用程序之间的接口,并允许两个软件应用程序相互通信...

    文章 python人工智能命理 2018-11-19 1581浏览量

  • 干货 | 知识库全文检索的最佳实践

    1、题记 这是stackoverflow上一篇精彩的问答。 原文不大好理解,我做了梳理+图解;原文是ES早期版本,部分写法已不适用,所有DSL我在6.X上进行了重写和验证;针对原文内容做了扩展。 2、知识库全文检索问题抛出 重新审视一个停滞不前的项目,并寻求建议,对数千个“旧”文档进行现代化改造,...

    文章 开发者社区 2019-07-03 333浏览量

  • 研究了 50 篇论文后,他发现 AI 领域的某些进步其实就是炒作

    云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 人工智能(AI)似乎变得越来越聪明。每一部 iPhone 都比上一部更了解你的脸、声音和习惯,人工智能对隐私的威胁也在不断增加,职位也在不断增加。这种激增反映了更快的芯片、更多的数据和更好的算法。但...

    文章 云栖号资讯小哥 2020-06-11 521浏览量

  • Impala——2.架构

    标签(空格分隔): Impala Impala Server的组件 Impala服务器是分布式,大规模并行处理(MPP)数据库引擎。它由不同的在群集中的特定主机上运行的守护程序进程组成。 Impala守护进程 核心Impala组件是一个守护进程,它通过impalad进程在集群的每个DataNod...

    文章 尊渊 2019-06-03 910浏览量

  • 《数据虚拟化:商务智能系统的数据架构与管理》一 1.7 数据虚拟化的技术优势

    1.7 数据虚拟化的技术优势 在大多数情况下,直接获取一个数据存储区对于数据使用者来说是很容易的。例如,如果访问SQL数据库中的一个表,数据使用者提供用户ID和密码,数据库的名称,以及一些其他的技术详细信息,它就可以立即通过SQL语句访问数据。这同样适用于数据使用者需要访问XML文档或电子表格的情...

    文章 华章计算机 2017-09-08 940浏览量

  • 基于深度学习的智能问答

    作者:周小强 陈清财 曾华军 1引言 纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史。但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应。自此,自动问答系统较以往任何时候都显得离实际应用更近。这一方面归功于机器学...

    文章 kevinliali 2016-08-03 30600浏览量

  • 《HBase企业应用开发实战》—— 1.5 HBase的使用场景和经典案例

    本节书摘来自华章出版社《HBase企业应用开发实战》一 书中的第1章,第1.5节,作者:马延辉 孟鑫 李立松 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 HBase的使用场景和经典案例 了解软件产品的最好方法是如何使用,解决什么问题以及如何适用于大型应用架构。接下来的内容将详...

    文章 华章计算机 2017-07-03 4236浏览量

  • 5分钟了解lucene全文索引

    一、Lucene介绍及应用 Apache Lucene是当下最为流行的开源全文检索工具包,基于JAVA语言编写。 目前基于此工具包开源的搜索引擎,成熟且广为人知的有Solr和Elasticsearch。2010年后Lucene和Solr两个项目由同一个Apache软件基金会的开发团队制作,所以通常...

    文章 宜信技术学院 2019-08-30 1573浏览量

  • 元数据驱动的 SaaS 架构与背后的技术思考

    道冲而用之或不盈,渊兮似万物之宗。 —老子 引言 作为业务系统技术开发同学,面向当下: 首先应该是快速搭建业务通路,让线上业务跑起来,快速试错,解决生存问题; 第二步是在链路畅通、业务基本跑起来的基础上,如何支撑业务跑得更快,就需要解决快速增长问题; 第三步,在完成支撑业务快...

    文章 中间件小哥 2021-01-12 489浏览量

  • 进击的 Flink:网易云音乐实时数仓建设实践

    作者 | 汪磊(网易云音乐 / 数据平台开发专家)整理 | 杨涛(Flink 社区志愿者) 如何基于 Flink 的新 API 升级实时数仓架构? 背景介绍 网易云音乐从 2018 年开始搭建实时计算平台,到目前为止已经发展至如下规模: 机器数量:130+ 单 Kafka 峰值 QPS:400W...

    文章 阿里云实时计算Flink 2020-07-24 1385浏览量

  • Hadoop - 任务调度系统比较

    1.概述   在Hadoop应用,随着业务指标的迭代,而使其日趋复杂化的时候,管理Hadoop的相关应用会变成一件头疼的事情,如:作业的依赖调度,任 务的运行情况的监控,异常问题的排查等,这些问题会是的我们日常的工作变得复杂。那么,在没有条件和精力去开发一套调度系统的情况下,我们去选择一款第三 方...

    文章 smartloli 2016-04-25 3050浏览量

  • Hadoop - 任务调度系统比较

    1.概述   在Hadoop应用,随着业务指标的迭代,而使其日趋复杂化的时候,管理Hadoop的相关应用会变成一件头疼的事情,如:作业的依赖调度,任 务的运行情况的监控,异常问题的排查等,这些问题会是的我们日常的工作变得复杂。那么,在没有条件和精力去开发一套调度系统的情况下,我们去选择一款第三 方...

    文章 smartloli 2016-04-25 2506浏览量

  • Python数据类型中的字典-创建和基本操作

    Python当中字典的创建和基本操作     本章 含有 字典定义 及操作 l  字典定义 l  基本操作 l  常用方法 列表也是常用的数据类型-列表是最灵活的一个,甚至可以当成一个小的数据库,用来存储数据。 用列表存储数据的时候会非常的不方便,所谓的不方便,下面会有例子演示当中,比较一下。 字...

    文章 技术小牛人 2017-11-07 821浏览量

  • java B2B2C 多租户电子商城系统-Spring Cloud Zipkin

    Zipkin是什么 Zipkin分布式跟踪系统;它可以帮助收集时间数据,解决在microservice架构下的延迟问题;它管理这些数据的收集和查找;Zipkin的设计是基于谷歌的Google Dapper论文。 每个应用程序向Zipkin报告定时数据,Zipkin UI呈现了一个依赖图表来展示多少...

    文章 it菲菲 2019-04-12 728浏览量

  • java B2B2C电子商务平台分析之十三-----Spring Cloud Zipkin

    Zipkin是什么Zipkin分布式跟踪系统;它可以帮助收集时间数据,解决在microservice架构下的延迟问题;它管理这些数据的收集和查找;Zipkin的设计是基于谷歌的Google Dapper论文。每个应用程序向Zipkin报告定时数据,Zipkin UI呈现了一个依赖图表来展示多少跟踪...

    文章 壹玖 2018-12-04 1110浏览量

  • java B2B2C电子商务平台分析之十三-----Spring Cloud Zipkin

    Zipkin是什么Zipkin分布式跟踪系统;它可以帮助收集时间数据,解决在microservice架构下的延迟问题;它管理这些数据的收集和查找;Zipkin的设计是基于谷歌的Google Dapper论文。每个应用程序向Zipkin报告定时数据,Zipkin UI呈现了一个依赖图表来展示多少跟踪...

    文章 游客atwagpgqn2agu 2019-11-27 857浏览量

1 2 3 4 ... 10 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板