• 阿里云 Elasticsearch 向量检索,轻松玩转人脸识别、...

    对 Elasticsearch 熟悉的同学会知道,X-pack 在 7.x 推出了 dense-vector 的向量检索字段,但对于前两个问题依旧没有解决,在我们实际测试中发现,dense-vector 这个字段,或者说向量检索,是基于线性暴力计算来实现...
    文章 2020-03-05 4891浏览量
  • 数据太大爆内存怎么办...七条解决思路|机器学习开发手册

    在内部,数据存在硬盘中,能渐进地 in batch 批量加载,并使用标准检索语言 SQL 检索。像 MySQL、Postgres 这样的开源数据库工具,支持绝大多数的(全部?编程语言。许多机器学习工具,都能直接与关系数据库连通...
    文章 2017-08-02 2068浏览量
  • [Git]写文章 史上最全文献检索、阅读及管理攻略

    举例来说,我们可以看文献开头几句话,看作者到底要研究什么样的问题、提出了什么问题解决了什么问题、这个问题重要还是不重要,是不是重复了别人的发现?你只要看他开头引得几篇文献,你立刻就能知道。因为如果这...
    文章 2017-06-22 1425浏览量
  • 在地理文本处理技术上,高德有哪些技巧?

    地图App的功能可以简单概括为定位、搜索、导航三部分,分别解决在哪里,去哪里,和怎么去的问题。高德地图的搜索场景下,输入的是:地理相关的检索query,用户位置,App图面等信息,输出的是,用户想要的POI。如何...
    文章 2020-02-28 636浏览量
  • 分布锁的几种实现方式~

    目前几乎很多大型网站及应用都是分布部署的,分布场景中的数据一致性问题一直是一个比较重要的话题。分布的CAP理论告诉我们“任何一个分布系统都无法同时满足一致性(Consistency)、可用性(Availability)...
    文章 2018-04-13 2509浏览量
  • 基于深度学习的智能问答

    此外,按照答案的生成反馈机制划分,问答系统可以分为基于检索式的问答系统和基于生成式的问答系统。本文主要阐述基于检索式的问答系统的处理框架和相关研究。2.2 问答系统的处理框架 不同类型的问答系统对于数据...
    文章 2016-08-03 31123浏览量
  • 弃用数据库自增ID,曝光一下我自己用到的解决方法...

    同时在数据库做移植时,也会出现各种问题,总之,对此自增ID有依赖的情况,都有可能出现问题。我绝对相信园子里有很一部分人都被这个“好用的东西”曾经害惨过!我平时在开发项目的时候,一般都没有用到数据库的自增...
    文章 2011-01-19 591浏览量
  • 地理文本处理技术在高德的演进(下)

    由于线上所有的搜索query都会经过路径规划模块,若是让模型去处理所有的query,那么模型不仅要解决意图识别问题(召回类问题),又要解决槽位提取问题(准确类问题),对于模型来说是很难同时将这两个任务学好的。...
    文章 2019-12-02 786浏览量
  • 想买奶茶,高德如何让我更快喝到?

    先看下怎么解决样本构造难题,我们解决方案是: 考量用户在出行场景的行为session,不光看在suggest的某次点击行为,更重要的是,考察用户在出行场景下的行为序列。比如suggest给出搜索建议后,继续搜索的是什么词,...
    文章 2019-12-29 625浏览量
  • 机器学习在高德搜索建议中的应用优化实践

    先看下怎么解决样本构造难题,我们解决方案是: 考量用户在出行场景的行为session,不光看在suggest的某次点击行为,更重要的是,考察用户在出行场景下的行为序列。比如suggest给出搜索建议后,继续搜索的是什么词,...
    文章 2019-07-09 12820浏览量
  • 《大型网站系统与Java中间件》读书笔记(上)

    数据库问题解决之后,应用也面临着挑战(应用的功能会越做越多,应用也随之越做越大),为了不让应用持续变大,这就需要把应用拆开,从一个应用变为两个/多个应用。不同功能/模块之间的调用不再单纯通过本机调用,...
    文章 2019-06-10 4904浏览量
  • 地理文本处理技术在高德的演进(上)

    地图App的功能可以简单概括为定位,搜索,导航三部分,分别解决在哪里,去哪里,和怎么去的问题。高德地图的搜索场景下,输入的是,地理相关的检索query,用户位置,App图面等信息,输出的是,用户想要的POI。如何...
    文章 2019-11-26 1982浏览量
  • 三角兽首席科学家分享实录:基于对抗学习的生成对话...

    对于用两种不同的技术路线构成对话系统,我在之前的报告里有强调:这就是作为生成式聊天和检索式聊天在技术路线上的区别:一个是偏向功能实现,另一个偏向现在热点的深度学习模型,这是一个偏研究的角度。...
    文章 2018-01-15 931浏览量
  • 正则表达-基础知识Review

    看了量词的介绍,也许爱思考的同学会想到关于匹配原则的一些问题,比如{3,5} 这个量词,要是在句子中出现了十次,那么他是每次匹配三个还是五个,反正3,4,5都满足3~5的条件。量词在默认下是尽可能多的匹配的,也...
    文章 2018-10-07 696浏览量
  • HBase二级索引

    但是对于hbase这种分布的数据库来说,最大的问题解决索引表和数据表的本地性问题,hbase很容易就因为负载均衡,表split等原因把索引表和数据表的数据分布到不同的region server上,比如下图中,数据表和索引表就出现...
    文章 2017-11-04 3929浏览量
  • 聊聊图数据库和图数据库的小知识

    Nebula 怎么解决的呀?恒子:现在都万兆网卡了,一般机房内很难把带宽打满的,通常 IO 会先是瓶颈。波娃子:如果是地理分布的图数据库,带宽是要考虑的性能限制因素。Sherman:是的,现在比较流行的做法是两地三...
    文章 2019-08-23 2218浏览量
  • 分布实时数据处理实战:从选型、应用到优化

    尽量少地将数据分片取出到不同的应用服务器上,通过Hurricane这种实时分布处理系统来完成统计工作,就能很好的解决这类问题->Hurricane实时处理系统完全开源,不依赖任何第三方库,易于维护和2次开发,相较其他...
    文章 2017-05-16 2982浏览量
  • 搞懂分布技术24:基于Flume+Kafka+Elasticsearch+...

    这样集中管理后,需要考虑解决实时查看日志类似tail-f命令,日志统计或检索,类似grep、awk、wc等Linux命令,并对更高要求的多机器日志全文检索、排序和统计等问题。目前业内比较流行开源实时日志分析ELK三件套为...
    文章 2018-07-05 2556浏览量
  • java session 详解

    cookie机制的基本原理就如上面的例子相同简单,不过更有几个问题需要解决:“会员卡”怎么分发;“会员卡”的内容;及客户怎么使用“会员卡”。正统的cookie分发是通过扩展HTTP协议来实现的,服务器通过在HTTP的响应...
    文章 2016-04-28 1234浏览量
  • 阿里研究员华先胜:图像搜索的前世今生

    但是图像的表征问题也就是怎么样有效描述这个图像的问题还没有很好地解决。只有描述得好才能够比较两幅图像——基于内容的图像搜索问题实际上就是两个图像比较的问题。当然一个真正的搜索系统其实比这个要复杂得多但...
    文章 2016-05-18 16284浏览量
  • ElasticSearch架构反向思路

    分布系统,只要涉及到数据更新,必然存在数据不一致问题怎么解决。由于索引本身原因,一旦出现Sharding,就很难做联合的查询,这个应该不能实现的,至少说不可能很简单得实现。有一个网络层或者说对外服务接口层...
    文章 2018-07-23 8795浏览量
  • 安防巨头大华半年股价翻倍的背后,AI起到了哪些作用

    尽管如今出现了许许多多深度学习的变种,去尝试解决小数据的智能化问题,但是一旦有真实的大数据支撑,算法效果都会更加优秀和稳定。所以,以目前的技术发展情况来看,AI还都尽可能地聚焦在已有大量数据的行业或者...
    文章 2017-08-01 868浏览量
  • 基于Tablestore的共享汽车管理平台

    在这个场景中,主要包含了三个数据存储需求:关系型数据、大规模时序数据以及大规模数据检索,在传统解决方案中,使用了三种不同的服务来满足业务需求,但Tablestore作为一款阿里自研的分布NoSQL服务,提供多元...
    文章 2019-05-21 3138浏览量
  • 如何让聊天机器人懂情感?这是一篇来自清华的论文

    与之前基于信息检索的对话系统不同,基于深度学习的生成对话系统可以从大规模的语料中学习到潜在的回复模式,从而可以生成语料中从未出现过的回复语句,在适用性与扩展性上都比基于信息检索的对话系统有了极大的...
    文章 2018-01-08 1213浏览量
  • 深入搜索引擎原理

    这既能解决全文检索问题,又能解决了SQL查询速度慢的问题。那么,淘宝是如何在1毫秒从上亿个商品找到上千种秋裤的呢,谷歌如何在1毫秒从万亿个网页中找寻到与你关键字匹配的几十万个网页,如此大的数据量是怎么...
    文章 2019-05-14 6280浏览量
  • 关于大型网站技术演进的思考(七)-存储的瓶颈(7)

    我想有些朋友看到这个问题肯定会说出自己平时开发中碰到了一个跟数据库有关的什么什么问题,然后如何解决的等等,这样的答案没问题,但是却没有代表性,如果出现了一个新的存储瓶颈问题,你在那个场景的处理经验可以...
    文章 2017-11-08 802浏览量
  • 分页与分库那些事儿(线上交流纪要)

    夸库事务,分布事务,在吞吐量是主要矛盾的互联网场景,目前没有能够很好解决的方案,尽量避免。问:采用hash取模方式的表扩容策略及采用一致性hash分表的表扩容策略如何实现?答:数据库水平切分的方式,常用的有...
    文章 2019-08-12 712浏览量
  • PaperWeekly 第35期|如何让聊天机器人懂情感

    与之前基于信息检索的对话系统不同,基于深度学习的生成对话系统可以从大规模的语料中学习到潜在的回复模式,从而可以生成语料中从未出现过的回复语句,在适用性与扩展性上都比基于信息检索的对话系统有了极大的...
    文章 2017-08-01 1468浏览量
  • 搜狗王小川说输入法的未来是自动问答,...发展得怎么样了...

    WSDM是信息检索和数据挖掘的大会,在今年年初WSDM上,微软亚洲研究院自然语言处理组公开过一个百度知道的社区问答数据集,此数据集已经过人工标注,标注返回的问题是否满足用户的查询,数据集可供下载,均为百度知道...
    文章 2017-08-01 1363浏览量
  • 怎样实现登录?Cookie or JWT

    但是当部署多个后台服务时,我们的session就会出现问题,看看下面的图, 假如用户登录的请求,分配到了后台服务1,后台服务1的session存了用户的登录状态和用户id。用户在点击其他功能时,请求分配到了后台服务2,...
    文章 2020-06-02 866浏览量
1 2 3 4 ... 12 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化