• 关于

    相似性度量问题怎么解决

    的搜索结果
  • M2GRL:一种用于全网规模推荐系统的多任务多视角图表示...

    我们接着分析目前公司已有技术是否能解决发现召回的问题。一个可行的方案是先做item2item召回,然后根据用户的行为序列过滤掉非发现商品。但是这个方法无法用模型优化,相对简单粗暴,需要对问题进一步思考。...

    文章 被纵养的懒猫 2020-07-27 1451浏览量

  • 《大数据管理概论》一2.3 大数据融合的方法论

    模式对齐解决两个模式元素之间的一致性问题,主要是利用属性名称、类型和值的相似性,以及属性之间的邻接关系寻找源模式与中介模式的对应关系,分为中介模式、属性匹配和模式映射三步完成[17]。目前采用演化模型、...

    文章 华章计算机 2017-05-02 4336浏览量

  • 《程序员度量:改善软件团队的分析学》一关于软件采用...

    它和解决所涉及的问题以及可能需要解决的潜在bug的复杂无关。尝试为每个能够反映程序员工作的问题跟踪其产品领域,除了那些显然无关的问题。例如,如果一个客户因为一个账单问题打电话过来,那么可能和软件开发...

    文章 华章计算机 2017-08-01 989浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 《基于模型的软件开发》——2.1 基本理念

    OOA为问题的功能需求提供了一个独立于特定计算环境的完整解决方案。在OO范式中,OOA呈现用户视图的解决方案,因为问题域抽象所表达的内容是根据用户域结构产生的。OOA基于用户域表达,因此它只能解决功能需求。...

    文章 华章计算机 2017-07-03 1007浏览量

  • 今日头条成功的核心技术秘诀是什么?...

    这篇文章重点解决推荐精准和新资讯的冷启动问题,文章想法也很朴素自然,主要是基于贝叶斯理论进行建模。他们假设用户兴趣有两个方面:个人不断变化的兴趣以及当前新闻热点。在具体建模之前,作者先基于历史数据...

    文章 玄学酱 2017-08-02 1329浏览量

  • 深度RNN解决语义搜索难题

    2.文档和查询的相似性度量函数如何取?直接用Cosine计算就行。这样,就能够构造出非常简单可行的语义搜索系统了。由于采用的是Word Embedding表示,所以它肯定可以支持语义搜索,因为即使文档里面没有出现过查询词,...

    文章 青衫无名 2017-08-01 1069浏览量

  • 深度解读:GAN模型及其在2016年度的进展

    换句话说,相当于在数据量无限的条件下,通过拟合G(z)得到的分布与通过拟合x得到的分布尽量一致,这一点不同于要求各个G(z)本身和各个真实数据x本身相同,这样才能保证G产生出的数据既与真实数据有一定相似性,同时...

    文章 云栖大讲堂 2017-08-01 1573浏览量

  • Facebook是怎么做到每秒索引数百万条记录的?

    Cubrick是由Facebook开发的新型分布式多维内存数据库管理系统,其目的在于解决大量数据资源并行运行所存在的问题。为达到交互式分析高度动态数据集这一目的,Cubrick运用一种用于管理柱形内存数据的新策略,这种策略...

    文章 晚来风急 2017-07-03 907浏览量

  • Facebook是怎么做到每秒索引数百万条记录的?

    Cubrick是由Facebook开发的新型分布式多维内存数据库管理系统,其目的在于解决大量数据资源并行运行所存在的问题。为达到交互式分析高度动态数据集这一目的,Cubrick运用一种用于管理柱形内存数据的新策略,这种策略...

    文章 青衫无名 2017-08-01 1037浏览量

  • QA seven's blog

    代码克隆工具可用于在整个 Visual Studio 解决方案内搜索 Visual C#和 Visual Basic 项目中重复或高度相似的代码。可以经常重构代码以消除重复代码,从而创建更易于维护的解决方案。PreEmptive Analytics for Team ...

    文章 沉默术士 2017-07-03 1157浏览量

  • 深层学习:心智如何超越经验3.1 创造性问题

    该产品与其原始产品有多相似问题是有别于产品是否是通过创造行为产生的问题的。2.个体 关于创造的研究和常识都强调个体间创造的差异。有些人比其他人创造更多,就自然被归为所谓具有高水平的“创造能力”的...

    文章 华章计算机 2017-05-02 1198浏览量

  • 论文笔记之:Deep Metric Learning via Lifted ...

    引言部分开头讲了距离相似性度量的重要性,并且应用广泛。这里提到了三元组损失函数(triplet loss),就是讲在训练的过程当中,尽可能的拉近两个相同物体之间的距离,而拉远不同物体之间的距离;这种做法会比普通的...

    文章 wangxiaocvpr 2016-09-29 1674浏览量

  • 连载7:阿里巴巴大数据实践:OneData模型实施介绍

    详细模型:详细的维度建模过程是为高层模型填补缺失的信息,解决设计问题,并不断测试模型能否满足业务需求,确保模型的完备。确定每个维表的属性和每个事实表的度量,并确定信息来源的位置、定义,确定属性和度量...

    文章 数据中台君 2020-09-10 2179浏览量

  • 少样本学习(Few-shot Learning)最新进展

    在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是Few-shot learning 要解决问题。Few-shot learning是meta learning在...

    文章 李永彬/水德 2020-11-21 837浏览量

  • 《数据结构与算法:Python语言描述》一1.3算法和算法...

    本节书摘来自华章出版社《数据结构与算法:Python语言描述》一书中的第1章,第1.3节,作者 裘宗燕,更多章节...对算法的一般研究不仅希望比较解决同一个问题的不同算法,还希望对解决不同问题的算法之间的关系有所...

    文章 华章计算机 2017-05-02 2762浏览量

  • 何勉:第一原理和精益敏捷的规模化实施

    对这个团队来说它并没有用清晰的过程展示前后端怎么协作的,BUG怎么关联的,怎么解决的,价值是怎么提出并交付给用户的。所以这个看板对团队能起到的作用就非常有限了。这个团队当时29个人,还有6个产品经理。我们...

    文章 云效平台 2018-01-22 4844浏览量

  • 还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附...

    步骤1和步骤2正在做的是计算3D空间中的点的相似性的概率,并计算相应的2D空间中的点的相似性的概率。逻辑上,条件概率和必须相等,以便把具有相似性的不同维空间中的数据点进行完美表示。即,和之间的差必须为零,...

    文章 技术小能手 2018-01-22 5674浏览量

  • 如何利用云原生技术构建现代化应用

    现代化应用中包含弹性、可观测度量、无状态和安全等典型特征,在整体的一个计算结构上我们可以看到,现代化应用跟云原生应用有非常多相似之处。它们之间的区别在于,现代化的应用不一定要跑在云上。​云原生应用...

    文章 阿里巴巴云原生小助手 2021-07-14 2484浏览量

  • 搜索背后的奥秘——浅谈语义主题计算

    事实上,这种文字语句之间的相关性、相似性问题,在搜索引擎算法中经常遇到。例如,一个用户输入了一个query,我们要从海量的网页库中找出和它最相关的结果。这里就涉及到如何衡量query和网页之间相似度的问题。对于...

    文章 jiacai2050 2012-08-17 1189浏览量

  • 搜索背后的奥秘——浅谈语义主题计算

    事实上,这种文字语句之间的相关性、相似性问题,在搜索引擎算法中经常遇到。例如,一个用户输入了一个query,我们要从海量的网页库中找出和它最相关的结果。这里就涉及到如何衡量query和网页之间相似度的问题。对于...

    文章 技术小美 2017-11-14 993浏览量

  • 开源大数据周刊-第79期

    相关排序问题,核心是如何定义相关,这就引出了种种的相似度量算法。当用户搜索并点击了一个词条时,把除此之外的最相关的东西呈现在用户面前,就完成了一次最简单的推荐。这个过程说简单也简单,说复杂也复杂...

    文章 开源大数据EMR 2018-01-19 2037浏览量

  • DC学院学习笔记(二十):用特征选择方法优化模型

    解决问题:假设我们已经确定了要使用哪个算法后,我们怎么知道哪个X的子集合作为特征训练模型效果最好。解决方案: 迭代特征选择python实现: import pandas import numpy as np from sklearn import linear_model...

    文章 kissjz 2018-02-19 1542浏览量

  • 面对数据缺失,如何选择合适的机器学习模型?

    即对需要替换的数据先和其他数据做相似度测量(proximity measurement)也就是下面公式中的Weight(W),在补全缺失点是相似的点的数据会有更好的权重W。以数值型变量为例: 注:公式仅做参考,未仔细检查。Breiman说明...

    文章 行者武松 2018-01-08 2705浏览量

  • 三角兽首席科学家分享实录:基于对抗学习的生成式对话...

    最关键的是两个问题怎么去考量两个短文本语义上的相似性,和怎么考量两个短文本的语义相关性或关联。相似性和相关性在短文本里面的区分是很明显的,不建议用相似性的模型做相关的排序,反之亦然。整体技术路线可以...

    文章 行者武松 2018-01-15 862浏览量

  • 访谈:关于持续敏捷交付与服务矩阵

    这会让你的开发更有可靠和可扩展,因为团队或者功能的问题阻碍不了其他的人。InfoQ:能分享下你是如何看待新的持续敏捷的吗?比如和频繁发布或者持续交付有什么不同?Andy:持续交付是持续敏捷的最重要的基石。...

    文章 六翁 2016-04-11 1602浏览量

  • 论文|2017KDD西行记

    其中最佳应用论文奖HinDroid解决问题非常有趣,利用android app的api异构信息网络,并直接提取meta-path作为feature。此文的精度报告会在本文的第三部分呈现。关于KDD Cup今年KDD Cup由阿里巴巴天池的小伙伴承办,...

    文章 安和林 2017-12-01 3017浏览量

  • 2020年,这个算法团队都干了啥?

    为了解决很多商家缺乏运营能力、表达能力弱、重要属性不填或者滥填、不知道该怎么填写合理的商品标题等问题,算法建立标题属性自动生成工具,其中提出了两大创新点:finetuning预训练文本生成模型BART,构建了文本...

    文章 开发者小助手_LS 2021-02-25 1560浏览量

  • 主动学习入门篇:如何能够显著地减少标注代价

    2)差异性度量或代表性度量。样例的不确定性一般可通过计算其信息熵获得,样例的代表性通常可根据其是否在聚类中心判断,而样例的差异性则可通过计算余弦相似度(基于采样策略的主动学习算法研究进展,2012)或用...

    文章 淘系技术 2020-09-24 2472浏览量

  • 一文带你入门图论和网络分析

    可能存在对“重要”的不同理解,因此存在许多中心性度量标准。中心性标准本身就可以分成好多类。有一些标准是以沿着边的流动为特征,还有一些标准以步行结构(Walk Structure)为特征。一些最常用的标准是: 度中心...

    文章 技术小能手 2018-08-07 8755浏览量

  • 7个你可能不认识的CSS单位

    说不定将来你遇到的某个特殊的问题就需要使用这些复杂的单位来解决。花点时间去阅读新的技术规范,注册订阅一些不错的网站或者资源,类似 cssweekly这样的。当然不要忘记现在就去注册像TUTS+这样的网站来获取每周的...

    文章 水灵儿 2017-11-05 878浏览量

1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化