• 关于

    相似性出问题什么情况

    的搜索结果
  • Recommender Systems协同过滤

      第一部分是学习ID3时候积累的。 一.以前写的基础知识   1.信息:是用来消除不确定性的度量,信息量的大小,由所消除的不确定性的大小来计量(香农)。  2.由于不确定性是由随机性引起的,所以用概率来描述和计量;熵entropy:源于热力学,是分子混乱程度的度量。  3.X(离散型随机变量)的...

    文章 哈沙给 2015-05-14 739浏览量

  • 协同过滤算法介绍

    在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。 1 什么是协同过滤 协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在...

    文章 nieson 2015-12-02 1643浏览量

  • 《MapReduce设计模式》一设计模式与MapReduce

    本节书摘来异步社区《MapReduce设计模式》一书中的第1章,第1.1节,作者: 【美】Donald Miner , Adam Shook 译者: 徐钊 , 赵重庆 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。 第1章 设计模式与MapReduce MapReduce设计...

    文章 异步社区 2017-05-02 1487浏览量

  • Linux性能优化1.2 性能调查概要

    1.2 性能调查概要 本节列出了开始性能调查时的几个重要步骤。由于终极目标是解决问题,因此最好的方法是在你接触性能工具之前就开始研究问题。遵循如下特定步骤是解决问题的有效方法,并且不会浪费宝贵的时间。 1.2.1 找到指标、基线和目标 性能调查的第一步就是确定当前的性能,并明确其应提升的程度。如...

    文章 华章计算机 2017-05-02 1191浏览量

  • 如何进行软件测试需求分析

    如何进行软件测试需求分析   1、项目经理会根据前期调研的情况进行需求整理,召开项目组会议讨论需求整理的内容,如果是大项目的话,请一些有经验的专家来参与讨论。讨论的范围:用户提出的需求哪些是可以通过技术完成,需求当中有哪些情况未调研,比如说非功能性的需求,性能,安全性等。   2、需求文档会经...

    文章 玄学酱 2017-07-10 2447浏览量

  • 无监督聚类问题中,如何决定簇的最优数量?

    本文会谈谈解决该问题的两种流行方法:elbow method(肘子法)和 silhouette method。 在监督学习里,某特定数据集的类(class)的数量,在一开始就是知道的——每个数据实例,都被标记归属于某个类。最坏的情况下,我们还可以盘查类属性( class attribute),计算...

    文章 玄学酱 2017-08-02 839浏览量

  • 神经网络嵌入详解

    深度学习在诸多方面,如图像分割、时序预测和自然语言处理,都优于其他机器学习方法。嵌入(embedding),即用连续向量表示离散变量的方法,在其中起到了不可或缺的作用。像机器翻译中的词嵌入和分类变量中的实体嵌入,都是嵌入的成功应用。 本文将围绕什么是神经网络嵌入、为什么要使用神经网络嵌入以及神经网...

    文章 【方向】 2018-10-09 1195浏览量

  • VDI监控工具对于用户体验至关重要

    性能问题无疑会严重影响VDI用户的体验,幸运的是,VDI监控工具能够帮助IT管理员查明并解决这些问题。 对于成功的VDI部署来说,其应该能够为终端用户提供比物理桌面更好的使用体验。而确保用户满意的最佳方式就是使用终端监控工具,检验VDI环境所提供的性能表现是否能够达到预期。 VDI监控工具和服务器...

    文章 泡泡浅眠 2017-07-10 1045浏览量

  • 带你读《数据挖掘导论(原书第2版)》之二:数据

    点击查看第一章点击查看第三章 第2章 数  据 本章讨论一些与数据相关的问题,它们对于数据挖掘的成败至关重要。数据类型 数据集的不同表现在多方面。例如,用来描述数据对象的属性可以具有不同的类型——定量的或定性的,并且数据集通常具有特定的性质,例如,某些数据集包含时间序列或彼此之间具有明显联系的对象...

    文章 温柔的养猫人 2019-11-18 2932浏览量

  • 阿里和浙大的“AI 训练师助手”是这样炼成的

    --------点击屏幕右侧或者屏幕底部“+订阅”,关注我,随时分享机器智能最新行业动态及技术干货---------- 不久前,人力资源社会保障部发布了一种炙手可热的新职业:AI 训练师。没想到,浙江大学与阿里安全的人工智能训练师马上创造出一个 “AI 训练师助手”,高效打造 AI 深度模型,...

    文章 机器智能技术 2020-04-07 269浏览量

  • 基于品类关系,虚拟类目如何建设?

    小叽导读:类目-属性项-属性值体系(简称CPV)是淘宝建设中非常重要的基石,在商品的发布、管理,以及搜索场景下都大量应用。比如每个商品都有自己的类目、以及属性,而且需要发布在适合自己的类目下,才能够方便管理和搜索;在用户搜索的过程中,对Query的类目预测也是相关性中非常重要的一环。 作者:玉昆、...

    文章 技术小能手 2019-02-20 2039浏览量

  • 深层学习:心智如何超越经验3.1 创造性问题

    摘要 Deep Learning: How the Mind Overrides Experience 新颖事物产生 事实上,显而易见的是,无论是发明还是发现,都来源于观点的组合。 ——Jacques Hadamard[1] 西方文化认为有三个专业领域格外注重原创性的培养。艺术家旨在创作原创作品,...

    文章 华章计算机 2017-05-02 1137浏览量

  • 专访 | 蚂蚁金服 MISA:比用户更懂自己的自然语言客服系统

    小蚂蚁说: 当手机取代了钱包,全民消费开启移动支付和在线生活时,中国的商业生态和消费习惯已经被深刻改变。 人们开始越来越习惯不带钱包的生活,此时的支付宝甚至已经比现金更常用了。 与支付宝这个产品端一同忙碌起来的还有蚂蚁金服的服务端,95188 服务热线就是其中之一。 然而当我们谈起客服...

    文章 兔子酱 2018-05-11 2696浏览量

  • 若无云,岂有风——词语语义相似度计算简介

    诸多事物都要受到其周边事物的影响,进而改变自身的形态,甚至确立自己的存在——云动,方知风的存在。反映在人的眼中,则是云赋予了风的含义:若无云,岂有风? 0. 动机 武林高手经常从山川之间顿悟,并由山川之形变化出上乘武艺。风云之间的飘渺互动,实则也为实打实的科学、工程实践提供了指引。风是客观存在的,...

    文章 技术小美 2017-11-23 1273浏览量

  • 从上千篇论文脱颖而出,支付宝论文凭什么获得WWW2020评委认可?

    2020年4月20-24日,国际顶级学术会议WWW2020(The Web Conference 2020)在中国台湾举办。创办于1994年的WWW会议,是CCF-A类会议,每年有大批的学者、研究人员、技术专家、政策制定者等参与。 据悉,受COVID-19疫情影响,WWW2020将在线上举行。此次...

    文章 缪克卢汉 2020-04-15 529浏览量

  • 千人千面智能淘宝店铺背后的算法研究登陆人工智能顶级会议AAAI 2017

    电商时代,消费者对推荐系统已经不再陌生。“蓦然回首”,你发现喜欢的商品就在首页显眼处。 如今,不仅仅是电商网站首页会给你贴心推荐。你逛进一家淘宝商家的店铺,也很有可能享受到推荐算法的服务。 这是阿里商家事业部推出的智能店铺“千人千面”模块。 阿里商家事业部相关负责人介绍,单纯通过算法做出的商品推...

    文章 技术小能手 2017-06-22 6880浏览量

  • 大数据挖掘技术之DM经典模型(上)

    实际上,所有的数据挖掘技术都是以概率论和统计学为基础的。 下面我们将探讨如何用模型来表示简单的、描述性的统计数据。如果我们可以描述所要找的事物,那么想要找到它就会变得很容易。这就是相似度模型的来历——某事物与所要寻找的事物越相似,其得分就越高。 下面就是查询模型,该模型正在直销行业很受欢迎,并广泛...

    文章 知与谁同 2017-08-01 1132浏览量

  • 还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码)

    假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音? 这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据...

    文章 技术小能手 2018-01-22 5561浏览量

  • 如何将机器学习应用于预测性维护?

    云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 通过使用机器学习,结合从工业物联网(IIOT)设备收集的数据,可以改进流程、降低成本并提高效率。 预测性维护应用数据和模型来预测设备或资产何时发生故障。这种方法可以通过预测故障,来帮助公司主动解决...

    文章 云栖号资讯小哥 2020-06-10 284浏览量

  • 深度RNN解决语义搜索难题

    雷锋网(公众号:雷锋网)按:本文作者张俊林,主要介绍了3种基于深度RNN的语义搜索模式。 本文讨论如何用深度学习系统来构造语义搜索引擎的问题。这里所谓的语义搜索,是指的能做用户查询和搜索网页之间的语义级别匹配,比如说,用户输入“Iphone”,虽然某篇文章讲到了“苹果公司正在试图做新型的手机”,但...

    文章 青衫无名 2017-08-01 1020浏览量

  • 一眼看尽上亿日志-日志服务(SLS)智能聚类(LogReduce)

    业务的高速发展,对系统稳定性提出了更高的要求,各个系统每天产生大量的日志,你是否曾担心过: 系统有潜在异常,但被淹没在海量日志中 机器被入侵,有异常登录,却后知后觉 新版本上线,系统行为有变化,却无法感知 这些问题,归根到底,是信息太多、太杂,不能良好归类,同时记录信息的日志,往往还都是无Sc...

    文章 suntingtao 2018-12-13 5518浏览量

  • 《短文本数据理解(1)》一2.3 属性得分推导

    本节书摘来自华章出版社《短文本数据理解(1)》一书中的第2章,第2.3节,作者王仲远,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.3 属性得分推导 本节首先直观地讨论属性的打分原则,进而介绍如何处理CB和IB列表以完成对属性的打分,最后讨论如何聚合不同数据源的属性得分。 2.3.1 ...

    文章 华章计算机 2017-05-02 1131浏览量

  • 《数据挖掘:实用案例分析》——3.2 数据挖掘建模过程

    3.2 数据挖掘建模过程   广州TipDM团队在多年的数据挖掘项目实施过程中,积累了一套行之有效的数据挖掘方法论,数据挖掘建模过程如图3-2所示。 3.2.1 定义挖掘目标   针对具体的数据挖掘应用需求,首先要非常清楚:本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此我们必须分析应...

    文章 华章计算机 2017-08-01 3792浏览量

  • 揭开Faiss的面纱 探究Facebook相似性搜索工具的原理

    Facebook 开源了 AI 相似性搜索工具 Faiss。而在一个月之后的今天,Facebook 发布了对 Faiss 的官方原理介绍。 它是一个能使开发者快速搜索相似多媒体文件的算法库。而该领域一直是传统的搜索引擎的短板。借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(ne...

    文章 玄学酱 2017-08-02 3349浏览量

  • 《程序员度量:改善软件团队的分析学》一生产力

    准确性 准确性显然是一个迫切希望的程序员技能。准确性是质量的关键因素,直接反映在完成的设计、编码和测试中。准确性的度量是一个重要的质量指标,即便它不是唯一的指标。因为没有bug、满足所有需求但是没有人喜欢的软件的准确性也不错。为了对质量有更全面的了解,还需要看用户的响应。关于这个主题,我们将在后面...

    文章 华章计算机 2017-08-01 928浏览量

  • ACL2016最佳论文:CNN/日常邮件阅读理解任务的彻底检查

    CNN/日常邮件阅读理解任务的彻底检查 联合编译:章敏,陈圳 摘要 NLP尚未解决的核心目标是,确保电脑理解文件回答理解问题。而通过机器学习系统,解决该问题的一大阻碍是:人类-注释数据的可用性有限。Hermann等人通过生成一个超过百万的实例(将CNN和日常邮件消息与他们自己总结的重点进行配对)来...

    文章 青衫无名 2017-08-01 796浏览量

  • 拓扑数据分析与机器学习的相互促进

    摘要:很多人认为拓扑数据分析是机器学习的一种形式,而这两者之间的区别在于你对机器学习的理解与认知,而这篇文章就为你解析拓扑数据分析的一切问题。 拓扑数据分析(TDA)和机器学习(ML)的区别与联系让不熟悉TDA的人扑朔迷离,本文通过两个定义,解释了TDA和ML的不同,以及TDA和ML如何相互促进...

    文章 小旋风柴进 2017-05-02 1409浏览量

  • 《深度学习:Java语言实现》一一1.2人与机器的区分因素

    1.2人与机器的区分因素前文介绍中我们已经探讨了人工智能领域的三大问题,分别是:框架问题、符号关联问题以及特征工程问题。这些问题都跟人没什么关系。那么,为什么机器无法处理这些问题呢?我们再一起回顾下这些问题。如果你仔细思考,就会发现所有这三个问题最后都能归结到同一个症结: 框架问题指的是机器在处...

    文章 华章计算机 2017-08-02 955浏览量

  • 你与其他程序员可能常犯的 6 个错误

    我担任 CTO 已经有一段时间了,我觉得这是一个非常好的锻炼机会,因为我不仅可以编写代码,还要带领团队,管理项目,设计架构,组织工作,审查代码,调查不同的问题,研究各种解决方案,了解许多技术以及联系客户等等。 通过这么广泛的任务,我学到了很多不同的技能,并有很多想法想跟大家分享一下。也许你的观点...

    文章 行者武松 2017-08-01 861浏览量

  • 《异构信息网络挖掘: 原理和方法》—— 1.2 为什么异构网络挖掘是一项新的挑战

    本节书摘来自华章出版社《异构信息网络挖掘: 原理和方法法》一 书中的第1章,第1.2节,作者( 美)孙艺洲(Yizhou Sun),(美)韩家炜(Jiawei Han),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 为什么异构网络挖掘是一项新的挑战     已设计出许多方法用于分...

    文章 华章计算机 2017-05-02 2294浏览量

1 2 3 4 ... 82 >

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询