• 关于

    聚类算法问题怎么解决

    的搜索结果
  • 利用模拟退火提高Kmeans的聚类精度

    Kmeans算法是一种非监督聚类算法,由于原理简单而在业界被广泛使用,一般在实践中遇到聚类问题往往会优先使用Kmeans尝试一把看看结果。本人在工作中对Kmeans有过多次实践,进行过用户行为聚类(MapReduce版本)、...

    文章 力君 2016-04-01 1630浏览量

  • 无推荐、不APP

    因为推荐要解决的一个很重要问题就是排序,而且在新品过来的时候,我们没有对于它的先验知识,在这种情况下怎么选择推荐结果。最流行的UCB bandit算法是这么解决的: 其中加号前面是这个item到目前的收益均值,后面...

    文章 黯灭_邓彬 2016-08-25 10907浏览量

  • 从内容/用户画像到如何做算法研发

    一个场景要解决的一个问题往往不是这么直观明显的,就如同我们上面提到的构建内容画像的问题,就得到了两个子问题,每个子问题又需要划分成好多个步骤,每个步骤可能对应一个或者多个算法问题。但是就算这样,也还是...

    文章 祝威廉 2016-09-07 1473浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 小白学数据分析----->在clementine基于两步聚类算法的次日留存分析探索

    准则有BIC和AIC,确定自动聚类算法如何确定聚类数。之后点击执行,但是此时我们发现了如下的错误: 原来我们对于过滤后的数据,没有进行数据类型的重新指定,为此此处我们要重新指定数据的类型,字段选项卡,双击...

    文章 老白爱分析 2012-06-20 856浏览量

  • 机器学习算法一览

    包括关联规则和聚类算法在内的一系列机器学习算法都属于这个范畴。半监督学习 这类问题给出的训练数据,有一部分有标签,有一部分没有标签。我们想学习出数据组织结构的同时,也能做相应的预测。此类问题相对应的...

    文章 小旋风柴进 2017-05-02 1188浏览量

  • 数据挖掘其实就是为了干这四种事?

    一般来说,数据挖掘主要侧重解决四类问题:分类、聚类、关联、预测。数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归纳,数据挖掘的应用就是把这几类问题演绎的一个过程。一、分类问题 分类问题...

    文章 知与谁同 2017-08-01 944浏览量

  • 数据挖掘主要解决的四类问题

    聚类问题不属于预测性的问题,它主要解决的是把一群对象划分成若干个组的问题。划分的依据是聚类问题的核心。所谓“物以类聚,人以群分”,故得名聚类。聚类问题容易与分类问题混淆,主要是语言表达的原因,因为我们...

    文章 jiacai2050 2012-09-28 878浏览量

  • 抛掉幻想,谈谈现实中的数据科学家

    例如各种机器学习算法聚类,分类,NLP,CV,IR,etc.),理解统计的原理。全栈开发能力。能够完成从数据清洗,到产品上线的全部工作,且能做各种数据可视化与报表。有资深的领域知识。了解行业背景,企业运行规律,...

    文章 小旋风柴进 2017-06-02 800浏览量

  • 你和真正的数据科学究竟差在哪里

    例如各种机器学习算法聚类,分类,NLP,CV,IR,etc.),理解统计的原理。全栈开发能力。能够完成从数据清洗,到产品上线的全部工作,且能做各种数据可视化与报表。有资深的领域知识。了解行业背景,企业运行规律,...

    文章 玄学酱 2017-08-02 800浏览量

  • 诠释数据降维算法:一文讲尽t-分布邻域嵌入算法(t-SNE)如何有效利用

    因此,在t-SNE算法结果图像中分离良好的聚类之间的距离可能没有什么意义。4.随机噪声不总是看起来随机 一个典型的错误观点就是认为你看到的模式就是随机数据。能够识别出噪音是一项重要的能力,而培养出这种准确的...

    文章 friday012 2016-11-08 15647浏览量

  • 带你读《深入理解AutoML和AutoDL:构建自动化机器 学习与深度学习平台》之三:机器学习概述

    聚类是指,根据数据的特征和行为对象进行分组,这里说的分组与分类算法是不同的,分类算法的组是人为规定的,而聚类算法中的组,则是由计算机自定义的,不是人为规定。聚类,将一组数据划分成不同的子组,如年龄、...

    文章 被纵养的懒猫 2019-11-01 1366浏览量

  • SLS机器学习最佳实践:时序相似性分析

    第二个函数主要针对针对原始曲线的相似性进行聚类,更多的会考虑曲线之间的欧式距离等因素,其底层的核心聚类算法是层次聚类;具体的原理介绍可以参考之前的文章,大家也可以去网上查阅相关资料自行阅读。接下来主要...

    文章 悟冥 2020-06-15 557浏览量

  • 《大数据算法》一1.2 大数据算法

    其中涉及的问题包括文本挖掘、机器学习,涉及的大数据算法包括分类算法聚类分析、实体识别、时间序列分析、回归分析等,这些问题在统计学和计算机科学方面都有相关的方法提出,然而面向大数据,这些方法的性能和可...

    文章 华章计算机 2017-06-21 1980浏览量

  • 机器学习性能改善备忘单:32个帮你做出更好预测模型的技巧和窍门

    你可以用无监督的聚类或投影方法,创造一个新的压缩数据集代表。特征选择。所有的输入变量是否同等重要?使用特征选择和衡量特征重要性的方法,可以创造出数据的新视角,供模型算法探索。特征工程。你能够创造或者...

    文章 知与谁同 2017-08-01 889浏览量

  • 机器学习性能改善备忘单:32个帮你做出更好预测模型的技巧和窍门

    你可以用无监督的聚类或投影方法,创造一个新的压缩数据集代表。特征选择。所有的输入变量是否同等重要?使用特征选择和衡量特征重要性的方法,可以创造出数据的新视角,供模型算法探索。特征工程。你能够创造或者...

    文章 小旋风柴进 2017-05-27 1258浏览量

  • TICA 2019 移动端App侧的智能化测试实践

    第二类是算法聚类和分类和规划,除了做前面经验规则所能解决问题,他还解决经验规则无法解决问题,随机操作覆盖,另外做调度类简单曲线的定位,还可以做缺陷修复和缺陷检测他就是一堆算法的应用,最后的准确率...

    文章 KB小秘书 2020-03-03 769浏览量

  • 8种常见机器学习算法比较

    机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM...

    文章 青衫无名 2017-08-01 2992浏览量

  • AI 大行其道,你准备好了吗?—谨送给徘徊于转行 AI 的程序员

    K-Means 算法就是一个无监督学习算法,在它执行前数据是每有类标的,执行过程中才会有类标,但是此时类标不固定,只有当聚类完成后每个样本的类标才能固定。如下图所示就是无监督算法的执行过程。K-Means 算法聚类...

    文章 玄学酱 2017-08-02 740浏览量

  • 带你读《增强型分析:AI驱动的数据分析、 业务决策与案例实践》之一:数据科学家的成长之路

    比如聚类算法属于无监督的学习范畴,而能够做类别判断或回归的算法都属于有监督的学习范畴。在实际使用时,需要针对需求灵活应用,如可以先用决策树算法生成预测模型,然后分析决策树的分支来细分客群。只有对这些...

    文章 被纵养的懒猫 2019-11-05 701浏览量

  • NLP技术的应用及思考

    还有文档分析,比如普通的文档聚类、文档分类、事件挖掘、层次聚类和意图分类,其他部分就是我们尝试比较多的偏深度学习的一些自然语言算法。右边的平台工程我们做了很多尝试。团队经过几年的发展,不停的去反思如何...

    文章 杨琬祯 2019-09-16 363浏览量

  • 从0到1搭建车企数字化营销中台(5):用户标签

    模型训练:根据相关算法使用样本进行模型训练,常用算法有分类(逻辑回归、决策数等)、聚类(kmeans、支持向量机)等;模型评估:主要是用相关指标来评估模型好坏,如精确率、召回率、AUC等;模型部署:将模型服务...

    文章 松果子 2020-07-16 652浏览量

  • 机器学习:入门方法与学习路径 (附资料)

    处理聚类问题的常用算法包括:K均值(K-means),基于密度聚类,LDA等等。降维的常用算法包括:主成分分析(PCA),奇异值分解(SVD)等。推荐系统的常用算法:协同过滤算法 模型融合(model ensemble)和提升(boosting...

    文章 小旋风柴进 2017-05-02 2932浏览量

  • NLP技术的应用及思考

    还有文档分析,比如普通的文档聚类、文档分类、事件挖掘、层次聚类和意图分类,其他部分就是我们尝试比较多的偏深度学习的一些自然语言算法。右边的平台工程我们做了很多尝试。团队经过几年的发展,不停的去反思如何...

    文章 云栖小秘书 2017-05-04 14511浏览量

  • 睿“至”进取,我们眼中的 AIOps

    我们不论是用算法也好,还是通过整合IT资源也好,最终手段一定要根据实际的应用场景和解决问题的场景深度集成,然后才是运用我们大数据还有机器学习的技术和手段。然后在以上的层面以多维度的分析视图或者场景化、...

    文章 技术小能手 2018-10-25 1059浏览量

  • 阿里工程师做了什么?90%的噪声标签原形毕露

    判断难易程度的方法,就是 paper 的创新点,主要思路是采用模型抽取出来的特征向量来聚类,来判断每个样本是否是离群,以此判断学习的难易程度。课程学习:把容易学习的样本集 A,在 first_model 模型的基础上继续...

    文章 警心 2019-12-28 1106浏览量

  • 为什么基于机器学习的产品很难见到?

    你振振有词地解释:“k-means算法就这样啊,运算前要猜分类的个数,干脆就给个随机数,另外,也得给几个随机初始中心点,这样下来,每次跑聚类结果不一样太正常不过了。这是你不懂。我在哪哪哪就是这么用的!用户...

    文章 知与谁同 2017-08-01 1105浏览量

  • 图像搜索与识别背后的故事

    图像搜索与识别技术的第二个挑战就是海量数据的挑战,拍立淘有高达30亿的图片,对图片逐一对比是做不到的,因此需要对这些向量引擎进行聚类操作,聚类操作会产生聚类标码,若标码一致就搜索,标码不一致不搜索。...

    文章 公开课小能手 2019-10-14 4870浏览量

  • 今日头条成功的核心技术秘诀是什么?深度解密个性化资讯推荐技术

    而线下则借助Map-Reduce实现了MinHash、PLSI两种聚类分群算法,定时把最新分群结果推到线上。为什么Google News会先选择协同过滤算法呢?除了CF算法在其他场景有成功的应用之外,还有一个重要的特点:CF是一个依赖...

    文章 玄学酱 2017-08-02 1329浏览量

  • 机器学习与R语言(原书第2版)》一1.4 实践中的机器学习

    类似地,聚类问题可能会用k均值算法,而数值预测则会应用回归分析或者回归树。对于分类来说,需要把精力花费在为学习问题找到合适的分类器。这时,考虑不同算法之间的各种差别是很有帮助的—深入学习每一种分类算法...

    文章 华章计算机 2017-05-02 1314浏览量

  • 每天审核淘宝性感图的工程师,用的是什么算法利器?

    判断难易程度的方法,就是 paper 的创新点,主要思路是采用模型抽取出来的特征向量来聚类,来判断每个样本是否是离群,以此判断学习的难易程度。3、课程学习:把容易学习的样本集 A,在 first_model 模型的基础上...

    文章 淘系技术 2019-09-11 13274浏览量

1 2 3 4 ... 10 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化