• 关于

    LDA可以做什么

    的搜索结果
  • 白话LDA隐式狄里克雷分布模型

    今天应学弟要求,又回顾了下LDA模型,陡然发现之前弄懂弄通的一些地方竟然开始有些生疏,果然还是得记录总结。 好记性不如烂笔头,于是将LDA模型又从头梳理了一下,有些体会,记录下来 以下尽可能不用代码也不用公式还原LDA模型的思想原貌 LDA全景图 1.LDA解决的问题: 如何自动的从一批文档中,找...

    文章 夜半饿得慌 2019-05-12 1109浏览量

  • 《LDA漫游指南》——第2章 前置知识

    本节书摘来异步社区《LDA漫游指南》一书中的第2章,作者: 马晨,更多章节内容可以访问云栖社区“异步社区”公众号查看 第2章 前置知识 LDA漫游指南本章所描述的工具和线索在后期LDA算法的采样公式推导中会全部明了。关于为什么需要使用这些知识要素,这里面有很长的一段历史渊源,比如在概率论和数理统计...

    文章 异步社区 2017-05-02 1170浏览量

  • Alex Smola论文详解:准确稀疏可解释,三大优点兼具的序列数据预测算法LLA| ICML 2017

    雷锋网 AI 科技评论按:近日,ICML2017收录的一篇论文引起了雷锋网AI科技评论的注意。这篇关于序列数据预测的论文是 Alex Smola 和他在 CMU 时的两个博士生 Manzil Zaheer 和 Amr Ahmed 共同完成的,后者目前已经加入谷歌大脑。 Alex Smola是机器学...

    文章 云栖大讲堂 2017-08-01 1209浏览量

  • 阿里云高校特惠,助力学生创业梦!0元体验,快速入门云计算!

    建个炫酷的简历网页,制作一个浪漫的表白网页,打造个人专属网盘,多种动手场景应用免费学!!!

    广告

  • NESASM教程——第五天——主角出场

    【主角】 主角和背景比起来,你肯定觉得背景会更简单。错!主角才简单得要命。 制造主角只需要向SPR-RAM写入一点点内容(主角的x,y坐标,tile编号,等等)。 等等,我觉得咱们得先绘制主角的图片才行,走起~:) 【Tile Layer Pro】 存储主角像素块的表格称为Pattern Tabl...

    文章 以亭 2014-11-16 1089浏览量

  • 如何用 Python 从海量文本抽取主题?

    你在工作、学习中是否曾因信息过载叫苦不迭?有一种方法能够替你读海量文章,并将不同的主题和对应的关键词抽取出来,让你谈笑间观其大略。本文使用Python对超过1000条文本做主题抽取,一步步带你体会非监督机器学习LDA方法的魅力。想不想试试呢? 淹没 每个现代人,几乎都体会过信息过载的痛苦。文章读...

    文章 玄学酱 2017-08-02 799浏览量

  • NESASM教程——第七天——使用内存

    【从哪里获得?】 我们做任何其他事情之前,最好展示怎么使用内存用于我们自己的数据。这个数据可能是任何东西,例如你需要存储的数字或主角的X/Y坐标值。我们将使用自由内存:位于CPU $0000。 【怎样使用?】 代码段0用ORG伪指令定位到$0000,为一些内存贴上标签,然后ORG定位到$8000开...

    文章 以亭 2014-11-16 917浏览量

  • [python] LDA处理文档主题分布及分词、词频、tfidf计算

            这篇文章主要是讲述如何通过LDA处理文本内容TXT,并计算其文档主题分布,主要是核心代码为主。其中LDA入门知识介绍参考这篇文章,包括安装及用法:        [python] LDA处理文档主题分布代码入门笔记         1.输入输出         输入是test.tx...

    文章 小珞珞 2016-03-15 6668浏览量

  • 百度开源其NLP主题模型工具包,文本分类等场景可直接使用L——LDA进行主题选择本质就是降维,然后用于推荐或者分类

    2017年7月4日,百度开源了一款主题模型项目,名曰:Familia。 InfoQ记者第一时间联系到百度Familia项目负责人姜迪并对他进行采访,在本文中,他将为我们解析Familia项目的技术细节。 什么是Familia Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工...

    文章 桃子红了呐 2017-11-15 1799浏览量

  • 独家 | 手把手带你用无监督学习检验国际美食!

    像很多人一样,我也是一名吃货。我很幸运能在一个所有食物都是从头开始亲自做的家庭里长大。所有的烹饪都由我妈妈完成,因为她是从德国移民到美国的,我也跟着接触了很多美味的德国菜。我最喜欢的一些包括Käsespätzle,Semmelknödel和Sauerbraten。虽然我没有妈妈的烹饪天赋,但我非常...

    文章 技术小能手 2018-09-18 1408浏览量

  • 干货 | 三年拿到斯坦福CS博士的创业者李纪为:AI如何赋能金融

    人工智能和金融,法律、医学等传统领域密切联系,金融科技正以前所未有的速度改变大众认知,这不仅驱动了传统金融业转型升级,也催生了诸多新金融业态。本次清华大数据“技术·前沿”系列讲座,我们荣幸地邀请到了香侬科技CEO李纪为博士,他从金融数据的获取、金融数据非结构到结构化、金融实体的用户画像等方面为大家...

    文章 技术小能手 2018-10-30 1746浏览量

  • 为何推荐sklearn做单机特征工程?【下】

    一、特征选择 当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通常来说,从两个方面考虑来选择特征: 特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有什么用。 特征与目标的相关性:这点比较显见,与...

    文章 初商 2019-08-04 324浏览量

  • 从内容/用户画像到如何做算法研发

    中午和一前同事一起用餐,发现还是有很多碰撞点的。交流了很多正在做的事情,对方也提供了非常多的思想值得自己很好的思考。先是和他聊了下我们现在做内容标签的进展,其实就是在做内容画像。我们一般都是在谈用户画像,其实内容也是要画像的。 我之前说,内容和用户是现在互联网企业核心的两个东西,用户的行为则将内容...

    文章 祝威廉 2016-09-07 1438浏览量

  • NESASM教程——第十天——主角DMA

    【主角DMA?】 是的,主角DMA。你还记得我们怎么利用$2003和$2004寄存器写入SPR-RAM(OAM)的吗?实际上真实系统中这种做法是不可靠的。我们应该利用内存作为OAM,然后向一个寄存器写入值,所有内容都自动拷贝到真实OAM。如果你不懂,那我们做一遍就懂了。 【什么内存?】 就像我上面...

    文章 以亭 2014-12-06 1173浏览量

  • 初学者如何选择合适的机器学习算法(附算法速查表)

    本文主要的目标读者是机器学习爱好者或数据科学的初学者,以及对学习和应用机器学习算法解决实际问题抱有浓厚兴趣的读者。面对大量的机器学习算法,初学者通常会问自己一个典型的问题:「我该使用哪一种算法?」有很多因素会影响这一问题的答案,比如: 数据的大小、质量及性质 可用计算时间 任务的急迫...

    文章 行者武松 2017-06-01 1185浏览量

  • PCA、NMF、KNN在实战中的算法解析

    我们用一些工具对数据进行降维,看看结果会怎样。PCA(主成分分析—对高维数据降维)会解决这个问题。NMF(非负矩阵分析—对高维数据降维,并且对事物的局部特性有很好的解释)在分解图像时经常会发现有用的“部分”来表达整体,并且在MNIST数据集或人脸识别数据集中会产生有趣的结果。本文着重探索这三种算法...

    文章 【方向】 2017-12-18 3238浏览量

  • 基于数加分析政府工作报告

    摘要:3月5日,第十二届全国人民代表大会第五次会议在北京人民大会堂开幕,两会期间的“部长通道”是每年两会的一个亮点,李克强总理多次强调要让部长们当“第一新闻发言人”,积极回应舆论关切,给社会各界一个稳定预期。笔者从新浪、搜狐、网易等各大门户网站上爬取部长答记者问的相关新闻数据导入到阿里数加平台,基...

    文章 武汉蓝智 2017-03-22 5654浏览量

  • 《LDA漫游指南》——2.6 共轭先验分布(conjugacy prior)

    本节书摘来异步社区《LDA漫游指南》一书中的第2章,第2.6节,作者: 马晨,更多章节内容可以访问云栖社区“异步社区”公众号查看 2.6 共轭先验分布(conjugacy prior) In Bayesian probability theory, if the posterior distrib...

    文章 异步社区 2017-05-02 2235浏览量

  • 贝叶斯机器学习到底是什么?看完这篇你就懂啦

    雷锋网按:不少人都在机器学习的过程中听说过贝叶斯分类器,但它是如何与机器学习建立联系的?作者Zygmunt Zając 提供了一些基础概念,雷锋网也尝试对其中的一些概念进行简化说明,让小白们也能容易地理解贝叶斯在机器学习中所起的作用。 贝叶斯学派与频率主义学派 简单说来,贝叶斯学派认为,概率是一个...

    文章 云栖大讲堂 2017-08-01 1262浏览量

  • 想用R和Python做文本挖掘又不知如何下手?方法来了!

    1、对文章产生好奇 在数据科学中,几乎做所有事情的第一步都是产生好奇,文本挖掘也不例外。 文本挖掘应用领域无比广泛,可以与电影台本、歌词、聊天记录等产生奇妙的化学反应:如南方公园的对话,电影对白的文本挖掘和分析等也都是受到了文本挖掘的启发;近期大数据文摘相关文章《从恋爱到婚后的短信词频图发生了这...

    文章 小旋风柴进 2017-05-23 2919浏览量

  • 浅谈数据归一化

      归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。归一化是为了加快训练网络的收敛性,可以不进行归一化处理     归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。   在这里主要讨论...

    文章 哈沙给 2015-10-22 1529浏览量

  • 高端访谈:人工智能下一步会如何改变商业与生活

    2015年11月22日,周日,北京大雪纷飞,但国家会议中心3层会场早已人满为患,因为虎嗅FM创新节在此召开。“人工智能下一步会如何改变商业与影响人类生活”的论坛非常精彩,大数据文摘编辑根据现场速记,整理对话中精华如下。 俞志晨问:什么是真正的人工智能,各自公司在这个领域做了什么,为什么做这些事情...

    文章 小旋风柴进 2017-05-02 1223浏览量

  • 【deep learning学习笔记】Recommending music on Spotify with deep learning

    主要内容: Spotify是个类似酷我音乐的音乐站点。做个性化音乐推荐和音乐消费。作者利用deep learning结合协同过滤来做音乐推荐。 详细内容: 1. 协同过滤 基本原理:某两个用户听的歌曲都差点儿相同,说明这两个用户听歌的兴趣、品味类似。某两个歌曲,被同一群人听,说明这两个歌曲风...

    文章 技术mix呢 2017-10-12 864浏览量

  • 机器学习在热门微博推荐中的应用

    近年来,机器学习在搜索、广告、推荐等领域取得了非常突出的成果,成为最引人注目的技术热点之一。微博也在机器学习方面做了广泛的探索,其中在推荐领域,将机器学习技术应用于微博最主要的产品之一——热门微博,并取得了显著的效果提升。 热门微博推荐系统介绍 热门微博业务场景 热门微博是基于微博原生内容的个性化...

    文章 技术小能手 2018-02-08 3572浏览量

  • 清华大学计算机科学与技术系朱军教授:机器学习里的贝叶斯基本理论、模型和算法

    雷锋网[AI科技评论]按:3月3日,中国人工智能学会AIDL第二期【人工智能前沿讲习班】在北京中科院自动化所举行,本期讲习班的主题为【机器学习前沿】。周志华教授担任学术主任,前来授课的嘉宾均为中国机器学习界一流专家、资深科研人员和企业精英,包括:耿新、郭天佑、刘铁岩、王立威、叶杰平、于剑、余扬、张...

    文章 云栖大讲堂 2017-08-01 1580浏览量

  • 周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

    2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄。 大数据文摘经周博磊授权...

    文章 技术小能手 2017-10-26 6330浏览量

  • 收藏 | 数据分析师最常用的10个机器学习算法!

    在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。 举个例子来说,你不能说神经网络永远比决策树好,反之亦然。模型运行被许多因素左右,例如数据集的大小和结构。 因此,你应该根据你的问题尝试许多不同...

    文章 技术小能手 2018-08-30 4067浏览量

  • 最全NLP反作弊攻略,从马蜂窝注水事件说起

    在开始正文之前,我们先回顾一下事件背景。 10月21日,朋友圈被一篇名为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章刷屏。文章作者小声比比指控在线旅游网站马蜂窝存在点评大量造假的情况,包括从其他网站如大众点评、携程等抓取相关点评,及通过水军撰写虚拟点评。 文章吸引了包括本人在内...

    文章 技术小能手 2018-11-19 1184浏览量

  • 深度学习的可解释性研究(一):让模型「说人话」

    本文为 BIGSCity 的知乎专栏内容,作者王小贱。北航智慧城市兴趣组 BIGSCITY是隶属于北京航空航天大学计算机学院的一个学术研究小组,小组致力于研究机器学习与数据挖掘在城市科学、社会科学等领域的交叉应用技术。AI 科技评论获得 BIGSCity 授权转载,敬请期待更多后续内容。 非常开心...

    文章 技术小能手 2018-05-30 3396浏览量

  • PCA作图里面的箭头是干嘛用的?

    作图的目的是希望在图里面发现问题或者解释问题,当然更本质一点就是你想解决什么问题? 前几天做了一个PCA的图,图是画出来了,但是问题有很多,比如说主成分是是啥意思,图里面的箭头有什么含义?为了不做无意义的重复,所以写一篇文章尝试做一个解释。 我们以R语言自带的数据集iris作为例子来演示。 da...

    文章 徐洲更 2018-09-16 1671浏览量

  • 还敢说自己是TED粉吗? 连哪个演讲最爆款都不知道!

    当我看到Kaggle上的TED数据集时,竟然发现观看次数极为分散:从五万到四千七百万多(平均数为100万左右)。到底是什么原因使得某些演讲独占鳌头, TED组织者和演讲者能否抓住这个秘诀制造下一个"爆款"呢? 下文中,我们尝试着从预测TED演讲的受欢迎程度出发,来分析最具影响力的因素。 数据 从...

    文章 技术小能手 2017-11-16 1570浏览量

1 2 3 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化