数据挖掘

首页 标签 数据挖掘
# 数据挖掘 #
关注
26952内容
【玩转数据系列六】文本分析算法实现新闻自动分类
新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式,消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标,完全由机器智能化实现。
诠释数据降维算法:一文讲尽t-分布邻域嵌入算法(t-SNE)如何有效利用
t-分布领域嵌入算法(t-SNE, t-distributed Stochastic Neighbor Embedding )是目前一个非常流行的对高维度数据进行降维的算法, 由Laurens van der Maaten和 Geoffrey Hinton于2008年提出。这个算法已经在机器学习领域
《凌云》第六期——直击AWDC2014-阿里云生态系统观察
透过AWDC 2014,可以看到一个生机盎然、物种丰富的云计算生态圈正在蓬勃发展。观云计算的技术力量在更多传统领域的应用与发展,敬请阅读第六期《凌云》-“直击AWDC2014-阿里云生态系统观察”。
互联网下半场的角逐,玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场(北京站)干货集锦
MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。欢迎加入钉钉交流群11782920。
往期直播:《驴妈妈,基于混合云的OTA行业数据分析、精准运营和大数据用户推荐》
云栖社区第3期在线培训报名开启,3月11日直播准时开始!本次分享嘉宾为驴妈妈技术副总邵汉成,分享主题为《基于混合云的OTA行业数据分析、精准运营和大数据用户推荐》,期间活跃成员将有精美图书赠送!
【最全资料下载】Python 系列直播——深入Python与日志服务,玩转大规模数据分析处理实战
直播讲师:丁来强(成喆)——阿里高级技术专家,从事阿里云日志服务相关的产品与研发工作,擅长AIOps/SecOps的大数据分析平台构建与场景落地,擅长C++与Python语言等。PyCon历届讲师,曾经在中国PyCon2015、2016与2018分享过7场/6个不同议题,覆盖Jupyter扩展、大数据分析可视化、工作流调度、函数式、设计模式、Python核心语言等方面,广受好评。
7步掌握Python机器学习
如今,网络上的Python机器学习资源纷繁复杂,使得刚入门的小白们眼花缭乱。究竟从哪里开始?如何进行?读完这篇文章,相信你就会有自己的答案。
免费试用