雷锋网(公众号:雷锋网)AI研习社讯:谱聚类是数据聚类研究领域里最有效的方法之一,从90年底被提出至今,二十年来一直受到学术界的广泛关注。谱聚类有着非常广泛的实际应用,是最基本的数据分析工具之一。但是谱聚类一直以来最大的缺点在于对大数据的可扩展性,使得其很难适应今天大数据的时代。在本次公开课中,我将分享其关于我们开发可扩展的端到端的谱聚类新方法的最新研究工作。我们提出的方法可以同时加速数据到图的构建和大矩阵特征分解,使得传统的谱聚类可以重新得力。在对大数据的处理上,我们的新提出谱聚类的方法的效果和效率上都比其他类似方法更优。
分享主题
可扩展的端到端谱聚类 (Oral Paper, Wu et al, KDD 2018)
分享嘉宾
吴凌飞,IBM全球研究院总部(IBM T.J. Watson Research Center) 研究员 , 威廉玛丽大学计算机系博士,主要研究方向为机器学习,深度学习,表征学习,自然语言处理,大数据。吴博士已经发表20几篇顶尖杂志和会议,包含但不局限于KDD, ICDM, AISTATS, EMNLP, AAAI, ICASSP, SC, SIAM Journal on Scientific Computing, IEEE Transaction on Big Data, and Journal of Computational Physics。吴博士同时也是13项美国专利的发明人。
分享提纲
1、谱聚类的应用,挑战,和当前的方法利弊比较。
2、重点介绍我们新提出方法SC_RB的两个重点模块,Random Binning核近似技术 (Wu et al., KDD 2016),和目前最好的大矩阵特征分解软件 PRIMME (Wu et al., SISC 2015,Wu et al., SISC 2017)。
3、介绍基于Random Binning 和 PRIMME的SC_RB (Wu et al, KDD 2018),最新的端到端的谱聚类方法。
分享时间
(北京时间 ) 10 月 22 日(星期一) 10:00
错过直播不要紧,回放视频上传后也能继续看哦~
直播链接
http://www.mooc.ai/open/course/579
想了解更多雷锋网 AI 研习社直播?
欢迎移步雷锋网 AI 研习社社区~
雷锋网版权文章,未经授权禁止转载。详情见转载须知。