重磅 | 数据挖掘之父韩家炜:文本语料库的数据挖掘(附视频+PPT下载)

简介:

近期,美国伊利诺伊大学厄巴纳香槟分校计算机科学Abel Bliss教授韩家炜在清华大学FIT楼多功能厅进行了关于文本语料库数据挖掘的主题分享。

嘉宾简介:韩家炜,美国伊利诺伊大学香槟分校计算机系教授,IEEE和ACM院士,美国信息网络学术研究中心主任。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席,创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文900余篇。

以下为演讲现场视频:

fe2c6858f3026d6da891d55b9da741f99bf9b799

全文演讲PPT如下:

6854aade5bbd7ff14d2b9cb50ed363ee50fbc1f2

原文发布时间为:2018-01-10

本文作者:韩家炜

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章
|
2月前
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
|
2月前
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 历史笔试详解
文章汇总并解析了百度机器学习/数据挖掘工程师/自然语言处理工程师历史笔试题目,覆盖了多分类任务激活函数、TCP首部确认号字段、GMM-HMM模型、朴素贝叶斯模型、SGD随机梯度下降法、随机森林算法、强连通图、红黑树和完全二叉树的高度、最长公共前后缀、冒泡排序比较次数、C4.5属性划分标准、语言模型类型、分词算法、贝叶斯决策理论、样本信息熵、数据降维方法、分箱方法、物理地址计算、分时系统响应时间分析、小顶堆删除调整等多个知识点。
33 1
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 历史笔试详解
|
2月前
|
机器学习/深度学习 自然语言处理 数据挖掘
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案--2 数据分析
讯飞英文学术论文分类挑战赛数据集的分析,包括数据加载、缺失值检查、标签分布、文本长度统计等内容,并总结了数据的基本情况。
17 0
|
5月前
|
机器学习/深度学习 数据采集 自然语言处理
【NLP】Datawhale-AI夏令营Day2打卡:数据分析
【NLP】Datawhale-AI夏令营Day2打卡:数据分析
|
5月前
|
机器学习/深度学习 存储 人工智能
Nougat:结合光学神经网络,引领学术PDF文档的智能解析、挖掘学术论文PDF的价值
Nougat:结合光学神经网络,引领学术PDF文档的智能解析、挖掘学术论文PDF的价值
|
机器学习/深度学习 人工智能 算法
「数据分析」精选数据挖掘和机器学习软件列表
「数据分析」精选数据挖掘和机器学习软件列表
|
机器学习/深度学习 人工智能 算法
「首席架构师推荐」精选数据挖掘和机器学习软件列表
「首席架构师推荐」精选数据挖掘和机器学习软件列表
|
机器学习/深度学习 人工智能 算法
首席架构师推荐」精选数据挖掘和机器学习软件列表
首席架构师推荐」精选数据挖掘和机器学习软件列表
|
机器学习/深度学习 自然语言处理 算法
机器学习 PAI 文本分析-新闻自动分类系|学习笔记
快速学习机器学习 PAI 文本分析-新闻自动分类系。
317 0
机器学习 PAI 文本分析-新闻自动分类系|学习笔记
|
机器学习/深度学习 JSON 数据挖掘
机器学习系列(2)_数据分析之Kaggle电影TMDB5000(上)
机器学习系列(2)_数据分析之Kaggle电影TMDB5000
机器学习系列(2)_数据分析之Kaggle电影TMDB5000(上)