重磅 | 数据挖掘之父韩家炜:文本语料库的数据挖掘(附视频+PPT下载)

简介:

近期,美国伊利诺伊大学厄巴纳香槟分校计算机科学Abel Bliss教授韩家炜在清华大学FIT楼多功能厅进行了关于文本语料库数据挖掘的主题分享。

嘉宾简介:韩家炜,美国伊利诺伊大学香槟分校计算机系教授,IEEE和ACM院士,美国信息网络学术研究中心主任。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席,创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文900余篇。

以下为演讲现场视频:

fe2c6858f3026d6da891d55b9da741f99bf9b799

全文演讲PPT如下:

6854aade5bbd7ff14d2b9cb50ed363ee50fbc1f2

原文发布时间为:2018-01-10

本文作者:韩家炜

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章
|
安全 Linux KVM
倚天产品介绍|倚天虚拟化:CPU虚拟化原理介绍
虚拟化技术中最关键的技术之一就是CPU虚拟化。在没有硬件辅助虚拟化技术出来之前,通常都是通过TCG(软件进行指令翻译)的方式实现CPU虚拟化。但是由于TCG方式的虚拟化层开销太大,性能太差,因此引入了硬件辅助虚拟化技术。
|
8月前
|
大数据 物联网 云计算
课时24:案例分享——中国邮政
在国企改革背景下,中国邮政积极推进行业信息化转型。通过与阿里云合作,中国邮政实现了核心业务云化,解决了高并发、资源不均衡等问题,并构建了PB级大数据平台,推动智能化分拣和寄递业务自动化。石崇斌总经理分享了邮政信息化发展历程及未来规划,强调以用户为中心的理念和技术应用的重要性。
263 1
课时24:案例分享——中国邮政
|
10月前
|
人工智能 自然语言处理 搜索推荐
GLM-Realtime:智谱推出多模态交互AI模型,融入清唱功能,支持视频和语音交互
GLM-Realtime 是智谱推出的端到端多模态模型,具备低延迟的视频理解与语音交互能力,支持清唱功能、2分钟内容记忆及灵活调用外部工具,适用于多种智能场景。
484 4
GLM-Realtime:智谱推出多模态交互AI模型,融入清唱功能,支持视频和语音交互
|
XML 数据格式 索引
xpath模块使用教程
XPath 是一种在 XML 文档中查找信息的语言,广泛用于 HTML 解析。本文介绍了 XPath 的安装与使用,包括 lxml 库的安装、解析流程、基本语法、路径表达式、谓语、通配符、多路径选择、逻辑运算、属性查询、索引查询、模糊查询、内容查询、属性值获取及节点内容转换等。通过实例详细说明了各种用法,帮助读者快速掌握 XPath 的应用技巧。
799 39
|
8月前
|
Android开发 UED iOS开发
Harmony os next~UI开发与ArkUI框架
鸿蒙OS的UI开发基于ArkUI框架,采用声明式编程,简化开发流程。五大核心组件(Text、Button、List、Grid、Flex)助力高效布局,支持数据绑定与动态更新。事件响应机制灵敏,适合构建交互丰富的应用。实战技巧包括规范命名、样式复用和调试方法。掌握这些,轻松开发鸿蒙应用。下期预告:分布式开发,记得带上烤冷面!
284 0
|
缓存 监控 网络协议
微服务系列:服务注册与发现原理详解
本文详细解析了微服务架构中的服务注册与发现原理,大厂面试高频,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
微服务系列:服务注册与发现原理详解
|
搜索推荐
LangChain-10 Agents langchainhub 共享的提示词Prompt
LangChain-10 Agents langchainhub 共享的提示词Prompt
185 3
|
人工智能 自然语言处理 安全
2024国产CRM排行榜:管理客户关系的新选择
本文综述了2024年主流国产CRM系统的市场情况,涵盖品牌、功能、特色及使用建议,旨在为企业提供全面的年度排名与选择指南。文中首先阐述了CRM对企业的重要性,包括提升客户满意度、优化销售策略、提高效率、数据驱动决策、增强竞争力、促进客户保留与增长及加强跨部门协作。随后,文章详细介绍了四大国产CRM系统:销售易CRM、白码CRM、悟空CRM和用友CRM,分别从品牌背景、核心功能、优势特点等方面进行了对比分析,适合不同类型企业的需求。
基于Dijkstra算法的最优行驶路线搜索matlab仿真,以实际城市复杂路线为例进行测试
使用MATLAB2022a实现的Dijkstra算法在城市地图上搜索最优行驶路线的仿真。用户通过鼠标点击设定起点和终点,算法规划路径并显示长度。测试显示,尽管在某些复杂情况下计算路径可能与实际有偏差,但多数场景下Dijkstra算法能找到接近最短路径。核心代码包括图的显示、用户交互及Dijkstra算法实现。算法基于图论,不断更新未访问节点的最短路径。测试结果证明其在简单路线及多数复杂城市路况下表现良好,但在交通拥堵等特殊情况下需结合其他数据提升准确性。
|
机器学习/深度学习 人工智能 自然语言处理
构建未来:AI在个性化教育中的应用
【5月更文挑战第27天】 随着人工智能(AI)技术的飞速发展,其在教育领域的应用正逐步从理论走向实践。本文探讨了AI如何通过个性化学习路径、智能辅导和数据驱动的决策支持,为教育带来革命性的变革。我们分析了当前AI技术在教育中应用的现状,挑战以及未来的发展趋势,并提出了相应的策略建议。文章旨在为教育工作者和技术开发者提供一个关于AI在教育领域应用的全面视角,以促进教育资源的优化配置和教学质量的提升。
385 5