人工智能、大数据、数据挖掘、机器学习-数据集来源(下)

简介: 人工智能、大数据、数据挖掘、机器学习-数据集来源(下)

多伦多大学


http://www.cs.toronto.edu / 深入 / 数据 / datasets.html


UCI 知识发现 (KDD) 归档


http://kdd.ics.uci.edu/


信息和计算机科学


http://www.ics.uci.edu/


加州大学欧文分校


https://uci.edu/


互联网相关数据集


Dataset for “Statistics and SocialNetwork of YouTube Videos”


http://netsg.cs.sfu.ca/youtubedata/


1998 World Cup Web Site Access Logs


http://ita.ee.lbl.gov/html/contrib/WorldCup.html


(从 1998/04/26 到 1998/07/26 的 92 天中,发生了 1,352,804,107 次请求)


Page view statistics for Wikimedia projects


http://dammit.lt/wikistats/


AOL Search Query Logs - RP


http://www.researchpipeline.com/mediawiki/index.php?title=AOL_Search_Query_Logs


livedoor gourmet


http://blog.livedoor.jp/techblog/archives/65836960.html


离散序列数据


UNIX 用户数据


http://kdd.ics.uci.edu/databases/UNIX_user_data/UNIX_user_data.html


主菜芝加哥推荐数据


http://kdd.ics.uci.edu/databases/entree/entree.html


多元数据


人口收入调查数据库


http://kdd.ics.uci.edu/databases/census-income/census-income.html


线圈数据


http://kdd.ics.uci.edu/databases/coil/coil.html


Corel 图像特征


http://kdd.ics.uci.edu/databases/CorelFeatures/CorelFeatures.html


森林 CoverType


http://kdd.ics.uci.edu/databases/covertype/covertype.html


保险公司基准 (2000 卷)


http://kdd.ics.uci.edu/databases/tic/tic.html


互联网使用数据


http://kdd.ics.uci.edu/databases/internet_usage/internet_usage.html


IPUMS 人口普查数据


http://kdd.ics.uci.edu/databases/ipums/ipums.html


KDD CUP 1998 数据


http://kdd.ics.uci.edu/databases/kddcup98/kddcup98.html


KDD CUP 1999 数据


http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html


1990 年美国人口普查数据


http://kdd.ics.uci.edu/databases/census1990/USCensus1990.html


关系数据


大肠杆菌基因


http://kdd.ics.uci.edu/databases/ecoli/ecoli.html


结核分枝杆菌基因


http://kdd.ics.uci.edu/databases/tb/tb.html


电影


http://kdd.ics.uci.edu/databases/movies/movies.html


MovieLens 数据集


http://datahub.io/dataset/movielens


厄尔尼诺现象的数据


http://kdd.ics.uci.edu/databases/el_nino/el_nino.html


文本


20 新闻组数据


http://kdd.ics.uci.edu/databases/20newsgroups/20newsgroups.html


路透社 - 21578 文本分类收集


http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html


路透转录子集


http://kdd.ics.uci.edu/databases/reuters_transcribed/reuters_transcribed.html


摘要 1990- 2003 年 NSF 研究奖项


http://kdd.ics.uci.edu/databases/nsfabs/nsfawards.html


其他


http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html


http://www.w3.org/TR/WD-logfile-960221.html


http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog


http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html


http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/


http://www.web-caching.com/traces-logs.html


http://www-2.cs.cmu.edu/webkb


http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf


http://www.cs.cornell.edu/projects/kddcup/index.html



相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
8月前
|
SQL 分布式计算 数据挖掘
你以为大数据只是存?其实真正的“宝藏”藏在这招里——数据挖掘!
你以为大数据只是存?其实真正的“宝藏”藏在这招里——数据挖掘!
250 1
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】金山办公2020校招大数据和机器学习算法笔试题
金山办公2020校招大数据和机器学习算法笔试题的解析,涵盖了编程、数据结构、正则表达式、机器学习等多个领域的题目和答案。
334 10
|
机器学习/深度学习 人工智能 搜索推荐
【数据挖掘】2022年深信服科技机器学习工程师笔试
总结了深信服科技机器学习工程师笔试中的几道题目及其解答,涉及数据结构、机器学习评估指标和过拟合缓解方法等内容。
238 1
|
机器学习/深度学习 存储 人工智能
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
本文是关于2022-2023年知能科技公司机器学习算法工程师岗位的秋招笔试题,包括简答题和编程题,简答题涉及神经网络防止过拟合的方法、ReLU激活函数的使用原因以及条件概率计算,编程题包括路径行走时间计算和两车相向而行相遇时间问题。
277 2
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 历史笔试详解
文章汇总并解析了百度机器学习/数据挖掘工程师/自然语言处理工程师历史笔试题目,覆盖了多分类任务激活函数、TCP首部确认号字段、GMM-HMM模型、朴素贝叶斯模型、SGD随机梯度下降法、随机森林算法、强连通图、红黑树和完全二叉树的高度、最长公共前后缀、冒泡排序比较次数、C4.5属性划分标准、语言模型类型、分词算法、贝叶斯决策理论、样本信息熵、数据降维方法、分箱方法、物理地址计算、分时系统响应时间分析、小顶堆删除调整等多个知识点。
270 1
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 历史笔试详解
|
机器学习/深度学习 数据采集 算法
数据挖掘和机器学习算法
数据挖掘和机器学习算法
|
机器学习/深度学习 人工智能 算法
【数据挖掘】2022年2023届秋招奇虎360机器学习算法工程师 笔试题
本文提供了奇虎360公司2022年秋招机器学习算法工程师岗位的笔试题内容,包括选择题和编程题,涉及概率统计、数据结构、机器学习、计算机组成原理等多个领域。
318 5
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】2022年2023届秋招宏瓴科技公司机器学习算法工程师 笔试题
关于宏瓴科技有限公司2022-2023年秋招机器学习算法工程师岗位的笔试题目及作者个人对部分题目的解答尝试,涉及贝叶斯误差和贝叶斯最优分类器的概念、贝叶斯误差的重要性和估算方法,以及如何有效利用训练集和测试集进行深度学习模型训练的数据集划分策略。
318 4
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 2023届校招笔试详解
百度2023届校招机器学习/数据挖掘/自然语言处理工程师笔试的题目详解
325 1
|
分布式计算 并行计算 大数据
【数据挖掘】百度2015大数据云计算研发笔试卷
百度2015年大数据云计算研发笔试卷的题目总结,涵盖了Hadoop、Spark、MPI计算框架特点、TCP连接建立过程、数组最大和问题、二分查找实现以及灯泡开关问题,提供了部分题目的解析和伪代码。
237 1