人工智能、大数据、数据挖掘、机器学习-数据集来源(下)

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 人工智能、大数据、数据挖掘、机器学习-数据集来源(下)

多伦多大学


http://www.cs.toronto.edu / 深入 / 数据 / datasets.html


UCI 知识发现 (KDD) 归档


http://kdd.ics.uci.edu/


信息和计算机科学


http://www.ics.uci.edu/


加州大学欧文分校


https://uci.edu/


互联网相关数据集


Dataset for “Statistics and SocialNetwork of YouTube Videos”


http://netsg.cs.sfu.ca/youtubedata/


1998 World Cup Web Site Access Logs


http://ita.ee.lbl.gov/html/contrib/WorldCup.html


(从 1998/04/26 到 1998/07/26 的 92 天中,发生了 1,352,804,107 次请求)


Page view statistics for Wikimedia projects


http://dammit.lt/wikistats/


AOL Search Query Logs - RP


http://www.researchpipeline.com/mediawiki/index.php?title=AOL_Search_Query_Logs


livedoor gourmet


http://blog.livedoor.jp/techblog/archives/65836960.html


离散序列数据


UNIX 用户数据


http://kdd.ics.uci.edu/databases/UNIX_user_data/UNIX_user_data.html


主菜芝加哥推荐数据


http://kdd.ics.uci.edu/databases/entree/entree.html


多元数据


人口收入调查数据库


http://kdd.ics.uci.edu/databases/census-income/census-income.html


线圈数据


http://kdd.ics.uci.edu/databases/coil/coil.html


Corel 图像特征


http://kdd.ics.uci.edu/databases/CorelFeatures/CorelFeatures.html


森林 CoverType


http://kdd.ics.uci.edu/databases/covertype/covertype.html


保险公司基准 (2000 卷)


http://kdd.ics.uci.edu/databases/tic/tic.html


互联网使用数据


http://kdd.ics.uci.edu/databases/internet_usage/internet_usage.html


IPUMS 人口普查数据


http://kdd.ics.uci.edu/databases/ipums/ipums.html


KDD CUP 1998 数据


http://kdd.ics.uci.edu/databases/kddcup98/kddcup98.html


KDD CUP 1999 数据


http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html


1990 年美国人口普查数据


http://kdd.ics.uci.edu/databases/census1990/USCensus1990.html


关系数据


大肠杆菌基因


http://kdd.ics.uci.edu/databases/ecoli/ecoli.html


结核分枝杆菌基因


http://kdd.ics.uci.edu/databases/tb/tb.html


电影


http://kdd.ics.uci.edu/databases/movies/movies.html


MovieLens 数据集


http://datahub.io/dataset/movielens


厄尔尼诺现象的数据


http://kdd.ics.uci.edu/databases/el_nino/el_nino.html


文本


20 新闻组数据


http://kdd.ics.uci.edu/databases/20newsgroups/20newsgroups.html


路透社 - 21578 文本分类收集


http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html


路透转录子集


http://kdd.ics.uci.edu/databases/reuters_transcribed/reuters_transcribed.html


摘要 1990- 2003 年 NSF 研究奖项


http://kdd.ics.uci.edu/databases/nsfabs/nsfawards.html


其他


http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html


http://www.w3.org/TR/WD-logfile-960221.html


http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog


http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html


http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/


http://www.web-caching.com/traces-logs.html


http://www-2.cs.cmu.edu/webkb


http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf


http://www.cs.cornell.edu/projects/kddcup/index.html



相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
28天前
|
机器学习/深度学习 数据采集 人工智能
深入探索人工智能与大数据的融合之路
本文旨在探讨人工智能(AI)与大数据技术如何相互促进,共同推动现代科技的进步。通过分析两者结合的必要性、挑战以及未来趋势,为读者提供一个全面的视角,理解这一领域内的最新发展动态及其对行业的影响。文章不仅回顾了历史背景,还展望了未来可能带来的变革,并提出了几点建议以促进更高效的技术整合。
|
12天前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
97 15
|
27天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年11月】
大数据& AI 产品技术月刊【2024年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
29天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
2月前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
236 5
|
2月前
|
机器学习/深度学习 人工智能 算法
探索人工智能与大数据的融合之道####
— 本文旨在探讨人工智能(AI)与大数据如何协同工作,以推动技术创新和产业升级。通过分析二者的基本概念、核心技术及应用场景,揭示它们相互促进的内在机制,并展望未来发展趋势。文章指出,AI提供了智能化处理数据的能力,而大数据则为AI提供了海量的训练资源,两者结合将开启无限可能。 ####
|
2月前
|
存储 人工智能 分布式计算
大数据& AI 产品月刊【2024年10月】
大数据& AI 产品技术月刊【2024年10月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习之解释性AI与可解释性机器学习
随着人工智能技术的广泛应用,机器学习模型越来越多地被用于决策过程。然而,这些模型,尤其是深度学习模型,通常被视为“黑箱”,难以理解其背后的决策逻辑。解释性AI(Explainable AI, XAI)和可解释性机器学习(Interpretable Machine Learning, IML)旨在解决这个问题,使模型的决策过程透明、可信。
76 2
|
2月前
|
机器学习/深度学习 数据采集 人工智能
揭秘AI:机器学习的魔法与代码
【10月更文挑战第33天】本文将带你走进AI的世界,了解机器学习的原理和应用。我们将通过Python代码示例,展示如何实现一个简单的线性回归模型。无论你是AI新手还是有经验的开发者,这篇文章都会给你带来新的启示。让我们一起探索AI的奥秘吧!
|
2月前
|
人工智能 算法 搜索推荐
探索人工智能与大数据的融合之道####
本文深入探讨了人工智能(AI)与大数据之间的紧密联系与相互促进的关系,揭示了二者如何共同推动科技进步与产业升级。在信息爆炸的时代背景下,大数据为AI提供了丰富的学习材料,而AI则赋予了大数据分析前所未有的深度与效率。通过具体案例分析,本文阐述了这一融合技术如何在医疗健康、智慧城市、金融科技等多个领域展现出巨大潜力,并对未来发展趋势进行了展望,强调了持续创新与伦理考量的重要性。 ####