人工智能、大数据、数据挖掘、机器学习-数据集来源(下)

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 人工智能、大数据、数据挖掘、机器学习-数据集来源(下)

多伦多大学


http://www.cs.toronto.edu / 深入 / 数据 / datasets.html


UCI 知识发现 (KDD) 归档


http://kdd.ics.uci.edu/


信息和计算机科学


http://www.ics.uci.edu/


加州大学欧文分校


https://uci.edu/


互联网相关数据集


Dataset for “Statistics and SocialNetwork of YouTube Videos”


http://netsg.cs.sfu.ca/youtubedata/


1998 World Cup Web Site Access Logs


http://ita.ee.lbl.gov/html/contrib/WorldCup.html


(从 1998/04/26 到 1998/07/26 的 92 天中,发生了 1,352,804,107 次请求)


Page view statistics for Wikimedia projects


http://dammit.lt/wikistats/


AOL Search Query Logs - RP


http://www.researchpipeline.com/mediawiki/index.php?title=AOL_Search_Query_Logs


livedoor gourmet


http://blog.livedoor.jp/techblog/archives/65836960.html


离散序列数据


UNIX 用户数据


http://kdd.ics.uci.edu/databases/UNIX_user_data/UNIX_user_data.html


主菜芝加哥推荐数据


http://kdd.ics.uci.edu/databases/entree/entree.html


多元数据


人口收入调查数据库


http://kdd.ics.uci.edu/databases/census-income/census-income.html


线圈数据


http://kdd.ics.uci.edu/databases/coil/coil.html


Corel 图像特征


http://kdd.ics.uci.edu/databases/CorelFeatures/CorelFeatures.html


森林 CoverType


http://kdd.ics.uci.edu/databases/covertype/covertype.html


保险公司基准 (2000 卷)


http://kdd.ics.uci.edu/databases/tic/tic.html


互联网使用数据


http://kdd.ics.uci.edu/databases/internet_usage/internet_usage.html


IPUMS 人口普查数据


http://kdd.ics.uci.edu/databases/ipums/ipums.html


KDD CUP 1998 数据


http://kdd.ics.uci.edu/databases/kddcup98/kddcup98.html


KDD CUP 1999 数据


http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html


1990 年美国人口普查数据


http://kdd.ics.uci.edu/databases/census1990/USCensus1990.html


关系数据


大肠杆菌基因


http://kdd.ics.uci.edu/databases/ecoli/ecoli.html


结核分枝杆菌基因


http://kdd.ics.uci.edu/databases/tb/tb.html


电影


http://kdd.ics.uci.edu/databases/movies/movies.html


MovieLens 数据集


http://datahub.io/dataset/movielens


厄尔尼诺现象的数据


http://kdd.ics.uci.edu/databases/el_nino/el_nino.html


文本


20 新闻组数据


http://kdd.ics.uci.edu/databases/20newsgroups/20newsgroups.html


路透社 - 21578 文本分类收集


http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html


路透转录子集


http://kdd.ics.uci.edu/databases/reuters_transcribed/reuters_transcribed.html


摘要 1990- 2003 年 NSF 研究奖项


http://kdd.ics.uci.edu/databases/nsfabs/nsfawards.html


其他


http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html


http://www.w3.org/TR/WD-logfile-960221.html


http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog


http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html


http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/


http://www.web-caching.com/traces-logs.html


http://www-2.cs.cmu.edu/webkb


http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf


http://www.cs.cornell.edu/projects/kddcup/index.html



相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
22天前
|
机器学习/深度学习 人工智能 算法
AI基础科普:机器学习入门与实践
本文全面介绍了机器学习及其在信用评分预测中的应用。首先概览了机器学习作为人工智能核心领域的重要性及其实现数字化转型的作用。接着定义了机器学习,并区分了监督、无监督和强化学习等主要类型。随后,通过一个具体的场景——利用Python与scikit-learn库构建逻辑回归模型来预测客户的信用等级,详细阐述了从数据准备、模型训练到评估的全过程。此外,还介绍了如何借助阿里云机器学习平台PAI进行云上的模型训练和部署。最后,通过总结逻辑回归算法和其在金融领域的应用,鼓励读者深入学习并实践AI技术,以适应快速发展的科技趋势。
69 2
AI基础科普:机器学习入门与实践
|
2天前
|
机器学习/深度学习 人工智能 运维
自动化测试的未来:AI与机器学习的融合
【8月更文挑战第29天】随着技术的快速发展,自动化测试正在经历一场革命。本文将探讨AI和机器学习如何改变软件测试领域,提供代码示例,并讨论未来趋势。
|
2天前
|
机器学习/深度学习 人工智能 Android开发
揭秘AI编程:从零开始构建你的第一个机器学习模型移动应用开发之旅:从新手到专家
【8月更文挑战第29天】本文将带你走进人工智能的奇妙世界,一起探索如何从零开始构建一个机器学习模型。我们将一步步解析整个过程,包括数据收集、预处理、模型选择、训练和测试等步骤,让你对AI编程有一个全面而深入的理解。无论你是AI初学者,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这段激动人心的AI编程之旅吧! 【8月更文挑战第29天】在这篇文章中,我们将探索移动应用开发的奇妙世界。无论你是刚刚踏入这个领域的新手,还是已经有一定经验的开发者,这篇文章都将为你提供有价值的信息和指导。我们将从基础开始,逐步深入到更复杂的主题,包括移动操作系统的选择、开发工具的使用、
|
4天前
|
机器学习/深度学习 数据采集 人工智能
揭秘AI的魔法:机器学习如何塑造我们的未来
【8月更文挑战第27天】在数字时代的浪潮中,人工智能(AI)已成为推动科技革命的核心力量。特别是机器学习,它像一位神秘的魔法师,通过数据和算法的魔咒,解锁了前所未有的智能应用。本文将带你探索机器学习的奥秘,了解它如何从理论走向实践,进而影响我们的生活、工作甚至思维方式。无论你是技术新手还是资深开发者,这篇文章都将为你揭示AI背后的原理,并通过生动的例子展示机器学习的实际应用。让我们一起跟随代码的步伐,开启一场关于智能与创新的奇妙之旅吧!
|
3天前
|
机器学习/深度学习 人工智能 算法
【悬念揭秘】ML.NET:那片未被探索的机器学习宝藏,如何让普通开发者一夜变身AI高手?——从零开始,揭秘构建智能应用的神秘旅程!
【8月更文挑战第28天】ML.NET 是微软推出的一款开源机器学习框架,专为希望在本地应用中嵌入智能功能的 .NET 开发者设计。无需深厚的数据科学背景,即可实现预测分析、推荐系统和图像识别等功能。它支持多种数据源,提供丰富的预处理工具和多样化的机器学习算法,简化了数据处理和模型训练流程。
16 1
|
4天前
|
机器学习/深度学习 人工智能 算法
探索AI的魔法:机器学习与深度学习的奥秘
【8月更文挑战第27天】在这篇文章中,我们将深入探讨人工智能的两个重要分支:机器学习和深度学习。我们将首先理解它们的基本概念,然后通过Python代码示例,展示如何应用这些技术解决实际问题。无论你是AI新手,还是有经验的开发者,这篇文章都将为你提供新的知识和启示。让我们一起开启这场AI的魔法之旅吧!
|
16天前
|
机器学习/深度学习 人工智能 算法
揭秘AI编程:从零开始的机器学习之旅
本文将带你走进人工智能的奇妙世界,一起探索机器学习的奥秘。我们将从最基础的概念入手,逐步深入到实际应用中,让你在轻松愉快的阅读过程中,对AI编程有一个全面而深刻的理解。无论你是编程新手,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这场充满智慧和乐趣的旅程吧!
33 1
|
22天前
|
机器学习/深度学习 人工智能 算法
AI与创造力的碰撞:探索机器学习在艺术创作中的角色
【8月更文挑战第9天】当科技遇见艺术,会擦出怎样的火花?本文将带您一探究竟,深入了解人工智能尤其是机器学习如何在现代和当代艺术创作中扮演着日益重要的角色。我们将通过具体实例探讨AI如何助力艺术家突破创意限制,以及这一技术趋势对艺术领域未来的可能影响。
|
24天前
|
机器学习/深度学习 人工智能 算法
探索自动化测试的未来:AI与机器学习的融合
在软件测试领域,自动化一直是提高效率和准确性的关键。随着人工智能(AI)和机器学习(ML)技术的飞速发展,它们正在逐步改变自动化测试的面貌。本文将探讨AI和ML如何增强自动化测试的能力,提高其智能性、预测性和适应性,并分析这些技术为测试实践带来的潜在变化和挑战。
|
25天前
|
分布式计算 并行计算 大数据
【数据挖掘】百度2015大数据云计算研发笔试卷
百度2015年大数据云计算研发笔试卷的题目总结,涵盖了Hadoop、Spark、MPI计算框架特点、TCP连接建立过程、数组最大和问题、二分查找实现以及灯泡开关问题,提供了部分题目的解析和伪代码。
39 1
下一篇
云函数