开源数据集网站推荐,持续更新!

简介: 开源数据集网站推荐,持续更新!

学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的地方:


  • 流行的开源数据仓库:
  1. UC Irvine Machine Learning Repository

37e6ee37b19c4d9b8abe13c6f8e0a1e2.png

  1. Kaggle datasets
  2. Amazon’s AWS datasets


  • 准入口(提供开源数据列表)
  1. http://dataportals.org/

image.png


  1. http://opendatamonitor.eu/
  2. http://quandl.com/
目录
相关文章
|
2天前
|
数据采集 Go Python
文本挖掘基础入门指南
本文介绍了文本挖掘中的数据预处理步骤,包括去除特殊字符和标点符号、移除停用词、小写化以及词干化或词形还原。使用Python的nltk库,通过示例代码展示了如何实现这些步骤,并强调了nltk库在文本处理中的便利性。文章最后提到,预处理后的文本更适合后续的文本分析任务.
|
9月前
|
人工智能
生信麻瓜的 ChatGPT 4.0 初体验
生信麻瓜的 ChatGPT 4.0 初体验
|
人工智能 自然语言处理 前端开发
Prompt工程师指南资料整合篇:Prompt最新前沿论文整理合集、工具和库推荐、数据集整合、推荐阅读内容等,超全面资料
Prompt工程师指南资料整合篇:Prompt最新前沿论文整理合集、工具和库推荐、数据集整合、推荐阅读内容等,超全面资料
|
存储 编解码 人工智能
学术论文插图要求简介
学术论文插图要求简介
104 0
|
Web App开发 搜索推荐 数据库
写论文经常用到的网站、工具、技巧汇总【持续更新】
写论文经常用到的网站、工具、技巧汇总【持续更新】
256 0
写论文经常用到的网站、工具、技巧汇总【持续更新】
|
机器学习/深度学习 人工智能 数据可视化
还在用PPT做神经网络架构图?GitHub2万星项目,手把手教你从入门到可视化大师
现在搞机器学习的成本越来越低了,熟悉了Python和sklearn、Keras、Pytorch等机器学习框架,就能搭建自己的模型了,可是模型建好后如何解释给别人听,难倒了不少人。今天,我们就来介绍两款开源的机器学习画图工具,让你分分钟做出精美的可视化。
1606 0
还在用PPT做神经网络架构图?GitHub2万星项目,手把手教你从入门到可视化大师
|
文字识别 搜索推荐 数据可视化
|
机器学习/深度学习 人工智能 自然语言处理
撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出
撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出
964 0
撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出
|
机器学习/深度学习 计算机视觉
112 页 PPT,2019 最新教程《深度学习数学基础》发布!
112 页 PPT,2019 最新教程《深度学习数学基础》发布!
209 0
112 页 PPT,2019 最新教程《深度学习数学基础》发布!
|
机器学习/深度学习 人工智能 数据挖掘
李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!
李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!
1925 0
李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!