开源数据集网站推荐,持续更新!

简介: 开源数据集网站推荐,持续更新!

学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的地方:


  • 流行的开源数据仓库:
  1. UC Irvine Machine Learning Repository

37e6ee37b19c4d9b8abe13c6f8e0a1e2.png

  1. Kaggle datasets
  2. Amazon’s AWS datasets


  • 准入口(提供开源数据列表)
  1. http://dataportals.org/

image.png


  1. http://opendatamonitor.eu/
  2. http://quandl.com/
目录
相关文章
|
8月前
|
存储 运维 安全
隐语第二期学习内容随笔
数据要素在采集、存储等环节内外循环,数据持有方需确保内外循环中的数据安全与管控。信任焦虑源于数据权属等问题,依赖技术信任解决。隐私计算原则与开源隐语技术保障隐私安全。数据资产化驱动价值释放,技术信任促进流通,强调数据安全、隐私和信任的核心地位。
49 0
|
搜索推荐 数据可视化 数据安全/隐私保护
免费、强大的开源笔记软件Joplin综合评测 —印象笔记的开源替代
Joplin 介绍 绝大部分开源工具都是免费的。如果寻找免费的笔记应用,自然需要考虑开源笔记软件。 在我的视野范围内,常见开源笔记软件包括Boostnote、GitNote、Joplin. 其中,前两者都是面向开发人员,全平台、支持中文、支持浏览器插件和扩展。而 Joplin 则面向一般用户。下面主要介绍 Joplin.
1934 0
免费、强大的开源笔记软件Joplin综合评测 —印象笔记的开源替代
|
3月前
|
人工智能 自然语言处理 算法
几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
【10月更文挑战第8天】几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
186 1
|
6月前
|
机器学习/深度学习 算法 搜索推荐
一个开源且全面的C#算法实战教程
一个开源且全面的C#算法实战教程
105 0
|
7月前
|
Web App开发 JavaScript
技术经验解读:【原创开源项目】EPUBBuilder一款在线的epub电子书编辑工具
技术经验解读:【原创开源项目】EPUBBuilder一款在线的epub电子书编辑工具
158 0
|
自然语言处理 测试技术 编译器
社区供稿 | 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0 再创榜单新高,魔搭开源可体验!
使用自然语言生成高质量的代码是大模型落地中的高频需求。近日,IDEA研究院封神榜团队正式开源最新的代码大模型Ziya-Coding-34B-v1.0,我们在HumanEval Pass@1的评测上,取得了75.5的好成绩,超过了GPT-4(67.0)的得分,也成为目前已知开源模型新高。
|
8月前
|
存储 监控 安全
隐语第一期学习内容随笔
构建基于技术信任的数据可信流通体系,确保数据传输、处理、存储安全可控,防范持有权风险和越权使用导致的数据泄露、篡改。密态数据和密态天空计算强化数据安全,实现跨云互联。内外循环管理数据安全域,全程保障涉及身份确认、利益对齐等环节,依赖先进加密和跨域管控技术。
58 0
|
存储 Kubernetes JavaScript
🚀 2023 年你必须贡献的 9 个国外开源库 🔥
🚀 2023 年你必须贡献的 9 个国外开源库 🔥
🚀 2023 年你必须贡献的 9 个国外开源库 🔥
|
机器学习/深度学习 人工智能 数据可视化
还在用PPT做神经网络架构图?GitHub2万星项目,手把手教你从入门到可视化大师
现在搞机器学习的成本越来越低了,熟悉了Python和sklearn、Keras、Pytorch等机器学习框架,就能搭建自己的模型了,可是模型建好后如何解释给别人听,难倒了不少人。今天,我们就来介绍两款开源的机器学习画图工具,让你分分钟做出精美的可视化。
2166 0
|
Web App开发 搜索推荐 数据库
写论文经常用到的网站、工具、技巧汇总【持续更新】
写论文经常用到的网站、工具、技巧汇总【持续更新】
334 0
写论文经常用到的网站、工具、技巧汇总【持续更新】