数据挖掘开源项目立项

简介: 项目背景 因为最近一直都在搞数据挖掘类的项目,且现在国内的大数据潮火热。在前几天与群里的几位兄弟聊天所以有了做一个开源项目的想法,以前也搞过一个开源的项目,当时只是想把权限集中化做一下,项目的名称和地址是: http://www.cnblogs.com/skyme/archive/2012/02/07/2341364.html 但是后期实在工作太忙,就搁置在那里了。

项目背景

因为最近一直都在搞数据挖掘类的项目,且现在国内的大数据潮火热。在前几天与群里的几位兄弟聊天所以有了做一个开源项目的想法,以前也搞过一个开源的项目,当时只是想把权限集中化做一下,项目的名称和地址是:

http://www.cnblogs.com/skyme/archive/2012/02/07/2341364.html

但是后期实在工作太忙,就搁置在那里了。

所以现在又搞了一个,目前方向已经大致明确,下边介绍一下思路。

仿今日头条

java+新闻等+仿今日头条+大数据分析和挖掘(分类器+聚类分析+推荐系统等)

经过大家几天的讨论,项目方向已经基本确定!

在github上会发起新项目

这个是讨论的投票结果,结果见下图。

image

系统定位

所有的app都可以接入,不重点做app端,而是做个性化推荐这一块,在服务端。

项目目前的思路如下图所示:

项目架构

目的是提供一个大众化的信息收集系统,让今日头条中所使用的技术不再神秘。

有想参与的可以一起进来讨论

群号 194338168
想深度参与的加,不想参与的就别往里进了,现在需要的主要是开发和文档两类人。群会定期往出清人! (项目会开源出来)

目录
相关文章
|
5月前
|
机器学习/深度学习 数据采集 算法
数据科学基础:数据挖掘与分析的技术探讨
【6月更文挑战第15天】本文探讨数据科学中的数据挖掘与分析技术,阐述其基础理论,包括数据预处理、探索和模型建立,并介绍统计分析、机器学习、深度学习等方法。面对数据质量、算法选择等挑战,数据挖掘在智能决策、个性化服务、预测等方面展现广阔前景,将在跨领域融合中发挥更大作用,同时也需关注隐私安全与技术伦理。
|
数据采集 机器学习/深度学习 大数据
数据科学与数据治理项目全纪录
数据科学与数据治理项目全纪录
|
人工智能 运维 数据可视化
参与共建 SolidUI AI 生成可视化项目:开源社区的力量
SolidUI是一个开源的AI生成可视化项目,旨在帮助开发者快速构建可视化界面。我们诚挚邀请您加入SolidUI社区,与我们共同打造更加优秀的开源项目。本文将为您介绍如何参与到SolidUI的共建中来,包括相关链接、当前项目进展以及如何为项目做出贡献。
133 0
|
SQL 机器学习/深度学习 人工智能
门外汉掌握数据分析处理技术的路线图
数据分析的学习思路与技术分享
210 0
门外汉掌握数据分析处理技术的路线图
2019国内外大数据挖掘工具有哪些?有什么特点?
数据挖掘工具是使用大数据挖掘技术从互联网的海量数据中发现、采集并挖掘出有有价值数据一种软件。利用特定的技术,例如:Hadoop、Spark……实现对互联网非机构化的大数据进行挖掘并获得正确、有价值数据的一种快速、便捷的方法。
2900 0
|
人工智能 数据挖掘 数据采集
人工智能相关职位数据分析-需求分析
数据收集-爬虫阶段需求 1.利用爬虫收集各大招聘网站的职位数据 2.收集不同职位的招聘信息数据 3.收集全国范围内的招聘信息数据 4.收集字段要求: 职位名title 公司名company 工作地点workPlace(最好精确到市下面的区) 薪资sal...
1368 0
|
机器学习/深度学习 算法 数据挖掘
细数数据科学团队中的十大关键角色
应用数据科学是一项高度跨学科的团队工作,需要用多样性的角度看问题。事实上,比起专业知识和经验,观点和态度的重要性也不容小觑。以下是我对数据科学团队构成的看法。
2676 0
|
数据挖掘
如何打造数据科学团队,你想知道的都在这里
本文的两位作者分别是 Instacart 负责数据科学业务的副总裁 Jeremy Stanley,以及技术顾问、LinkedIn 前数据业务负责人 Daniel Tunkelang。
1548 0
|
机器学习/深度学习 算法 数据挖掘