临行在即,分享一个自己写的sklearn源码库

简介: 考虑接下来一段时间会出差在外,现将自己近1个月来学习ML算法的一点成果做以分享,相关源码纯干货版本已上传至GitHub,有需要者可通过"阅读原文"连接自行clone

640.pngmySKlearn工程文件结构


640.png

GitHub仓库目录



几点说明:

  • 算法进度:当前已完成大部分经典算法,包括:
  • 线性回归模型3个、线性分类(逻辑斯蒂回归)1个
  • 朴素贝叶斯2个,多项式NB和高斯NB
  • 决策树分类和回归各1个
  • K近邻分类和回归各1个
  • Kmeans聚类1个
  • 降维算法1个,PCA
  • 常用预处理模型
  • 常用模型选择函数及网格搜索类
  • 常用评价指标
  • 程序规范:代码基本符合sklearn标准,包括参数命名、接口规范等
  • 代码来源:90%以上源码为个人学习后根据理解编写,极少数有参考sklearn官方源码(如调整兰德指数源码)或他人成果(ID3决策树实现和LinearRegression中梯度下降求解)
  • 算法测试:毫无疑问,当前算法还远远达不到鲁棒性标准,仅添加了部分对数据的断言,遇到不合法输入还可能会出bug或报错
  • 后续:下步将逐步添加SVM以及部分集成学习算法实现,并持续优化已有算法实现


源码断续更新中……


640.png

目录
相关文章
|
25天前
|
机器学习/深度学习 算法 数据挖掘
sklearn-决策树
sklearn-决策树
27 0
|
3月前
|
算法
sklearn算法
sklearn算法
22 0
|
机器学习/深度学习 算法 计算机视觉
使用sklearn进行特征选择
背景 一个典型的机器学习任务,是通过样本的特征来预测样本所对应的值。如果样本的特征少,我们会考虑增加特征。而现实中的情况往往是特征太多了,需要减少一些特征。
|
4月前
|
机器学习/深度学习 算法 数据挖掘
sklearn
sklearn 是一个基于 Python 的机器学习库,它提供了大量的机器学习算法和工具,旨在帮助数据科学家和机器学习工程师快速、简单地实现和测试机器学习模型。
46 2
|
10月前
|
API Python
Sklearn介绍3
Sklearn介绍
74 0
|
10月前
|
数据挖掘
Sklearn介绍1
Sklearn介绍
127 0
|
10月前
|
机器学习/深度学习 API
sklearn相关3
sklearn介绍
89 1
|
10月前
|
机器学习/深度学习
Sklearn介绍2
Sklearn介绍
58 0
sklearn.preprocessing.PolynomialFeatures多项式特征
sklearn.preprocessing.PolynomialFeatures多项式特征
75 0
|
机器学习/深度学习 算法
sklearn集成学习之VotingClassifier
sklearn集成学习之VotingClassifier
sklearn集成学习之VotingClassifier

热门文章

最新文章