快速入门Python机器学习(14)

简介: 快速入门Python机器学习(14)

我的Django电子商务代码已经可以支持Django 4.X版本了,由于github很慢,现在放到百度网盘上了。链接:https://pan.baidu.com/s/1FEs6lggPtPplnYTsyEbaSg?pwd=7gq1提取码:7gq1


8.2 SVC


8.2.1 SVC类参数、属性和方法


class sklearn.svm.SVC(*, C=1.0, kernel='rbf', degree=3, gamma='scale', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_iter=- 1, decision_function_shape='ovr', break_ties=False, random_state=None)


参数

属性

类型

解释

C

float, default=1.0

正则化参数。正则化的强度与c成反比。必须严格为正。惩罚是l2平方惩罚。

kernel

{'linear', 'poly', 'rbf', 'sigmoid', 'precomputed'}, default='rbf'

指定算法中要使用的内核类型。它必须是'linear', 'poly', 'rbf', 'sigmoid', 'precomputed'或可调用类型之一。如果没有给出,将使用‘rbf’。如果给定了一个可调用的,它被用来从数据矩阵中预先计算内核矩阵;该矩阵应该是形状数组(n_samples, n_samples)

gamma

{'scale', 'auto' or float, default='scale'

'rbf','poly''sigmoid'的核系数。如果gamma='scale '(默认值)被传递,那么它使用1 / (n_features * X.var())作为gamma的值,如果'auto',则使用1 / n_features


属性

属性

类型

class_weight_

ndarray of shape (n_classes,)

classes_

ndarray of shape (n_classes,)

coef_

is a readonly property derived from dual_coef_ and support_vectors_.

coef_

ndarray of shape (n_classes * (n_classes - 1) / 2, n_features)

dual_coef_

ndarray of shape (n_classes -1, n_SV)

fit_status_

int

intercept_

ndarray of shape (n_classes * (n_classes - 1) / 2,)

support_

ndarray of shape (n_SV)

support_vectors_

ndarray of shape (n_SV, n_features)

n_support_

ndarray of shape (n_classes,), dtype=int32

probA_

_ndarray of shape (n_classes * (n_classes - 1) / 2)

probB

_ndarray of shape (n_classes * (n_classes - 1) / 2)

shape_fit_

tuple of int of shape (n_dimensions_of_X,)


方法

decision_function(X)

计算X中样本的决策函数。

fit(X, y[, sample_weight])

根据给定的训练数据拟合SVM模型。

get_params([deep])

获取此估计器的参数。

predict(X)

X中的样品进行分类。

score(X, y[, sample_weight])

返回给定测试数据和标签的平均精度。

set_params(**params)

设置此估计器的参数。


8.2.2 SVC原理(分析make_blobs数据)

def SVC_Theory():
myutil = util()
#创建50个数据点,分成2类
X , y = make_blobs(n_samples=50,random_state=6,centers=2)
for kernel in ['linear','rbf','sigmoid','poly']:
    for gamma in ['scale', 'auto',0.1,0.01,0.001]:
        clf = SVC(kernel=kernel,gamma=gamma,C=1000)# C-SVC的惩罚参数C,默认值是1.0
        clf.fit(X,y) 
        plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.Paired,s=30)
        ax = plt.gca
        xlim = ax.get_xlim()
        ylim = ax.get_ylim()
        xx = np.linspace(xlim[0],xlim[1],30)
        yy = np.linspace(ylim[0],ylim[1],30)
        YY , XX = np.meshgrid(yy,xx) 。
        xy = np.vstack([XX.ravel(),YY.ravel()]).T
        Z = clf.decision_function(xy). reshape(XX.shape) 
        ax.contour(XX,YY,Z,colors='k',levels=[-1,0,1],alpha=0.5,linestyles=['--','-','--']) #绘制等高线
        ax.scatter(clf.support_vectors_[:,0],clf.support_vectors_[:,1],s=100,linewidth=1,facecolors='none')
        title=u"VC原理,"+kernel+",gamma="+str(gamma)
        myutil.show_pic(title)


       kernel=linner (线性核) 基本一致


image.png

image.png

image.png

image.png

image.png


kernel=rbf (径向基函数核(高斯核)),第2、3最好

image.png

image.png

image.png

image.png

image.png


kernel= Sigmoid (Sigmoid核)

image.png

image.png

image.pngimage.png


kernel=poly(多项式核) 最后一个很好

image.png

image.png

image.png

image.png

image.png


8.2.3 SVC分析鸢尾花数据

#SVC分析鸢尾花数据
def SVC_for_load_iris():
       warnings.filterwarnings("ignore")
       myutil = util()
       X,y = datasets.load_iris().data,datasets.load_iris().target
       X1 = datasets.load_iris().data[:,:2]
       X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
       for kernel in ['linear','rbf','sigmoid','poly']:
              for gamma in ['scale', 'auto',0.1,0.01,0.001]:
                     clf = SVC(max_iter=100000,kernel=kernel,gamma=gamma)
                     clf.fit(X_train, y_train)
                     title = "SVC_鸢尾花数据,kernel="+kernel+",gamma="+str(gamma)
                     myutil.print_scores(clf,X_train,y_train,X_test,y_test,title)
                     myutil.plot_learning_curve(SVC(max_iter=100000,kernel=kernel,gamma=gamma),X,y,title)
                     myutil.draw_scatter(X,y,clf,title)
                     myutil.show_pic(title)
                     clf = SVC(max_iter=100000,kernel=kernel,gamma=gamma).fit(X1,y)
                     myutil.draw_scatter_for_clf(X1,y,clf,title)


输出
SVC_鸢尾花数据,kernel=linear,gamma=scale:
99.17%
SVC_鸢尾花数据,kernel=linear,gamma=scale:
100.00%
SVC_鸢尾花数据,kernel=linear,gamma=auto:
99.17%
SVC_鸢尾花数据,kernel=linear,gamma=auto:
100.00%
SVC_鸢尾花数据,kernel=linear,gamma=0.1:
99.17%
SVC_鸢尾花数据,kernel=linear,gamma=0.1:
100.00%
SVC_鸢尾花数据,kernel=linear,gamma=0.01:
99.17%
SVC_鸢尾花数据,kernel=linear,gamma=0.01:
100.00%
SVC_鸢尾花数据,kernel=linear,gamma=0.001:
99.17%
SVC_鸢尾花数据,kernel=linear,gamma=0.001:
96.67%
SVC_鸢尾花数据,kernel=rbf,gamma=scale:
96.67%
SVC_鸢尾花数据,kernel=rbf,gamma=scale:
96.67%
SVC_鸢尾花数据,kernel=rbf,gamma=auto:
97.50%
SVC_鸢尾花数据,kernel=rbf,gamma=auto:
96.67%
SVC_鸢尾花数据,kernel=rbf,gamma=0.1:
97.50%
SVC_鸢尾花数据,kernel=rbf,gamma=0.1:
96.67%
SVC_鸢尾花数据,kernel=rbf,gamma=0.01:
95.00%
SVC_鸢尾花数据,kernel=rbf,gamma=0.01:
86.67%
SVC_鸢尾花数据,kernel=rbf,gamma=0.001:
70.00%
SVC_鸢尾花数据,kernel=rbf,gamma=0.001:
53.33%
SVC_鸢尾花数据,kernel=sigmoid,gamma=scale:
6.67%
SVC_鸢尾花数据,kernel=sigmoid,gamma=scale:
10.00%
SVC_鸢尾花数据,kernel=sigmoid,gamma=auto:
4.17%
SVC_鸢尾花数据,kernel=sigmoid,gamma=auto:
3.33%
SVC_鸢尾花数据,kernel=sigmoid,gamma=0.1:
5.83%
SVC_鸢尾花数据,kernel=sigmoid,gamma=0.1:
6.67%
SVC_鸢尾花数据,kernel=sigmoid,gamma=0.01:
70.00%
SVC_鸢尾花数据,kernel=sigmoid,gamma=0.01:
53.33%
SVC_鸢尾花数据,kernel=sigmoid,gamma=0.001:
70.00%
SVC_鸢尾花数据,kernel=sigmoid,gamma=0.001:
53.33%
SVC_鸢尾花数据,kernel=poly,gamma=scale:
98.33%
SVC_鸢尾花数据,kernel=poly,gamma=scale:
93.33%
SVC_鸢尾花数据,kernel=poly,gamma=auto:
99.17%
SVC_鸢尾花数据,kernel=poly,gamma=auto:
93.33%
SVC_鸢尾花数据,kernel=poly,gamma=0.1:
97.50%
SVC_鸢尾花数据,kernel=poly,gamma=0.1:
93.33%
SVC_鸢尾花数据,kernel=poly,gamma=0.01:
89.17%
SVC_鸢尾花数据,kernel=poly,gamma=0.01:
86.67%
SVC_鸢尾花数据,kernel=poly,gamma=0.001:
57.50%
SVC_鸢尾花数据,kernel=poly,gamma=0.001:
50.00%

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.pngimage.png


比较差

微信图片_20230215142744.png

很差

微信图片_20230215142751.png

很差

微信图片_20230215142755.png

很差

微信图片_20230215142839.png

很差

微信图片_20230215142843.png

很差。可见Kernel=sigmoid基本上都很差。

微信图片_20230215142905.png

微信图片_20230215142910.png


微信图片_20230215142914.png

微信图片_20230215142952.png

微信图片_20230215142957.png

很差


微信图片_20230215143001.png

微信图片_20230215143054.png

微信图片_20230215143058.png

微信图片_20230215143102.png

微信图片_20230215143130.png

微信图片_20230215143134.png

微信图片_20230215143141.png

微信图片_20230215143208.png

微信图片_20230215143218.png

微信图片_20230215143222.png

很差

微信图片_20230215143248.png

很差

微信图片_20230215143252.png

很差

微信图片_20230215143333.png

微信图片_20230215143338.png

微信图片_20230215143344.png

微信图片_20230215143537.png

微信图片_20230215143541.png

微信图片_20230215143545.png

微信图片_20230215143615.png




目录
相关文章
|
3月前
|
机器学习/深度学习 数据可视化 数据处理
掌握Python数据科学基础——从数据处理到机器学习
掌握Python数据科学基础——从数据处理到机器学习
69 0
|
3月前
|
机器学习/深度学习 数据采集 人工智能
机器学习入门:Python与scikit-learn实战
机器学习入门:Python与scikit-learn实战
107 0
|
3月前
|
机器学习/深度学习 数据采集 数据挖掘
Python在数据科学中的应用:从数据处理到模型训练
Python在数据科学中的应用:从数据处理到模型训练
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据科学实战:从Pandas到机器学习
Python数据科学实战:从Pandas到机器学习
|
3月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
179 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
3月前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
88 2
|
23天前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
58 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
2月前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
52 14
|
2月前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
116 2
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
126 80

热门文章

最新文章

推荐镜像

更多