文本相似度分析:
def knn(k,testdata,traindata,labels): trainsize=traindata.shape[0] dif=np.tile(testdata,(trainsize,1))-traindata dif_2=dif**2 row_sum=dif_2.sum(axis=1) distance=row_sum**0.5 sorted_distance=distance.argsort() count={} for i in range(0,k): vote=labels[sorted_distance[i]] count[vote]=count.get(vote,0)+1 count_sort=sorted(count,key=operator.itemgetter(1),reverse=True) count_sort[0][0]
知识点补充:
(axis 的取值方法:0-->表示行,进行列相加 1---->表示列,进行行相加 也就是 0行列相加,1列行相加)
逻辑回归:
决策树(ID3, C4.5, CART):
聚类算法原理:
bp神经网络:误差往前推
激活函数的说明:激活函数详解--小白入门必备!!
设置PIP源
使用BP神经网络进行手写体数字的识别:
关联规则分析:
apriori原理: