小森ai小小贾_社区达人页

个人头像照片
小森ai小小贾
已加入开发者社区296

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
江湖新秀
江湖新秀

成就

已发布137篇文章
14条评论
已回答1个问题
0条评论
已发布0个视频
github地址

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

AI冲

暂无精选文章
暂无更多信息

2024年06月

  • 06.22 09:50:52
    发表了文章 2024-06-22 09:50:52

    机器学习项目实践-基础知识部分

    创建Python隔离环境使用`python -m venv`命令,如`python -m venv ml`来创建名为`ml`的虚拟环境。激活环境通过`.\<Scripts>\activate`(Windows)。然后可以使用`pip`安装库,如`numpy`、`pandas`、`matplotlib`和`jupyter notebook`。在虚拟环境中,`numpy`是用于数组计算的库,支持数学操作和绘图。`pip install`命令后面可添加`-i Simple Index`指定索引源。完成安装后,激活环境并启动`jupyter notebook`进行开发。
  • 06.22 09:50:10
    发表了文章 2024-06-22 09:50:10

    神经网络中的归一化

    **神经网络中的归一化方法加速和稳定学习,避免梯度问题。通过批量归一化(Batch Normalization),每个mini-batch数据被调整至均值0、标准差1的分布,减少数据分布变化带来的不稳定性,提升模型训练速度与泛化能力。归一化也包括L1和L2正则化,如sklearn库中的Lasso和Ridge实现。批量归一化层如PyTorch中的`nn.BatchNorm2d`,调整输入数据分布并学习可变参数。**
  • 06.22 09:46:52
    发表了文章 2024-06-22 09:46:52

    神经网络之防止过拟合

    防止神经网络过拟合的方法包括正则化,如L1(Lasso)和L2(岭回归)正则化,以及Dropout技术。L1正则化能产生稀疏权重,帮助特征选择;L2正则化避免权重过大但不使其为零。Dropout在训练时随机关闭部分神经元,减少依赖,提高模型泛化能力。此外,还有数据增强、早停法等策略来改善过拟合问题。
  • 06.22 09:40:08
    发表了文章 2024-06-22 09:40:08

    Stable Diffusion AI绘画

    Stable Diffusion是人工智能领域的文本到图像生成模型,基于概率的连续扩散过程,学习数据潜在分布并生成新样本。模型使用Web UI进行交互,提供不同采样器如Euler和DPM++,后者常配以Karras算法。提示词对生成效果至关重要,可以利用GPT等生成提示词。用户还能调整参数如高清修复和批处理次数来影响生成的图像。此外,模型文件(ckpt/safetensors)和Lora微调模型需存放在正确目录以确保功能正常。
  • 06.22 09:35:51
    发表了文章 2024-06-22 09:35:51

    神经网络反向传播算法

    神经网络中的反向传播算法是用于训练的关键步骤,通过计算损失函数梯度更新权重。它始于前向传播,即输入数据通过网络得出预测输出,接着计算预测与实际值的误差。反向传播利用链式法则从输出层开始逐层计算误差,更新每一层的权重和偏置。例如,一个包含隐藏层的网络,初始权重随机设定,通过反向传播计算损失函数梯度,如sigmoid激活函数的网络,调整权重以减小预测误差。在Python的PyTorch框架中,可以使用`nn.Linear`定义层,`optimizer`进行参数优化,通过`backward()`计算梯度,`step()`更新参数。
  • 06.22 09:35:19
    发表了文章 2024-06-22 09:35:19

    神经网络的反向传播

    梯度下降是神经网络中的优化算法,用于找目标函数最小值,通过梯度指示的最速下降方向调整参数。学习率η控制步长,过大可能导致震荡,过小则收敛慢。初始点随机选择,可能影响找到的最小值。梯度下降有三种方式:批量(BGD)、随机(SGD)和小批量(MBGD),主要区别在于Batch Size。SGD速度快但波动大,BGD准确但慢,MBGD是折中。在训练中,Epoch是完整遍历数据集的次数,Batch是每次处理的数据子集,Iteration是参数更新的次数。反向传播利用链式法则计算损失函数梯度,更新权重。
  • 06.22 09:01:38
    发表了文章 2024-06-22 09:01:38

    Pytorch实现线性回归模型

    在机器学习和深度学习领域,线性回归是一种基本且广泛应用的算法,它简单易懂但功能强大,常作为更复杂模型的基础。使用PyTorch实现线性回归,不仅帮助初学者理解模型概念,还为探索高级模型奠定了基础。代码示例中,`creat_data()` 函数生成线性回归数据,包括噪声,`linear_regression()` 定义了线性模型,`square_loss()` 计算损失,而 `sgd()` 实现了梯度下降优化。
  • 06.22 08:59:41
    发表了文章 2024-06-22 08:59:41

    神经网络的激活函数(二)

    本文介绍了神经网络中的激活函数,特别是tanh和ReLU。tanh函数将输入映射到(-1,1),以0为中心,加快了训练速度,但两侧导数为0可能导致梯度消失。ReLU函数在正区间的导数为1,解决了梯度消失问题,常用于隐藏层。softmax函数用于多分类,将输出转换为概率分布。文章还包含了代码示例,展示了这些函数的图形和导数。
  • 06.22 08:59:30
    发表了文章 2024-06-22 08:59:30

    神经网络的激活函数(一)

    人工神经网络( Artificial Neural Network, 简写为ANN)也简称为神经网络(NN),是一种模仿生物神经网络结构和功能的 计算模型。人脑可以看做是一个生物神经网络,由众多的神经元连接而成。各个神经元传递复杂的电信号,树突接收到输入信号,然后对信号进行处理,通过轴突输出信号。
  • 06.22 08:46:38
    发表了文章 2024-06-22 08:46:38

    Pytorch-自动微分模块

    PyTorch的torch.autograd模块提供了自动微分功能,用于深度学习中的梯度计算。它包括自定义操作的函数、构建计算图、数值梯度检查、错误检测模式和梯度模式设置等组件。张量通过设置`requires_grad=True`来追踪计算,`backward()`用于反向传播计算梯度,`grad`属性存储张量的梯度。示例展示了如何计算标量和向量张量的梯度,并通过`torch.no_grad()`等方法控制梯度计算。在优化过程中,梯度用于更新模型参数。注意,使用numpy转换要求先`detach()`以避免影响计算图。
  • 06.22 08:46:16
    发表了文章 2024-06-22 08:46:16

    LLM-AI大模型介绍

    大语言模型(LLM)是深度学习的产物,包含数十亿至数万亿参数,通过大规模数据训练,能处理多种自然语言任务。LLM基于Transformer架构,利用多头注意力机制处理长距离依赖,经过预训练和微调,擅长文本生成、问答等。发展经历了从概率模型到神经网络,再到预训练和大模型的演变。虽然强大,但存在生成不当内容、偏见等问题,需要研究者解决。评估指标包括BLEU、ROUGE和困惑度PPL。
  • 06.22 08:37:41
    发表了文章 2024-06-22 08:37:41

    Pytorch-张量形状操作

    PyTorch中,张量形状操作至关重要,如reshape用于改变维度而不变元素,transpose/permute用于维度交换,view改形状需内存连续,squeeze移除单维度,unsqueeze添加维度。这些函数帮助数据适应神经网络层间的转换。例如,reshape能调整数据适配层的输入,transpose用于矩阵转置或多维排列,而squeeze和unsqueeze则用于处理单维度。理解并熟练运用这些工具是深度学习中必要的技能。
  • 06.22 08:33:06
    发表了文章 2024-06-22 08:33:06

    Pytorch - 张量转换拼接

    使用 Tensor.numpy 函数可以将张量转换为 ndarray 数组,但是共享内存,可以使用 copy 函数避免共享。
  • 06.22 08:32:22
    发表了文章 2024-06-22 08:32:22

    如何使用Docker部署WPS Office服务并实现无公网IP远程处理文档表格(二)

    使用Docker部署的WPS Office服务可以通过内网穿透工具Cpolar实现远程访问。首先,创建一个名为“wps office”的隧道,选择HTTP协议和3000端口,分配免费的随机域名,并指定中国地区。然后,通过Cpolar的管理界面获取HTTP公网地址,用以远程访问WPS Office。由于随机域名会变化,可以升级Cpolar套餐并保留一个二级子域名,确保长期稳定的远程访问。配置子域名后,更新隧道设置,完成固定公网地址的绑定,从而实现随时随地通过固定地址访问WPS Office。
  • 06.22 08:26:34
    发表了文章 2024-06-22 08:26:34

    如何使用Docker部署WPS Office服务并实现无公网IP远程处理文档表格(一)

    在群晖NAS上使用Docker部署WPS Office并结合Cpolar内网穿透的步骤包括: 1. 通过SSH命令行拉取`linuxserver/wps-office`镜像。 2. 在群晖容器管理界面运行镜像,设置启动选项和端口映射。 3. 本地访问群晖IP:3000端口以使用WPS Office。 4. 安装Cpolar套件,手动添加并安装到群晖,通过9200端口访问其Web管理界面。 5. 使用Cpolar配置内网穿透,实现远程访问WPS Office。 这一过程允许用户即使在没有公网IP的情况下,也能通过Cpolar将内网的WPS Office服务暴露到公网,便于远程办公和文档处理。
  • 06.22 08:17:16
    发表了文章 2024-06-22 08:17:16

    Pytorch-张量基础操作

    张量是一个多维数组,它是标量、向量和矩阵概念的推广。在深度学习中,张量被广泛用于表示数据和模型参数。
  • 06.22 08:16:47
    发表了文章 2024-06-22 08:16:47

    PyTorch-张量

    PyTorch 是Facebook AI团队开发的深度学习框架,其核心是张量,它是同类型数据的多维数组。张量可以通过`torch.tensor()`、`torch.Tensor()`、指定类型如`IntTensor`等创建。张量操作包括线性(`torch.arange`, `torch.linspace`)、随机(`torch.randn`, `torch.manual_seed`)和全0/1张量(`torch.zeros`, `torch.ones`)。张量间可进行阿达玛积(逐元素相乘),类型转换用`type()`或`double()`。
  • 06.22 08:06:48
    发表了文章 2024-06-22 08:06:48

    AI - 机器学习GBDT算法

    梯度提升决策树(Gradient Boosting Decision Tree),是一种集成学习的算法,它通过构建多个决策树来逐步修正之前模型的错误,从而提升模型整体的预测性能。
  • 06.22 08:06:43
    发表了文章 2024-06-22 08:06:43

    AI - 集成学习

    集成学习是一种机器学习策略,它通过组合多个模型(称为基学习器)来创建一个更强大、更稳健的预测模型。基学习器可以是不同类型或同类型的模型,如决策树、SVM、神经网络等。
  • 06.22 07:58:51
    发表了文章 2024-06-22 07:58:51

    AI - 支持向量机算法

    **支持向量机(SVM)**是一种用于二分类的强大学习算法,寻找最佳超平面以最大化类别间间隔。对于线性可分数据,SVM通过硬间隔最大化找到线性分类器;非线性数据则通过核技巧映射到高维空间,成为非线性分类器。SVM利用软间隔处理异常或线性不可分情况,并通过惩罚参数C平衡间隔和误分类。损失函数常采用合页损失,鸢尾花数据集常用于SVM的示例实验。
  • 06.22 07:49:24
    发表了文章 2024-06-22 07:49:24

    AI - 决策树模型

    决策树算法起源于古希腊的逻辑推理,20世纪在军事策略研究中首次提出。它通过构建树形模型模拟决策过程,每个节点代表一个属性判断,分支代表可能结果。ID3算法基于信息增益,C4.5则引入信息增益率,解决了ID3偏好多值属性的问题,还能处理缺失值。CART决策树适用于分类和回归任务,使用基尼系数或信息增益来选择特征。在Python的`sklearn`库中,`DecisionTreeClassifier`实现决策树分类,通过参数如`criterion`、`max_depth`等控制模型。
  • 06.22 07:44:04
    发表了文章 2024-06-22 07:44:04

    计算机网络基础

    网络是我们生活中不可或缺的部分,通过手机、电脑和平板等设备连接。OSI模型是通信的理论框架,分为7层,从下至上分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,分别处理硬件连接、数据传输、路由、端到端通信等任务。TCP/IP模型简化为5层,包括应用层、传输层、互联网层、链路层和物理层,TCP和UDP协议在传输层负责数据传输,IP协议在互联网层处理路由。 TCP协议提供可靠的、面向连接的服务,通过三次握手建立连接,四次挥手断开连接。UDP则是无连接、不可靠的,但速度较快。端口号标识不同应用,如HTTP的80端口。Socket是网络通信的基本接口,用于创建和管理网络连接。
  • 06.22 07:43:57
    发表了文章 2024-06-22 07:43:57

    AI-逻辑回归模型

    逻辑回归是一种用于分类问题的统计模型,尤其适合二分类任务,如预测广告点击率、判断邮件是否为垃圾邮件、评估疾病风险和预测信用卡违约等。模型通过线性方程(logit函数)结合Sigmoid函数将结果映射到0到1区间,表示概率。损失函数通常使用交叉熵,优化时常用梯度下降。评估指标包括ROC曲线和AUC,后者衡量模型整体性能,值越接近1表示性能越好。在不平衡数据集上,可使用`class_weight='balanced'`来调整样本权重。
  • 06.22 07:30:40
    发表了文章 2024-06-22 07:30:40

    AI-线性回归模型(二)

    这篇内容介绍了梯度下降法在机器学习中的应用,特别是在线性回归中的角色。它是一种迭代优化算法,用于找到损失函数最小值的参数。全梯度下降(FGD)使用所有数据计算梯度,适合大数据但计算成本高;随机梯度下降(SGD)随机选取样本,速度快但可能收敛到局部最小值。随机平均梯度下降(SAG)结合两者的优点,提高收敛速度。评估线性回归模型的性能通常使用平均绝对误差、均方误差和均方根误差。文中还展示了波士顿房价预测案例,使用SGDRegressor进行训练,并讨论了学习率的影响。最后提到了如何使用`joblib`库保存和加载模型。
  • 06.22 07:30:17
    发表了文章 2024-06-22 07:30:17

    AI-线性回归模型(一)

    线性回归是用于分析变量间线性关系的统计方法,常见于房价预测、销售额预测和贷款额度评估。通过最小二乘法寻找最佳直线方程y=wx+b,其中y是因变量,x是自变量,w和b是模型参数。在Python的`sklearn`库中,使用`LinearRegression`类可构建模型,通过`fit`训练和`predict`进行预测。损失函数通常用平方损失(均方误差)衡量预测误差,优化目标是最小化这些误差的平方和。
  • 06.22 07:26:07
    发表了文章 2024-06-22 07:26:07

    K 近邻算法(二)

    K-近邻(KNN)算法是一种监督学习方法,用于分类和回归。关键步骤包括计算新样本与训练样本的距离,选择合适的邻近样本数K,基于K个邻居的多数类别或平均值做出预测。K值的选择影响模型性能:小K易受噪声影响(过拟合),大K可能导致模型过于简单(欠拟合)。评估模型通常使用测试集的预测准确率,如sklearn.metrics.accuracy_score。最优K值可通过交叉验证,如GridSearchCV,来确定,但它可能计算密集。KNN常用于手写数字识别等任务,如MNIST数据集。
  • 06.22 07:16:23
    发表了文章 2024-06-22 07:16:23

    K 近邻算法(一)

    本文介绍了KNN算法的基本概念、步骤、优缺点,以及在图像识别、文本分类、回归预测、医疗诊断和金融风控等领域的应用。重点讲解了数据预处理、模型训练、评估方法和参数选择策略,包括K值确定、交叉验证和GridSearchCV的使用。
  • 06.21 20:48:07
    发表了文章 2024-06-21 20:48:07

    神经网络中的优化方法

    摘要: 这篇内容介绍了梯度下降优化算法在机器学习中的挑战,如平缓区域、鞍点和局部最小值,以及如何通过改进策略来克服这些问题。文章提到了几种优化方法,包括Momentum、AdaGrad、RMSprop和Adam。Momentum通过累积历史梯度信息来调整参数更新,帮助模型在训练过程中更快地收敛。AdaGrad和RMSprop解决了AdaGrad学习率过早衰减的问题,RMSprop结合了Momentum和AdaGrad的优势,通过一阶矩估计和二阶矩估计动态调整学习率,尤其适用于大规模数据集和复杂模型。Adam是RMSprop的一个变种,是深度学习中最常用的优化器之一。
  • 06.21 20:38:14
    发表了文章 2024-06-21 20:38:14

    神经网络参数初始化

    **神经网络参数初始化**是深度学习的关键步骤。权重常通过**Xavier**或**He**初始化来打破对称性,适用于ReLU激活;而偏置通常初始化为0。初始化方法还包括**均匀分布**、**正态分布**、**全零**、**全一**和**固定值**。在PyTorch中,`torch.nn.init`模块提供了如`xavier_uniform_`和`kaiming_normal_`等初始化函数。预训练模型也可用于初始化,通过微调提升性能。
  • 06.21 20:32:05
    发表了文章 2024-06-21 20:32:05

    YOLO算法

    YOLO(You Only Look Once)是一种实时目标检测算法,将目标检测视为回归问题,通过单个CNN模型预测边界框和类别。YOLOv1使用24个卷积层和2个全连接层,将输入图像划分为7x7网格,每个网格预测2个边界框。模型直接从448x448图像输出7x7x30的张量,每个单元负责检测中心在其内的目标。YOLO训练涉及构造训练样本和损失函数,常采用预训练的Backbone(如CSPDarknet53)和数据增强技术。YOLOv4是YOLO系列的改进版,包括SPP和PANet等结构,提升了精度和速度,使用IOU损失函数,并采用CutMix和马赛克数据增强。
  • 06.21 20:23:33
    发表了文章 2024-06-21 20:23:33

    OpenCV算法库

    numba是一个用于编译Python数组和数值计算函数的编译器,这个编译器能够大幅提高直接使用Python编写的函数的运算速度。
  • 06.21 20:23:27
    发表了文章 2024-06-21 20:23:27

    DFS算法及应用(二)

    回溯:回溯就是DFS的一种,在搜索探索过程中寻找问题的解,当发现不满足求解条件时,就回溯返回,尝试其他路径。
  • 06.21 20:22:48
    发表了文章 2024-06-21 20:22:48

    DFS算法及应用(一)

    DFS(深度优先搜索)是一种图遍历算法,常用于解决穷举问题,如全排列、迷宫问题、图的连通性等。它沿着树的深度分支进行探索,直至达到叶子节点,若无法继续则回溯。例如,将数字6拆分为3个正整数的递增序列问题可以通过DFS实现,类似地,分糖果问题和买瓜问题同样可以用DFS求解。DFS通常涉及递归或栈结构,通过标记已访问节点避免重复。在编程中,会定义递归函数,设定结束条件,然后枚举可能的情况,并处理下一层节点。
  • 06.21 20:06:25
    发表了文章 2024-06-21 20:06:25

    Docker技术仓库

    本文详细介绍了Docker中数据卷的作用、特点、管理方式,包括bindmounts和volumes挂载、Dockerfile中的数据卷使用、Docker仓库(公有与私有)以及DockerCompose在多容器应用中的应用。
  • 06.21 19:52:07
    发表了文章 2024-06-21 19:52:07

    如何在IDEA中使用固定公网地址SSH远程连接服务器开发环境(三)

    在IDEA中通过固定公网地址SSH远程连接服务器开发环境,需要配置固定TCP端口以避免地址随机变化。首先,升级cpolar至专业版及以上,然后在官网保留一个固定TCP地址。进入cpolar管理界面,编辑隧道信息,将保留的固定地址填入,更新隧道。最后,在IDEA中新建SSH连接,输入固定地址和端口,验证连接。成功后,即可稳定远程开发。
  • 06.21 19:51:52
    发表了文章 2024-06-21 19:51:52

    如何在IDEA中使用固定公网地址SSH远程连接服务器开发环境(二)

    在IDEA中通过Cpolar实现固定公网地址SSH远程连接到Linux服务器开发环境,主要步骤包括:1) 在Linux服务器上安装Cpolar,使用一键脚本进行安装和启动服务;2) 登录Cpolar Web UI,创建隧道,指定隧道名称、协议、本地地址(SSH默认端口22)、临时随机TCP端口和中国地区;3) 使用生成的公网TCP地址在IDEA中新建SSH连接,输入该地址和端口,完成远程连接。这种方式允许开发者在任何地方通过固定的公网地址进行远程开发,而无需公网IP。
  • 06.21 19:42:17
    发表了文章 2024-06-21 19:42:17

    如何在IDEA中使用固定公网地址SSH远程连接服务器开发环境(一)

    该文介绍了如何通过IDEA设置远程连接Linux服务器的步骤,使用Cpolar内网穿透工具实现在没有公网IP的情况下进行远程开发。主要内容包括检查Linux SSH服务、本地连接测试、在Linux上安装Cpolar、创建远程连接的公网地址、公网远程连接测试以及固定连接公网地址。文章还提供了相关截图辅助说明,适用于IDEA2023.2.5版本。
  • 06.21 19:37:32
    发表了文章 2024-06-21 19:37:32

    Docker核心技术(二)

    Docker核心功能包括`docker container inspect`用于检查容器详情,`docker logs`显示容器日志,`docker attach`连接容器。容器与镜像是独立的,镜像是静态的执行环境,容器是动态实例。Docker提供多种网络模式,如默认的bridge、host、none、overlay和macvlan。管理网络的命令有`docker network ls`(列出网络)、`docker network create`(创建网络)、`docker network rm`(删除网络)和`docker network inspect`(检查网络详情)。
  • 06.21 19:34:03
    发表了文章 2024-06-21 19:34:03

    Docker核心技术(一)

    本文介绍了Docker的核心技术——容器,包括容器的定义、与虚拟机的区别,以及容器的生命周期阶段(创建、运行、暂停、停止和删除)。同时详细讲解了容器的网络管理和Docker提供的五种网络驱动模式。
  • 06.21 19:27:49
    发表了文章 2024-06-21 19:27:49

    Docker介绍(二)

    Docker是基于Go语言的开源容器平台,利用Linux内核的namespace、cgroups和UnionFS等技术实现在Linux上运行。它分为社区版(Docker-CE)和企业版(Docker-EE),在CentOS上可安装Docker-CE。Docker的核心技术包括镜像,它是包含应用及环境的可执行文件,用于创建容器。常用镜像操作有搜索、查看、下载、删除、保存备份、导入、重命名和检查。
  • 06.21 19:26:56
    发表了文章 2024-06-21 19:26:56

    Docker介绍(一)

    Docker是开源的应用容器引擎,让开发者打包应用及依赖到可移植容器中,可在任何环境一致运行。它提供快速启动、高效资源利用、轻松迁移和维护,适用于开发、测试和生产。Docker由客户端、守护进程、REST API组成,支持镜像存储在仓库如Docker Hub。容器是隔离的执行环境,能在同一主机上互不影响地运行多个容器。
  • 06.21 19:19:27
    发表了文章 2024-06-21 19:19:27

    OpenCV基础(二)

    OpenCV教程概览:介绍如何在图像中绘制几何图形,如使用`cv.line`绘制直线,`cv.circle`画圆,`cv.rectangle`画矩形,并添加文字。还涵盖了图像的几何变换,包括缩放、平移、旋转和仿射变换。代码示例展示了这些操作在Python中的实现,通过`cv2.resize`进行图像缩放,`cv.getRotationMatrix2D`及`cv.warpAffine`实现旋转,以及`cv.getPerspectiveTransform`进行透射变换。
  • 06.21 19:15:20
    发表了文章 2024-06-21 19:15:20

    OpenCV基础(一)

    OpenCV是一个开源的计算机视觉库,用于图像处理和机器学习,由Intel发起,支持多种平台和语言,如Python、C++。它提供丰富的优化算法,适用于面部识别、物体识别等应用。OpenCV-Python是其Python接口,便于快速原型设计,包含多个模块,并有丰富的学习资源。基本操作包括使用`cv.imread()`读取图像,`cv.imshow()`显示图像,以及`cv.imwrite()`保存图像。
  • 06.21 19:14:08
    发表了文章 2024-06-21 19:14:08

    XGBoost算法

    XGBoost是高效、灵活且强大的梯度提升决策树算法,擅长处理结构化数据,广泛应用在数据挖掘和Kaggle竞赛中。它通过迭代地添加决策树优化目标函数,支持自定义损失函数和正则化以防止过拟合。与AdaBoost相比,XGBoost支持更复杂的基分类器,如线性模型,使用二阶导数加速优化,并有内置并行处理能力。XGBoost在模型构建时考虑缺失值处理,并提供了Python等多语言接口,便于参数调优和模型评估,如使用GridSearchCV进行交叉验证。
  • 06.21 19:00:13
    发表了文章 2024-06-21 19:00:13

    AdaBoost算法

    **AdaBoost** 是一种 Boosting 算法,通过序列训练弱分类器并赋予错误分类样本更大权重,逐步构建强分类器。它使用指数损失函数,每次迭代时,弱分类器聚焦于前一轮分类错误的样本。最终,弱分类器的预测结果按其性能加权组合成强分类器。与 Bagging 相比,Boosting 是串行的,每个模型依赖前一个模型的输出,更重视错误样本。AdaBoost 的优点包括提高弱分类器性能、鲁棒性和灵活性,但对噪声敏感且训练时间可能较长。
  • 06.21 18:59:47
    发表了文章 2024-06-21 18:59:47

    机器学习聚类算法

    聚类算法是无监督学习技术,用于发现数据集中的自然群体,如用户画像、广告推荐等。常见的聚类算法包括K-Means,它基于距离分配样本至簇,适合球形分布;层次聚类则通过合并或分裂形成簇,能发现任意形状的簇;DBSCAN依据密度来聚类,对噪声鲁棒。KMeans API中`sklearn.cluster.KMeans(n_clusters=8)`用于指定簇的数量。评估聚类效果可使用轮廓系数、SSE等指标,Elbow方法帮助选择合适的K值。
  • 06.21 17:39:29
    发表了文章 2024-06-21 17:39:29

    支持向量机(二)

    这是一个关于支持向量机(SVM)的实践教程概要。作者使用Python的sklearn库演示了SVM的步骤,包括导入库、构建数据集、训练线性SVM模型、查看模型参数、进行预测及可视化决策边界。讨论了SVM在处理线性不可分数据时使用核函数(如高斯核)的重要性,并总结了SVM的优缺点:它擅长处理高维和非线性问题,但对大规模数据和参数选择敏感,训练时间可能较长。
  • 06.21 17:39:18
    发表了文章 2024-06-21 17:39:18

    支持向量机(一)

    **支持向量机(SVM)** 是一种优雅的分类和回归算法,广泛应用于文本分类、图像识别、生物信息学和金融预测。它寻找最大化类别间边距的决策边界,适应小样本、高维和非线性问题。SVM通过核函数(如RBF)处理非线性数据,目标是找到具有最大边距的超平面,以提高泛化能力。C参数调节模型复杂度,允许数据点偏离边界的程度。
  • 06.21 17:36:12
    发表了文章 2024-06-21 17:36:12

    机器学习算法决策树(二)

    **ID3决策树算法**是1975年由J. Ross Quinlan提出的,它基于信息增益来选择最佳划分特征。信息增益是衡量数据集纯度变化的指标,熵则是评估数据不确定性的度量。算法通过比较每个特征的信息增益来选择分裂属性,目标是构建一个能最大化信息增益的决策树。然而,ID3容易偏向于选择具有更多特征值的属性,C4.5算法为解决这一问题引入了信息增益率,降低了这种偏好。CART决策树则不仅用于分类,也用于回归,并使用基尼指数或信息熵来选择分割点。剪枝是防止过拟合的重要手段,包括预剪枝和后剪枝策略。
  • 06.21 17:25:11
    发表了文章 2024-06-21 17:25:11

    机器学习算法决策树(一)

    **决策树模型**是一种直观的分类模型,常用于金融风控和医疗诊断等领域。它通过树形结构对数据进行划分,易于理解和解释,能揭示特征重要性且计算复杂度低。然而,模型可能过拟合,需剪枝处理;不擅长处理连续特征;预测能力有限,且对数据变化敏感。在集成学习如XGBoost中,决策树作为基模型广泛应用。示例代码展示了使用Python的`sklearn`库构建和可视化决策树的过程。
  • 发表了文章 2024-06-22

    LLM主要类别架构(二)

  • 发表了文章 2024-06-22

    LLM主要类别架构(一)

  • 发表了文章 2024-06-22

    大模型Prompt-Tuning技术入门(二)

  • 发表了文章 2024-06-22

    大模型Prompt-Tuning技术入门(一)

  • 发表了文章 2024-06-22

    Sklearn中逻辑回归建模

  • 发表了文章 2024-06-22

    机器学习归一化特征编码(一)

  • 发表了文章 2024-06-22

    机器学习归一化特征编码(二)

  • 发表了文章 2024-06-22

    GBDT算法超参数评估(二)

  • 发表了文章 2024-06-22

    机器学习多场景实战(二 )

  • 发表了文章 2024-06-22

    GBDT算法超参数评估(一)

  • 发表了文章 2024-06-22

    机器学习多场景实战(一)

  • 发表了文章 2024-06-22

    反向传播算法

  • 发表了文章 2024-06-22

    Transformer介绍

  • 发表了文章 2024-06-22

    梯度提升树GBDT系列算法

  • 发表了文章 2024-06-22

    BERT+PET方式模型训练(一)

  • 发表了文章 2024-06-22

    使用seq2seq架构实现英译法(二)

  • 发表了文章 2024-06-22

    使用seq2seq架构实现英译法(一)

  • 发表了文章 2024-06-22

    BERT+PET方式模型训练(二)

  • 发表了文章 2024-06-22

    大模型Prompt-Tuning技术进阶

  • 发表了文章 2024-06-22

    AB测试实战(二)

正在加载, 请稍后...
滑动查看更多
  • 回答了问题 2023-12-16

    你有哪些低成本又能保持扩展性的套路?

    单例、组合、模板设计模式
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息