小森ai小小贾_社区达人页_第2页-阿里云开发者社区

小森ai小小贾

已加入开发者社区742天

勋章更多

专家博主

星级博主

技术博主

初入江湖

成就

已发布137篇文章

14条评论

已回答1个问题

0条评论

已发布0个视频

github地址

我关注的人更多

粉丝更多

技术能力

兴趣领域

擅长领域

技术认证

暂时未有相关云产品技术能力~

AI冲

精选

高分内容

最新动态

文章
问答
视频

暂无精选文章

暂无更多信息

2024年06月

06.22 09:50:52

发表了文章 2024-06-22 09:50:52

机器学习项目实践-基础知识部分

创建Python隔离环境使用`python -m venv`命令，如`python -m venv ml`来创建名为`ml`的虚拟环境。激活环境通过`.\<Scripts>\activate`（Windows）。然后可以使用`pip`安装库，如`numpy`、`pandas`、`matplotlib`和`jupyter notebook`。在虚拟环境中，`numpy`是用于数组计算的库，支持数学操作和绘图。`pip install`命令后面可添加`-i Simple Index`指定索引源。完成安装后，激活环境并启动`jupyter notebook`进行开发。
06.22 09:50:10

发表了文章 2024-06-22 09:50:10

神经网络中的归一化

**神经网络中的归一化方法加速和稳定学习，避免梯度问题。通过批量归一化（Batch Normalization），每个mini-batch数据被调整至均值0、标准差1的分布，减少数据分布变化带来的不稳定性，提升模型训练速度与泛化能力。归一化也包括L1和L2正则化，如sklearn库中的Lasso和Ridge实现。批量归一化层如PyTorch中的`nn.BatchNorm2d`，调整输入数据分布并学习可变参数。**
06.22 09:46:52

发表了文章 2024-06-22 09:46:52

神经网络之防止过拟合

防止神经网络过拟合的方法包括正则化，如L1（Lasso）和L2（岭回归）正则化，以及Dropout技术。L1正则化能产生稀疏权重，帮助特征选择；L2正则化避免权重过大但不使其为零。Dropout在训练时随机关闭部分神经元，减少依赖，提高模型泛化能力。此外，还有数据增强、早停法等策略来改善过拟合问题。
06.22 09:40:08

发表了文章 2024-06-22 09:40:08

Stable Diffusion AI绘画

Stable Diffusion是人工智能领域的文本到图像生成模型，基于概率的连续扩散过程，学习数据潜在分布并生成新样本。模型使用Web UI进行交互，提供不同采样器如Euler和DPM++，后者常配以Karras算法。提示词对生成效果至关重要，可以利用GPT等生成提示词。用户还能调整参数如高清修复和批处理次数来影响生成的图像。此外，模型文件（ckpt/safetensors）和Lora微调模型需存放在正确目录以确保功能正常。
06.22 09:35:51

发表了文章 2024-06-22 09:35:51

神经网络反向传播算法

神经网络中的反向传播算法是用于训练的关键步骤，通过计算损失函数梯度更新权重。它始于前向传播，即输入数据通过网络得出预测输出，接着计算预测与实际值的误差。反向传播利用链式法则从输出层开始逐层计算误差，更新每一层的权重和偏置。例如，一个包含隐藏层的网络，初始权重随机设定，通过反向传播计算损失函数梯度，如sigmoid激活函数的网络，调整权重以减小预测误差。在Python的PyTorch框架中，可以使用`nn.Linear`定义层，`optimizer`进行参数优化，通过`backward()`计算梯度，`step()`更新参数。
06.22 09:35:19

发表了文章 2024-06-22 09:35:19

神经网络的反向传播

梯度下降是神经网络中的优化算法，用于找目标函数最小值，通过梯度指示的最速下降方向调整参数。学习率η控制步长，过大可能导致震荡，过小则收敛慢。初始点随机选择，可能影响找到的最小值。梯度下降有三种方式：批量（BGD）、随机（SGD）和小批量（MBGD），主要区别在于Batch Size。SGD速度快但波动大，BGD准确但慢，MBGD是折中。在训练中，Epoch是完整遍历数据集的次数，Batch是每次处理的数据子集，Iteration是参数更新的次数。反向传播利用链式法则计算损失函数梯度，更新权重。
06.22 09:01:38

发表了文章 2024-06-22 09:01:38

Pytorch实现线性回归模型

在机器学习和深度学习领域，线性回归是一种基本且广泛应用的算法，它简单易懂但功能强大，常作为更复杂模型的基础。使用PyTorch实现线性回归，不仅帮助初学者理解模型概念，还为探索高级模型奠定了基础。代码示例中，`creat_data()` 函数生成线性回归数据，包括噪声，`linear_regression()` 定义了线性模型，`square_loss()` 计算损失，而 `sgd()` 实现了梯度下降优化。
06.22 08:59:41

发表了文章 2024-06-22 08:59:41

神经网络的激活函数（二）

本文介绍了神经网络中的激活函数，特别是tanh和ReLU。tanh函数将输入映射到(-1,1)，以0为中心，加快了训练速度，但两侧导数为0可能导致梯度消失。ReLU函数在正区间的导数为1，解决了梯度消失问题，常用于隐藏层。softmax函数用于多分类，将输出转换为概率分布。文章还包含了代码示例，展示了这些函数的图形和导数。
06.22 08:59:30

发表了文章 2024-06-22 08:59:30

神经网络的激活函数（一）

人工神经网络（ Artificial Neural Network，简写为ANN）也简称为神经网络（NN），是一种模仿生物神经网络结构和功能的计算模型。人脑可以看做是一个生物神经网络，由众多的神经元连接而成。各个神经元传递复杂的电信号，树突接收到输入信号，然后对信号进行处理，通过轴突输出信号。
06.22 08:46:38

发表了文章 2024-06-22 08:46:38

Pytorch-自动微分模块

PyTorch的torch.autograd模块提供了自动微分功能，用于深度学习中的梯度计算。它包括自定义操作的函数、构建计算图、数值梯度检查、错误检测模式和梯度模式设置等组件。张量通过设置`requires_grad=True`来追踪计算，`backward()`用于反向传播计算梯度，`grad`属性存储张量的梯度。示例展示了如何计算标量和向量张量的梯度，并通过`torch.no_grad()`等方法控制梯度计算。在优化过程中，梯度用于更新模型参数。注意，使用numpy转换要求先`detach()`以避免影响计算图。
06.22 08:46:16

发表了文章 2024-06-22 08:46:16

LLM-AI大模型介绍

大语言模型（LLM）是深度学习的产物，包含数十亿至数万亿参数，通过大规模数据训练，能处理多种自然语言任务。LLM基于Transformer架构，利用多头注意力机制处理长距离依赖，经过预训练和微调，擅长文本生成、问答等。发展经历了从概率模型到神经网络，再到预训练和大模型的演变。虽然强大，但存在生成不当内容、偏见等问题，需要研究者解决。评估指标包括BLEU、ROUGE和困惑度PPL。
06.22 08:37:41

发表了文章 2024-06-22 08:37:41

Pytorch-张量形状操作

PyTorch中，张量形状操作至关重要，如reshape用于改变维度而不变元素，transpose/permute用于维度交换，view改形状需内存连续，squeeze移除单维度，unsqueeze添加维度。这些函数帮助数据适应神经网络层间的转换。例如，reshape能调整数据适配层的输入，transpose用于矩阵转置或多维排列，而squeeze和unsqueeze则用于处理单维度。理解并熟练运用这些工具是深度学习中必要的技能。
06.22 08:33:06

发表了文章 2024-06-22 08:33:06

Pytorch - 张量转换拼接

使用 Tensor.numpy 函数可以将张量转换为 ndarray 数组，但是共享内存，可以使用 copy 函数避免共享。
06.22 08:32:22

发表了文章 2024-06-22 08:32:22

如何使用Docker部署WPS Office服务并实现无公网IP远程处理文档表格（二）

使用Docker部署的WPS Office服务可以通过内网穿透工具Cpolar实现远程访问。首先，创建一个名为“wps office”的隧道，选择HTTP协议和3000端口，分配免费的随机域名，并指定中国地区。然后，通过Cpolar的管理界面获取HTTP公网地址，用以远程访问WPS Office。由于随机域名会变化，可以升级Cpolar套餐并保留一个二级子域名，确保长期稳定的远程访问。配置子域名后，更新隧道设置，完成固定公网地址的绑定，从而实现随时随地通过固定地址访问WPS Office。
06.22 08:26:34

发表了文章 2024-06-22 08:26:34

如何使用Docker部署WPS Office服务并实现无公网IP远程处理文档表格（一）

在群晖NAS上使用Docker部署WPS Office并结合Cpolar内网穿透的步骤包括： 1. 通过SSH命令行拉取`linuxserver/wps-office`镜像。 2. 在群晖容器管理界面运行镜像，设置启动选项和端口映射。 3. 本地访问群晖IP:3000端口以使用WPS Office。 4. 安装Cpolar套件，手动添加并安装到群晖，通过9200端口访问其Web管理界面。 5. 使用Cpolar配置内网穿透，实现远程访问WPS Office。这一过程允许用户即使在没有公网IP的情况下，也能通过Cpolar将内网的WPS Office服务暴露到公网，便于远程办公和文档处理。
06.22 08:17:16

发表了文章 2024-06-22 08:17:16

Pytorch-张量基础操作

张量是一个多维数组，它是标量、向量和矩阵概念的推广。在深度学习中，张量被广泛用于表示数据和模型参数。
06.22 08:16:47

发表了文章 2024-06-22 08:16:47

PyTorch-张量

PyTorch 是Facebook AI团队开发的深度学习框架，其核心是张量，它是同类型数据的多维数组。张量可以通过`torch.tensor()`、`torch.Tensor()`、指定类型如`IntTensor`等创建。张量操作包括线性（`torch.arange`, `torch.linspace`）、随机（`torch.randn`, `torch.manual_seed`）和全0/1张量（`torch.zeros`, `torch.ones`）。张量间可进行阿达玛积（逐元素相乘），类型转换用`type()`或`double()`。
06.22 08:06:48

发表了文章 2024-06-22 08:06:48

AI - 机器学习GBDT算法

梯度提升决策树（Gradient Boosting Decision Tree），是一种集成学习的算法，它通过构建多个决策树来逐步修正之前模型的错误，从而提升模型整体的预测性能。
06.22 08:06:43

发表了文章 2024-06-22 08:06:43

AI - 集成学习

集成学习是一种机器学习策略，它通过组合多个模型（称为基学习器）来创建一个更强大、更稳健的预测模型。基学习器可以是不同类型或同类型的模型，如决策树、SVM、神经网络等。
06.22 07:58:51

发表了文章 2024-06-22 07:58:51

AI - 支持向量机算法

**支持向量机（SVM）**是一种用于二分类的强大学习算法，寻找最佳超平面以最大化类别间间隔。对于线性可分数据，SVM通过硬间隔最大化找到线性分类器；非线性数据则通过核技巧映射到高维空间，成为非线性分类器。SVM利用软间隔处理异常或线性不可分情况，并通过惩罚参数C平衡间隔和误分类。损失函数常采用合页损失，鸢尾花数据集常用于SVM的示例实验。
06.22 07:49:24

发表了文章 2024-06-22 07:49:24

AI - 决策树模型

决策树算法起源于古希腊的逻辑推理，20世纪在军事策略研究中首次提出。它通过构建树形模型模拟决策过程，每个节点代表一个属性判断，分支代表可能结果。ID3算法基于信息增益，C4.5则引入信息增益率，解决了ID3偏好多值属性的问题，还能处理缺失值。CART决策树适用于分类和回归任务，使用基尼系数或信息增益来选择特征。在Python的`sklearn`库中，`DecisionTreeClassifier`实现决策树分类，通过参数如`criterion`、`max_depth`等控制模型。
06.22 07:44:04

发表了文章 2024-06-22 07:44:04

计算机网络基础

网络是我们生活中不可或缺的部分，通过手机、电脑和平板等设备连接。OSI模型是通信的理论框架，分为7层，从下至上分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层，分别处理硬件连接、数据传输、路由、端到端通信等任务。TCP/IP模型简化为5层，包括应用层、传输层、互联网层、链路层和物理层，TCP和UDP协议在传输层负责数据传输，IP协议在互联网层处理路由。 TCP协议提供可靠的、面向连接的服务，通过三次握手建立连接，四次挥手断开连接。UDP则是无连接、不可靠的，但速度较快。端口号标识不同应用，如HTTP的80端口。Socket是网络通信的基本接口，用于创建和管理网络连接。
06.22 07:43:57

发表了文章 2024-06-22 07:43:57

AI-逻辑回归模型

逻辑回归是一种用于分类问题的统计模型，尤其适合二分类任务，如预测广告点击率、判断邮件是否为垃圾邮件、评估疾病风险和预测信用卡违约等。模型通过线性方程（logit函数）结合Sigmoid函数将结果映射到0到1区间，表示概率。损失函数通常使用交叉熵，优化时常用梯度下降。评估指标包括ROC曲线和AUC，后者衡量模型整体性能，值越接近1表示性能越好。在不平衡数据集上，可使用`class_weight='balanced'`来调整样本权重。
06.22 07:30:40

发表了文章 2024-06-22 07:30:40

AI-线性回归模型（二）

这篇内容介绍了梯度下降法在机器学习中的应用，特别是在线性回归中的角色。它是一种迭代优化算法，用于找到损失函数最小值的参数。全梯度下降（FGD）使用所有数据计算梯度，适合大数据但计算成本高；随机梯度下降（SGD）随机选取样本，速度快但可能收敛到局部最小值。随机平均梯度下降（SAG）结合两者的优点，提高收敛速度。评估线性回归模型的性能通常使用平均绝对误差、均方误差和均方根误差。文中还展示了波士顿房价预测案例，使用SGDRegressor进行训练，并讨论了学习率的影响。最后提到了如何使用`joblib`库保存和加载模型。
06.22 07:30:17

发表了文章 2024-06-22 07:30:17

AI-线性回归模型（一）

线性回归是用于分析变量间线性关系的统计方法，常见于房价预测、销售额预测和贷款额度评估。通过最小二乘法寻找最佳直线方程y=wx+b，其中y是因变量，x是自变量，w和b是模型参数。在Python的`sklearn`库中，使用`LinearRegression`类可构建模型，通过`fit`训练和`predict`进行预测。损失函数通常用平方损失（均方误差）衡量预测误差，优化目标是最小化这些误差的平方和。
06.22 07:26:07

发表了文章 2024-06-22 07:26:07

K 近邻算法（二）

K-近邻（KNN）算法是一种监督学习方法，用于分类和回归。关键步骤包括计算新样本与训练样本的距离，选择合适的邻近样本数K，基于K个邻居的多数类别或平均值做出预测。K值的选择影响模型性能：小K易受噪声影响（过拟合），大K可能导致模型过于简单（欠拟合）。评估模型通常使用测试集的预测准确率，如sklearn.metrics.accuracy_score。最优K值可通过交叉验证，如GridSearchCV，来确定，但它可能计算密集。KNN常用于手写数字识别等任务，如MNIST数据集。
06.22 07:16:23

发表了文章 2024-06-22 07:16:23

K 近邻算法（一）

本文介绍了KNN算法的基本概念、步骤、优缺点，以及在图像识别、文本分类、回归预测、医疗诊断和金融风控等领域的应用。重点讲解了数据预处理、模型训练、评估方法和参数选择策略，包括K值确定、交叉验证和GridSearchCV的使用。
06.21 20:48:07

发表了文章 2024-06-21 20:48:07

神经网络中的优化方法

摘要：这篇内容介绍了梯度下降优化算法在机器学习中的挑战，如平缓区域、鞍点和局部最小值，以及如何通过改进策略来克服这些问题。文章提到了几种优化方法，包括Momentum、AdaGrad、RMSprop和Adam。Momentum通过累积历史梯度信息来调整参数更新，帮助模型在训练过程中更快地收敛。AdaGrad和RMSprop解决了AdaGrad学习率过早衰减的问题，RMSprop结合了Momentum和AdaGrad的优势，通过一阶矩估计和二阶矩估计动态调整学习率，尤其适用于大规模数据集和复杂模型。Adam是RMSprop的一个变种，是深度学习中最常用的优化器之一。
06.21 20:38:14

发表了文章 2024-06-21 20:38:14

神经网络参数初始化

**神经网络参数初始化**是深度学习的关键步骤。权重常通过**Xavier**或**He**初始化来打破对称性，适用于ReLU激活；而偏置通常初始化为0。初始化方法还包括**均匀分布**、**正态分布**、**全零**、**全一**和**固定值**。在PyTorch中，`torch.nn.init`模块提供了如`xavier_uniform_`和`kaiming_normal_`等初始化函数。预训练模型也可用于初始化，通过微调提升性能。
06.21 20:32:05

发表了文章 2024-06-21 20:32:05

YOLO算法

YOLO（You Only Look Once）是一种实时目标检测算法，将目标检测视为回归问题，通过单个CNN模型预测边界框和类别。YOLOv1使用24个卷积层和2个全连接层，将输入图像划分为7x7网格，每个网格预测2个边界框。模型直接从448x448图像输出7x7x30的张量，每个单元负责检测中心在其内的目标。YOLO训练涉及构造训练样本和损失函数，常采用预训练的Backbone（如CSPDarknet53）和数据增强技术。YOLOv4是YOLO系列的改进版，包括SPP和PANet等结构，提升了精度和速度，使用IOU损失函数，并采用CutMix和马赛克数据增强。
06.21 20:23:33

发表了文章 2024-06-21 20:23:33

OpenCV算法库

numba是一个用于编译Python数组和数值计算函数的编译器，这个编译器能够大幅提高直接使用Python编写的函数的运算速度。
06.21 20:23:27

发表了文章 2024-06-21 20:23:27

DFS算法及应用（二）

回溯：回溯就是DFS的一种，在搜索探索过程中寻找问题的解，当发现不满足求解条件时，就回溯返回，尝试其他路径。
06.21 20:22:48

发表了文章 2024-06-21 20:22:48

DFS算法及应用（一）

DFS（深度优先搜索）是一种图遍历算法，常用于解决穷举问题，如全排列、迷宫问题、图的连通性等。它沿着树的深度分支进行探索，直至达到叶子节点，若无法继续则回溯。例如，将数字6拆分为3个正整数的递增序列问题可以通过DFS实现，类似地，分糖果问题和买瓜问题同样可以用DFS求解。DFS通常涉及递归或栈结构，通过标记已访问节点避免重复。在编程中，会定义递归函数，设定结束条件，然后枚举可能的情况，并处理下一层节点。
06.21 20:06:25

发表了文章 2024-06-21 20:06:25

Docker技术仓库

本文详细介绍了Docker中数据卷的作用、特点、管理方式，包括bindmounts和volumes挂载、Dockerfile中的数据卷使用、Docker仓库（公有与私有）以及DockerCompose在多容器应用中的应用。
06.21 19:52:07

发表了文章 2024-06-21 19:52:07

如何在IDEA中使用固定公网地址SSH远程连接服务器开发环境（三）

在IDEA中通过固定公网地址SSH远程连接服务器开发环境，需要配置固定TCP端口以避免地址随机变化。首先，升级cpolar至专业版及以上，然后在官网保留一个固定TCP地址。进入cpolar管理界面，编辑隧道信息，将保留的固定地址填入，更新隧道。最后，在IDEA中新建SSH连接，输入固定地址和端口，验证连接。成功后，即可稳定远程开发。
06.21 19:51:52

发表了文章 2024-06-21 19:51:52

如何在IDEA中使用固定公网地址SSH远程连接服务器开发环境（二）

在IDEA中通过Cpolar实现固定公网地址SSH远程连接到Linux服务器开发环境，主要步骤包括：1) 在Linux服务器上安装Cpolar，使用一键脚本进行安装和启动服务；2) 登录Cpolar Web UI，创建隧道，指定隧道名称、协议、本地地址（SSH默认端口22）、临时随机TCP端口和中国地区；3) 使用生成的公网TCP地址在IDEA中新建SSH连接，输入该地址和端口，完成远程连接。这种方式允许开发者在任何地方通过固定的公网地址进行远程开发，而无需公网IP。
06.21 19:42:17

发表了文章 2024-06-21 19:42:17

如何在IDEA中使用固定公网地址SSH远程连接服务器开发环境（一）

该文介绍了如何通过IDEA设置远程连接Linux服务器的步骤，使用Cpolar内网穿透工具实现在没有公网IP的情况下进行远程开发。主要内容包括检查Linux SSH服务、本地连接测试、在Linux上安装Cpolar、创建远程连接的公网地址、公网远程连接测试以及固定连接公网地址。文章还提供了相关截图辅助说明，适用于IDEA2023.2.5版本。
06.21 19:37:32

发表了文章 2024-06-21 19:37:32

Docker核心技术（二）

Docker核心功能包括`docker container inspect`用于检查容器详情，`docker logs`显示容器日志，`docker attach`连接容器。容器与镜像是独立的，镜像是静态的执行环境，容器是动态实例。Docker提供多种网络模式，如默认的bridge、host、none、overlay和macvlan。管理网络的命令有`docker network ls`（列出网络）、`docker network create`（创建网络）、`docker network rm`（删除网络）和`docker network inspect`（检查网络详情）。
06.21 19:34:03

发表了文章 2024-06-21 19:34:03

Docker核心技术（一）

本文介绍了Docker的核心技术——容器，包括容器的定义、与虚拟机的区别，以及容器的生命周期阶段（创建、运行、暂停、停止和删除）。同时详细讲解了容器的网络管理和Docker提供的五种网络驱动模式。
06.21 19:27:49

发表了文章 2024-06-21 19:27:49

Docker介绍（二）

Docker是基于Go语言的开源容器平台，利用Linux内核的namespace、cgroups和UnionFS等技术实现在Linux上运行。它分为社区版(Docker-CE)和企业版(Docker-EE)，在CentOS上可安装Docker-CE。Docker的核心技术包括镜像，它是包含应用及环境的可执行文件，用于创建容器。常用镜像操作有搜索、查看、下载、删除、保存备份、导入、重命名和检查。
06.21 19:26:56

发表了文章 2024-06-21 19:26:56

Docker介绍（一）

Docker是开源的应用容器引擎，让开发者打包应用及依赖到可移植容器中，可在任何环境一致运行。它提供快速启动、高效资源利用、轻松迁移和维护，适用于开发、测试和生产。Docker由客户端、守护进程、REST API组成，支持镜像存储在仓库如Docker Hub。容器是隔离的执行环境，能在同一主机上互不影响地运行多个容器。
06.21 19:19:27

发表了文章 2024-06-21 19:19:27

OpenCV基础（二）

OpenCV教程概览：介绍如何在图像中绘制几何图形，如使用`cv.line`绘制直线，`cv.circle`画圆，`cv.rectangle`画矩形，并添加文字。还涵盖了图像的几何变换，包括缩放、平移、旋转和仿射变换。代码示例展示了这些操作在Python中的实现，通过`cv2.resize`进行图像缩放，`cv.getRotationMatrix2D`及`cv.warpAffine`实现旋转，以及`cv.getPerspectiveTransform`进行透射变换。
06.21 19:15:20

发表了文章 2024-06-21 19:15:20

OpenCV基础（一）

OpenCV是一个开源的计算机视觉库，用于图像处理和机器学习，由Intel发起，支持多种平台和语言，如Python、C++。它提供丰富的优化算法，适用于面部识别、物体识别等应用。OpenCV-Python是其Python接口，便于快速原型设计，包含多个模块，并有丰富的学习资源。基本操作包括使用`cv.imread()`读取图像，`cv.imshow()`显示图像，以及`cv.imwrite()`保存图像。
06.21 19:14:08

发表了文章 2024-06-21 19:14:08

XGBoost算法

XGBoost是高效、灵活且强大的梯度提升决策树算法，擅长处理结构化数据，广泛应用在数据挖掘和Kaggle竞赛中。它通过迭代地添加决策树优化目标函数，支持自定义损失函数和正则化以防止过拟合。与AdaBoost相比，XGBoost支持更复杂的基分类器，如线性模型，使用二阶导数加速优化，并有内置并行处理能力。XGBoost在模型构建时考虑缺失值处理，并提供了Python等多语言接口，便于参数调优和模型评估，如使用GridSearchCV进行交叉验证。
06.21 19:00:13

发表了文章 2024-06-21 19:00:13

AdaBoost算法

**AdaBoost** 是一种 Boosting 算法，通过序列训练弱分类器并赋予错误分类样本更大权重，逐步构建强分类器。它使用指数损失函数，每次迭代时，弱分类器聚焦于前一轮分类错误的样本。最终，弱分类器的预测结果按其性能加权组合成强分类器。与 Bagging 相比，Boosting 是串行的，每个模型依赖前一个模型的输出，更重视错误样本。AdaBoost 的优点包括提高弱分类器性能、鲁棒性和灵活性，但对噪声敏感且训练时间可能较长。
06.21 18:59:47

发表了文章 2024-06-21 18:59:47

机器学习聚类算法

聚类算法是无监督学习技术，用于发现数据集中的自然群体，如用户画像、广告推荐等。常见的聚类算法包括K-Means，它基于距离分配样本至簇，适合球形分布；层次聚类则通过合并或分裂形成簇，能发现任意形状的簇；DBSCAN依据密度来聚类，对噪声鲁棒。KMeans API中`sklearn.cluster.KMeans(n_clusters=8)`用于指定簇的数量。评估聚类效果可使用轮廓系数、SSE等指标，Elbow方法帮助选择合适的K值。
06.21 17:39:29

发表了文章 2024-06-21 17:39:29

支持向量机（二）

这是一个关于支持向量机（SVM）的实践教程概要。作者使用Python的sklearn库演示了SVM的步骤，包括导入库、构建数据集、训练线性SVM模型、查看模型参数、进行预测及可视化决策边界。讨论了SVM在处理线性不可分数据时使用核函数（如高斯核）的重要性，并总结了SVM的优缺点：它擅长处理高维和非线性问题，但对大规模数据和参数选择敏感，训练时间可能较长。
06.21 17:39:18

发表了文章 2024-06-21 17:39:18

支持向量机（一）

**支持向量机（SVM）** 是一种优雅的分类和回归算法，广泛应用于文本分类、图像识别、生物信息学和金融预测。它寻找最大化类别间边距的决策边界，适应小样本、高维和非线性问题。SVM通过核函数（如RBF）处理非线性数据，目标是找到具有最大边距的超平面，以提高泛化能力。C参数调节模型复杂度，允许数据点偏离边界的程度。
06.21 17:36:12

发表了文章 2024-06-21 17:36:12

机器学习算法决策树（二）

**ID3决策树算法**是1975年由J. Ross Quinlan提出的，它基于信息增益来选择最佳划分特征。信息增益是衡量数据集纯度变化的指标，熵则是评估数据不确定性的度量。算法通过比较每个特征的信息增益来选择分裂属性，目标是构建一个能最大化信息增益的决策树。然而，ID3容易偏向于选择具有更多特征值的属性，C4.5算法为解决这一问题引入了信息增益率，降低了这种偏好。CART决策树则不仅用于分类，也用于回归，并使用基尼指数或信息熵来选择分割点。剪枝是防止过拟合的重要手段，包括预剪枝和后剪枝策略。
06.21 17:25:11

发表了文章 2024-06-21 17:25:11

机器学习算法决策树（一）

**决策树模型**是一种直观的分类模型，常用于金融风控和医疗诊断等领域。它通过树形结构对数据进行划分，易于理解和解释，能揭示特征重要性且计算复杂度低。然而，模型可能过拟合，需剪枝处理；不擅长处理连续特征；预测能力有限，且对数据变化敏感。在集成学习如XGBoost中，决策树作为基模型广泛应用。示例代码展示了使用Python的`sklearn`库构建和可视化决策树的过程。

发表了文章 2024-06-22

LLM主要类别架构（二）
发表了文章 2024-06-22

LLM主要类别架构（一）
发表了文章 2024-06-22

大模型Prompt-Tuning技术入门（二）
发表了文章 2024-06-22

大模型Prompt-Tuning技术入门（一）
发表了文章 2024-06-22

Sklearn中逻辑回归建模
发表了文章 2024-06-22

机器学习归一化特征编码（一）
发表了文章 2024-06-22

机器学习归一化特征编码（二）
发表了文章 2024-06-22

GBDT算法超参数评估（二）
发表了文章 2024-06-22

机器学习多场景实战（二）
发表了文章 2024-06-22

GBDT算法超参数评估（一）
发表了文章 2024-06-22

机器学习多场景实战（一）
发表了文章 2024-06-22

反向传播算法
发表了文章 2024-06-22

Transformer介绍
发表了文章 2024-06-22

BERT+PET方式模型训练（一）
发表了文章 2024-06-22

使用seq2seq架构实现英译法（二）
发表了文章 2024-06-22

使用seq2seq架构实现英译法（一）
发表了文章 2024-06-22

BERT+PET方式模型训练（二）
发表了文章 2024-06-22

大模型Prompt-Tuning技术进阶
发表了文章 2024-06-22

AB测试实战（二）
发表了文章 2024-06-22

AB测试实战（一）

正在加载, 请稍后...

滑动查看更多

回答了问题 2023-12-16

你有哪些低成本又能保持扩展性的套路？

单例、组合、模板设计模式

赞0 踩0 评论0

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

小森ai小小贾_社区达人页

探索云世界

热门

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

勋章 更多

成就

我关注的人 更多

粉丝 更多

技术能力

LLM主要类别架构（二）

LLM主要类别架构（一）

大模型Prompt-Tuning技术入门（二）

大模型Prompt-Tuning技术入门（一）

Sklearn中逻辑回归建模

机器学习归一化特征编码（一）

机器学习归一化特征编码（二）

GBDT算法超参数评估（二）

机器学习多场景实战（二 ）

GBDT算法超参数评估（一）

机器学习多场景实战（一）

反向传播算法

Transformer介绍

BERT+PET方式模型训练（一）

使用seq2seq架构实现英译法（二）

使用seq2seq架构实现英译法（一）

BERT+PET方式模型训练（二）

大模型Prompt-Tuning技术进阶

AB测试实战（二）

AB测试实战（一）

你有哪些低成本又能保持扩展性的套路？

勋章更多

我关注的人更多

粉丝更多

机器学习多场景实战（二）