大葱蘸大酱2_个人页

大葱蘸大酱2

文章

问答

318

视频

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

暂无更多信息

2021年11月

11.05 16:41:14

提交了问题 2021-11-05 16:41:14

什么是Python的匿名函数？
11.05 16:41:05

提交了问题 2021-11-05 16:41:05

什么是Python的函数？
11.05 16:40:15

提交了问题 2021-11-05 16:40:15

什么是Python的字典？
11.05 16:40:09

提交了问题 2021-11-05 16:40:09

什么是Python的容器对象？
11.05 16:40:03

提交了问题 2021-11-05 16:40:03

什么是Python的名称空间？
11.05 16:39:02

提交了问题 2021-11-05 16:39:02

Python的复数数值类型？
11.05 16:38:57

提交了问题 2021-11-05 16:38:57

Python的布尔值数值类型？
11.05 16:38:51

提交了问题 2021-11-05 16:38:51

Python的整型数值类型？
11.05 16:37:47

提交了问题 2021-11-05 16:37:47

什么是Python的对象和标识符？
11.05 16:37:39

提交了问题 2021-11-05 16:37:39

什么是IPython的魔法命令？
11.05 16:37:25

提交了问题 2021-11-05 16:37:25

什么是Python的print函数？
11.05 16:35:51

提交了问题 2021-11-05 16:35:51

什么是IPython的自省功能？
11.05 16:35:41

提交了问题 2021-11-05 16:35:41

在IPython中Tab键有什么作用？
11.05 16:35:32

提交了问题 2021-11-05 16:35:32

什么是IPython？
11.03 15:40:03

回答了问题 2021-11-03 15:40:03

为什么要离散化处理？

赞0 踩0 评论0
11.03 15:39:41

回答了问题 2021-11-03 15:39:41

概率抽样的整群抽样是什么？

赞0 踩0 评论0
11.03 15:37:54

回答了问题 2021-11-03 15:37:54

概率抽样的分层抽样是什么？

赞0 踩0 评论0
11.03 15:37:30

回答了问题 2021-11-03 15:37:30

概率抽样的等距抽样是什么？

赞0 踩0 评论0
11.03 15:37:07

回答了问题 2021-11-03 15:37:07

概率抽样的简单随机抽样是什么？

赞0 踩0 评论0
11.03 15:36:32

回答了问题 2021-11-03 15:36:32

数据化运营的哪些场景会出现样本分布不均衡的问题？

赞0 踩0 评论0
11.03 15:35:35

回答了问题 2021-11-03 15:35:35

特征的组合方法有哪些形式？

赞0 踩0 评论0
11.03 15:34:55

回答了问题 2021-11-03 15:34:55

降维经过特征组合形成新特征后有哪些优点？

赞0 踩0 评论0
11.03 15:33:41

回答了问题 2021-11-03 15:33:41

什么是ICA？

赞0 踩0 评论0
11.03 15:32:48

回答了问题 2021-11-03 15:32:48

LDA和PCA有哪些不同点？

赞0 踩0 评论0
11.03 15:32:14

回答了问题 2021-11-03 15:32:14

什么是LDA？

赞0 踩0 评论0
11.03 15:31:10

回答了问题 2021-11-03 15:31:10

FA和PCA有哪些不同点？

赞0 踩0 评论0
11.03 15:20:14

回答了问题 2021-11-03 15:20:14

FA和PCA有哪些共同点？

赞0 踩0 评论0
11.03 15:19:39

回答了问题 2021-11-03 15:19:39

什么是FA？

赞0 踩0 评论0
11.03 15:19:12

回答了问题 2021-11-03 15:19:12

什么是PCA？

赞0 踩0 评论0
11.03 15:18:49

回答了问题 2021-11-03 15:18:49

PCA适用哪些场景？

赞0 踩0 评论0
11.03 15:17:29

回答了问题 2021-11-03 15:17:29

基于特征选择的降维方法有哪些？

赞0 踩0 评论0
11.03 15:16:13

回答了问题 2021-11-03 15:16:13

哪些情况需要数据降维？

赞0 踩0 评论0
11.03 15:14:58

回答了问题 2021-11-03 15:14:58

什么是分类数据和顺序数据？

赞3 踩0 评论0
11.03 15:14:13

回答了问题 2021-11-03 15:14:13

数据丢失有哪些情况？

赞0 踩0 评论0
11.03 15:12:09

回答了问题 2021-11-03 15:12:09

什么是外部公开数据？它有哪些来源？

赞0 踩0 评论0
11.03 15:10:36

回答了问题 2021-11-03 15:10:36

流式数据有哪些类型？

赞0 踩0 评论0
11.03 15:00:58

回答了问题 2021-11-03 15:00:58

什么是流式数据？

赞0 踩0 评论0
11.03 15:00:39

回答了问题 2021-11-03 15:00:39

什么是TensorFlow？

赞0 踩0 评论0
11.03 14:59:52

回答了问题 2021-11-03 14:59:52

什么是Statsmodels？

赞0 踩0 评论0
11.03 14:59:31

回答了问题 2021-11-03 14:59:31

什么是lmblearn？

赞0 踩0 评论0
11.03 14:59:09

回答了问题 2021-11-03 14:59:09

什么是gplearn？

赞0 踩0 评论0
11.03 14:58:41

回答了问题 2021-11-03 14:58:41

什么是XGBoost？

赞0 踩0 评论0
11.03 14:58:14

回答了问题 2021-11-03 14:58:14

什么是LightGBM？

赞0 踩0 评论0
11.03 14:57:44

回答了问题 2021-11-03 14:57:44

什么是TPOT？

赞0 踩0 评论0
11.03 14:56:53

回答了问题 2021-11-03 14:56:53

什么是结巴分词？

赞0 踩0 评论0
11.03 14:56:00

回答了问题 2021-11-03 14:56:00

什么是Pyecharts？

赞0 踩0 评论0
11.03 14:39:12

提交了问题 2021-11-03 14:39:12

PIL和Pillow是什么？
11.03 14:39:06

提交了问题 2021-11-03 14:39:06

IPython和Jupyter有什么差异？
11.03 14:39:01

提交了问题 2021-11-03 14:39:01

IPython和Jupyter有什么关系？
11.03 14:37:32

提交了问题 2021-11-03 14:37:32

什么是Anaconda？它有哪些优势？

...

正在加载, 请稍后...

暂无更多信息

提交了问题 2021-11-05

什么是Python的匿名函数？
提交了问题 2021-11-05

什么是Python的函数？
提交了问题 2021-11-05

什么是Python的字典？
提交了问题 2021-11-05

什么是Python的容器对象？
提交了问题 2021-11-05

什么是Python的名称空间？
提交了问题 2021-11-05

Python的复数数值类型？
提交了问题 2021-11-05

Python的布尔值数值类型？
提交了问题 2021-11-05

Python的整型数值类型？
提交了问题 2021-11-05

什么是Python的对象和标识符？
提交了问题 2021-11-05

什么是IPython的魔法命令？
提交了问题 2021-11-05

什么是Python的print函数？
提交了问题 2021-11-05

什么是IPython的自省功能？
提交了问题 2021-11-05

在IPython中Tab键有什么作用？
提交了问题 2021-11-05

什么是IPython？
回答了问题 2021-11-03

为什么要离散化处理？

离散化处理的必要性如下：

节约计算资源，提高计算效率。

算法模型（尤其是分类模型）的计算需要。虽然很多模型，例如决策树可以支持输入连续型数据，但是决策树本身会先将连续型数据转化为离散型数据，因此离散化转换是一个必要步骤。

增强模型的稳定性和准确度。数据离散化之后，处于异常状态的数据不会明显地突出异常特征，而是会被划分为一个子集中的一部分，因此异常数据对模型的影响会大大降低，尤其是基于距离计算的模型（例如K均值、协同过滤等）效果明显。

特定数据处理和分析的必要步骤，尤其在图像处理方面应用广泛。大多数图像做特征检测（以及其他基于特征的分析）时，都需要先将图像做二值化处理，二值化也是离散化的一种。

模型结果应用和部署的需要。如果原始数据的值域分布过多，或值域划分不符合业务逻辑，那么模型结果将很难被业务理解并应用。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

赞0 踩0 评论0
回答了问题 2021-11-03

概率抽样的整群抽样是什么？

整群抽样是先将所有样本分为几个小群体集，然后随机抽样几个小群体集来代表总体。这种操作方法与之前的3种方法的差异点在于该方法抽取的是小群体集，而不是每个数据个体本身。该方法虽然简单易行，但是样本的分布受限于小群体集的划分，抽样误差较大。这种方法适用于小群体集的特征差异比较小的数据，并且对划分小群体集有更高要求。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

赞0 踩0 评论0
回答了问题 2021-11-03

概率抽样的分层抽样是什么？

分层抽样是先将所有个体样本按照某种特征划分为几个类别，然后从每个类别中使用随机抽样或等距抽样的方法选择个体组成样本。这种操作方法能明显降低抽样误差，并且便于针对不同类别的数据样本进行单独研究，因此是一种较好的实现方法。该方法适用于带有分类逻辑的属性、标签等特征的数据。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

赞0 踩0 评论0
回答了问题 2021-11-03

概率抽样的等距抽样是什么？

等距抽样是先将总体中的每个个体按顺序编号，然后计算出抽样间隔，再按照固定抽样间隔抽取个体。这种操作方法易于理解、简便易行，但当总体样本的分布呈现明显的分布规律时容易产生偏差，例如增减趋势、周期性规律等。该方法适用于个体分布均匀或呈现明显的均匀分布规律，无明显趋势或周期性规律的数据。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

赞0 踩0 评论0
回答了问题 2021-11-03

概率抽样的简单随机抽样是什么？

该抽样方法是按等概率原则直接从总样本中抽取n个样本，这种随机抽样方法简单、易于操作，但是它并不能保证样本能完美代表总体。这种抽样的基本前提是所有样本个体都是等概率分布的，但真实情况却是多数样本都不是或无法判断是否是等概率分布的。在简单随机抽样中，得到的结果是不重复的样本集，还可以使用有放回的简单随机抽样，这样得到的样本集中会存在重复数据。该方法适用于个体分布均匀的场景。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

赞0 踩0 评论0
回答了问题 2021-11-03

数据化运营的哪些场景会出现样本分布不均衡的问题？

异常检测场景。大多数企业中的异常个案都是少量的，比如恶意刷单、黄牛订单、信用卡欺诈、电力窃电、设备故障等。这些数据样本所占的比例通常是整体样本中很少的一部分。以信用卡欺诈为例，刷实体信用卡欺诈的比例一般在0.1%以内。

客户流失场景。大型企业的流失客户相对于整体客户通常是少量的，尤其对于具有垄断地位的行业巨擘，例如电信、石油、网络运营商等更是如此。

罕见事件的分析。罕见事件与异常检测类似，都属于发生个案较少的情况；但不同点在于异常检测通常都有是预先定义好的规则和逻辑，并且大多数异常事件都对会企业运营造成负面影响，因此针对异常事件的检测和预防非常重要；但罕见事件则无法预判，并且也没有明显的积极和消极影响倾向。例如，由于某网络大V无意中转发了企业的一条趣味广告，导致用户流量明显提升便属于此类。

发生低频率的事件。这种事件是预期或计划性事件，但是发生频率非常低。例如，每年一次的“双11”购物节一般都会产生较高的销售额，但放到全年来看，这一天的销售额占比很可能只有不到1%，尤其对于很少参与活动的公司而言，这种情况更加明显。这种就属于典型的低频率事件。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

赞0 踩0 评论0

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

大葱蘸大酱2_个人页

个人介绍

擅长的技术

什么是Python的匿名函数？

什么是Python的函数？

什么是Python的字典？

什么是Python的容器对象？

什么是Python的名称空间？

Python的复数数值类型？

Python的布尔值数值类型？

Python的整型数值类型？

什么是Python的对象和标识符？

什么是IPython的魔法命令？

什么是Python的print函数？

什么是IPython的自省功能？

在IPython中Tab键有什么作用？

什么是IPython？

为什么要离散化处理？

概率抽样的整群抽样是什么？

概率抽样的分层抽样是什么？

概率抽样的等距抽样是什么？

概率抽样的简单随机抽样是什么？

数据化运营的哪些场景会出现样本分布不均衡的问题？