1293931883641585_社区达人页

个人头像照片
1293931883641585
已加入开发者社区1997

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
初入江湖
初入江湖

成就

已发布86篇文章
2条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
  • Linux
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍

暂无精选文章
暂无更多信息

2022年04月

  • 04.13 19:01:56
    发表了文章 2022-04-13 19:01:56

    该死!B 站上这些 Python 视频真香!

    无论什么时候,都有初学者存在找不到学习资源的困惑。其实呢,一般通过百度、知乎估计也都能找到个的结果,不过质量可能就会层次不齐了。
  • 04.13 18:53:43
    发表了文章 2022-04-13 18:53:43

    基于 Python 的 8 种常用抽样方法

    抽样是统计学、机器学习中非常重要,也是经常用到的方法,因为大多时候使用全量数据是不现实的,或者根本无法取到。所以我们需要抽样,比如在推断性统计中,我们会经常通过采样的样本数据来推断估计总体的样本。
  • 04.13 18:44:11
    发表了文章 2022-04-13 18:44:11

    Toad:基于 Python 的标准化评分卡模型(下)

    在信贷的风控模型中最常用、最经典的可能要属评分卡了,所谓评分卡就是给信贷客户进行打分,按照不同业务场景可为贷前、贷中、贷后和反欺诈,一般叫做ABCF卡。模型得到分数,通过设置cutoff阈值给出评估结果,结果可直接用于通过或拒绝,或者用于策略应用。
  • 04.13 18:41:35
    发表了文章 2022-04-13 18:41:35

    Toad:基于 Python 的标准化评分卡模型(上)

    在信贷的风控模型中最常用、最经典的可能要属评分卡了,所谓评分卡就是给信贷客户进行打分,按照不同业务场景可为贷前、贷中、贷后和反欺诈,一般叫做ABCF卡。模型得到分数,通过设置cutoff阈值给出评估结果,结果可直接用于通过或拒绝,或者用于策略应用。
  • 04.13 18:34:49
    发表了文章 2022-04-13 18:34:49

    JupyterLab 出 Windows 桌面版了!

    Jupyter最近迎来了一个劲爆的更新:JupyterLab 发布了桌面APP版本!知道以后,马上第一时间码字来告诉大家。
  • 04.13 18:30:27
    发表了文章 2022-04-13 18:30:27

    安利 3 个 pandas 数据探索分析神器!

    EDA是数据分析必须的过程,用来查看变量统计特征,可以此为基础尝试做特征工程。东哥这次分享3个EDA神器,其实之前每一个都分享过,这次把这三个工具包汇总到一起来介绍。
  • 04.13 16:31:34
    发表了文章 2022-04-13 16:31:34

    pandas 分类数据处理大全(附代码)

    category是pandas的一种分类的定类数据类型。和文本数据.str.<methond>一样,它也有访问器功能.cat.<method>。
  • 04.13 16:28:12
    发表了文章 2022-04-13 16:28:12

    一文读懂层次聚类(Python代码)

    本篇想和大家介绍下层次聚类,先通过一个简单的例子介绍它的基本理论,然后再用一个实战案例Python代码实现聚类效果。
  • 04.13 16:21:43
    发表了文章 2022-04-13 16:21:43

    pandas 文本处理大全(附代码)

    大家好,我是东哥。 继续更新pandas数据清洗,历史文章: pandas 缺失数据处理大全(附代码) pandas 重复数据处理大全(附代码) 感兴趣可以关注这个话题pandas数据清洗,第一时间看到更新。
  • 04.13 16:16:43
    发表了文章 2022-04-13 16:16:43

    pandas 重复数据处理大全(附代码)

    继续更新pandas数据清洗,上一篇说到缺失值的处理。
  • 04.13 15:50:25
    发表了文章 2022-04-13 15:50:25

    pandas 缺失数据处理大全(附代码)

    之前一直在分享pandas的一些骚操作:pandas骚操作,根据大家反映还不错,但是很多技巧都混在了一起,没有细致的分类,这样不利于查找,也不成体系。
  • 04.13 15:34:48
    发表了文章 2022-04-13 15:34:48

    暴减内存!pandas 自动优化骚操作

    本篇是pandas骚操作系列的第 24 篇:自动优化数据类型,暴省内存! 系列内容,请看👉「pandas骚操作」话题,订阅后文章更新可第一时间推送至订阅号。内容也同步我的GitHub,欢迎star!
  • 04.13 15:32:26
    发表了文章 2022-04-13 15:32:26

    吹爆这个 pandas GUI 神器,自动转代码!

    关于pandas的GUI工具,我之前介绍过pandasgui。可以说,有了GUI可视化界面,操作就和Excel一样简单,本次再介绍一款功能更加强大的GUI神器:D-Tale。
  • 04.13 15:23:17
    发表了文章 2022-04-13 15:23:17

    模型神器组合,yyds!

    最近在kaggle上有一个调参神器非常热门,在top方案中频频出现,它就是OPTUNA。知道很多小伙伴苦恼于漫长的调参时间里,这次结合一些自己的经验,给大家带来一个LGBM模型+OPTUNA调参的使用教程,这对可谓是非常实用且容易上分的神器组合了,实际工作中也可使用。
  • 04.13 15:19:54
    发表了文章 2022-04-13 15:19:54

    再见 CSV,速度提升 150 倍!

    我的原计划是输出100个,目前来看可能最终不一定会到100个,但每个都是超实用且平时经常会遇到的问题。pandas的用法太多了,如果不熟练,平时是需要经常网上查找的,这个系列可以帮助大家快速回忆用法。
  • 04.13 14:52:39
    发表了文章 2022-04-13 14:52:39

    pandas 筛选数据的 8 个骚操作

    日常用Python做数据分析最常用到的就是查询筛选了,按各种条件、各种维度以及组合挑出我们想要的数据,以方便我们分析挖掘。
  • 04.13 14:44:34
    发表了文章 2022-04-13 14:44:34

    20 个短小精悍的 pandas 骚操作

    本次为大家整理了一个pandas骚操作操作的大集合,共20个功能,个个短小精悍,一次让你爱个够。系列内容,请看👉「pandas100个骚操作」话题。
  • 04.13 14:38:12
    发表了文章 2022-04-13 14:38:12

    好习惯!pandas 8 个常用的 index 设置

    在数据处理时,经常会因为index报错而发愁。不要紧,本次来和大家聊聊pandas中处理索引的几种常用方法。
  • 04.13 14:28:52
    发表了文章 2022-04-13 14:28:52

    好习惯!pandas 8 个常用的 option 设置

    通过pandas的使用,我们经常要交互式地展示表格(dataframe)、分析表格。而表格的格式就显得尤为重要了,因为大部分时候如果我们直接展示表格,格式并不是很友好。
  • 04.13 14:23:17
    发表了文章 2022-04-13 14:23:17

    爱了,吹爆这个高颜值的流程图工具!

    说起流程图可能大家第一个想到Viso,功能是很强大,但也有一些弊端: 需要付费 无法跨平台使用 之前东哥就分享过一些在线的流程图软件了,比如draw.io和processon,功能上丝毫不比商业软件差,而且更加便捷、不占据硬盘空间,同时支持团队协同。
  • 04.13 14:13:59
    发表了文章 2022-04-13 14:13:59

    数据挖掘实战:个人信贷违约预测(下)

    大家好,我是东哥。本次分享一个数据挖掘实战项目:个人信贷违约预测,此项目对于想要学习信贷风控模型的同学非常有帮助,数据和源码在文末。
  • 04.13 14:10:07
    发表了文章 2022-04-13 14:10:07

    数据挖掘实战:个人信贷违约预测(上)

    大家好,我是东哥。本次分享一个数据挖掘实战项目:个人信贷违约预测,此项目对于想要学习信贷风控模型的同学非常有帮助,数据和源码在文末。
  • 04.13 14:05:41
    发表了文章 2022-04-13 14:05:41

    Bokeh 这可视化图表做的,也太好看了吧!

    Python交互式可视化库Bokeh在现代web浏览器中支持大型数据集的高性能可视化表示。Bokeh 的目标是使用 D3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功能。
  • 04.13 14:01:12
    发表了文章 2022-04-13 14:01:12

    pandas100个骚操作:concat 5 个常用技巧!

    本篇将介绍concat常用的5个操作技巧: 处理索引和轴 避免重复索引 使用keys和names选项添加层次结构索引 列匹配和排序 连接CSV文件数据集
  • 04.13 13:54:44
    发表了文章 2022-04-13 13:54:44

    用了一年pandas,才知道category的这些坑!

    pandas有一个特别的数据类型叫category,如其名一样,是一种分类的数据类型。category很娇气,使用的时候稍有不慎就会进坑,因此本篇东哥将介绍在pandas中,
  • 04.13 13:45:04
    发表了文章 2022-04-13 13:45:04

    太强了!这个建模神器可以玩一辈子

    玩过建模的朋友都知道,在建立模型之前有很长的一段特征工程工作要做,而在特征工程的过程中,探索性数据分析又是必不可少的一部分,因为如果我们要对各个特征进行细致的分析,那么必然会进行一些可视化以辅助我们来做选择和判断。
  • 04.13 13:35:41
    发表了文章 2022-04-13 13:35:41

    pandas100个骚操作:groupby 8 个常用技巧!

    pandas的groupby是数据处理中一个非常强大的功能。虽然很多同学已已经非常熟悉了,但有些小技巧还是要和大家普及一下的。
  • 04.13 13:32:48
    发表了文章 2022-04-13 13:32:48

    又一个Jupyter神器,操作Excel自动生成Python代码!

    不得不说,Jupyter对于表的处理真的是越来越方便了,很多库可以直接实现可视化操作,无需写代码。但是这还不够,最近看到一个神器叫Mito,它真的是做到了无需写一行代码,而且手动的操作可以自动转换为代码,供后续批量化操作,这简直不要太爽。
  • 04.13 13:26:19
    发表了文章 2022-04-13 13:26:19

    pandas100个骚操作:逆天!一行代码让 apply 速度飙到极致

    本篇是pandas100个骚操作系列的第 13 篇:一行代码让 pandas 的 apply 速度飙到极致!
  • 04.13 13:23:24
    发表了文章 2022-04-13 13:23:24

    pandas100个骚操作:Squeeze 类型压缩小技巧!

    本次分享的pandas骚操作非常简单,但很实用。尤其在面临数据处理的过程中,是我们一定会面临的问题,下面一起来看一下。
  • 04.13 13:19:41
    发表了文章 2022-04-13 13:19:41

    pandas100个骚操作:再见 for 循环!速度提升315倍!

    大家好,我是东哥。 本篇是pandas100个骚操作系列的第 11 篇:再见 for 循环!速度提升315倍! 系列内容,请看👉「pandas100个骚操作」话题,订阅后文章更新可第一时间推送至订阅号。
  • 04.13 13:16:44
    发表了文章 2022-04-13 13:16:44

    pandas100个骚操作:使用 Datetime 提速 50 倍运行速度!

    本篇是pandas100个骚操作系列的第 10 篇:使用 Datetime 提速 50 倍运行速度!

2022年02月

  • 发表了文章 2022-04-13

    该死!B 站上这些 Python 视频真香!

  • 发表了文章 2022-04-13

    基于 Python 的 8 种常用抽样方法

  • 发表了文章 2022-04-13

    Toad:基于 Python 的标准化评分卡模型(下)

  • 发表了文章 2022-04-13

    Toad:基于 Python 的标准化评分卡模型(上)

  • 发表了文章 2022-04-13

    JupyterLab 出 Windows 桌面版了!

  • 发表了文章 2022-04-13

    安利 3 个 pandas 数据探索分析神器!

  • 发表了文章 2022-04-13

    pandas 分类数据处理大全(附代码)

  • 发表了文章 2022-04-13

    一文读懂层次聚类(Python代码)

  • 发表了文章 2022-04-13

    pandas 文本处理大全(附代码)

  • 发表了文章 2022-04-13

    pandas 重复数据处理大全(附代码)

  • 发表了文章 2022-04-13

    pandas 缺失数据处理大全(附代码)

  • 发表了文章 2022-04-13

    暴减内存!pandas 自动优化骚操作

  • 发表了文章 2022-04-13

    吹爆这个 pandas GUI 神器,自动转代码!

  • 发表了文章 2022-04-13

    模型神器组合,yyds!

  • 发表了文章 2022-04-13

    再见 CSV,速度提升 150 倍!

  • 发表了文章 2022-04-13

    pandas 筛选数据的 8 个骚操作

  • 发表了文章 2022-04-13

    20 个短小精悍的 pandas 骚操作

  • 发表了文章 2022-04-13

    好习惯!pandas 8 个常用的 index 设置

  • 发表了文章 2022-04-13

    好习惯!pandas 8 个常用的 option 设置

  • 发表了文章 2022-04-13

    爱了,吹爆这个高颜值的流程图工具!

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息