Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区1087

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1556篇文章
357条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息

2023年04月

  • 04.18 09:59:34
    发表了文章 2023-04-18 09:59:34

    生成式模型与辨别式模型

    分类模型可以分为两大类:生成式模型与辨别式模型。本文解释了这两种模型类型之间的区别,并讨论了每种方法的优缺点。
  • 04.17 10:37:36
    发表了文章 2023-04-17 10:37:36

    TensorFlow 决策森林详细介绍和使用说明

    使用TensorFlow训练、调优、评估、解释和部署基于树的模型的完整教程
  • 04.16 09:52:36
    发表了文章 2023-04-16 09:52:36

    时间序列的平稳性

    如何检查时间序列是否平稳,如果它是非平稳的,我们可以怎么处理
  • 04.15 11:06:52
    发表了文章 2023-04-15 11:06:52

    用CTGAN生成真实世界的表格数据

    随着CLIP和稳定模型的快速发展,图像生成领域中GAN已经不常见了,但是在表格数据中GAN还是可以看到它的身影。
  • 04.14 11:00:04
    发表了文章 2023-04-14 11:00:04

    神经网络初学者的激活函数指南

    如果你刚刚开始学习神经网络,激活函数的原理一开始可能很难理解。但是如果你想开发强大的神经网络,理解它们是很重要的。
  • 04.13 11:29:51
    发表了文章 2023-04-13 11:29:51

    2023年4月的12篇AI论文推荐

    GPT-4发布仅仅三周后,就已经随处可见了。本月的论文推荐除了GPT-4以外还包括、语言模型的应用、扩散模型、计算机视觉、视频生成、推荐系统和神经辐射场。
  • 04.12 10:56:06
    发表了文章 2023-04-12 10:56:06

    Pandas 2.0 vs Polars:速度的全面对比

    前几天的文章,我们已经简单的介绍过Pandas 和Polars的速度对比。刚刚发布的Pandas 2.0速度得到了显著的提升。但是本次测试发现NumPy数组上的一些基本操作仍然更快。并且Polars 0.17.0,也在上周发布,并且也提到了性能的改善,所以我们这里做一个更详细的关于速度方面的评测。
  • 04.11 11:00:54
    发表了文章 2023-04-11 11:00:54

    利用强化学习Q-Learning实现最短路径算法

    如果你是一名计算机专业的学生,有对图论有基本的了解,那么你一定知道一些著名的最优路径解,如Dijkstra算法、Bellman-Ford算法和a*算法(A-Star)等。
  • 04.10 10:49:05
    发表了文章 2023-04-10 10:49:05

    可视化CNN和特征图

    卷积神经网络(cnn)是一种神经网络,通常用于图像分类、目标检测和其他计算机视觉任务。CNN的关键组件之一是特征图,它是通过对图像应用卷积滤波器生成的输入图像的表示。
  • 04.09 10:41:52
    发表了文章 2023-04-09 10:41:52

    论文推荐:DCSAU-Net,更深更紧凑注意力U-Net

    这是一篇23年发布的新论文,论文提出了一种更深、更紧凑的分裂注意力的U-Net,该网络基于主特征守恒和紧凑分裂注意力模块,有效地利用了底层和高层语义信息。
  • 04.08 10:11:38
    发表了文章 2023-04-08 10:11:38

    7个最新的时间序列分析库介绍和代码示例

    时间序列分析包括检查随着时间推移收集的数据点,目的是确定可以为未来预测提供信息的模式和趋势。我们已经介绍过很多个时间序列分析库了,但是随着时间推移,新的库和更新也在不断的出现,所以本文将分享8个目前比较常用的,用于处理时间序列问题的Python库。他们是tsfresh, autots, darts, atspy, kats, sktime, greykite。
  • 04.06 11:12:12
    发表了文章 2023-04-06 11:12:12

    Pandas 2.0正式版发布: Pandas 1.5,Polars,Pandas 2.0 速度对比测试

    Pandas 2.0正式版在4月3日已经发布了,以后我们pip install默认安装的就是2.0版了,Polars 是最近比较火的一个DataFrame 库,最近在kaggle上经常使用,所以这里我们将对比下 Pandas 1.5,Polars,Pandas 2.0 。看看在速度上 Pandas 2.0有没有优势。
  • 04.05 10:46:52
    发表了文章 2023-04-05 10:46:52

    使用Python实现Hull Moving Average (HMA)

    赫尔移动平均线(Hull Moving Average,简称HMA)是一种技术指标,于2005年由Alan Hull开发。它是一种移动平均线,利用加权计算来减少滞后并提高准确性。
  • 04.04 10:56:07
    发表了文章 2023-04-04 10:56:07

    用遗传算法寻找迷宫出路

    遗传算法是一种基于达尔文进化论的搜索启发式算法。该算法模拟了基于种群中最适合个体的自然选择。
  • 04.03 10:30:08
    发表了文章 2023-04-03 10:30:08

    奇异值分解(SVD)和图像压缩

    在本文中,我将尝试解释 SVD 背后的数学及其几何意义,还有它在数据科学中的最常见的用法,图像压缩。
  • 04.01 10:15:04
    发表了文章 2023-04-01 10:15:04

    基于凸集上投影(POCS)的聚类算法

    POCS:Projections onto Convex Sets。在数学中,凸集是指其中任意两点间的线段均在该集合内的集合。而投影则是将某个点映射到另一个空间中的某个子空间上的操作。给定一个凸集合和一个点,可以通过找到该点在该凸集合上的投影来进行操作。该投影是离该点最近的凸集内的点,可以通过最小化该点和凸集内任何其他点之间的距离来计算。既然是投影,那么我们就可以将特征映射到另一个空间中的凸集合上,这样就可以进行聚类或降维等操作。

2023年03月

  • 03.31 10:50:52
    发表了文章 2023-03-31 10:50:52

    使用Unit Scaling进行FP16 和 FP8 训练

    Unit Scaling 是一种新的低精度机器学习方法,能够在没有损失缩放的情况下训练 FP16 和 FP8 中的语言模型。
  • 03.30 11:06:41
    发表了文章 2023-03-30 11:06:41

    时间序列特征提取的Python和Pandas代码示例

    使用Pandas和Python从时间序列数据中提取有意义的特征,包括移动平均,自相关和傅里叶变换。
  • 03.28 10:14:07
    发表了文章 2023-03-28 10:14:07

    使用Pytorch实现对比学习SimCLR 进行自监督预训练

    SimCLR(Simple Framework for Contrastive Learning of Representations)是一种学习图像表示的自监督技术。 与传统的监督学习方法不同,SimCLR 不依赖标记数据来学习有用的表示。 它利用对比学习框架来学习一组有用的特征,这些特征可以从未标记的图像中捕获高级语义信息。
  • 03.27 11:40:57
    发表了文章 2023-03-27 11:40:57

    高斯混合模型 GMM 的详细解释

    高斯混合模型(后面本文中将使用他的缩写 GMM)听起来很复杂,其实他的工作原理和 KMeans 非常相似,你甚至可以认为它是 KMeans 的概率版本。 这种概率特征使 GMM 可以应用于 KMeans 无法解决的许多复杂问题。
  • 03.26 11:09:47
    发表了文章 2023-03-26 11:09:47

    使用树状图可视化聚类

    一般情况下,我们都是使用散点图进行聚类可视化,但是某些的聚类算法可视化时散点图并不理想,所以在这篇文章中,我们介绍如何使用树状图(Dendrograms)对我们的聚类结果进行可视化。
  • 03.25 10:02:24
    发表了文章 2023-03-25 10:02:24

    Half-UNet:用于医学图像分割的简化U-Net架构

    Half-UNet简化了编码器和解码器,还使用了Ghost模块(GhostNet)。并重新设计的体系结构,把通道数进行统一。
  • 03.24 11:18:10
    发表了文章 2023-03-24 11:18:10

    10个Pandas的另类数据处理技巧

    本文所整理的技巧与以前整理过10个Pandas的常用技巧不同,你可能并不会经常的使用它,但是有时候当你遇到一些非常棘手的问题时,这些技巧可以帮你快速解决一些不常见的问题。
  • 03.23 10:42:27
    发表了文章 2023-03-23 10:42:27

    Huggingface微调BART的代码示例:WMT16数据集训练新的标记进行翻译

    BART模型是用来预训练seq-to-seq模型的降噪自动编码器(autoencoder)。它是一个序列到序列的模型,具有对损坏文本的双向编码器和一个从左到右的自回归解码器,所以它可以完美的执行翻译任务。
  • 03.22 10:48:25
    发表了文章 2023-03-22 10:48:25

    DDPG强化学习的PyTorch代码实现和逐步讲解

    深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是受Deep Q-Network启发的无模型、非策略深度强化算法,是基于使用策略梯度的Actor-Critic,本文将使用pytorch对其进行完整的实现和讲解
  • 03.21 10:14:56
    发表了文章 2023-03-21 10:14:56

    NLP / LLMs中的Temperature 是什么?

    ChatGPT, GPT-3, GPT-3.5, GPT-4, LLaMA, Bard等大型语言模型的一个重要的超参数
  • 03.20 10:31:47
    发表了文章 2023-03-20 10:31:47

    Pandas 2.0 简单介绍和速度评测

    最近 Pandas 2.0 的RC版已经最近发布了。这个版本主要包括bug修复、性能改进和增加Apache Arrow后端。
  • 03.19 09:56:49
    发表了文章 2023-03-19 09:56:49

    2023年3月的10篇论文推荐

    三月有很多的重大产品发布,包括刚刚发布的GPT4,还有Meta刚发布就被泄露的LLaMA,midjourney V5,还有ChatGPT的API(非常便宜)等等。
  • 03.18 11:24:09
    发表了文章 2023-03-18 11:24:09

    CLIP:语言-图像表示之间的桥梁

    最近GPT4的火爆覆盖了一个新闻:midjourney v5发布,DALLE2,midjourney都可以从文本中生成图像,这种模型要求人工智能同时理解语言和图像数据。
  • 03.17 13:05:04
    发表了文章 2023-03-17 13:05:04

    GPT-4 和ChatGPT API的定价分析

    OpenAI发布了他们的ChatGPT新机器学习模型GPT-4。GPT-4是GPT-3的一大进步,GPT-3是当前ChatGPT免费版本(GPT 3.5 Turbo)所运行的模型的基础,今天我们也来凑个热点,研究一下它们的定价
  • 03.16 11:06:01
    发表了文章 2023-03-16 11:06:01

    处理缺失值的三个层级的方法总结

    缺失值是现实数据集中的常见问题,处理缺失值是数据预处理的关键步骤。本文将展示如何使用三种不同级别的方法处理这些缺失值:
  • 03.15 11:27:39
    发表了文章 2023-03-15 11:27:39

    SDG,ADAM,LookAhead,Lion等优化器的对比介绍

    本文将介绍了最先进的深度学习优化方法,帮助神经网络训练得更快,表现得更好。有很多个不同形式的优化器,这里我们只找最基础、最常用、最有效和最新的来介绍。
  • 03.14 10:41:12
    发表了文章 2023-03-14 10:41:12

    集成时间序列模型提高预测精度

    使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测
  • 03.13 12:02:27
    发表了文章 2023-03-13 12:02:27

    图神经网络的数学原理总结

    图深度学习(Graph Deep Learning) 多年来一直在加速发展。本文将流行的图神经网络及其数学细微差别的进行详细的梳理和解释
  • 03.12 09:57:31
    发表了文章 2023-03-12 09:57:31

    少样本学习综述:技术、算法和模型

    少样本学习(FSL)是机器学习的一个子领域,它解决了只用少量标记示例学习新任务的问题
  • 03.11 10:41:11
    发表了文章 2023-03-11 10:41:11

    PlotNeuralNet + ChatGPT创建专业的神经网络的可视化图形

    PlotNeuralNet:可以创建任何神经网络的可视化图表,并且这个LaTeX包有Python接口,我们可以方便的调用。
  • 03.10 10:25:10
    发表了文章 2023-03-10 10:25:10

    使用ControlNet 控制 Stable Diffusion

    本文将要介绍整合HuggingFace的diffusers 包和ControlNet调节生成文本到图像,可以更好地控制文本到图像的生成
  • 03.09 11:08:38
    发表了文章 2023-03-09 11:08:38

    Python中函数参数传递方法*args, **kwargs,还有其他

    本文将讨论Python的函数参数。我们将了解*args和**kwargs,/和*的都是什么,虽然这个问题是一个基本的python问题,但是在我们写代码时会经常遇到,比如timm中就大量使用了这样的参数传递方式。
  • 03.08 11:05:14
    发表了文章 2023-03-08 11:05:14

    Python图像处理:频域滤波降噪和图像增强

    图像处理已经成为我们日常生活中不可或缺的一部分,涉及到社交媒体和医学成像等各个领域。通过数码相机或卫星照片和医学扫描等其他来源获得的图像可能需要预处理以消除或增强噪声。频域滤波是一种可行的解决方案,它可以在增强图像锐化的同时消除噪声。
  • 03.07 10:45:52
    发表了文章 2023-03-07 10:45:52

    结合基于规则和机器学习的方法构建强大的混合系统

    在本文中,我将介绍一些实际的案例,以及如何将手动规则和ML结合使得我们的方案变得更好。
  • 03.06 10:29:42
    发表了文章 2023-03-06 10:29:42

    DetectGPT:使用概率曲率的零样本机器生成文本检测

    DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。如果平均对数比高,则样本可能来自源模型。
  • 03.05 10:36:55
    发表了文章 2023-03-05 10:36:55

    带加权的贝叶斯自举法 Weighted Bayesian Bootstrap

    在去年的文章中我们介绍过Bayesian Bootstrap,今天我们来说说Weighted Bayesian Bootstrap
  • 03.04 10:14:20
    发表了文章 2023-03-04 10:14:20

    梯度提升算法决策过程的逐步可视化

    梯度提升算法是最常用的集成机器学习技术之一,该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础,所以在这篇文章中,我们将从头开始构建一个梯度增强模型并将其可视化。
  • 03.03 10:52:27
    发表了文章 2023-03-03 10:52:27

    论文推荐:ScoreGrad,基于能量模型的时间序列预测

    能量模型(Energy-based model)是一种以自监督方式执行的生成式模型,近年来受到了很多关注。本文将介绍ScoreGrad:基于连续能量生成模型的多变量概率时间序列预测。如果你对时间序列预测感兴趣,推荐继续阅读本文。
  • 03.02 10:47:28
    发表了文章 2023-03-02 10:47:28

    XGBoost和LightGBM时间序列预测对比

    XGBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型,它们都有着高效的性能表现,但是在某些情况下,它们也有着不同的特点。
  • 03.01 10:29:10
    发表了文章 2023-03-01 10:29:10

    使用手工特征提升模型性能

    本文将使用信用违约数据集介绍手工特征的概念和创建过程。

2023年02月

  • 02.28 10:41:02
    发表了文章 2023-02-28 10:41:02

    非参数检验方法,核密度估计简介

    核密度估计(Kernel Density Estimation,简称KDE)是一种非参数统计方法,用于估计数据样本背后的概率密度函数。
  • 发表了文章 2025-11-28

    GraphRAG进阶:基于Neo4j与LlamaIndex的DRIFT搜索实现详解

  • 发表了文章 2025-11-27

    从零开始:用Python和Gemini 3四步搭建你自己的AI Agent

  • 发表了文章 2025-11-26

    LLM提示注入攻击深度解析:从原理到防御的完整应对方案

  • 发表了文章 2025-11-25

    分类模型校准:ROC-AUC不够?用ECE/pMAD评估概率质量

  • 发表了文章 2025-11-24

    Pixeltable:一张表搞定embeddings、LLM、向量搜索,多模态开发不再拼凑工具

  • 发表了文章 2025-11-23

    JAX 核心特性详解:纯函数、JIT 编译、自动微分等十大必知概念

  • 发表了文章 2025-11-22

    高级检索增强生成系统:LongRAG、Self-RAG 和 GraphRAG 的实现与选择

  • 发表了文章 2025-11-21

    CrewAI 上手攻略:多 Agent 自动化处理复杂任务,让 AI 像员工一样分工协作

  • 发表了文章 2025-11-20

    PyTorch 分布式训练底层原理与 DDP 实战指南

  • 发表了文章 2025-11-19

    LEANN:一个极简的本地向量数据库

  • 发表了文章 2025-11-18

    Pandas GroupBy 的 10 个实用技巧

  • 发表了文章 2025-11-17

    TOON:专为 LLM 设计的轻量级数据格式

  • 发表了文章 2025-11-16

    Python 3.14 实用技巧:10个让代码更清晰的小改进

  • 发表了文章 2025-11-15

    Python 开发必备:tempfile 模块深度解析

  • 发表了文章 2025-11-14

    超参数调优:Grid Search 和 Random Search 的实战对比

  • 发表了文章 2025-11-13

    QF-Lib:用一个库搞定Python量化回测和策略开发

  • 发表了文章 2025-11-12

    HaluMem:揭示当前AI记忆系统的系统性缺陷,系统失效率超50%

  • 发表了文章 2025-11-11

    AI智能体落地:Agent-Assist vs 全自动化完整决策指南

  • 发表了文章 2025-11-10

    基于 LangGraph 的对话式 RAG 系统实现:多轮检索与自适应查询优化

  • 发表了文章 2025-11-09

    LightRAG 实战: 基于 Ollama 搭建带知识图谱的可控 RAG 系统

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息