Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区710

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1185篇文章
177条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息

2023年03月

  • 03.28 10:14:07
    发表了文章 2023-03-28 10:14:07

    使用Pytorch实现对比学习SimCLR 进行自监督预训练

    SimCLR(Simple Framework for Contrastive Learning of Representations)是一种学习图像表示的自监督技术。 与传统的监督学习方法不同,SimCLR 不依赖标记数据来学习有用的表示。 它利用对比学习框架来学习一组有用的特征,这些特征可以从未标记的图像中捕获高级语义信息。
  • 03.27 11:40:57
    发表了文章 2023-03-27 11:40:57

    高斯混合模型 GMM 的详细解释

    高斯混合模型(后面本文中将使用他的缩写 GMM)听起来很复杂,其实他的工作原理和 KMeans 非常相似,你甚至可以认为它是 KMeans 的概率版本。 这种概率特征使 GMM 可以应用于 KMeans 无法解决的许多复杂问题。
  • 03.26 11:09:47
    发表了文章 2023-03-26 11:09:47

    使用树状图可视化聚类

    一般情况下,我们都是使用散点图进行聚类可视化,但是某些的聚类算法可视化时散点图并不理想,所以在这篇文章中,我们介绍如何使用树状图(Dendrograms)对我们的聚类结果进行可视化。
  • 03.25 10:02:24
    发表了文章 2023-03-25 10:02:24

    Half-UNet:用于医学图像分割的简化U-Net架构

    Half-UNet简化了编码器和解码器,还使用了Ghost模块(GhostNet)。并重新设计的体系结构,把通道数进行统一。
  • 03.24 11:18:10
    发表了文章 2023-03-24 11:18:10

    10个Pandas的另类数据处理技巧

    本文所整理的技巧与以前整理过10个Pandas的常用技巧不同,你可能并不会经常的使用它,但是有时候当你遇到一些非常棘手的问题时,这些技巧可以帮你快速解决一些不常见的问题。
  • 03.23 10:42:27
    发表了文章 2023-03-23 10:42:27

    Huggingface微调BART的代码示例:WMT16数据集训练新的标记进行翻译

    BART模型是用来预训练seq-to-seq模型的降噪自动编码器(autoencoder)。它是一个序列到序列的模型,具有对损坏文本的双向编码器和一个从左到右的自回归解码器,所以它可以完美的执行翻译任务。
  • 03.22 10:48:25
    发表了文章 2023-03-22 10:48:25

    DDPG强化学习的PyTorch代码实现和逐步讲解

    深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是受Deep Q-Network启发的无模型、非策略深度强化算法,是基于使用策略梯度的Actor-Critic,本文将使用pytorch对其进行完整的实现和讲解
  • 03.21 10:14:56
    发表了文章 2023-03-21 10:14:56

    NLP / LLMs中的Temperature 是什么?

    ChatGPT, GPT-3, GPT-3.5, GPT-4, LLaMA, Bard等大型语言模型的一个重要的超参数
  • 03.20 10:31:47
    发表了文章 2023-03-20 10:31:47

    Pandas 2.0 简单介绍和速度评测

    最近 Pandas 2.0 的RC版已经最近发布了。这个版本主要包括bug修复、性能改进和增加Apache Arrow后端。
  • 03.19 09:56:49
    发表了文章 2023-03-19 09:56:49

    2023年3月的10篇论文推荐

    三月有很多的重大产品发布,包括刚刚发布的GPT4,还有Meta刚发布就被泄露的LLaMA,midjourney V5,还有ChatGPT的API(非常便宜)等等。
  • 03.18 11:24:09
    发表了文章 2023-03-18 11:24:09

    CLIP:语言-图像表示之间的桥梁

    最近GPT4的火爆覆盖了一个新闻:midjourney v5发布,DALLE2,midjourney都可以从文本中生成图像,这种模型要求人工智能同时理解语言和图像数据。
  • 03.17 13:05:04
    发表了文章 2023-03-17 13:05:04

    GPT-4 和ChatGPT API的定价分析

    OpenAI发布了他们的ChatGPT新机器学习模型GPT-4。GPT-4是GPT-3的一大进步,GPT-3是当前ChatGPT免费版本(GPT 3.5 Turbo)所运行的模型的基础,今天我们也来凑个热点,研究一下它们的定价
  • 03.16 11:06:01
    发表了文章 2023-03-16 11:06:01

    处理缺失值的三个层级的方法总结

    缺失值是现实数据集中的常见问题,处理缺失值是数据预处理的关键步骤。本文将展示如何使用三种不同级别的方法处理这些缺失值:
  • 03.15 11:27:39
    发表了文章 2023-03-15 11:27:39

    SDG,ADAM,LookAhead,Lion等优化器的对比介绍

    本文将介绍了最先进的深度学习优化方法,帮助神经网络训练得更快,表现得更好。有很多个不同形式的优化器,这里我们只找最基础、最常用、最有效和最新的来介绍。
  • 03.14 10:41:12
    发表了文章 2023-03-14 10:41:12

    集成时间序列模型提高预测精度

    使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测
  • 03.13 12:02:27
    发表了文章 2023-03-13 12:02:27

    图神经网络的数学原理总结

    图深度学习(Graph Deep Learning) 多年来一直在加速发展。本文将流行的图神经网络及其数学细微差别的进行详细的梳理和解释
  • 03.12 09:57:31
    发表了文章 2023-03-12 09:57:31

    少样本学习综述:技术、算法和模型

    少样本学习(FSL)是机器学习的一个子领域,它解决了只用少量标记示例学习新任务的问题
  • 03.11 10:41:11
    发表了文章 2023-03-11 10:41:11

    PlotNeuralNet + ChatGPT创建专业的神经网络的可视化图形

    PlotNeuralNet:可以创建任何神经网络的可视化图表,并且这个LaTeX包有Python接口,我们可以方便的调用。
  • 03.10 10:25:10
    发表了文章 2023-03-10 10:25:10

    使用ControlNet 控制 Stable Diffusion

    本文将要介绍整合HuggingFace的diffusers 包和ControlNet调节生成文本到图像,可以更好地控制文本到图像的生成
  • 03.09 11:08:38
    发表了文章 2023-03-09 11:08:38

    Python中函数参数传递方法*args, **kwargs,还有其他

    本文将讨论Python的函数参数。我们将了解*args和**kwargs,/和*的都是什么,虽然这个问题是一个基本的python问题,但是在我们写代码时会经常遇到,比如timm中就大量使用了这样的参数传递方式。
  • 03.08 11:05:14
    发表了文章 2023-03-08 11:05:14

    Python图像处理:频域滤波降噪和图像增强

    图像处理已经成为我们日常生活中不可或缺的一部分,涉及到社交媒体和医学成像等各个领域。通过数码相机或卫星照片和医学扫描等其他来源获得的图像可能需要预处理以消除或增强噪声。频域滤波是一种可行的解决方案,它可以在增强图像锐化的同时消除噪声。
  • 03.07 10:45:52
    发表了文章 2023-03-07 10:45:52

    结合基于规则和机器学习的方法构建强大的混合系统

    在本文中,我将介绍一些实际的案例,以及如何将手动规则和ML结合使得我们的方案变得更好。
  • 03.06 10:29:42
    发表了文章 2023-03-06 10:29:42

    DetectGPT:使用概率曲率的零样本机器生成文本检测

    DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。如果平均对数比高,则样本可能来自源模型。
  • 03.05 10:36:55
    发表了文章 2023-03-05 10:36:55

    带加权的贝叶斯自举法 Weighted Bayesian Bootstrap

    在去年的文章中我们介绍过Bayesian Bootstrap,今天我们来说说Weighted Bayesian Bootstrap
  • 03.04 10:14:20
    发表了文章 2023-03-04 10:14:20

    梯度提升算法决策过程的逐步可视化

    梯度提升算法是最常用的集成机器学习技术之一,该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础,所以在这篇文章中,我们将从头开始构建一个梯度增强模型并将其可视化。
  • 03.03 10:52:27
    发表了文章 2023-03-03 10:52:27

    论文推荐:ScoreGrad,基于能量模型的时间序列预测

    能量模型(Energy-based model)是一种以自监督方式执行的生成式模型,近年来受到了很多关注。本文将介绍ScoreGrad:基于连续能量生成模型的多变量概率时间序列预测。如果你对时间序列预测感兴趣,推荐继续阅读本文。
  • 03.02 10:47:28
    发表了文章 2023-03-02 10:47:28

    XGBoost和LightGBM时间序列预测对比

    XGBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型,它们都有着高效的性能表现,但是在某些情况下,它们也有着不同的特点。
  • 03.01 10:29:10
    发表了文章 2023-03-01 10:29:10

    使用手工特征提升模型性能

    本文将使用信用违约数据集介绍手工特征的概念和创建过程。

2023年02月

  • 02.28 10:41:02
    发表了文章 2023-02-28 10:41:02

    非参数检验方法,核密度估计简介

    核密度估计(Kernel Density Estimation,简称KDE)是一种非参数统计方法,用于估计数据样本背后的概率密度函数。
  • 02.27 10:31:06
    发表了文章 2023-02-27 10:31:06

    聚类算法(下):10个聚类算法的评价指标

    上篇文章我们已经介绍了一些常见的聚类算法,下面我们将要介绍评估聚类算法的指标
  • 02.26 09:33:57
    发表了文章 2023-02-26 09:33:57

    聚类算法(上):8个常见的无监督聚类方法介绍和比较

    本文将全面概述Scikit-Learn库中用于的聚类技术以及各种评估方法。本文作为第一部分将介绍和比较各种聚类算法
  • 02.25 09:25:31
    发表了文章 2023-02-25 09:25:31

    稀疏特征和密集特征

    在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。
  • 02.24 10:44:55
    发表了文章 2023-02-24 10:44:55

    选择最佳机器学习模型的10步指南

    机器学习可以用来解决广泛的问题。但是有很多多不同的模型可以选择,要知道哪一个适合是一个非常麻烦的事情。本文的总结将帮助你选择最适合需求的机器学习模型。
  • 02.23 10:14:55
    发表了文章 2023-02-23 10:14:55

    在Pandas中通过时间频率来汇总数据的三种常用方法

    当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。
  • 02.22 10:31:24
    发表了文章 2023-02-22 10:31:24

    广义学习矢量量化(GLVQ)分类算法介绍和代码实现

    广义学习矢量量化(Generalized Learning Vector Quantization,GLVQ)是一种基于原型的分类算法,用于将输入数据分配到先前定义的类别中。
  • 02.21 10:17:21
    发表了文章 2023-02-21 10:17:21

    计算时间序列周期的三种方法

    周期是数据中出现重复模式所需的时间长度。更具体地说,它是模式的一个完整周期的持续时间。在这篇文章中,将介绍计算时间序列周期的三种不同方法。
  • 02.20 10:09:15
    发表了文章 2023-02-20 10:09:15

    使用PyTorch-LSTM进行单变量时间序列预测的示例教程

    时间序列是指在一段时间内发生的任何可量化的度量或事件。尽管这听起来微不足道,但几乎任何东西都可以被认为是时间序列。一个月里你每小时的平均心率,一年里一只股票的日收盘价,一年里某个城市每周发生的交通事故数。在任何一段时间段内记录这些信息都被认为是一个时间序列。对于这些例子中的每一个,都有事件发生的频率(每天、每周、每小时等)和事件发生的时间长度(一个月、一年、一天等)。
  • 02.19 09:59:17
    发表了文章 2023-02-19 09:59:17

    PyTorch 并行训练 DistributedDataParallel完整代码示例

    使用大型数据集训练大型深度神经网络 (DNN) 的问题是深度学习领域的主要挑战。 随着 DNN 和数据集规模的增加,训练这些模型的计算和内存需求也会增加。 这使得在计算资源有限的单台机器上训练这些模型变得困难甚至不可能。 使用大型数据集训练大型 DNN 的一些主要挑战包括:
  • 02.18 10:39:51
    发表了文章 2023-02-18 10:39:51

    概率和似然

    在日常生活中,我们经常使用这些术语。但是在统计学和机器学习上下文中使用时,有一个本质的区别。本文将用理论和例子来解释概率和似然之间的关键区别。
  • 02.17 11:08:40
    发表了文章 2023-02-17 11:08:40

    知识图谱嵌入模型 (KGE) 的总结和比较

    知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。它们将“知识”投射到一个连续的低维空间,这些低维空间向量一般只有几百个维度(用来表示知识存储的内存效率)。向量空间中,每个点代表一个概念,每个点在空间中的位置具有语义意义,类似于词嵌入。
  • 02.16 10:44:31
    发表了文章 2023-02-16 10:44:31

    2023年2月的十篇深度学习论文推荐

    本月的论文包括语言模型、扩散模型、音乐生成、多模态等主题。
  • 02.15 09:59:48
    发表了文章 2023-02-15 09:59:48

    100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)

    提起三维重建技术,NeRF是一个绝对绕不过去的名字。这项逆天的技术,一经提出就被众多研究者所重视,对该技术进行深入研究并提出改进已经成为一个热点。不到两年的时间,NeRF及其变种已经成为重建领域的主流。本文通过100行的Pytorch代码实现最初的 NeRF 论文。
  • 02.14 10:22:14
    发表了文章 2023-02-14 10:22:14

    使用Pandas也可以进行数据可视化

    在本文中,我们介绍使用 Pandas 进行数据可视化的基础知识,包括创建简单图、自定义图以及使用多个DF进行绘图。
  • 02.13 10:07:29
    发表了文章 2023-02-13 10:07:29

    10个用于可解释AI的Python库

    XAI的目标是为模型的行为和决定提供有意义的解释,本文整理了目前能够看到的10个用于可解释AI的Python库
  • 02.12 10:34:41
    发表了文章 2023-02-12 10:34:41

    GPT-3 vs Bert vs GloVe vs Word2vec 文本嵌入技术的性能对比测试

    本文将GPT3与三种传统文本嵌入技术GloVe、Word2vec(Mikolov ,2013 年)和 BERT生成的嵌入进行性能的简单对比。
  • 02.11 11:03:54
    发表了文章 2023-02-11 11:03:54

    使用scikit-learn为PyTorch 模型进行超参数网格搜索

    scikit-learn是Python中最好的机器学习库,而PyTorch又为我们构建模型提供了方便的操作,能否将它们的优点整合起来呢?
  • 02.10 11:01:16
    发表了文章 2023-02-10 11:01:16

    机器学习评估指标的十个常见面试问题

    评估指标是用于评估机器学习模型性能的定量指标。本文整理了10个常见的问题。
  • 02.09 11:29:27
    发表了文章 2023-02-09 11:29:27

    如何解决混合精度训练大模型的局限性问题

    混合精度已经成为训练大型深度学习模型的必要条件,但也带来了许多挑战。在这篇文章中,我们将讨论混合精确训练的数值稳定性问题。
  • 02.08 10:18:41
    发表了文章 2023-02-08 10:18:41

    Numpy中数组和矩阵操作的数学函数

    Numpy 是一个强大的 Python 计算库。它提供了广泛的数学函数,可以对数组和矩阵执行各种操作。本文中将整理一些基本和常用的数学操作。
  • 发表了文章 2024-11-16

    利用PyTorch的三元组损失Hard Triplet Loss进行嵌入模型微调

  • 发表了文章 2024-11-15

    告别Print,使用IceCream进行高效的Python调试

  • 发表了文章 2024-11-14

    为什么卷积现在不火了:CNN研究热度降温的深层原因分析

  • 发表了文章 2024-11-13

    SMoA: 基于稀疏混合架构的大语言模型协同优化框架

  • 发表了文章 2024-11-12

    TSMamba:基于Mamba架构的高效时间序列预测基础模型

  • 发表了文章 2024-11-11

    基于MCMC的贝叶斯营销组合模型评估方法论: 系统化诊断、校准及选择的理论框架

  • 发表了文章 2024-11-10

    深度学习工程实践:PyTorch Lightning与Ignite框架的技术特性对比分析

  • 发表了文章 2024-11-09

    通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

  • 发表了文章 2024-11-08

    贝叶斯统计中常见先验分布选择方法总结

  • 发表了文章 2024-11-07

    Tokenformer:基于参数标记化的高效可扩展Transformer架构

  • 发表了文章 2024-11-06

    基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践

  • 发表了文章 2024-11-05

    基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模

  • 发表了文章 2024-11-04

    深入理解多重共线性:基本原理、影响、检验与修正策略

  • 发表了文章 2024-11-03

    基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例

  • 发表了文章 2024-11-02

    10种数据预处理中的数据泄露模式解析:识别与避免策略

  • 发表了文章 2024-11-01

    随机性、熵与随机数生成器:解析伪随机数生成器(PRNG)和真随机数生成器(TRNG)

  • 发表了文章 2024-10-31

    Github上的十大RAG(信息检索增强生成)框架

  • 发表了文章 2024-10-30

    基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

  • 发表了文章 2024-10-28

    深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究

  • 发表了文章 2024-10-27

    过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息