Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区1044

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1485篇文章
354条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息

2023年03月

  • 03.07 10:45:52
    发表了文章 2023-03-07 10:45:52

    结合基于规则和机器学习的方法构建强大的混合系统

    在本文中,我将介绍一些实际的案例,以及如何将手动规则和ML结合使得我们的方案变得更好。
  • 03.06 10:29:42
    发表了文章 2023-03-06 10:29:42

    DetectGPT:使用概率曲率的零样本机器生成文本检测

    DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。如果平均对数比高,则样本可能来自源模型。
  • 03.05 10:36:55
    发表了文章 2023-03-05 10:36:55

    带加权的贝叶斯自举法 Weighted Bayesian Bootstrap

    在去年的文章中我们介绍过Bayesian Bootstrap,今天我们来说说Weighted Bayesian Bootstrap
  • 03.04 10:14:20
    发表了文章 2023-03-04 10:14:20

    梯度提升算法决策过程的逐步可视化

    梯度提升算法是最常用的集成机器学习技术之一,该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础,所以在这篇文章中,我们将从头开始构建一个梯度增强模型并将其可视化。
  • 03.03 10:52:27
    发表了文章 2023-03-03 10:52:27

    论文推荐:ScoreGrad,基于能量模型的时间序列预测

    能量模型(Energy-based model)是一种以自监督方式执行的生成式模型,近年来受到了很多关注。本文将介绍ScoreGrad:基于连续能量生成模型的多变量概率时间序列预测。如果你对时间序列预测感兴趣,推荐继续阅读本文。
  • 03.02 10:47:28
    发表了文章 2023-03-02 10:47:28

    XGBoost和LightGBM时间序列预测对比

    XGBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型,它们都有着高效的性能表现,但是在某些情况下,它们也有着不同的特点。
  • 03.01 10:29:10
    发表了文章 2023-03-01 10:29:10

    使用手工特征提升模型性能

    本文将使用信用违约数据集介绍手工特征的概念和创建过程。

2023年02月

  • 02.28 10:41:02
    发表了文章 2023-02-28 10:41:02

    非参数检验方法,核密度估计简介

    核密度估计(Kernel Density Estimation,简称KDE)是一种非参数统计方法,用于估计数据样本背后的概率密度函数。
  • 02.27 10:31:06
    发表了文章 2023-02-27 10:31:06

    聚类算法(下):10个聚类算法的评价指标

    上篇文章我们已经介绍了一些常见的聚类算法,下面我们将要介绍评估聚类算法的指标
  • 02.26 09:33:57
    发表了文章 2023-02-26 09:33:57

    聚类算法(上):8个常见的无监督聚类方法介绍和比较

    本文将全面概述Scikit-Learn库中用于的聚类技术以及各种评估方法。本文作为第一部分将介绍和比较各种聚类算法
  • 02.25 09:25:31
    发表了文章 2023-02-25 09:25:31

    稀疏特征和密集特征

    在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。
  • 02.24 10:44:55
    发表了文章 2023-02-24 10:44:55

    选择最佳机器学习模型的10步指南

    机器学习可以用来解决广泛的问题。但是有很多多不同的模型可以选择,要知道哪一个适合是一个非常麻烦的事情。本文的总结将帮助你选择最适合需求的机器学习模型。
  • 02.23 10:14:55
    发表了文章 2023-02-23 10:14:55

    在Pandas中通过时间频率来汇总数据的三种常用方法

    当我们的数据涉及日期和时间时,分析随时间变化变得非常重要。Pandas提供了一种方便的方法,可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。
  • 02.22 10:31:24
    发表了文章 2023-02-22 10:31:24

    广义学习矢量量化(GLVQ)分类算法介绍和代码实现

    广义学习矢量量化(Generalized Learning Vector Quantization,GLVQ)是一种基于原型的分类算法,用于将输入数据分配到先前定义的类别中。
  • 02.21 10:17:21
    发表了文章 2023-02-21 10:17:21

    计算时间序列周期的三种方法

    周期是数据中出现重复模式所需的时间长度。更具体地说,它是模式的一个完整周期的持续时间。在这篇文章中,将介绍计算时间序列周期的三种不同方法。
  • 02.20 10:09:15
    发表了文章 2023-02-20 10:09:15

    使用PyTorch-LSTM进行单变量时间序列预测的示例教程

    时间序列是指在一段时间内发生的任何可量化的度量或事件。尽管这听起来微不足道,但几乎任何东西都可以被认为是时间序列。一个月里你每小时的平均心率,一年里一只股票的日收盘价,一年里某个城市每周发生的交通事故数。在任何一段时间段内记录这些信息都被认为是一个时间序列。对于这些例子中的每一个,都有事件发生的频率(每天、每周、每小时等)和事件发生的时间长度(一个月、一年、一天等)。
  • 02.19 09:59:17
    发表了文章 2023-02-19 09:59:17

    PyTorch 并行训练 DistributedDataParallel完整代码示例

    使用大型数据集训练大型深度神经网络 (DNN) 的问题是深度学习领域的主要挑战。 随着 DNN 和数据集规模的增加,训练这些模型的计算和内存需求也会增加。 这使得在计算资源有限的单台机器上训练这些模型变得困难甚至不可能。 使用大型数据集训练大型 DNN 的一些主要挑战包括:
  • 02.18 10:39:51
    发表了文章 2023-02-18 10:39:51

    概率和似然

    在日常生活中,我们经常使用这些术语。但是在统计学和机器学习上下文中使用时,有一个本质的区别。本文将用理论和例子来解释概率和似然之间的关键区别。
  • 02.17 11:08:40
    发表了文章 2023-02-17 11:08:40

    知识图谱嵌入模型 (KGE) 的总结和比较

    知识图谱嵌入(KGE)是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型。它们将“知识”投射到一个连续的低维空间,这些低维空间向量一般只有几百个维度(用来表示知识存储的内存效率)。向量空间中,每个点代表一个概念,每个点在空间中的位置具有语义意义,类似于词嵌入。
  • 02.16 10:44:31
    发表了文章 2023-02-16 10:44:31

    2023年2月的十篇深度学习论文推荐

    本月的论文包括语言模型、扩散模型、音乐生成、多模态等主题。
  • 02.15 09:59:48
    发表了文章 2023-02-15 09:59:48

    100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)

    提起三维重建技术,NeRF是一个绝对绕不过去的名字。这项逆天的技术,一经提出就被众多研究者所重视,对该技术进行深入研究并提出改进已经成为一个热点。不到两年的时间,NeRF及其变种已经成为重建领域的主流。本文通过100行的Pytorch代码实现最初的 NeRF 论文。
  • 02.14 10:22:14
    发表了文章 2023-02-14 10:22:14

    使用Pandas也可以进行数据可视化

    在本文中,我们介绍使用 Pandas 进行数据可视化的基础知识,包括创建简单图、自定义图以及使用多个DF进行绘图。
  • 02.13 10:07:29
    发表了文章 2023-02-13 10:07:29

    10个用于可解释AI的Python库

    XAI的目标是为模型的行为和决定提供有意义的解释,本文整理了目前能够看到的10个用于可解释AI的Python库
  • 02.12 10:34:41
    发表了文章 2023-02-12 10:34:41

    GPT-3 vs Bert vs GloVe vs Word2vec 文本嵌入技术的性能对比测试

    本文将GPT3与三种传统文本嵌入技术GloVe、Word2vec(Mikolov ,2013 年)和 BERT生成的嵌入进行性能的简单对比。
  • 02.11 11:03:54
    发表了文章 2023-02-11 11:03:54

    使用scikit-learn为PyTorch 模型进行超参数网格搜索

    scikit-learn是Python中最好的机器学习库,而PyTorch又为我们构建模型提供了方便的操作,能否将它们的优点整合起来呢?
  • 02.10 11:01:16
    发表了文章 2023-02-10 11:01:16

    机器学习评估指标的十个常见面试问题

    评估指标是用于评估机器学习模型性能的定量指标。本文整理了10个常见的问题。
  • 02.09 11:29:27
    发表了文章 2023-02-09 11:29:27

    如何解决混合精度训练大模型的局限性问题

    混合精度已经成为训练大型深度学习模型的必要条件,但也带来了许多挑战。在这篇文章中,我们将讨论混合精确训练的数值稳定性问题。
  • 02.08 10:18:41
    发表了文章 2023-02-08 10:18:41

    Numpy中数组和矩阵操作的数学函数

    Numpy 是一个强大的 Python 计算库。它提供了广泛的数学函数,可以对数组和矩阵执行各种操作。本文中将整理一些基本和常用的数学操作。
  • 02.07 11:19:22
    发表了文章 2023-02-07 11:19:22

    3个用于时间序列数据整理的Pandas函数

    本文将演示 3 个处理时间序列数据最常用的 pandas 操作
  • 02.06 12:41:34
    发表了文章 2023-02-06 12:41:34

    使用JAX实现完整的Vision Transformer

    本文将展示如何使用JAX/Flax实现Vision Transformer (ViT),以及如何使用JAX/Flax训练ViT。
  • 02.05 10:30:33
    发表了文章 2023-02-05 10:30:33

    论文推荐:ACMix整合self-Attention和Convolution (ACMix)的优点的混合模型

    混合模型ACmix将自注意与卷积的整合,同时具有自注意和卷积的优点。这是清华大学、华为和北京人工智能研究院共同发布在2022年CVPR中的论文
  • 02.04 10:35:16
    发表了文章 2023-02-04 10:35:16

    使用谱聚类(spectral clustering)进行特征选择

    在本文中,我们将介绍一种从相关特征的高维数据中选择或提取特征的有用方法。
  • 02.03 09:52:19
    发表了文章 2023-02-03 09:52:19

    Pandas的apply, map, transform介绍和性能测试

    在这篇文章中,我们将通过一些示例讨论apply、agg、map和transform的预期用途。
  • 02.02 10:49:06
    发表了文章 2023-02-02 10:49:06

    2023 年 1 月的5篇深度学习论文推荐

    本文整理了 2023 年 1 月5 篇著名的 AI 论文,涵盖了计算机视觉、自然语言处理等方面的新研究。
  • 02.01 11:07:59
    发表了文章 2023-02-01 11:07:59

    在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型

    本文将介绍解梯度检查点(Gradient Checkpointing),这是一种可以让你以增加训练时间为代价在 GPU 中训练大模型的技术。 我们将在 PyTorch 中实现它并训练分类器模型。

2023年01月

  • 01.31 10:54:51
    发表了文章 2023-01-31 10:54:51

    CRPS:贝叶斯机器学习模型的评分函数

    连续分级概率评分(Continuous Ranked Probability Score, CRPS)或“连续概率排位分数”是一个函数或统计量,可以将分布预测与真实值进行比较。
  • 01.30 10:48:23
    发表了文章 2023-01-30 10:48:23

    不平衡数据集的建模的技巧和策略

    不平衡数据集是指一个类中的示例数量与另一类中的示例数量显著不同的情况。 例如在一个二元分类问题中,一个类只占总样本的一小部分,这被称为不平衡数据集。类不平衡会在构建机器学习模型时导致很多问题。
  • 01.29 10:34:34
    发表了文章 2023-01-29 10:34:34

    DeepTime:时间序列预测中的元学习模型

    DeepTime,是一个结合使用元学习的深度时间指数模型。通过使用元学习公式来预测未来,以应对时间序列中的常见问题(协变量偏移和条件分布偏移——非平稳)。该模型是时间序列预测的元学习公式协同作用的一个很好的例子。
  • 01.28 10:45:15
    发表了文章 2023-01-28 10:45:15

    使用OpenAI的Whisper 模型进行语音识别

    本文将解释用于训练的数据集的种类以及模型的训练方法,以及如何使用Whisper
  • 01.27 10:36:21
    发表了文章 2023-01-27 10:36:21

    监控Python 内存使用情况和代码执行时间

    我的代码的哪些部分运行时间最长、内存最多?我怎样才能找到需要改进的地方?”在开发过程中,我很确定我们大多数人都会想知道这一点,在本文中总结了一些方法来监控 Python 代码的时间和内存使用情况。
  • 01.26 11:52:43
    发表了文章 2023-01-26 11:52:43

    使用CNN进行2D路径规划

    卷积神经网络(CNN)是解决图像分类、分割、目标检测等任务的流行模型。本文将CNN应用于解决简单的二维路径规划问题。主要使用Python, PyTorch, NumPy和OpenCV。
  • 01.25 11:24:45
    发表了文章 2023-01-25 11:24:45

    这20个Pandas函数可以完成80%的数据科学工作

    Pandas 是数据科学社区中使用最广泛的库之一,它是一个强大的工具,可以进行数据操作、清理和分析。本文将提供最常用的 Pandas 函数以及如何实际使用它们的样例。我们将涵盖从基本数据操作到高级数据分析技术的所有内容,到本文结束时,你会深入了解如何使用 Pandas 并使数据科学工作流程更高效。
  • 01.24 11:10:43
    发表了文章 2023-01-24 11:10:43

    使用Stable-Diffusion生成视频的完整教程

    本文是关于如何使用cuda和Stable-Diffusion生成视频的完整指南,将使用cuda来加速视频生成,并且可以使用Kaggle的TESLA GPU来免费执行我们的模型。
  • 01.23 10:56:11
    发表了文章 2023-01-23 10:56:11

    7个流行的强化学习算法及代码实现

    目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。 这些算法已被用于在游戏、机器人和决策制定等各种应用中,并且这些流行的算法还在不断发展和改进,本文我们将对其做一个简单的介绍。
  • 01.22 11:28:07
    发表了文章 2023-01-22 11:28:07

    2023 年8个ChatGPT 的替代品

    OpenAI 于 2022 年 11 月下旬推出的 ChatGPT 在网络世界引起了不小的轰动。它不仅引起了社交媒体用户的关注,也引起了各大媒体的关注。
  • 01.21 11:35:49
    发表了文章 2023-01-21 11:35:49

    8种时间序列分类方法总结

    对时间序列进行分类是应用机器和深度学习模型的常见任务之一。本篇文章将涵盖 8 种类型的时间序列分类方法。这包括从简单的基于距离或间隔的方法到使用深度神经网络的方法。这篇文章旨在作为所有时间序列分类算法的参考文章。
  • 01.20 10:39:09
    发表了文章 2023-01-20 10:39:09

    深度学习中高斯噪声:为什么以及如何使用

    在数学上,高斯噪声是一种通过向输入数据添加均值为零和标准差(σ)的正态分布随机值而产生的噪声。
  • 01.19 19:47:04
    发表了文章 2023-01-19 19:47:04

    可视化VIT中的注意力

    ViT中最主要的就是注意力机制,所以可视化注意力就成为了解ViT的重要步骤,所以我们这里介绍如何可视化ViT中的注意力
  • 01.18 11:04:40
    发表了文章 2023-01-18 11:04:40

    CycleMLP:一种用于密集预测的mlp架构

    CycleMLP由香港大学、商汤科技研究院和上海人工智能实验室共同开发,在2022年ICLR上发布。
  • 01.17 11:04:11
    发表了文章 2023-01-17 11:04:11

    Jupyter Lab 的 10 个有用技巧

    JupyterLab是 Jupyter Notebook「新」界面。它包含了jupyter notebook的所有功能,并升级增加了很多功能。它最大的更新是模块化的界面,可以在同一个窗口以标签的形式同时打开好几个文档,同时插件管理非常强大,使用起来要比jupyter notebook高大尚许多。
  • 发表了文章 2025-10-17

    REFRAG技术详解:如何通过压缩让RAG处理速度提升30倍

  • 发表了文章 2025-10-16

    RAG检索质量差?这5种分块策略帮你解决70%的问题

  • 发表了文章 2025-10-15

    别再用均值填充了!MICE算法教你正确处理缺失数据

  • 发表了文章 2025-10-14

    LlamaIndex检索调优实战:分块、HyDE、压缩等8个提效方法快速改善答案质量

  • 发表了文章 2025-10-13

    斯坦福ACE框架:让AI自己学会写prompt,性能提升17%成本降87%

  • 发表了文章 2025-10-12

    氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"

  • 发表了文章 2025-10-11

    12 种 Pandas 测试技巧,让数据处理少踩坑

  • 发表了文章 2025-10-10

    mmBERT:307M参数覆盖1800+语言,3万亿tokens训练

  • 发表了文章 2025-10-09

    vLLM 吞吐量优化实战:10个KV-Cache调优方法让tokens/sec翻倍

  • 发表了文章 2025-10-08

    vLLM推理加速指南:7个技巧让QPS提升30-60%

  • 发表了文章 2025-10-06

    向量存储vs知识图谱:LLM记忆系统技术选型

  • 发表了文章 2025-10-05

    NumPy广播:12个技巧替代循环,让数组计算快40倍

  • 发表了文章 2025-10-04

    Google开源Tunix:JAX生态的LLM微调方案来了

  • 发表了文章 2025-10-03

    从DQN到Double DQN:分离动作选择与价值评估,解决强化学习中的Q值过估计问题

  • 发表了文章 2025-10-02

    PINN训练新思路:把初始条件和边界约束嵌入网络架构,解决多目标优化难题

  • 发表了文章 2025-10-01

    Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测

  • 发表了文章 2025-09-30

    Min-p采样:通过动态调整截断阈值让大模型文本生成兼顾创造力与逻辑性

  • 发表了文章 2025-09-29

    从零构建能自我优化的AI Agent:Reflection和Reflexion机制对比详解与实现

  • 发表了文章 2025-09-28

    从零构建短视频推荐系统:双塔算法架构解析与代码实现

  • 发表了文章 2025-09-27

    AI智能体框架怎么选?7个主流工具详细对比解析

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息