Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区1087

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1556篇文章
357条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息

2023年06月

  • 06.08 10:08:56
    发表了文章 2023-06-08 10:08:56

    CAM, Grad-CAM, Grad-CAM++可视化CNN方式的代码实现和对比

    当使用神经网络时,我们可以通过它的准确性来评估模型的性能,但是当涉及到计算机视觉问题时,不仅要有最好的准确性,还要有可解释性和对哪些特征/数据点有助于做出决策的理解。模型专注于正确的特征比模型的准确性更重要。
  • 06.07 10:07:24
    发表了文章 2023-06-07 10:07:24

    JupyterLab 4.0 发布了

    JupyterLab 是 Jupyter Notebook 的下一代版本,它提供了更强大的功能和更灵活的用户界面,6月6日,官方发布了JupyterLab 4.0的说明,并且说该版本是下一个主要的版本。
  • 06.06 10:18:31
    发表了文章 2023-06-06 10:18:31

    使用Optuna进行PyTorch模型的超参数调优

    Optuna是一个开源的超参数优化框架,Optuna与框架无关,可以在任何机器学习或深度学习框架中使用它。本文将以表格数据为例,使用Optuna对PyTorch模型进行超参数调优。
  • 06.05 09:08:20
    发表了文章 2023-06-05 09:08:20

    Python中的Time和DateTime

    Python在处理与时间相关的操作时有两个重要模块:time和datetime。在本文中,我们介绍这两个模块并为每个场景提供带有代码和输出的说明性示例。
  • 06.04 09:51:27
    发表了文章 2023-06-04 09:51:27

    设置和使用DragGAN:搭建非官方的演示版

    DragGAN的官方版还没有发布,但是已经有非官方版的实现了,我们看看如何使用。
  • 06.03 09:25:13
    发表了文章 2023-06-03 09:25:13

    七篇深入理解机器学习和深度学习的读物推荐

    在这篇文章中将介绍7篇机器学习和深度学习的论文或者图书出版物,这些内容都论文极大地影响了我对该领域的理解,如果你想深入了解机器学习的内容,哪么推荐阅读。
  • 06.02 09:24:28
    发表了文章 2023-06-02 09:24:28

    QLoRa:在消费级GPU上微调大型语言模型

    大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如,650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器,花费的开销也不是所有人都能够承担的。
  • 06.01 09:09:24
    发表了文章 2023-06-01 09:09:24

    这8个NumPy函数可以解决90%的常见问题

    NumPy是一个用于科学计算和数据分析的Python库,也是机器学习的支柱。可以说NumPy奠定了Python在机器学习中的地位。NumPy提供了一个强大的多维数组对象,以及广泛的数学函数,可以对大型数据集进行有效的操作。这里的“大”是指数百万行。

2023年05月

  • 05.31 09:52:49
    发表了文章 2023-05-31 09:52:49

    DHVT:在小数据集上降低VIT与卷积神经网络之间差距,解决从零开始训练的问题

    VIT在归纳偏置方面存在空间相关性和信道表示的多样性两大缺陷。所以论文提出了动态混合视觉变压器(DHVT)来增强这两种感应偏差。
  • 05.30 10:29:04
    发表了文章 2023-05-30 10:29:04

    基于GMM的一维时序数据平滑算法

    本文将介绍我们使用高斯混合模型(GMM)算法作为一维数据的平滑和去噪算法。
  • 05.29 09:33:18
    发表了文章 2023-05-29 09:33:18

    数据偏度介绍和处理方法

    偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。它描述了数据分布的尾部(tail)在平均值的哪一侧更重或更长。偏度可以帮助我们了解数据的偏斜性质,即数据相对于平均值的分布情况。
  • 05.28 10:09:45
    发表了文章 2023-05-28 10:09:45

    深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

    平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。在目标检测任务中,模型需要识别图像中的不同目标,并返回它们的边界框(bounding box)和类别。mAP用于综合考虑模型在不同类别上的准确度和召回率。
  • 05.27 10:05:41
    发表了文章 2023-05-27 10:05:41

    Scikit-LLM:将大语言模型整合进Sklearn的工作流

    我们以前介绍过Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM,它结合了强大的语言模型,如ChatGPT和scikit-learn。但这个并不是让我们自动化scikit-learn,而是将scikit-learn和语言模型进行整合,scikit-learn也可以处理文本数据了。
  • 05.26 10:02:47
    发表了文章 2023-05-26 10:02:47

    PyTorch-Forecasting一个新的时间序列预测库

    时间序列预测在金融、天气预报、销售预测和需求预测等各个领域发挥着至关重要的作用。PyTorch- forecasting是一个建立在PyTorch之上的开源Python包,专门用于简化和增强时间序列的工作。
  • 05.24 10:07:59
    发表了文章 2023-05-24 10:07:59

    Jupyter Notebook 10个提升体验的高级技巧

    Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。Jupyter 笔记本的基本功能大家都已经很熟悉了,但还有一些鲜为人知的技巧可以大大提高生产力和效率。在这篇文章中,我将介绍10个可以提升体验的高级技巧。
  • 05.23 10:43:36
    发表了文章 2023-05-23 10:43:36

    升级到PyTorch 2.0的技巧总结

    PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢? PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。 与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。
  • 05.22 09:56:29
    发表了文章 2023-05-22 09:56:29

    计算GMAC和GFLOPS

    GMAC 代表“Giga Multiply-Add Operations per Second”(每秒千兆乘法累加运算),是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量,以每秒十亿 (giga) 表示。
  • 05.21 10:02:49
    发表了文章 2023-05-21 10:02:49

    NSFW 图片分类

    NSFW指的是 **不适宜工作场所**("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。
  • 05.20 09:49:30
    发表了文章 2023-05-20 09:49:30

    常用的视频帧提取工具和方法总结

    视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中,视频可以看作是由一系列连续的图像帧组成的。因此,要对视频进行理解和分析,首先需要从视频中提取出每一帧的图像。
  • 05.19 10:09:34
    发表了文章 2023-05-19 10:09:34

    使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具

    Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。它提供一个框架将LLM与其他数据源(如互联网或个人文件)连接起来。这允许开发人员将多个命令链接在一起,以创建更复杂的应用程序。包括最近比较火爆的AutoGPT等都是使用了Langchain框架进行开发的。所以本文将介绍如何使用LangChain来创建我们自己的论文汇总工具。
  • 05.18 09:52:35
    发表了文章 2023-05-18 09:52:35

    LoRA:大模型的低秩自适应微调模型

    对于大型模型来说,重新训练所有模型参数的全微调变得不可行。比如GPT-3 175B,模型包含175B个参数吗,无论是微调训练和模型部署,都是不可能的事。所以Microsoft 提出了低秩自适应(Low-Rank Adaptation, LoRA),它冻结了预先训练好的模型权重,并将可训练的秩的分解矩阵注入到Transformer体系结构的每一层,从而大大减少了下游任务的可训练参数数量。
  • 05.17 10:40:58
    发表了文章 2023-05-17 10:40:58

    Github Copilot Chat的规则泄露,详细分析这31条规则

    GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它是一种基于机器学习的代码自动完成工具,旨在帮助开发人员更高效地编写代码。
  • 05.16 09:54:36
    发表了文章 2023-05-16 09:54:36

    LayerNorm 在 Transformers 中对注意力的作用研究

    LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。
  • 05.15 09:47:52
    发表了文章 2023-05-15 09:47:52

    数据信息汇总的7种基本技术总结

    数据汇总是一个将原始数据简化为其主要成分或特征的过程,使其更容易理解、可视化和分析。本文介绍总结数据的七种重要方法,有助于理解数据实质的内容。
  • 05.14 09:14:13
    发表了文章 2023-05-14 09:14:13

    使用RobustPCA 进行时间序列的异常检测

    鲁棒主成分分析(Robust Principal Component Analysis, RobustPCA)是一种将时间序列矩阵分解为低秩分量和稀疏分量的技术。这种分解能够识别潜在的趋势,以及检测异常和异常值。
  • 05.13 09:43:42
    发表了文章 2023-05-13 09:43:42

    视觉大模型DINOv2:自我监督学习的新领域

    本文将介绍DINOv2是如何改进的,以及这些进步可能对整个领域有什么影响。
  • 05.12 09:52:48
    发表了文章 2023-05-12 09:52:48

    形态学运算与仿真:图像处理中形态学操作的简单解释

    形态学是图像处理领域的一个分支,主要用于描述和处理图像中的形状和结构。形态学可以用于提取图像中的特征、消除噪声、改变图像的形状等。其中形态学的核心操作是形态学运算。
  • 05.11 09:57:00
    发表了文章 2023-05-11 09:57:00

    Softmax简介

    Softmax是一种数学函数,通常用于将一组任意实数转换为表示概率分布的实数。其本质上是一种归一化函数,可以将一组任意的实数值转化为在[0, 1]之间的概率值,因为softmax将它们转换为0到1之间的值,所以它们可以被解释为概率。如果其中一个输入很小或为负,softmax将其变为小概率,如果输入很大,则将其变为大概率,但它将始终保持在0到1之间。
  • 05.10 10:19:41
    发表了文章 2023-05-10 10:19:41

    使用Actor-Critic的DDPG强化学习算法控制双关节机械臂

    在本文中,我们将介绍在 Reacher 环境中训练智能代理控制双关节机械臂,这是一种使用 Unity ML-Agents 工具包开发的基于 Unity 的模拟程序。 我们的目标是高精度的到达目标位置,所以这里我们可以使用专为连续状态和动作空间设计的最先进的Deep Deterministic Policy Gradient (DDPG) 算法。
  • 05.09 10:41:43
    发表了文章 2023-05-09 10:41:43

    Transformers回顾 :从BERT到GPT4

    人工智能已成为近年来最受关注的话题之一,由于神经网络的发展,曾经被认为纯粹是科幻小说中的服务现在正在成为现实。从对话代理到媒体内容生成,人工智能正在改变我们与技术互动的方式。特别是机器学习 (ML) 模型在自然语言处理 (NLP) 领域取得了重大进展。一个关键的突破是引入了“自注意力”和用于序列处理的Transformers架构,这使得之前主导该领域的几个关键问题得以解决。
  • 05.08 09:50:09
    发表了文章 2023-05-08 09:50:09

    使用思维链(Chain-of-thoughts)提示在大型语言模型中引出推理

    语言模型(LM)在NLP领域的发展速度非常快,特别是在大型语言模型(LLM)方面:当语言模型具有大量参数或权重/系数时,它们被称为“大型”。这些“大型”语言模型拥有处理和理解大量自然语言数据的能力。
  • 05.07 09:12:40
    发表了文章 2023-05-07 09:12:40

    UNeXt:基于 MLP 的快速医学图像分割网络

    UNeXt是约翰霍普金斯大学在2022年发布的论文。它在早期阶段使用卷积,在潜在空间阶段使用 MLP。通过一个标记化的 MLP 块来标记和投影卷积特征,并使用 MLP 对表示进行建模。对输入通道进行移位,可以专注于学习局部依赖性。
  • 05.06 09:34:30
    发表了文章 2023-05-06 09:34:30

    KNN中不同距离度量对比和介绍

    k近邻算法KNN是一种简单而强大的算法,可用于分类和回归任务。他实现简单,主要依赖不同的距离度量来判断向量间的区别,但是有很多距离度量可以使用,所以本文演示了KNN与三种不同距离度量(Euclidean、Minkowski和Manhattan)的使用。
  • 05.05 09:39:29
    发表了文章 2023-05-05 09:39:29

    交互式数据分析和处理新方法:pandas-ai =Pandas + ChatGPT

    Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。
  • 05.04 10:22:47
    发表了文章 2023-05-04 10:22:47

    VLAD Diffusion,一个更好用且易于安装的Stable Diffusion Web UI

    VLAD Diffusion 是我们前面介绍过的 AUTOMATIC1111/stable-diffusion-webui的一个定制的更新,它主要是为了更频繁发布的更新和错误修复。
  • 05.03 09:10:25
    发表了文章 2023-05-03 09:10:25

    余弦相似度算法进行客户流失分类预测

    余弦相似性是一种用于计算两个向量之间相似度的方法,常被用于文本分类和信息检索领域。
  • 05.02 10:33:17
    发表了文章 2023-05-02 10:33:17

    医学图像的深度学习的完整代码示例:使用Pytorch对MRI脑扫描的图像进行分割

    图像分割是医学图像分析中最重要的任务之一,在许多临床应用中往往是第一步也是最关键的一步。在脑MRI分析中,图像分割通常用于测量和可视化解剖结构,分析大脑变化,描绘病理区域以及手术计划和图像引导干预,分割是大多数形态学分析的先决条件。

2023年04月

  • 04.30 10:28:06
    发表了文章 2023-04-30 10:28:06

    使用Dino+SAM+Stable diffusion 自动进行图片的修改

    SAM 可以准确识别和提取图像中的对象,与Stable Diffusion 相结合,可以对分割后的图像进行细微的更改。
  • 04.29 13:11:48
    发表了文章 2023-04-29 13:11:48

    将时间序列转换为分类问题

    本文将以股票交易作为示例。我们用 AI 模型预测股票第二天是涨还是跌。在此背景下,比较了分类算法 XGBoost、随机森林和逻辑分类器。文章的另外一个重点是数据准备。我们必须如何转换数据以便模型可以处理它。
  • 04.28 16:03:35
    发表了文章 2023-04-28 16:03:35

    从零开始实现VAE和CVAE

    扩散模型可以看作是一个层次很深的VAE(变分自编码器),前向(forward,或者译为正向)的过程,通过在多个尺度上添加噪声来逐步扰乱数据分布;然后是反向的过程,去学习如何恢复数据结构,上述的破坏和恢复过程分别对应于VAE中的编码和解码过程。所以VAE是一个重要的概念需要掌握,本文将用python从头开始实现VAE和CVAE,来增加对于它们的理解。
  • 04.27 10:25:06
    发表了文章 2023-04-27 10:25:06

    ChatGPT的提示的一些高级知识

    作为一个大型语言模型(LLM)接口,ChatGPT有令人印象深刻的潜力,但是真正能否用好取决与我们的提示(Prompt ),一个好的提示可以让ChatGPT晋升到一个更好的层次。
  • 04.26 09:53:58
    发表了文章 2023-04-26 09:53:58

    AutoGPT也有Web UI了

    AutoGPT能够在你的电脑上做任何你想做的事情,并且我们在前面的文章中也介绍了其他的一些类似的应用。
  • 04.25 10:24:01
    发表了文章 2023-04-25 10:24:01

    使用PyTorch和Flower 进行联邦学习

    本文将介绍如何使用 Flower 构建现有机器学习工作的联邦学习版本。我们将使用 PyTorch 在 CIFAR-10 数据集上训练卷积神经网络,然后将展示如何修改训练代码以联邦的方式运行训练。
  • 04.24 10:13:21
    发表了文章 2023-04-24 10:13:21

    参数与非参数检验:理解差异并正确使用

    数据科学是一个快速发展的领域,它在很大程度上依赖于统计技术来分析和理解复杂的数据集。这个过程的一个关键部分是假设检验,它有助于确定从样本中获得的结果是否可以推广到总体。
  • 04.23 10:20:56
    发表了文章 2023-04-23 10:20:56

    论文推荐:基于联合损失函数的多任务肿瘤分割

    以FFANet为主干,加入分类的分支,将模型扩展为多任务图像分割框架,设计了用于分类和分割的联合损失函数。
  • 04.22 10:23:49
    发表了文章 2023-04-22 10:23:49

    KL散度和交叉熵的对比介绍

    KL散度(Kullback-Leibler Divergence)和交叉熵(Cross Entropy)是在机器学习中广泛使用的概念。这两者都用于比较两个概率分布之间的相似性,但在一些方面,它们也有所不同。本文将对KL散度和交叉熵的详细解释和比较。
  • 04.21 10:01:29
    发表了文章 2023-04-21 10:01:29

    AutoGPT、AgentGPT、BabyAGI、HuggingGPT、CAMEL:各种基于GPT-4自治系统总结

    ChatGPT和LLM技术的出现使得这些最先进的语言模型席卷了世界,不仅是AI的开发人员,爱好者和一些组织也在研究探索集成和构建这些模型的创新方法。各种平台如雨后春笋般涌现,集成并促进新应用程序的开发。
  • 04.20 10:05:19
    发表了文章 2023-04-20 10:05:19

    从Pandas快速切换到Polars :数据的ETL和查询

    对于我们日常的数据清理、预处理和分析方面的大多数任务,Pandas已经绰绰有余。但是当数据量变得非常大时,它的性能开始下降。
  • 04.19 11:07:55
    发表了文章 2023-04-19 11:07:55

    Grad-CAM的详细介绍和Pytorch代码实现

    Grad-CAM (Gradient-weighted Class Activation Mapping) 是一种可视化深度神经网络中哪些部分对于预测结果贡献最大的技术。它能够定位到特定的图像区域,从而使得神经网络的决策过程更加可解释和可视化。
  • 发表了文章 2025-11-28

    GraphRAG进阶:基于Neo4j与LlamaIndex的DRIFT搜索实现详解

  • 发表了文章 2025-11-27

    从零开始:用Python和Gemini 3四步搭建你自己的AI Agent

  • 发表了文章 2025-11-26

    LLM提示注入攻击深度解析:从原理到防御的完整应对方案

  • 发表了文章 2025-11-25

    分类模型校准:ROC-AUC不够?用ECE/pMAD评估概率质量

  • 发表了文章 2025-11-24

    Pixeltable:一张表搞定embeddings、LLM、向量搜索,多模态开发不再拼凑工具

  • 发表了文章 2025-11-23

    JAX 核心特性详解:纯函数、JIT 编译、自动微分等十大必知概念

  • 发表了文章 2025-11-22

    高级检索增强生成系统:LongRAG、Self-RAG 和 GraphRAG 的实现与选择

  • 发表了文章 2025-11-21

    CrewAI 上手攻略:多 Agent 自动化处理复杂任务,让 AI 像员工一样分工协作

  • 发表了文章 2025-11-20

    PyTorch 分布式训练底层原理与 DDP 实战指南

  • 发表了文章 2025-11-19

    LEANN:一个极简的本地向量数据库

  • 发表了文章 2025-11-18

    Pandas GroupBy 的 10 个实用技巧

  • 发表了文章 2025-11-17

    TOON:专为 LLM 设计的轻量级数据格式

  • 发表了文章 2025-11-16

    Python 3.14 实用技巧:10个让代码更清晰的小改进

  • 发表了文章 2025-11-15

    Python 开发必备:tempfile 模块深度解析

  • 发表了文章 2025-11-14

    超参数调优:Grid Search 和 Random Search 的实战对比

  • 发表了文章 2025-11-13

    QF-Lib:用一个库搞定Python量化回测和策略开发

  • 发表了文章 2025-11-12

    HaluMem:揭示当前AI记忆系统的系统性缺陷,系统失效率超50%

  • 发表了文章 2025-11-11

    AI智能体落地:Agent-Assist vs 全自动化完整决策指南

  • 发表了文章 2025-11-10

    基于 LangGraph 的对话式 RAG 系统实现:多轮检索与自适应查询优化

  • 发表了文章 2025-11-09

    LightRAG 实战: 基于 Ollama 搭建带知识图谱的可控 RAG 系统

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息