Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区1044

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1485篇文章
354条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息

2023年06月

  • 06.16 09:31:34
    发表了文章 2023-06-16 09:31:34

    时间序列异常检测:统计和机器学习方法介绍

    在本文中将探索各种方法来揭示时间序列数据中的异常模式和异常值。
  • 06.15 09:10:45
    发表了文章 2023-06-15 09:10:45

    XGBoost超参数调优指南

    本文将详细解释XGBoost中十个最常用超参数的介绍,功能和值范围,及如何使用Optuna进行超参数调优。
  • 06.14 10:05:17
    发表了文章 2023-06-14 10:05:17

    预训练、微调和上下文学习

    最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程。
  • 06.13 09:40:31
    发表了文章 2023-06-13 09:40:31

    量子机器学习Variational Quantum Classifier (VQC)简介

    变分量子分类器(Variational Quantum Classifier,简称VQC)是一种利用量子计算技术进行分类任务的机器学习算法。它属于量子机器学习算法家族,旨在利用量子计算机的计算能力,潜在地提升经典机器学习方法的性能。
  • 06.12 10:14:09
    发表了文章 2023-06-12 10:14:09

    Segment-Anything的一些相关论文总结

    Segment-Anything的一些相关论文总结
  • 06.11 10:55:01
    发表了文章 2023-06-11 10:55:01

    时间序列预测的20个基本概念总结

    时间序列是一组按时间顺序排列的数据点
  • 06.10 09:53:38
    发表了文章 2023-06-10 09:53:38

    使用NLPAUG 进行文本数据的扩充增强

    在机器学习中,训练数据集的质量在很大程度上决定了模型的有效性。我们往往没有足够的多样化数据,这影响了模型的准确性。这时数据增强技术就派上了用场。
  • 06.09 09:54:54
    发表了文章 2023-06-09 09:54:54

    谷歌发布一个免费的生成式人工智能课程

    在过去几周,我们看到的都是AI将如何改变生活,无论是ChatGPT的文本生成,还是SD,Midjourney 的图像生成,这些AI的特点就是都是生成式的AI。而几天前,谷歌推出了一个生成式人工智能学习课程,课程涵盖了生成式人工智能入门、大型语言模型、图像生成等主题。
  • 06.08 10:08:56
    发表了文章 2023-06-08 10:08:56

    CAM, Grad-CAM, Grad-CAM++可视化CNN方式的代码实现和对比

    当使用神经网络时,我们可以通过它的准确性来评估模型的性能,但是当涉及到计算机视觉问题时,不仅要有最好的准确性,还要有可解释性和对哪些特征/数据点有助于做出决策的理解。模型专注于正确的特征比模型的准确性更重要。
  • 06.07 10:07:24
    发表了文章 2023-06-07 10:07:24

    JupyterLab 4.0 发布了

    JupyterLab 是 Jupyter Notebook 的下一代版本,它提供了更强大的功能和更灵活的用户界面,6月6日,官方发布了JupyterLab 4.0的说明,并且说该版本是下一个主要的版本。
  • 06.06 10:18:31
    发表了文章 2023-06-06 10:18:31

    使用Optuna进行PyTorch模型的超参数调优

    Optuna是一个开源的超参数优化框架,Optuna与框架无关,可以在任何机器学习或深度学习框架中使用它。本文将以表格数据为例,使用Optuna对PyTorch模型进行超参数调优。
  • 06.05 09:08:20
    发表了文章 2023-06-05 09:08:20

    Python中的Time和DateTime

    Python在处理与时间相关的操作时有两个重要模块:time和datetime。在本文中,我们介绍这两个模块并为每个场景提供带有代码和输出的说明性示例。
  • 06.04 09:51:27
    发表了文章 2023-06-04 09:51:27

    设置和使用DragGAN:搭建非官方的演示版

    DragGAN的官方版还没有发布,但是已经有非官方版的实现了,我们看看如何使用。
  • 06.03 09:25:13
    发表了文章 2023-06-03 09:25:13

    七篇深入理解机器学习和深度学习的读物推荐

    在这篇文章中将介绍7篇机器学习和深度学习的论文或者图书出版物,这些内容都论文极大地影响了我对该领域的理解,如果你想深入了解机器学习的内容,哪么推荐阅读。
  • 06.02 09:24:28
    发表了文章 2023-06-02 09:24:28

    QLoRa:在消费级GPU上微调大型语言模型

    大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如,650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器,花费的开销也不是所有人都能够承担的。
  • 06.01 09:09:24
    发表了文章 2023-06-01 09:09:24

    这8个NumPy函数可以解决90%的常见问题

    NumPy是一个用于科学计算和数据分析的Python库,也是机器学习的支柱。可以说NumPy奠定了Python在机器学习中的地位。NumPy提供了一个强大的多维数组对象,以及广泛的数学函数,可以对大型数据集进行有效的操作。这里的“大”是指数百万行。

2023年05月

  • 05.31 09:52:49
    发表了文章 2023-05-31 09:52:49

    DHVT:在小数据集上降低VIT与卷积神经网络之间差距,解决从零开始训练的问题

    VIT在归纳偏置方面存在空间相关性和信道表示的多样性两大缺陷。所以论文提出了动态混合视觉变压器(DHVT)来增强这两种感应偏差。
  • 05.30 10:29:04
    发表了文章 2023-05-30 10:29:04

    基于GMM的一维时序数据平滑算法

    本文将介绍我们使用高斯混合模型(GMM)算法作为一维数据的平滑和去噪算法。
  • 05.29 09:33:18
    发表了文章 2023-05-29 09:33:18

    数据偏度介绍和处理方法

    偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。它描述了数据分布的尾部(tail)在平均值的哪一侧更重或更长。偏度可以帮助我们了解数据的偏斜性质,即数据相对于平均值的分布情况。
  • 05.28 10:09:45
    发表了文章 2023-05-28 10:09:45

    深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

    平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。在目标检测任务中,模型需要识别图像中的不同目标,并返回它们的边界框(bounding box)和类别。mAP用于综合考虑模型在不同类别上的准确度和召回率。
  • 05.27 10:05:41
    发表了文章 2023-05-27 10:05:41

    Scikit-LLM:将大语言模型整合进Sklearn的工作流

    我们以前介绍过Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM,它结合了强大的语言模型,如ChatGPT和scikit-learn。但这个并不是让我们自动化scikit-learn,而是将scikit-learn和语言模型进行整合,scikit-learn也可以处理文本数据了。
  • 05.26 10:02:47
    发表了文章 2023-05-26 10:02:47

    PyTorch-Forecasting一个新的时间序列预测库

    时间序列预测在金融、天气预报、销售预测和需求预测等各个领域发挥着至关重要的作用。PyTorch- forecasting是一个建立在PyTorch之上的开源Python包,专门用于简化和增强时间序列的工作。
  • 05.24 10:07:59
    发表了文章 2023-05-24 10:07:59

    Jupyter Notebook 10个提升体验的高级技巧

    Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。Jupyter 笔记本的基本功能大家都已经很熟悉了,但还有一些鲜为人知的技巧可以大大提高生产力和效率。在这篇文章中,我将介绍10个可以提升体验的高级技巧。
  • 05.23 10:43:36
    发表了文章 2023-05-23 10:43:36

    升级到PyTorch 2.0的技巧总结

    PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢? PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。 与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。
  • 05.22 09:56:29
    发表了文章 2023-05-22 09:56:29

    计算GMAC和GFLOPS

    GMAC 代表“Giga Multiply-Add Operations per Second”(每秒千兆乘法累加运算),是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量,以每秒十亿 (giga) 表示。
  • 05.21 10:02:49
    发表了文章 2023-05-21 10:02:49

    NSFW 图片分类

    NSFW指的是 **不适宜工作场所**("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。
  • 05.20 09:49:30
    发表了文章 2023-05-20 09:49:30

    常用的视频帧提取工具和方法总结

    视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中,视频可以看作是由一系列连续的图像帧组成的。因此,要对视频进行理解和分析,首先需要从视频中提取出每一帧的图像。
  • 05.19 10:09:34
    发表了文章 2023-05-19 10:09:34

    使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具

    Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。它提供一个框架将LLM与其他数据源(如互联网或个人文件)连接起来。这允许开发人员将多个命令链接在一起,以创建更复杂的应用程序。包括最近比较火爆的AutoGPT等都是使用了Langchain框架进行开发的。所以本文将介绍如何使用LangChain来创建我们自己的论文汇总工具。
  • 05.18 09:52:35
    发表了文章 2023-05-18 09:52:35

    LoRA:大模型的低秩自适应微调模型

    对于大型模型来说,重新训练所有模型参数的全微调变得不可行。比如GPT-3 175B,模型包含175B个参数吗,无论是微调训练和模型部署,都是不可能的事。所以Microsoft 提出了低秩自适应(Low-Rank Adaptation, LoRA),它冻结了预先训练好的模型权重,并将可训练的秩的分解矩阵注入到Transformer体系结构的每一层,从而大大减少了下游任务的可训练参数数量。
  • 05.17 10:40:58
    发表了文章 2023-05-17 10:40:58

    Github Copilot Chat的规则泄露,详细分析这31条规则

    GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它是一种基于机器学习的代码自动完成工具,旨在帮助开发人员更高效地编写代码。
  • 05.16 09:54:36
    发表了文章 2023-05-16 09:54:36

    LayerNorm 在 Transformers 中对注意力的作用研究

    LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。
  • 05.15 09:47:52
    发表了文章 2023-05-15 09:47:52

    数据信息汇总的7种基本技术总结

    数据汇总是一个将原始数据简化为其主要成分或特征的过程,使其更容易理解、可视化和分析。本文介绍总结数据的七种重要方法,有助于理解数据实质的内容。
  • 05.14 09:14:13
    发表了文章 2023-05-14 09:14:13

    使用RobustPCA 进行时间序列的异常检测

    鲁棒主成分分析(Robust Principal Component Analysis, RobustPCA)是一种将时间序列矩阵分解为低秩分量和稀疏分量的技术。这种分解能够识别潜在的趋势,以及检测异常和异常值。
  • 05.13 09:43:42
    发表了文章 2023-05-13 09:43:42

    视觉大模型DINOv2:自我监督学习的新领域

    本文将介绍DINOv2是如何改进的,以及这些进步可能对整个领域有什么影响。
  • 05.12 09:52:48
    发表了文章 2023-05-12 09:52:48

    形态学运算与仿真:图像处理中形态学操作的简单解释

    形态学是图像处理领域的一个分支,主要用于描述和处理图像中的形状和结构。形态学可以用于提取图像中的特征、消除噪声、改变图像的形状等。其中形态学的核心操作是形态学运算。
  • 05.11 09:57:00
    发表了文章 2023-05-11 09:57:00

    Softmax简介

    Softmax是一种数学函数,通常用于将一组任意实数转换为表示概率分布的实数。其本质上是一种归一化函数,可以将一组任意的实数值转化为在[0, 1]之间的概率值,因为softmax将它们转换为0到1之间的值,所以它们可以被解释为概率。如果其中一个输入很小或为负,softmax将其变为小概率,如果输入很大,则将其变为大概率,但它将始终保持在0到1之间。
  • 05.10 10:19:41
    发表了文章 2023-05-10 10:19:41

    使用Actor-Critic的DDPG强化学习算法控制双关节机械臂

    在本文中,我们将介绍在 Reacher 环境中训练智能代理控制双关节机械臂,这是一种使用 Unity ML-Agents 工具包开发的基于 Unity 的模拟程序。 我们的目标是高精度的到达目标位置,所以这里我们可以使用专为连续状态和动作空间设计的最先进的Deep Deterministic Policy Gradient (DDPG) 算法。
  • 05.09 10:41:43
    发表了文章 2023-05-09 10:41:43

    Transformers回顾 :从BERT到GPT4

    人工智能已成为近年来最受关注的话题之一,由于神经网络的发展,曾经被认为纯粹是科幻小说中的服务现在正在成为现实。从对话代理到媒体内容生成,人工智能正在改变我们与技术互动的方式。特别是机器学习 (ML) 模型在自然语言处理 (NLP) 领域取得了重大进展。一个关键的突破是引入了“自注意力”和用于序列处理的Transformers架构,这使得之前主导该领域的几个关键问题得以解决。
  • 05.08 09:50:09
    发表了文章 2023-05-08 09:50:09

    使用思维链(Chain-of-thoughts)提示在大型语言模型中引出推理

    语言模型(LM)在NLP领域的发展速度非常快,特别是在大型语言模型(LLM)方面:当语言模型具有大量参数或权重/系数时,它们被称为“大型”。这些“大型”语言模型拥有处理和理解大量自然语言数据的能力。
  • 05.07 09:12:40
    发表了文章 2023-05-07 09:12:40

    UNeXt:基于 MLP 的快速医学图像分割网络

    UNeXt是约翰霍普金斯大学在2022年发布的论文。它在早期阶段使用卷积,在潜在空间阶段使用 MLP。通过一个标记化的 MLP 块来标记和投影卷积特征,并使用 MLP 对表示进行建模。对输入通道进行移位,可以专注于学习局部依赖性。
  • 05.06 09:34:30
    发表了文章 2023-05-06 09:34:30

    KNN中不同距离度量对比和介绍

    k近邻算法KNN是一种简单而强大的算法,可用于分类和回归任务。他实现简单,主要依赖不同的距离度量来判断向量间的区别,但是有很多距离度量可以使用,所以本文演示了KNN与三种不同距离度量(Euclidean、Minkowski和Manhattan)的使用。
  • 05.05 09:39:29
    发表了文章 2023-05-05 09:39:29

    交互式数据分析和处理新方法:pandas-ai =Pandas + ChatGPT

    Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。
  • 05.04 10:22:47
    发表了文章 2023-05-04 10:22:47

    VLAD Diffusion,一个更好用且易于安装的Stable Diffusion Web UI

    VLAD Diffusion 是我们前面介绍过的 AUTOMATIC1111/stable-diffusion-webui的一个定制的更新,它主要是为了更频繁发布的更新和错误修复。
  • 05.03 09:10:25
    发表了文章 2023-05-03 09:10:25

    余弦相似度算法进行客户流失分类预测

    余弦相似性是一种用于计算两个向量之间相似度的方法,常被用于文本分类和信息检索领域。
  • 05.02 10:33:17
    发表了文章 2023-05-02 10:33:17

    医学图像的深度学习的完整代码示例:使用Pytorch对MRI脑扫描的图像进行分割

    图像分割是医学图像分析中最重要的任务之一,在许多临床应用中往往是第一步也是最关键的一步。在脑MRI分析中,图像分割通常用于测量和可视化解剖结构,分析大脑变化,描绘病理区域以及手术计划和图像引导干预,分割是大多数形态学分析的先决条件。

2023年04月

  • 04.30 10:28:06
    发表了文章 2023-04-30 10:28:06

    使用Dino+SAM+Stable diffusion 自动进行图片的修改

    SAM 可以准确识别和提取图像中的对象,与Stable Diffusion 相结合,可以对分割后的图像进行细微的更改。
  • 04.29 13:11:48
    发表了文章 2023-04-29 13:11:48

    将时间序列转换为分类问题

    本文将以股票交易作为示例。我们用 AI 模型预测股票第二天是涨还是跌。在此背景下,比较了分类算法 XGBoost、随机森林和逻辑分类器。文章的另外一个重点是数据准备。我们必须如何转换数据以便模型可以处理它。
  • 04.28 16:03:35
    发表了文章 2023-04-28 16:03:35

    从零开始实现VAE和CVAE

    扩散模型可以看作是一个层次很深的VAE(变分自编码器),前向(forward,或者译为正向)的过程,通过在多个尺度上添加噪声来逐步扰乱数据分布;然后是反向的过程,去学习如何恢复数据结构,上述的破坏和恢复过程分别对应于VAE中的编码和解码过程。所以VAE是一个重要的概念需要掌握,本文将用python从头开始实现VAE和CVAE,来增加对于它们的理解。
  • 04.27 10:25:06
    发表了文章 2023-04-27 10:25:06

    ChatGPT的提示的一些高级知识

    作为一个大型语言模型(LLM)接口,ChatGPT有令人印象深刻的潜力,但是真正能否用好取决与我们的提示(Prompt ),一个好的提示可以让ChatGPT晋升到一个更好的层次。
  • 发表了文章 2025-10-17

    REFRAG技术详解:如何通过压缩让RAG处理速度提升30倍

  • 发表了文章 2025-10-16

    RAG检索质量差?这5种分块策略帮你解决70%的问题

  • 发表了文章 2025-10-15

    别再用均值填充了!MICE算法教你正确处理缺失数据

  • 发表了文章 2025-10-14

    LlamaIndex检索调优实战:分块、HyDE、压缩等8个提效方法快速改善答案质量

  • 发表了文章 2025-10-13

    斯坦福ACE框架:让AI自己学会写prompt,性能提升17%成本降87%

  • 发表了文章 2025-10-12

    氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"

  • 发表了文章 2025-10-11

    12 种 Pandas 测试技巧,让数据处理少踩坑

  • 发表了文章 2025-10-10

    mmBERT:307M参数覆盖1800+语言,3万亿tokens训练

  • 发表了文章 2025-10-09

    vLLM 吞吐量优化实战:10个KV-Cache调优方法让tokens/sec翻倍

  • 发表了文章 2025-10-08

    vLLM推理加速指南:7个技巧让QPS提升30-60%

  • 发表了文章 2025-10-06

    向量存储vs知识图谱:LLM记忆系统技术选型

  • 发表了文章 2025-10-05

    NumPy广播:12个技巧替代循环,让数组计算快40倍

  • 发表了文章 2025-10-04

    Google开源Tunix:JAX生态的LLM微调方案来了

  • 发表了文章 2025-10-03

    从DQN到Double DQN:分离动作选择与价值评估,解决强化学习中的Q值过估计问题

  • 发表了文章 2025-10-02

    PINN训练新思路:把初始条件和边界约束嵌入网络架构,解决多目标优化难题

  • 发表了文章 2025-10-01

    Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测

  • 发表了文章 2025-09-30

    Min-p采样:通过动态调整截断阈值让大模型文本生成兼顾创造力与逻辑性

  • 发表了文章 2025-09-29

    从零构建能自我优化的AI Agent:Reflection和Reflexion机制对比详解与实现

  • 发表了文章 2025-09-28

    从零构建短视频推荐系统:双塔算法架构解析与代码实现

  • 发表了文章 2025-09-27

    AI智能体框架怎么选?7个主流工具详细对比解析

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息