Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区710

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1185篇文章
177条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息

2023年07月

  • 07.13 10:08:16
    发表了文章 2023-07-13 10:08:16

    ​注意力机制中的掩码详解

    注意力机制的掩码允许我们发送不同长度的批次数据一次性的发送到transformer中。在代码中是通过将所有序列填充到相同的长度,然后使用“attention_mask”张量来识别哪些令牌是填充的来做到这一点,本文将详细介绍这个掩码的原理和机制。
  • 07.08 10:28:53
    发表了文章 2023-07-08 10:28:53

    并行计算框架Polars、Dask的数据处理性能对比

    在Pandas 2.0发布以后,我们发布过一些评测的文章,这次我们看看,除了Pandas以外,常用的两个都是为了大数据处理的并行数据框架的对比测试。
  • 07.07 09:46:19
    发表了文章 2023-07-07 09:46:19

    使用Streamlit和OpenAI API构建视频摘要

    本文提供了使用Streamlit和OpenAI创建的视频摘要应用程序的概述。该程序为视频的每个片段创建简洁的摘要,并总结视频的完整内容。
  • 07.06 10:42:25
    发表了文章 2023-07-06 10:42:25

    矢量数据库对比和选择指南

    矢量数据库是为实现高维矢量数据的高效存储、检索和相似性搜索而设计的。使用一种称为嵌入的过程,将向量数据表示为一个连续的、有意义的高维向量。
  • 07.05 10:09:45
    发表了文章 2023-07-05 10:09:45

    WideNet:让网络更宽而不是更深

    这是新加坡国立大学在2022 aaai发布的一篇论文。WideNet是一种参数有效的框架,它的方向是更宽而不是更深。通过混合专家(MoE)代替前馈网络(FFN),使模型沿宽度缩放。使用单独LN用于转换各种语义表示,而不是共享权重。
  • 07.04 10:35:34
    发表了文章 2023-07-04 10:35:34

    LeViT-UNet:transformer 编码器和CNN解码器的有效整合

    levi - unet[2]是一种新的医学图像分割架构,它使用transformer 作为编码器,这使得它能够更有效地学习远程依赖关系。levi - unet[2]比传统的U-Nets更快,同时仍然实现了最先进的分割性能。
  • 07.03 09:42:28
    发表了文章 2023-07-03 09:42:28

    基于声音信号的工业设备异常检测

    异常检测主要目标是将异常事件与正常事件区分开来,因此才有了“异常”一词。本文将介绍基于声音信号的工业机械异常检测,使用的数据集是MIMII声音数据集,该数据集很容易在网上获得。
  • 07.02 09:46:05
    发表了文章 2023-07-02 09:46:05

    玩转Matplotlib的10个高级技巧

    Matplotlib是Python中流行的数据可视化库,仅使用简单的几行代码就可以生成图表。但是默认的方法是生成的图表很简单,如果想增强数据演示的影响和清晰度,可以试试本文总结的10个高级技巧,这些技巧可以将可视化提升到一个新的水平:

2023年06月

  • 06.30 09:37:44
    发表了文章 2023-06-30 09:37:44

    MidJourney v5.2 、Stable Diffusion XL 0.9 出图对比

    最近两个最流行的AI图像生成器,Midjourney和Stable Diffusion,都发布了重大更新。Midjourney v5.2引入了许多新功能,包括“缩小”功能、“/缩短”命令、改进的图像质量等。
  • 06.29 09:10:32
    发表了文章 2023-06-29 09:10:32

    LLM-Client一个轻量级的LLM集成工具

    大型语言模型(llm)已经彻底改变了我们与文本交互的方式,OpenAI、Google、AI21、HuggingfaceHub、Anthropic和众多开源模型提供了不同的功能和优势。但是每个模型都有其独特的体系结构、api和兼容性需求,集成这些模型是一项耗时且具有挑战性的任务。
  • 06.28 10:33:02
    发表了文章 2023-06-28 10:33:02

    用于语义图像分割的弱监督和半监督学习:弱监督期望最大化方法

    这篇论文只有图像级标签或边界框标签作为弱/半监督学习的输入。使用期望最大化(EM)方法,用于弱/半监督下的语义分割模型训练。
  • 06.27 10:36:28
    发表了文章 2023-06-27 10:36:28

    10个图像处理的Python库

    在这篇文章中,我们将整理计算机视觉项目中常用的Python库,如果你想进入计算机视觉领域,可以先了解下本文介绍的库,这会对你的工作很有帮助。
  • 06.26 10:15:08
    发表了文章 2023-06-26 10:15:08

    本地部署开源大模型的完整教程:LangChain + Streamlit+ Llama

    在过去的几个月里,大型语言模型(llm)获得了极大的关注,这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员。
  • 06.25 09:49:35
    发表了文章 2023-06-25 09:49:35

    MaskFormer:将语义分割和实例分割作为同一任务进行训练

    目标检测和实例分割是计算机视觉的基本任务,在从自动驾驶到医学成像的无数应用中发挥着关键作用。目标检测的传统方法中通常利用边界框技术进行对象定位,然后利用逐像素分类为这些本地化实例分配类。但是当处理同一类的重叠对象时,或者在每个图像的对象数量不同的情况下,这些方法通常会出现问题。
  • 06.23 10:03:49
    发表了文章 2023-06-23 10:03:49

    轻量级的深度学习框架Tinygrad

    Tinygrad是一个轻量级的深度学习库,它提供了一种简化和直观的方法来理解和实现神经网络。在本文中,我们将探讨Tinygrad及其主要功能,以及它如何成为那些开始深度学习之旅的人的有价值的工具。
  • 06.22 16:54:42
    发表了文章 2023-06-22 16:54:42

    PromptBench:大型语言模型的对抗性基准测试

    PromptBench是微软研究人员设计的一个用于测量大型语言模型(llm)对对抗性提示鲁棒性的基准测试。这个的工具是理解LLM的重要一步,随着这些模型在各种应用中越来越普遍,这个主题也变得越来越重要。
  • 06.21 09:40:02
    发表了文章 2023-06-21 09:40:02

    Video-LLaMa:利用多模态增强对视频内容理解

    在数字时代,视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务,不仅需要视觉和听觉信号的整合,还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的视觉和听觉内容。论文设计了两个分支,即视觉语言分支和音频语言分支,分别将视频帧和音频信号转换为与llm文本输入兼容的查询表示。
  • 06.20 09:43:06
    发表了文章 2023-06-20 09:43:06

    图解transformer中的自注意力机制

    本文将将介绍注意力的概念从何而来,它是如何工作的以及它的简单的实现。
  • 06.19 09:06:20
    发表了文章 2023-06-19 09:06:20

    使用PyMC进行时间序列分层建模

    在统计建模领域,理解总体趋势的同时解释群体差异的一个强大方法是分层(或多层)建模。这种方法允许参数随组而变化,并捕获组内和组间的变化。在时间序列数据中,这些特定于组的参数可以表示不同组随时间的不同模式。
  • 06.18 09:29:00
    发表了文章 2023-06-18 09:29:00

    6月人工智能论文推荐

    6月人工智能论文推荐
  • 06.17 11:55:09
    发表了文章 2023-06-17 11:55:09

    开源大型语言模型(llm)总结

    大型语言模型(LLM)是人工智能领域中的一个重要研究方向,在ChatGPT之后,它经历了快速的发展。
  • 06.16 09:31:34
    发表了文章 2023-06-16 09:31:34

    时间序列异常检测:统计和机器学习方法介绍

    在本文中将探索各种方法来揭示时间序列数据中的异常模式和异常值。
  • 06.15 09:10:45
    发表了文章 2023-06-15 09:10:45

    XGBoost超参数调优指南

    本文将详细解释XGBoost中十个最常用超参数的介绍,功能和值范围,及如何使用Optuna进行超参数调优。
  • 06.14 10:05:17
    发表了文章 2023-06-14 10:05:17

    预训练、微调和上下文学习

    最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程。
  • 06.13 09:40:31
    发表了文章 2023-06-13 09:40:31

    量子机器学习Variational Quantum Classifier (VQC)简介

    变分量子分类器(Variational Quantum Classifier,简称VQC)是一种利用量子计算技术进行分类任务的机器学习算法。它属于量子机器学习算法家族,旨在利用量子计算机的计算能力,潜在地提升经典机器学习方法的性能。
  • 06.12 10:14:09
    发表了文章 2023-06-12 10:14:09

    Segment-Anything的一些相关论文总结

    Segment-Anything的一些相关论文总结
  • 06.11 10:55:01
    发表了文章 2023-06-11 10:55:01

    时间序列预测的20个基本概念总结

    时间序列是一组按时间顺序排列的数据点
  • 06.10 09:53:38
    发表了文章 2023-06-10 09:53:38

    使用NLPAUG 进行文本数据的扩充增强

    在机器学习中,训练数据集的质量在很大程度上决定了模型的有效性。我们往往没有足够的多样化数据,这影响了模型的准确性。这时数据增强技术就派上了用场。
  • 06.09 09:54:54
    发表了文章 2023-06-09 09:54:54

    谷歌发布一个免费的生成式人工智能课程

    在过去几周,我们看到的都是AI将如何改变生活,无论是ChatGPT的文本生成,还是SD,Midjourney 的图像生成,这些AI的特点就是都是生成式的AI。而几天前,谷歌推出了一个生成式人工智能学习课程,课程涵盖了生成式人工智能入门、大型语言模型、图像生成等主题。
  • 06.08 10:08:56
    发表了文章 2023-06-08 10:08:56

    CAM, Grad-CAM, Grad-CAM++可视化CNN方式的代码实现和对比

    当使用神经网络时,我们可以通过它的准确性来评估模型的性能,但是当涉及到计算机视觉问题时,不仅要有最好的准确性,还要有可解释性和对哪些特征/数据点有助于做出决策的理解。模型专注于正确的特征比模型的准确性更重要。
  • 06.07 10:07:24
    发表了文章 2023-06-07 10:07:24

    JupyterLab 4.0 发布了

    JupyterLab 是 Jupyter Notebook 的下一代版本,它提供了更强大的功能和更灵活的用户界面,6月6日,官方发布了JupyterLab 4.0的说明,并且说该版本是下一个主要的版本。
  • 06.06 10:18:31
    发表了文章 2023-06-06 10:18:31

    使用Optuna进行PyTorch模型的超参数调优

    Optuna是一个开源的超参数优化框架,Optuna与框架无关,可以在任何机器学习或深度学习框架中使用它。本文将以表格数据为例,使用Optuna对PyTorch模型进行超参数调优。
  • 06.05 09:08:20
    发表了文章 2023-06-05 09:08:20

    Python中的Time和DateTime

    Python在处理与时间相关的操作时有两个重要模块:time和datetime。在本文中,我们介绍这两个模块并为每个场景提供带有代码和输出的说明性示例。
  • 06.04 09:51:27
    发表了文章 2023-06-04 09:51:27

    设置和使用DragGAN:搭建非官方的演示版

    DragGAN的官方版还没有发布,但是已经有非官方版的实现了,我们看看如何使用。
  • 06.03 09:25:13
    发表了文章 2023-06-03 09:25:13

    七篇深入理解机器学习和深度学习的读物推荐

    在这篇文章中将介绍7篇机器学习和深度学习的论文或者图书出版物,这些内容都论文极大地影响了我对该领域的理解,如果你想深入了解机器学习的内容,哪么推荐阅读。
  • 06.02 09:24:28
    发表了文章 2023-06-02 09:24:28

    QLoRa:在消费级GPU上微调大型语言模型

    大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如,650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器,花费的开销也不是所有人都能够承担的。
  • 06.01 09:09:24
    发表了文章 2023-06-01 09:09:24

    这8个NumPy函数可以解决90%的常见问题

    NumPy是一个用于科学计算和数据分析的Python库,也是机器学习的支柱。可以说NumPy奠定了Python在机器学习中的地位。NumPy提供了一个强大的多维数组对象,以及广泛的数学函数,可以对大型数据集进行有效的操作。这里的“大”是指数百万行。

2023年05月

  • 05.31 09:52:49
    发表了文章 2023-05-31 09:52:49

    DHVT:在小数据集上降低VIT与卷积神经网络之间差距,解决从零开始训练的问题

    VIT在归纳偏置方面存在空间相关性和信道表示的多样性两大缺陷。所以论文提出了动态混合视觉变压器(DHVT)来增强这两种感应偏差。
  • 05.30 10:29:04
    发表了文章 2023-05-30 10:29:04

    基于GMM的一维时序数据平滑算法

    本文将介绍我们使用高斯混合模型(GMM)算法作为一维数据的平滑和去噪算法。
  • 05.29 09:33:18
    发表了文章 2023-05-29 09:33:18

    数据偏度介绍和处理方法

    偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。它描述了数据分布的尾部(tail)在平均值的哪一侧更重或更长。偏度可以帮助我们了解数据的偏斜性质,即数据相对于平均值的分布情况。
  • 05.28 10:09:45
    发表了文章 2023-05-28 10:09:45

    深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

    平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。在目标检测任务中,模型需要识别图像中的不同目标,并返回它们的边界框(bounding box)和类别。mAP用于综合考虑模型在不同类别上的准确度和召回率。
  • 05.27 10:05:41
    发表了文章 2023-05-27 10:05:41

    Scikit-LLM:将大语言模型整合进Sklearn的工作流

    我们以前介绍过Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM,它结合了强大的语言模型,如ChatGPT和scikit-learn。但这个并不是让我们自动化scikit-learn,而是将scikit-learn和语言模型进行整合,scikit-learn也可以处理文本数据了。
  • 05.26 10:02:47
    发表了文章 2023-05-26 10:02:47

    PyTorch-Forecasting一个新的时间序列预测库

    时间序列预测在金融、天气预报、销售预测和需求预测等各个领域发挥着至关重要的作用。PyTorch- forecasting是一个建立在PyTorch之上的开源Python包,专门用于简化和增强时间序列的工作。
  • 05.24 10:07:59
    发表了文章 2023-05-24 10:07:59

    Jupyter Notebook 10个提升体验的高级技巧

    Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。Jupyter 笔记本的基本功能大家都已经很熟悉了,但还有一些鲜为人知的技巧可以大大提高生产力和效率。在这篇文章中,我将介绍10个可以提升体验的高级技巧。
  • 05.23 10:43:36
    发表了文章 2023-05-23 10:43:36

    升级到PyTorch 2.0的技巧总结

    PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢? PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。 与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。
  • 05.22 09:56:29
    发表了文章 2023-05-22 09:56:29

    计算GMAC和GFLOPS

    GMAC 代表“Giga Multiply-Add Operations per Second”(每秒千兆乘法累加运算),是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量,以每秒十亿 (giga) 表示。
  • 05.21 10:02:49
    发表了文章 2023-05-21 10:02:49

    NSFW 图片分类

    NSFW指的是 **不适宜工作场所**("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。
  • 05.20 09:49:30
    发表了文章 2023-05-20 09:49:30

    常用的视频帧提取工具和方法总结

    视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中,视频可以看作是由一系列连续的图像帧组成的。因此,要对视频进行理解和分析,首先需要从视频中提取出每一帧的图像。
  • 发表了文章 2024-11-16

    利用PyTorch的三元组损失Hard Triplet Loss进行嵌入模型微调

  • 发表了文章 2024-11-15

    告别Print,使用IceCream进行高效的Python调试

  • 发表了文章 2024-11-14

    为什么卷积现在不火了:CNN研究热度降温的深层原因分析

  • 发表了文章 2024-11-13

    SMoA: 基于稀疏混合架构的大语言模型协同优化框架

  • 发表了文章 2024-11-12

    TSMamba:基于Mamba架构的高效时间序列预测基础模型

  • 发表了文章 2024-11-11

    基于MCMC的贝叶斯营销组合模型评估方法论: 系统化诊断、校准及选择的理论框架

  • 发表了文章 2024-11-10

    深度学习工程实践:PyTorch Lightning与Ignite框架的技术特性对比分析

  • 发表了文章 2024-11-09

    通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

  • 发表了文章 2024-11-08

    贝叶斯统计中常见先验分布选择方法总结

  • 发表了文章 2024-11-07

    Tokenformer:基于参数标记化的高效可扩展Transformer架构

  • 发表了文章 2024-11-06

    基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践

  • 发表了文章 2024-11-05

    基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模

  • 发表了文章 2024-11-04

    深入理解多重共线性:基本原理、影响、检验与修正策略

  • 发表了文章 2024-11-03

    基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例

  • 发表了文章 2024-11-02

    10种数据预处理中的数据泄露模式解析:识别与避免策略

  • 发表了文章 2024-11-01

    随机性、熵与随机数生成器:解析伪随机数生成器(PRNG)和真随机数生成器(TRNG)

  • 发表了文章 2024-10-31

    Github上的十大RAG(信息检索增强生成)框架

  • 发表了文章 2024-10-30

    基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

  • 发表了文章 2024-10-28

    深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究

  • 发表了文章 2024-10-27

    过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息