Deephub_社区达人页_第9页-阿里云开发者社区

Deephub

已加入开发者社区1145天

勋章更多

专家博主

星级博主

技术博主

一代宗师

成就

已发布1614篇文章

367条评论

已回答0个问题

0条评论

已发布0个视频

github地址

我关注的人更多

粉丝更多

技术能力

兴趣领域

擅长领域

技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

精选

高分内容

最新动态

文章
问答
视频

暂无精选文章

暂无更多信息

2024年12月

12.16 10:45:20

发表了文章 2024-12-16 10:45:20

基于图神经网络的大语言模型检索增强生成框架研究：面向知识图谱推理的优化与扩展

本文探讨了图神经网络（GNN）与大型语言模型（LLM）结合在知识图谱问答中的应用。研究首先基于G-Retriever构建了探索性模型，然后深入分析了GNN-RAG架构，通过敏感性研究和架构改进，显著提升了模型的推理能力和答案质量。实验结果表明，改进后的模型在多个评估指标上取得了显著提升，特别是在精确率和召回率方面。最后，文章提出了反思机制和教师网络的概念，进一步增强了模型的推理能力。
12.15 17:19:29

发表了文章 2024-12-15 17:19:29

Differential Transformer: 通过差分注意力机制提升大语言模型性能

《Differential Transformer》论文提出了一种新的差分注意力机制，旨在解决传统Transformer模型过分关注不相关信息的问题。该机制通过计算两个独立的注意力图谱之差来消除注意力噪声，提高模型性能。实验结果显示，DIFF Transformer在减少参数量和训练token数量的同时，显著提升了多目标检索任务的准确率。
12.14 09:24:01

发表了文章 2024-12-14 09:24:01

使用机器学习技术进行时间序列缺失数据填充：基础方法与入门案例

本文探讨了时间序列分析中数据缺失的问题，并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集，采用线性回归和决策树回归两种方法进行缺失值补充，并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示，决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳，而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣，并给出了实际应用建议。
12.13 09:52:55

发表了文章 2024-12-13 09:52:55

Python量化投资实践：基于蒙特卡洛模拟的投资组合风险建模与分析

蒙特卡洛模拟是一种利用重复随机抽样解决确定性问题的计算方法，广泛应用于金融领域的不确定性建模和风险评估。本文介绍如何使用Python和EODHD API获取历史交易数据，通过模拟生成未来价格路径，分析投资风险与收益，包括VaR和CVaR计算，以辅助投资者制定合理决策。
12.12 21:53:07

发表了文章 2024-12-12 21:53:07

使用PaliGemma2构建多模态目标检测系统：从架构设计到性能优化的技术实践指南

本文详细介绍了PaliGemma2模型的微调流程及其在目标检测任务中的应用。PaliGemma2通过整合SigLIP-So400m视觉编码器与Gemma 2系列语言模型，实现了多模态数据的高效处理。文章涵盖了开发环境构建、数据集预处理、模型初始化与配置、数据加载系统实现、模型微调、推理与评估系统以及性能分析与优化策略等内容。特别强调了计算资源优化、训练过程监控和自动化优化流程的重要性，为机器学习工程师和研究人员提供了系统化的技术方案。
12.11 13:02:43

发表了文章 2024-12-11 13:02:43

时间序列预测的不确定性区间估计：基于EnbPI的方法与应用研究

本文探讨了时间序列预测中不确定性量化的问题，特别是基于一致性预测理论的EnbPI方法。EnbPI通过集成学习和自举采样技术，解决了传统方法在处理非平稳时间序列数据时的局限性，提供了一种分布无关的预测区间构建方法，支持任意估计器的集成，并在推理阶段保持高效。实验结果显示，EnbPI在德国电力价格预测中表现出良好的覆盖率和适应性，尽管存在一定的计算成本。
12.10 09:35:40

发表了文章 2024-12-10 09:35:40

基于Huffman树的层次化Softmax：面向大规模神经网络的高效概率计算方法

层次化Softmax算法通过引入Huffman树结构，将传统Softmax的计算复杂度从线性降至对数级别，显著提升了大规模词汇表的训练效率。该算法不仅优化了计算效率，还在处理大规模离散分布问题上提供了新的思路。文章详细介绍了Huffman树的构建、节点编码、概率计算及基于Gensim的实现方法，并讨论了工程实现中的优化策略与应用实践。
12.09 10:05:23

发表了文章 2024-12-09 10:05:23

Beta分布与汤普森采样：智能决策系统概率采样的理论基础

在现代技术领域，算法决策优化成为核心竞争力的关键。Meta、Netflix和亚马逊等公司通过广告位置、缩略图及产品推荐的优化，显著提升了用户体验和商业效益。这些优化背后的共同点是采用了基于Beta分布的汤普森采样算法，有效解决了决策系统中探索与利用的平衡问题。通过从概率分布中随机采样来做出决策，汤普森采样不仅保证了对已知良好选项的充分利用，还维持了对潜在更优选项的探索，从而在实践中实现了高效且自适应的决策过程。
12.08 09:33:39

发表了文章 2024-12-08 09:33:39

从方向导数到梯度：深度学习中的关键数学概念详解

方向导数衡量函数在特定方向上的变化率，其值可通过梯度与方向向量的点积或构造辅助函数求得。梯度则是由偏导数组成的向量，指向函数值增长最快的方向，其模长等于最速上升方向上的方向导数。这两者的关系在多维函数分析中至关重要，广泛应用于优化算法等领域。
12.07 09:54:22

发表了文章 2024-12-07 09:54:22

ORCA：基于持续批处理的LLM推理性能优化技术详解

大语言模型（LLMs）的批处理优化面临诸多挑战，尤其是由于推理过程的迭代性导致的资源利用不均问题。ORCA系统通过引入迭代级调度和选择性批处理技术，有效解决了这些问题，大幅提高了GPU资源利用率和系统吞吐量，相比FasterTransformer实现了最高37倍的性能提升。
12.06 21:28:38

发表了文章 2024-12-06 21:28:38

深入解析图神经网络：Graph Transformer的算法基础与工程实践

Graph Transformer是一种结合了Transformer自注意力机制与图神经网络（GNNs）特点的神经网络模型，专为处理图结构数据而设计。它通过改进的数据表示方法、自注意力机制、拉普拉斯位置编码、消息传递与聚合机制等核心技术，实现了对图中节点间关系信息的高效处理及长程依赖关系的捕捉，显著提升了图相关任务的性能。本文详细解析了Graph Transformer的技术原理、实现细节及应用场景，并通过图书推荐系统的实例，展示了其在实际问题解决中的强大能力。
12.05 09:46:01

发表了文章 2024-12-05 09:46:01

Hymba: 结合注意力头和SSM头的创新型语言模型方案

NVIDIA提出的Hymba架构，通过在同一层中结合注意力头和状态空间模型（SSM）头，实现了计算效率和记忆回溯能力的双重提升。核心创新包括并行混合头设计、可学习的元令牌和KV缓存优化，使得Hymba在多项基准测试中表现出色，尤其在处理长序列文本时优势明显。
12.04 09:42:42

发表了文章 2024-12-04 09:42:42

分布式机器学习系统：设计原理、优化策略与实践经验

本文详细探讨了分布式机器学习系统的发展现状与挑战，重点分析了数据并行、模型并行等核心训练范式，以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性，旨在提供一套全面的技术解决方案，以应对超大规模模型训练中的计算、存储及通信挑战。
12.03 09:52:31

发表了文章 2024-12-03 09:52:31

Transformer模型变长序列优化：解析PyTorch上的FlashAttention2与xFormers

本文探讨了Transformer模型中变长输入序列的优化策略，旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战，特别是填充方法导致的资源浪费。随后，提出了多种优化技术，包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式，显著提升了模型的性能。实验结果显示，使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒，相比未优化版本提升了约2.5倍。
12.02 10:11:48

发表了文章 2024-12-02 10:11:48

图卷积网络入门：数学基础与架构设计

本文系统地阐述了图卷积网络的架构原理。通过简化数学表述并聚焦于矩阵运算的核心概念，详细解析了GCN的工作机制。
12.01 09:57:15

发表了文章 2024-12-01 09:57:15

从本地部署到企业级服务：十种主流LLM推理框架的技术介绍与对比

本文深入探讨了十种主流的大语言模型（LLM）服务引擎和工具，涵盖从轻量级本地部署到高性能企业级解决方案，详细分析了它们的技术特点、优势及局限性，旨在为研究人员和工程团队提供适合不同应用场景的技术方案。内容涉及WebLLM、LM Studio、Ollama、vLLM、LightLLM、OpenLLM、HuggingFace TGI、GPT4ALL、llama.cpp及Triton Inference Server与TensorRT-LLM等。

2024年11月

11.30 21:06:22

发表了文章 2024-11-30 21:06:22

基于特征子空间的高维异常检测：一种高效且可解释的方法

本文探讨了一种替代传统单一检测器的方法，通过构建多个专注于特征子集（子空间）的检测器系统，来提高异常检测的准确性和效率。文章详细介绍了子空间方法在处理高维数据时的优势，包括缓解维度灾难、提高异常检测的可解释性和计算效率。同时，文中还讨论了子空间的选择策略，如基于领域知识、相关性、随机选择等，并介绍了PyOD工具包中实现子空间异常检测的具体方法。通过这些技术，异常检测系统能够更有效地识别数据中的异常记录，尤其是在特征数量众多的情况下。
11.29 17:29:47

发表了文章 2024-11-29 17:29:47

置信区间与预测区间：数据科学中的不确定性量化技术深度解读

本文深入探讨了统计学中两个常见但容易混淆的不确定性量化工具：置信区间和预测区间。
11.28 10:41:41

发表了文章 2024-11-28 10:41:41

基于改进自适应分段线性近似（IAPLA）的微分方程数值解法研究：从简单动力系统到混沌系统的应用分析

IAPLA方法为复杂动力系统的数值模拟提供了一个灵活、高效且易于实现的框架，在众多实际应用中可以作为现有数值求解器的有效替代方案。
11.27 09:48:21

发表了文章 2024-11-27 09:48:21

一份写给数据工程师的 Polars 迁移指南：将 Pandas 速度提升 20 倍代码重构实践

Polars作为现代化的数据处理框架，通过先进的工程实践和算法优化，为数据科学工作者提供了高效的数据处理工具。在从Pandas迁移时，理解这些核心概念和最佳实践将有助于充分发挥Polars的性能优势。
11.26 10:06:03

发表了文章 2024-11-26 10:06:03

Scikit-learn Pipeline完全指南:高效构建机器学习工作流

Scikit-learn管道是构建高效、鲁棒、可复用的机器学习工作流程的利器。通过掌握管道的使用,我们可以轻松地完成从数据预处理到模型训练、评估和部署的全流程,极大地提高工作效率。
11.24 09:53:42

发表了文章 2024-11-24 09:53:42

IoU已经out了，试试这几个变体:GIoU、DIoU和CIoU介绍与对比分析

本文探讨了目标检测中常用的交并比（IoU）及其变体，包括广义交并比（GIoU）、距离交并比（DIoU）和完全交并比（CIoU）。这些指标不仅提高了模型在处理不重叠、距离较远或形状差异大的边界框时的表现，还为模型的学习过程提供了更深入的洞察。文章详细解释了各指标的计算方法及应用场景，并提供了相应的代码示例，帮助读者更好地理解和应用这些先进的评估指标。
11.23 10:04:28

发表了文章 2024-11-23 10:04:28

图神经网络在欺诈检测与蛋白质功能预测中的应用概述

金融交易网络与蛋白质结构的共同特点是它们无法通过简单的欧几里得空间模型来准确描述，而是需要复杂的图结构来捕捉实体间的交互模式。传统深度学习方法在处理这类数据时效果不佳，图神经网络（GNNs）因此成为解决此类问题的关键技术。GNNs通过消息传递机制，能有效提取图结构中的深层特征，适用于欺诈检测和蛋白质功能预测等复杂网络建模任务。
11.22 21:42:01

发表了文章 2024-11-22 21:42:01

优化注意力层提升 Transformer 模型效率：通过改进注意力机制降低机器学习成本

Transformer架构自2017年被Vaswani等人提出以来，凭借其核心的注意力机制，已成为AI领域的重大突破。该机制允许模型根据任务需求灵活聚焦于输入的不同部分，极大地增强了对复杂语言和结构的理解能力。起初主要应用于自然语言处理，Transformer迅速扩展至语音识别、计算机视觉等多领域，展现出强大的跨学科应用潜力。然而，随着模型规模的增长，注意力层的高计算复杂度成为发展瓶颈。为此，本文探讨了在PyTorch生态系统中优化注意力层的各种技术，
11.21 09:54:56

发表了文章 2024-11-21 09:54:56

LLM2CLIP：使用大语言模型提升CLIP的文本处理，提高长文本理解和跨语言能力

LLM2CLIP 为多模态学习提供了一种新的范式，通过整合 LLM 的强大功能来增强 CLIP 模型。
11.20 09:59:40

发表了文章 2024-11-20 09:59:40

解读双编码器和交叉编码器：信息检索中的向量表示与语义匹配

在信息检索领域（即从海量数据中查找相关信息），双编码器和交叉编码器是两种至关重要的工具。它们各自拥有独特的工作机制、优势和局限性。本文将深入探讨这两种核心技术。
11.19 09:48:49

发表了文章 2024-11-19 09:48:49

使用Pytorch构建视觉语言模型（VLM）

视觉语言模型（Vision Language Model，VLM）正在改变计算机对视觉和文本信息的理解与交互方式。本文将介绍 VLM 的核心组件和实现细节，可以让你全面掌握这项前沿技术。我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。
11.18 10:06:11

发表了文章 2024-11-18 10:06:11

使用 PyTorch-BigGraph 构建和部署大规模图嵌入的完整教程

当处理大规模图数据时，复杂性难以避免。PyTorch-BigGraph (PBG) 是一款专为此设计的工具，能够高效处理数十亿节点和边的图数据。PBG通过多GPU或节点无缝扩展，利用高效的分区技术，生成准确的嵌入表示，适用于社交网络、推荐系统和知识图谱等领域。本文详细介绍PBG的设置、训练和优化方法，涵盖环境配置、数据准备、模型训练、性能优化和实际应用案例，帮助读者高效处理大规模图数据。
11.17 11:04:19

发表了文章 2024-11-17 11:04:19

25 个值得关注的检索增强生成 (RAG) 模型和框架

大型语言模型（LLM）如GPT-4在自然语言处理（NLP）领域展现了卓越能力，但也存在知识截止、静态知识库和内存限制等局限。检索增强生成（RAG）通过集成检索机制，允许LLM动态访问和整合外部数据源，提高了生成响应的准确性、相关性和时效性。本文深入探讨了25种先进的RAG变体，每种变体都旨在优化检索和生成过程的特定方面，涵盖成本限制、实时交互和多模态数据集成等问题，展示了RAG在提升NLP能力方面的多功能性和潜力。
11.16 09:57:11

发表了文章 2024-11-16 09:57:11

利用PyTorch的三元组损失Hard Triplet Loss进行嵌入模型微调

本文介绍了如何使用 PyTorch 和三元组边缘损失（Triplet Margin Loss）微调嵌入模型，详细讲解了实现细节和代码示例。
11.15 18:20:29

发表了文章 2024-11-15 18:20:29

告别Print，使用IceCream进行高效的Python调试

本文将介绍**IceCream**库，这个专门用于调试的工具显著提升了调试效率，使整个过程更加系统化和规范化。
11.14 10:03:07

发表了文章 2024-11-14 10:03:07

为什么卷积现在不火了：CNN研究热度降温的深层原因分析

纵观近年的顶会论文和研究热点，我们不得不承认一个现实：CNN相关的研究论文正在减少，曾经的"主角"似乎正逐渐淡出研究者的视野。
11.13 09:51:54

发表了文章 2024-11-13 09:51:54

SMoA: 基于稀疏混合架构的大语言模型协同优化框架

通过引入稀疏化和角色多样性，SMoA为大语言模型多代理系统的发展开辟了新的方向。
11.12 09:59:45

发表了文章 2024-11-12 09:59:45

TSMamba：基于Mamba架构的高效时间序列预测基础模型

TSMamba通过其创新的架构设计和训练策略，成功解决了传统时间序列预测模型面临的多个关键问题。
11.11 10:01:42

发表了文章 2024-11-11 10:01:42

基于MCMC的贝叶斯营销组合模型评估方法论：系统化诊断、校准及选择的理论框架

贝叶斯营销组合建模（Bayesian Marketing Mix Modeling，MMM）作为一种先进的营销效果评估方法，其核心在于通过贝叶斯框架对营销投资的影响进行量化分析。
11.10 10:15:43

发表了文章 2024-11-10 10:15:43

深度学习工程实践：PyTorch Lightning与Ignite框架的技术特性对比分析

在深度学习框架的选择上，PyTorch Lightning和Ignite代表了两种不同的技术路线。本文将从技术实现的角度，深入分析这两个框架在实际应用中的差异，为开发者提供客观的技术参考。
11.09 09:48:59

发表了文章 2024-11-09 09:48:59

通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

在 PyTorch 中，`pin_memory` 是一个重要的设置，可以显著提高 CPU 与 GPU 之间的数据传输速度。当 `pin_memory=True` 时，数据会被固定在 CPU 的 RAM 中，从而加快传输到 GPU 的速度。这对于处理大规模数据集、实时推理和多 GPU 训练等任务尤为重要。本文详细探讨了 `pin_memory` 的作用、工作原理及最佳实践，帮助你优化数据加载和传输，提升模型性能。
11.08 17:19:23

发表了文章 2024-11-08 17:19:23

贝叶斯统计中常见先验分布选择方法总结

本文详细介绍了贝叶斯统计中三种常见的先验分布选择方法:经验贝叶斯方法、信息先验和无信息/弱信息先验。
11.07 09:44:38

发表了文章 2024-11-07 09:44:38

Tokenformer：基于参数标记化的高效可扩展Transformer架构

本文是对发表于arXiv的论文 "TOKENFORMER: RETHINKING TRANSFORMER SCALING WITH TOKENIZED MODEL PARAMETERS" 的深入解读与扩展分析。主要探讨了一种革新性的Transformer架构设计方案，该方案通过参数标记化实现了模型的高效扩展和计算优化。
11.06 09:52:02

发表了文章 2024-11-06 09:52:02

基于LLM Graph Transformer的知识图谱构建技术研究：LangChain框架下转换机制实践

本文介绍了LangChain的LLM Graph Transformer框架，探讨了文本到图谱转换的双模式实现机制。基于工具的模式利用结构化输出和函数调用，简化了提示工程并支持属性提取；基于提示的模式则为不支持工具调用的模型提供了备选方案。通过精确定义图谱模式（包括节点类型、关系类型及其约束），显著提升了提取结果的一致性和可靠性。LLM Graph Transformer为非结构化数据的结构化表示提供了可靠的技术方案，支持RAG应用和复杂查询处理。
11.05 09:44:55

发表了文章 2024-11-05 09:44:55

基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模

**Liquid State Machine (LSM)** 是一种 **脉冲神经网络 (Spiking Neural Network, SNN)** ,在计算神经科学和机器学习领域中得到广泛应用,特别适用于处理 **时变或动态数据**。它是受大脑自然信息处理过程启发而提出的一种 **脉冲神经网络** 。
11.04 09:30:13

发表了文章 2024-11-04 09:30:13

深入理解多重共线性:基本原理、影响、检验与修正策略

本文将深入探讨多重共线性的本质,阐述其重要性,并提供有效处理多重共线性的方法,同时避免数据科学家常犯的陷阱。
11.03 09:32:43

发表了文章 2024-11-03 09:32:43

基于PyTorch的大语言模型微调指南：Torchtune完整教程与代码示例

**Torchtune**是由PyTorch团队开发的一个专门用于LLM微调的库。它旨在简化LLM的微调流程,提供了一系列高级API和预置的最佳实践
11.02 09:36:30

发表了文章 2024-11-02 09:36:30

10种数据预处理中的数据泄露模式解析:识别与避免策略

在机器学习中，数据泄露是一个常见问题，指的是测试数据在数据准备阶段无意中混入训练数据，导致模型在测试集上的表现失真。本文详细探讨了数据预处理步骤中的数据泄露问题，包括缺失值填充、分类编码、数据缩放、离散化和重采样，并提供了具体的代码示例，展示了如何避免数据泄露，确保模型的测试结果可靠。
11.01 09:42:31

发表了文章 2024-11-01 09:42:31

随机性、熵与随机数生成器:解析伪随机数生成器（PRNG）和真随机数生成器（TRNG）

随机性在密码学、仿真和机器学习等领域中至关重要，本文探讨了随机性、熵的概念以及伪随机数生成器（PRNG）和真随机数生成器（TRNG）的原理和应用。PRNG通过算法生成看似随机的序列，适用于高效需求；TRNG利用物理过程生成真正随机数，适用于高安全需求。文章还讨论了两者的协同应用及其面临的挑战。

2024年10月

10.31 09:29:20

发表了文章 2024-10-31 09:29:20

Github上的十大RAG(信息检索增强生成)框架

信息检索增强生成（RAG）是一种结合了检索系统和生成模型优势的技术，能够显著提升大型语言模型的性能。RAG通过从外部知识库中检索相关信息，增强模型的输入，从而生成更加准确、符合上下文、实时更新的响应。GitHub上涌现出多个开源RAG框架，如Haystack、RAGFlow、txtai等，每个框架都有独特的功能和特性，适用于不同的应用场景。这些框架不仅提高了模型的准确性和可靠性，还增强了过程的透明度和可解释性。
10.30 09:41:01

发表了文章 2024-10-30 09:41:01

基于图论的时间序列数据平稳性与连通性分析：利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

本文探讨了如何利用图论分析时间序列数据的平稳性和连通性。通过将时间序列数据转换为图结构，计算片段间的相似性，并构建连通图，可以揭示数据中的隐藏模式。文章介绍了平稳性的概念，提出了基于图的平稳性度量，并展示了图分区在可视化平稳性中的应用。此外，还模拟了不同平稳性和非平稳性程度的信号，分析了图度量的变化，为时间序列数据分析提供了新视角。
10.28 09:47:23

发表了文章 2024-10-28 09:47:23

深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究

本文探讨了多种学习率调度策略在神经网络训练中的应用，强调了选择合适学习率的重要性。文章介绍了阶梯式衰减、余弦退火、循环学习率等策略，并分析了它们在不同实验设置下的表现。研究表明，循环学习率和SGDR等策略在提高模型性能和加快训练速度方面表现出色，而REX调度则在不同预算条件下表现稳定。这些策略为深度学习实践者提供了实用的指导。
10.27 09:38:50

发表了文章 2024-10-27 09:38:50

过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比

本文介绍了处理不平衡数据集的过采样和欠采样技术，包括随机过采样、SMOTE、ADASYN、随机欠采样、Tomek Links、Near Miss 和 ENN 等方法。通过二维数据集的可视化示例，直观展示了各种方法的原理和效果差异。文章还讨论了混合采样方法（如SMOTETomek和SMOTEENN）以及应用这些方法的潜在风险，强调了在实际应用中审慎选择的重要性。
10.26 09:52:14

发表了文章 2024-10-26 09:52:14

LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势

近年来，大型语言模型（LLMs）在自然语言处理领域取得显著进展，研究人员开始探索将其应用于时间序列预测。Jin等人提出了LLM-Mixer框架，通过多尺度时间序列分解和预训练的LLMs，有效捕捉时间序列数据中的短期波动和长期趋势，提高了预测精度。实验结果显示，LLM-Mixer在多个基准数据集上优于现有方法，展示了其在时间序列预测任务中的巨大潜力。

...

发表了文章 2026-01-26

用 PydanticAI 让 LLM 输出变成可信赖的 Python 对象
发表了文章 2026-01-25

为什么标准化要用均值0和方差1？
发表了文章 2026-01-24

知识图谱的可验证性：断言图谱的设计原理
发表了文章 2026-01-23

OPIK：一个开源的自动提示词优化框架
发表了文章 2026-01-22

RAG 检索模型如何学习：三种损失函数的机制解析
发表了文章 2026-01-21

对抗样本：20行Python代码让95%准确率的图像分类器彻底失效
发表了文章 2026-01-20

使用 tsfresh 和 AutoML 进行时间序列特征工程
发表了文章 2026-01-19

用提示工程让大模型自己检查自己：CoVe方法有效减少幻觉
发表了文章 2026-01-18

为什么所有主流LLM都使用SwiGLU？
发表了文章 2026-01-17

多智能体强化学习（MARL）核心概念与算法概览
发表了文章 2026-01-16

LLM多跳推理深度测试：四项指标精准定位模型的推理极限
发表了文章 2026-01-15

Agentic Memory 实践：用 agents.md 实现 LLM 持续学习
发表了文章 2026-01-14

CALM模型的黑盒采样：用碰撞方法实现温度调节
发表了文章 2026-01-13

RAG检索模型选型：Bi-Encoder、Cross-Encoder、SPLADE与ColBERT的技术对比
发表了文章 2026-01-12

构建自己的AI编程助手：基于RAG的上下文感知实现方案
发表了文章 2026-01-11

深度研究Agent架构解析：4种Agent架构介绍及实用Prompt模板
发表了文章 2026-01-10

别再往一个智能体里塞功能了：6种多智能体模式技术解析与选型指南
发表了文章 2026-01-09

LLM-as-a-judge有30%评测偏差？这篇论文给出修复方案
发表了文章 2026-01-08

神经辐射场NeRF入门：3D视图合成的原理与PyTorch代码实现
发表了文章 2026-01-07

Mosaic：面向超长序列的多GPU注意力分片方案

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

Deephub_社区达人页

探索云世界

热门

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

勋章 更多

成就

我关注的人 更多

粉丝 更多

技术能力

用 PydanticAI 让 LLM 输出变成可信赖的 Python 对象

为什么标准化要用均值0和方差1？

知识图谱的可验证性：断言图谱的设计原理

OPIK：一个开源的自动提示词优化框架

RAG 检索模型如何学习：三种损失函数的机制解析

对抗样本：20行Python代码让95%准确率的图像分类器彻底失效

使用 tsfresh 和 AutoML 进行时间序列特征工程

用提示工程让大模型自己检查自己：CoVe方法有效减少幻觉

为什么所有主流LLM都使用SwiGLU？

多智能体强化学习（MARL）核心概念与算法概览

LLM多跳推理深度测试：四项指标精准定位模型的推理极限

Agentic Memory 实践：用 agents.md 实现 LLM 持续学习

CALM模型的黑盒采样：用碰撞方法实现温度调节

RAG检索模型选型：Bi-Encoder、Cross-Encoder、SPLADE与ColBERT的技术对比

构建自己的AI编程助手：基于RAG的上下文感知实现方案

深度研究Agent架构解析：4种Agent架构介绍及实用Prompt模板

别再往一个智能体里塞功能了：6种多智能体模式技术解析与选型指南

LLM-as-a-judge有30%评测偏差？这篇论文给出修复方案

神经辐射场NeRF入门：3D视图合成的原理与PyTorch代码实现

Mosaic：面向超长序列的多GPU注意力分片方案

勋章更多

我关注的人更多

粉丝更多