Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区804

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1276篇文章
278条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息
  • 发表了文章 2025-02-18

    DeepMind发布Matryoshka(套娃)量化:利用嵌套表示实现多精度LLM的低比特深度学习

  • 发表了文章 2025-02-17

    MOIRAI-MOE: 基于混合专家系统的大规模时间序列预测模型

  • 发表了文章 2025-02-16

    知识蒸馏方法探究:Google Distilling Step-by-Step 论文深度分析

  • 发表了文章 2025-02-15

    大语言模型的解码策略与关键优化总结

  • 发表了文章 2025-02-14

    DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解

  • 发表了文章 2025-02-13

    基于结构化状态空间对偶性的贝叶斯注意力机制设计与实现

  • 发表了文章 2025-02-12

    近端策略优化(PPO)算法的理论基础与PyTorch代码详解

  • 发表了文章 2025-02-11

    CoAT: 基于蒙特卡洛树搜索和关联记忆的大模型推理能力优化框架

  • 发表了文章 2025-02-10

    用傅里叶变换解码时间序列:从频域视角解析季节性模式

  • 发表了文章 2025-02-09

    PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率

  • 发表了文章 2025-02-08

    DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架

  • 发表了文章 2025-02-07

    SRMT:一种融合共享记忆与稀疏注意力的多智能体强化学习框架

  • 发表了文章 2025-02-06

    EvalPlanner:基于“计划-执行”双阶段的大语言模型评估框架

  • 发表了文章 2025-02-05

    DeepSeek技术报告解析:为什么DeepSeek-R1 可以用低成本训练出高效的模型

  • 发表了文章 2025-02-05

    数据降维技术研究:Karhunen-Loève展开与快速傅里叶变换的理论基础及应用

  • 发表了文章 2025-02-03

    PyTorch生态系统中的连续深度学习:使用Torchdyn实现连续时间神经网络

  • 发表了文章 2025-02-02

    DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构

  • 发表了文章 2025-02-01

    哪些特征导致过拟合?使用ParShap 方法精准定位导致模型泛化能力下降的关键特征

  • 发表了文章 2025-01-31

    Python GIL(全局解释器锁)机制对多线程性能影响的深度分析

  • 发表了文章 2025-01-30

    深入剖析SVM核心机制:铰链损失函数的原理与代码实现

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息