Deephub_社区达人页

个人头像照片
Deephub
已加入开发者社区815

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
一代宗师
一代宗师

成就

已发布1287篇文章
284条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

公众号 Deephub-IMBA

暂无精选文章
暂无更多信息
  • 发表了文章 2025-03-01

    PyTorch内存优化的10种策略总结:在有限资源环境下高效训练模型

  • 发表了文章 2025-02-28

    LLM模型添加自定义Token代码示例:为Llama 3.2模型添加思考与回答标记

  • 发表了文章 2025-02-27

    Featurewiz-Polars:基于XGBoost的高性能特征选择框架,一行代码搞定特征选择

  • 发表了文章 2025-02-26

    Logic-RL: 小模型也能强推理,通过基于规则的强化学习提升大语言模型结构化推理能力

  • 发表了文章 2025-02-25

    SelfCite:  通过自监督奖励提升LLM对上下文内容的引用质量

  • 发表了文章 2025-02-24

    用PyTorch从零构建 DeepSeek R1:模型架构和分步训练详解

  • 发表了文章 2025-02-23

    SmolLM2:多阶段训练策略优化和高质量数据集,小型语言模型同样可以实现卓越的性能表现

  • 发表了文章 2025-02-22

    Diffusion-DPO:一种基于直接偏好优化的扩散模型对齐新方法

  • 发表了文章 2025-02-21

    LLM高效推理:KV缓存与分页注意力机制深度解析

  • 发表了文章 2025-02-20

    Vision Transformer中的图像块嵌入详解:线性投影和二维卷积的数学原理与代码实现

  • 发表了文章 2025-02-19

    STAR: 利用时空注意力机制和动态频率损失的视频超分辨率增强框架

  • 发表了文章 2025-02-18

    DeepMind发布Matryoshka(套娃)量化:利用嵌套表示实现多精度LLM的低比特深度学习

  • 发表了文章 2025-02-17

    MOIRAI-MOE: 基于混合专家系统的大规模时间序列预测模型

  • 发表了文章 2025-02-16

    知识蒸馏方法探究:Google Distilling Step-by-Step 论文深度分析

  • 发表了文章 2025-02-15

    大语言模型的解码策略与关键优化总结

  • 发表了文章 2025-02-14

    DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解

  • 发表了文章 2025-02-13

    基于结构化状态空间对偶性的贝叶斯注意力机制设计与实现

  • 发表了文章 2025-02-12

    近端策略优化(PPO)算法的理论基础与PyTorch代码详解

  • 发表了文章 2025-02-11

    CoAT: 基于蒙特卡洛树搜索和关联记忆的大模型推理能力优化框架

  • 发表了文章 2025-02-10

    用傅里叶变换解码时间序列:从频域视角解析季节性模式

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息