大成鹏通信_个人页

个人头像照片 大成鹏通信
个人头像照片
3
0
0

个人介绍

暂无个人介绍

擅长的技术

  • 网络架构
  • 光模块
  • 数据中心
  • 智算中心
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2024年09月

  • 09.29 16:36:26
    发表了文章 2024-09-29 16:36:26

    使用光模块Breakout功能减少AI训练中断故障

    本文介绍了使用大成鹏通信光模块Breakout功能可以减少AI训练中断故障的问题。通过Breakout功能,单通道故障不会中断其他通道的数据转发,有效解决了传统光模块因单通道故障导致的训练中断问题。同时,还介绍了如何利用Breakout功能进行更灵活的AI基础网络组网。

2024年08月

2024年06月

  • 06.11 11:08:10
    发表了文章 2024-06-11 11:08:10

    以LLaMa 65B模型训练实例来计算AI/HPC算力光模块数量

    本文介绍了如何根据LLaMa 65B模型训练需求计算所需的AI/HPC光模块数量。在案例中,使用2048个A100 GPU,单GPU算力为156 TFLOPS。模型算力需求为546*10^21 FLOPS,预计训练时间为20天。采用两层Fat-Tree网络架构,需1024个400G网卡,48台交换机,若全用400G光模块则需4096个,交换机间2048个,网卡间1024个。大成鹏通信提供200G至800G的解决方案,并提供咨询与支持服务。
  • 发表了文章 2024-09-29

    使用光模块Breakout功能减少AI训练中断故障

  • 发表了文章 2024-08-16

    合理使用光互联产品减少万卡集群高性能网络中TOR交换机上行网络的ECMP哈希冲突

  • 发表了文章 2024-06-11

    以LLaMa 65B模型训练实例来计算AI/HPC算力光模块数量

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息