官方博客-第22页-阿里云开发者社区

  • 2024-05-15
    412

    联合XTuner,魔搭社区全面支持数据集的长文本训练

    XTuner和魔搭社区(SWIFT)合作引入了一项长序列文本训练技术,该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU,从而减少每个GPU上的显存占用。通过这种方式,训练超大规模模型时可以处理更长的序列,提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术,支持多种大模型和数据集的训练。此外,SWIFT还提供了一个用户友好的界面,方便用户进行训练和部署,并且支持评估功能。

  • 2024-05-15
    415

    阿里云微服务引擎及 API 网关 2024 年 4 月产品动态

    阿里云微服务引擎及 API 网关 2024 年 4 月产品动态。

  • 2024-05-15
    621

    LISA微调技术解析:比LoRA更低的显存更快的速度

    LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。

  • 2024-05-15
    67034

    无需重新学习,使用 Kibana 查询/可视化 SLS 数据

    本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

  • 2024-05-15
    368

    阿里云可观测 2024 年 4 月产品动态

    阿里云可观测 2024 年 4 月产品动态。

  • 2024-05-15
    13193

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

    Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

    13,193
  • 2024-05-15
    248

    OpenSergo 流量路由:从场景到标准化的探索

    本文从常见的微服务治理场景出发,从流量路由这个场景入手。先是根据流量路由的实践设计流量路由的 Spec,同时在 Spring Cloud Alibaba 中实践遵循 OpenSergo 标准的流量路由能力。

    248
  • 2024-05-15
    165

    融合数据库生态:利用EventBridge构建CDC应用

    本文介绍了CDC的一些概念、CDC在EventBridge上的应用以及若干最佳实践场景。

    165
  • 2024-05-15
    243

    618大促来袭,浅谈如何做好大促备战

    本文介绍了阿里云上关于大促备战的最佳实践。

    243
  • 1
    ...
    21
    22
    23
    ...
    36
    到第
    22/36