官方博客-第20页-阿里云开发者社区

  • 2024-05-15
    411

    联合XTuner,魔搭社区全面支持数据集的长文本训练

    XTuner和魔搭社区(SWIFT)合作引入了一项长序列文本训练技术,该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU,从而减少每个GPU上的显存占用。通过这种方式,训练超大规模模型时可以处理更长的序列,提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术,支持多种大模型和数据集的训练。此外,SWIFT还提供了一个用户友好的界面,方便用户进行训练和部署,并且支持评估功能。

  • 2024-05-15
    415

    阿里云微服务引擎及 API 网关 2024 年 4 月产品动态

    阿里云微服务引擎及 API 网关 2024 年 4 月产品动态。

  • 2024-05-15
    620

    LISA微调技术解析:比LoRA更低的显存更快的速度

    LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。

  • 2024-05-15
    67034

    无需重新学习,使用 Kibana 查询/可视化 SLS 数据

    本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

  • 2024-05-15
    368

    阿里云可观测 2024 年 4 月产品动态

    阿里云可观测 2024 年 4 月产品动态。

  • 2024-05-15
    13191

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

    Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

    13,191
  • 2024-05-15
    474

    安全防御四部曲---检测实践方案 (多产品结合)

    本次方案主要是针对阿里云国际站客户,企业在实际使用阿里云的过程中如何做好运维检测的一些多产品结合的方案介绍。 本篇文章的重点会放在检测(Detection)部分,会具体介绍涉及使用产品配置,FAQ等等,同时对整体的理论框架进行简单的介绍,帮助大家更好理解本部分在运维工作中的分属情况,更好的建立整体性的概念。

    474
  • 2024-05-15
    248

    OpenSergo 流量路由:从场景到标准化的探索

    本文从常见的微服务治理场景出发,从流量路由这个场景入手。先是根据流量路由的实践设计流量路由的 Spec,同时在 Spring Cloud Alibaba 中实践遵循 OpenSergo 标准的流量路由能力。

    248
  • 2024-05-15
    165

    融合数据库生态:利用EventBridge构建CDC应用

    本文介绍了CDC的一些概念、CDC在EventBridge上的应用以及若干最佳实践场景。

    165
  • 1
    ...
    19
    20
    21
    ...
    34
    到第
    20/34