官方博客-第25页-阿里云开发者社区

  • 2024-05-15
    722

    联合XTuner,魔搭社区全面支持数据集的长文本训练

    XTuner和魔搭社区(SWIFT)合作引入了一项长序列文本训练技术,该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU,从而减少每个GPU上的显存占用。通过这种方式,训练超大规模模型时可以处理更长的序列,提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术,支持多种大模型和数据集的训练。此外,SWIFT还提供了一个用户友好的界面,方便用户进行训练和部署,并且支持评估功能。

  • 2024-05-15
    1111

    LISA微调技术解析:比LoRA更低的显存更快的速度

    LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。

    1,111
  • 大数据分析平台之 OLAP 架构的最佳实践

    本文将分享聚水潭云原生 OLAP 架构的最佳实践。

  • 2024-05-15
    15126

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

    Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

    15,126
  • 2024-05-15
    704

    使用智能媒体生产ICE剪辑OSS视频文件

    本篇介绍智能媒体生产ICE一些常见场景,如裁剪、拼接、字幕、ASR等,通过一些时间线示例,介绍如何快速剪辑OSS上的视频文件。

    704
  • 2024-05-15
    1345

    全景剖析阿里云容器网络数据链路(一)—— Flannel

    本文是[全景剖析容器网络数据链路]第一部分,主要介绍Kubernetes Flannel模式下,数据面链路的转转发链路

    1,345
  • 2024-05-15
    374

    日志审计:多账号下VPC流日志采集与监控方案

    本文主要介绍如何基于日志审计进行跨账号的VPC流日志采集与监控。

    374
  • 2024-05-15
    241898

    卓越工程布道:掌握条件判断的模式

    本文是普适性的经验分享,并非按规范局限在 JavaScript 前端视角 做出的总结,除JavaScript外还深入结合了ActionScript 3.0、PHP、C / C++、Basic非纯粹OOP领域语言的经验。

    241,898
  • 2024-05-15
    654

    Hologres RoaringBitmap在Lazada选品平台的最佳实践

    Lazada选品平台包含全网商家、商品的圈选,通过Hologres RoaringBitmap能力帮助业务突破选品池20w大小限制,6000+选品池调度完成由12h下降至1h,单个选品池调度时间由90s下降至2s。

    654
  • 1
    ...
    24
    25
    26
    ...
    42
    到第