官方博客-第27页-阿里云开发者社区

  • 2024-05-15
    656

    联合XTuner,魔搭社区全面支持数据集的长文本训练

    XTuner和魔搭社区(SWIFT)合作引入了一项长序列文本训练技术,该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU,从而减少每个GPU上的显存占用。通过这种方式,训练超大规模模型时可以处理更长的序列,提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术,支持多种大模型和数据集的训练。此外,SWIFT还提供了一个用户友好的界面,方便用户进行训练和部署,并且支持评估功能。

  • 2024-05-15
    1048

    LISA微调技术解析:比LoRA更低的显存更快的速度

    LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。

    1,048
  • 2024-05-15
    330

    Serverless架构的弹幕应用开发实践

    Serverless的理念是即时弹性,用完即走。服务并非长时间运行,这也就意味着像websocket这种长链接的请求模式看起来并不适合Serverless,但是否有其他的办法既能满足长连接模式请求,也能够利用Serverless本身特性呢?答案是肯定的,我们通过API网关来解决webscoket连接的问题,然后由网关触达Serverless服务的后端,本文以弹幕场景为例来介绍如何使用Serverless架构实现全双工通信。

    330
  • 2024-05-15
    14847

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

    Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

    14,847
  • 2024-05-15
    340

    基于Serverless搭建批量打马赛克服务

    本方案实现在阿里云Serverless函数计算服务中搭建图片批量打马赛克服务,具备自动将用户上传到OSS桶内的图片批量打上马赛克功能,实现用户敏感信息自动化处理。

  • 2024-05-15
    330

    日志审计:多账号下VPC流日志采集与监控方案

    本文主要介绍如何基于日志审计进行跨账号的VPC流日志采集与监控。

    330
  • 2024-05-15
    270

    Serverless 应用优化四则秘诀

    Serverless 架构下,虽然我们更多精力是关注我们的业务代码,但是实际上对于一些配置和成本也是需要进行关注的,并且在必要的时候,还需要根据配置与成本进行对我们的 Serverless 应用进行配置优化和代码优化。

  • 2024-05-15
    530

    一天完成基于Serverless架构的头像漫画风处理小程序

    我一直都想要有一个漫画版的头像,奈何手太笨,用了很多软件 “捏不出来”,所以就在想着,是否可以基于 AI 实现这样一个功能,并部署到 Serverless 架构上让更多人来尝试使用呢。

  • 2024-05-15
    241883

    卓越工程布道:掌握条件判断的模式

    本文是普适性的经验分享,并非按规范局限在 JavaScript 前端视角 做出的总结,除JavaScript外还深入结合了ActionScript 3.0、PHP、C / C++、Basic非纯粹OOP领域语言的经验。

    241,883
  • 1
    ...
    26
    27
    28
    ...
    40
    到第