官方博客-第18页-阿里云开发者社区

  • 2025-02-20
    643

    大模型推理服务全景图

    推理性能的提升涉及底层硬件、模型层,以及其他各个软件中间件层的相互协同,因此了解大模型技术架构的全局视角,有助于我们对推理性能的优化方案进行评估和选型。

    643
  • 2024-05-15
    103620

    一文搞懂需求流程规范的制定方法和落地技巧

    随着业务和产品的发展、团队的不断扩大,很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档,但最终却流于纸面,难以在团队真正落地。如何科学制定并有效落实需求管理规范呢?对此,云效产品经理陈逊进行了非常详细的直播分享,本文是他经验的文字总结。

    103,620
  • 2024-05-15
    3223

    阿里云容器服务 ACK AI 助手正式上线

    期待已久!阿里云容器服务 ACK AI 助手正式上线

    3,223
  • 2024-05-15
    133382

    谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

    谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

    133,382
  • 2024-05-15
    2576

    Multi-Agent实践第5期:RAG智能体的应用:让AgentScope介绍一下自己吧

    本期文章,我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体,创造AgentScope助手群,为大家解答和AgentScope相关的问题。

    2,576
  • 2024-05-15
    1118

    LISA微调技术解析:比LoRA更低的显存更快的速度

    LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。

    1,118
  • 60876

    突破大表瓶颈|小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

    PolarDB已经成为小鹏汽车应对TB级别大表标注、分析查询的"利器"。

  • 705

    内附原文|SIGMOD’24:百万核的智能调度,云数仓如何结合AI处理用户混合负载

    论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性,解决了云数据仓库的性能瓶颈,同时支持了资源按需预留。Flux优于传统的方法,查询响应时间 (RT) 最多可减少75%,资源利用率提高19.0%,成本开销降低77.8%。

  • 1
    ...
    17
    18
    19
    ...
    55
    到第