官方博客-第26页-阿里云开发者社区

  • 2023-02-28
    16917

    应用场景系列之(1),流量管理下的熔断场景

    本文主要介绍深入理解熔断器在不同场景下的行为。

    16,917
  • 2024-05-15
    739

    解密最受欢迎的开源 Serverless 框架:流量篇

    解密最受欢迎的开源 Serverless 框架:流量篇

    739
  • 2024-05-15
    105552

    SLS 大模型可观测&安全推理审计标准解决方案

    本文介绍大模型可观测&安全推理审计解决方案和Demo演示,SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能,自定义仪表盘;SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据,建设完整统一的大模型可观测方案,为用户的大模型安全推理审计提供全面合规支持。

    105,552
  • 2024-05-15
    125156

    倚天使用|YODA倚天应用迁移神器,让跨架构应用迁移变得简单高效

    YODA(Yitian Optimal Development Assistant,倚天应用迁移工具)旨在帮助用户更加高效、便捷地实现跨平台、跨结构下的应用迁移,大幅度缩短客户在新平台上端到端性能验证所需的人力和时间,使得客户更加专注于应用本身算法的优化,协同客户实现降本增效。

    125,156
  • 2024-05-15
    630

    Yuan2.0大模型,联合向量数据库和Llama-index,助力检索增强生成技术

    本文将以Yuan2.0最新发布的Februa模型为例进行测试验证,用更小规模的模型达到更好的效果。

  • 2024-05-15
    794

    Mistral 7B v0.2 基础模型开源,魔搭社区微调教程和评测来啦!

    Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型,有如下几个特点

  • 2024-06-13
    56111

    基于云效 AppStack,5 分钟搞定一个 AI 应用的开发和部署

    区别于传统的流水线工具,本实验将带你体验云效应用交付平台 AppStack,从应用视角,完成一个 AI 聊天应用的高效交付。

  • 2024-09-30
    419

    阿里云 SAE Web:百毫秒高弹性的实时事件中心的架构和挑战

    SAE 事件中心通过智能诊断显示通知与用户连接起来,SAE WEB 百毫秒弹性实例给事件中心带来了新的实时性、海量数据和高吞吐的挑战,本篇将带您了解 SAE 整体事件中心的架构和挑战。

    419
  • 2024-10-18
    995

    海量大模型如何一键部署上云,函数计算 x ModelScope 社区给出答案

    得益于阿里云函数计算的产品能力,魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩(缩零能力)、GPU 虚拟化(最小 1GB 显存粒度)、异步调用能力、按用付费、闲置计费等能力,这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

  • 1
    ...
    25
    26
    27
    ...
    48
    到第