官方博客-第19页-阿里云开发者社区

  • 2024-05-15
    102414

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,414
  • 2024-05-15
    104668

    手把手教你捏一个自己的Agent

    Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。

    104,668
  • 2024-05-15
    710

    企业用户认证及文件权限控制-手把手指南

    本篇文章模拟一个企业级用户需求,手把手的描述企业级客户如何使用阿里云文件存储 NAS 实现云办公,实现多用户数据共享与隔离。

    710
  • 2024-07-25
    14019

    通义灵码:AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

    SDCon 全球软件技术大会上,阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践,随着 AIGC 技术的发展,软件研发领域将迎来智能化的新高度,助力 DevOps 流程优化,提升研发效率和研发幸福感。

    14,019
  • 2024-07-29
    20042

    LLM 应用可观测性:从 Trace 视角展开的探索与实践之旅

    基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点,本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战,近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践,一起来了解下吧。

    20,042
  • 2024-08-12
    530

    使用 Higress 快速构建 AI 应用

    Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能,推出了 AI 原生的 API 网关形态并且全部开源。

    530
  • 2024-08-15
    11729

    动手实践:高效构建企业级AI搜索

    本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用,以及搭建演示等。

    11,729
  • 2024-08-19
    20086

    不改一行代码轻松玩转 Go 应用微服务治理

    为了更好的进行 Go 应用微服务治理,提高研发效率和系统稳定性,本文将介绍 MSE 微服务治理方案,无需修改业务代码,实现治理能力。

    20,086
  • 2024-08-23
    281

    MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

    本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景,提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

    281
  • 1
    ...
    18
    19
    20
    ...
    79
    到第