官方博客-第26页-阿里云开发者社区

  • 2024-05-15
    1138

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,138
  • 2024-05-15
    104687

    手把手教你捏一个自己的Agent

    Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。

    104,687
  • 2024-05-15
    533

    链路追踪(Tracing)其实很简单——链路拓扑

    最近一年,小玉所在的业务部门发起了轰轰烈烈的微服务化运动,大量业务中台应用被拆分成更细粒度的微服务应用。为了迎接即将到来的双十一大促重保活动,小玉的主管让她在一周内梳理出订单中心的全局关键上下游依赖,提前拉...

    533
  • 2024-05-16
    88535

    通义千问 2.5 “客串” ChatGPT4,看这篇让你分清楚

    这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

    88,535
  • 707

    内附原文|SIGMOD’24:百万核的智能调度,云数仓如何结合AI处理用户混合负载

    论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性,解决了云数据仓库的性能瓶颈,同时支持了资源按需预留。Flux优于传统的方法,查询响应时间 (RT) 最多可减少75%,资源利用率提高19.0%,成本开销降低77.8%。

  • 2024-08-06
    810

    AI 创业及变现新思路:零门槛 AI 绘图,定制 ComfyUI Serverless API 应用

    为了帮助用户高效率、低成本应对企业级复杂场景,本文介绍 ComfyUI API Serverless 版解决方案,通过使用该方案,用户可以充分利用 ComfyUI +Serverless 技术优势快速开发上线 AI 绘画应用,期待为广大开发者 AI 绘画创业及变现提供思路。

  • 2024-08-12
    476

    5 大场景上手通义灵码企业知识库 RAG

    大家好,我是通义灵码,你的智能编程助手!今天就跟大家分享下企业知识库能帮开发者做些什么。

  • 1
    ...
    25
    26
    27
    ...
    67
    到第