官方博客-第2页-阿里云开发者社区

  • 2024-05-15
    3799

    高并发架构设计三大利器:缓存、限流和降级

    软件系统有三个追求:高性能、高并发、高可用,俗称三高。本篇讨论高并发,从高并发是什么到高并发应对的策略、缓存、限流、降级等。

    3,799
  • 2025-04-25
    1841

    MCP Server 实践之旅第 1 站:MCP 协议解析与云上适配

    本文深入解析了Model Context Protocol(MCP)协议,探讨其在AI领域的应用与技术挑战。MCP作为AI协作的“USB-C接口”,通过标准化数据交互解决大模型潜力释放的关键瓶颈。文章详细分析了MCP的生命周期、传输方式(STDIO与SSE),并提出针对SSE协议不足的优化方案——MCP Proxy,实现从STDIO到SSE的无缝转换。同时,函数计算平台被推荐为MCP Server的理想运行时,因其具备自动弹性扩缩容、高安全性和按需计费等优势。最后,展望了MCP技术演进方向及对AI基础设施普及的推动作用,强调函数计算助力MCP大规模落地,加速行业创新。

  • 2023-10-17
    2309

    使用ECS部署并使用Docker

    本文介绍如何在云服务ECS实例上,部署并使用Docker。

  • 2024-05-15
    2569

    为大模型工程提效,基于阿里云 ACK 的云原生 AI 工程化实践

    本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案,随后介绍云原生 AI 领域的关键技术与架构细节,最后分享我们在 ACK 的相关经验及工程实践。

  • 2024-11-06
    3782

    再也不用心惊胆战地使用FastJSON了——序列化篇

    本篇将主要介绍json序列化的详细流程。本文阅读的FastJSON源码版本为2.0.31。

    3,782
  • 2024-09-27
    892

    灵魂拷问-前端的作用--性能优化篇

    作者最近在尝试对负责的平台进行性能优化,本文整理了些前端性能优化的一些常见策略。

    892
  • 2023-09-26
    139064

    云原生场景下高可用架构的最佳实践

    云原生场景下高可用架构的最佳实践

    139,064
  • 2023-02-22
    23243

    Flink CDC+Kafka 加速业务实时化

    阿里巴巴开发工程师,Apache Flink Committer 任庆盛,在 9 月 24 日 Apache Flink Meetup 的分享。

    23,243
  • 2024-05-15
    102501

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,501
  • 1
    2
    3
    4
    ...
    33
    到第
    2/33