官方博客-第37页-阿里云开发者社区

  • 2024-10-22
    424

    ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用

    本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用》。

  • 2024-10-31
    477

    基于 EventBridge + DashVector 打造 RAG 全链路动态语义检索能力

    本文将演示如何使用事件总线(EventBridge),向量检索服务(DashVector),函数计算(FunctionCompute)结合灵积模型服务[1]上的 Embedding API[2],来从 0 到 1 构建基于文本索引的构建+向量检索基础上的语义搜索能力。具体来说,我们将基于 OSS 文本文档动态插入数据,进行实时的文本语义搜索,查询最相似的相关内容。

    477
  • 2024-11-01
    835

    ROS Terraform 托管服务与原生 Terraform 对比:选择最适合你的 IaC 工具

    本文详细介绍了阿里云资源编排服务(ROS)提供的Terraform托管服务,对比了ROS与Terraform的原生能力,帮助用户根据需求选择合适的IaC工具。

  • 2024-11-21
    597

    构建理想容器镜像——以CSI为例

    本文围绕阿里云CSI(Container Storage Interface)镜像构建的实际案例,探讨了一系列优化容器镜像的最佳实践。

    597
  • 2024-12-04
    583

    C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

    游戏行业蓬勃发展,作为国内领先的 STEAM 游戏饰品交易的服务平台,看 C5GAME 如何利用 RocketMQ Serverless 技术,为千万级玩家提供流畅的游戏体验,同时降低成本并提升运维效率。

  • 2025-01-06
    307

    函数计算助您 7 分钟极速部署开源对话大模型

    本方案利用函数计算的无服务器架构,您可以在函数计算控制台选择魔搭(ModelScope)开源大模型应用模板;同时,我们将利用文件存储 NAS ,为应用服务所需的大模型和相关文件提供一个安全的存储环境;最终通过访问提供的域名进行模型的调用与验证。仅需三步,即可玩转目前热门 AI 大模型。

  • 2025-01-07
    276

    Envoy 开启 HTTP2 后偶现 404 解决方法

    在大部分基于 Envoy 实现的网关里,都存在这样一个问题,当开启 http2 时,客户端访问会出现偶发的 404,并且可以从日志注意到这些 404 的请求,:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书,且配置了多个域名的路由的情况下,这个问题特别容易出现。

  • 2025-01-10
    511

    Qwen2.5 的云端新体验,5 分钟完成极速部署

    将 Qwen2.5 模型部署于函数计算 FC,用户能依据业务需求调整资源配置,有效应对高并发场景,并通过优化资源配置,如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外,函数计算支持多样化 GPU 计费模式(按需计费、阶梯定价、极速模式),可根据业务需求调整,在面对高频请求和大规模数据处理时,能够显著降低综合成本。

  • 2025-01-24
    1900

    DeepSeek-R1 来了,从 OpenAI 平滑迁移到 DeepSeek的方法

    Higress 作为一款开源的 AI 网关工具,可以提供基于灰度+观测的平滑迁移方案。

    1,900
  • 1
    ...
    36
    37
    38
    ...
    64
    到第