ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

414

升正

2024-05-15

59

我知道你想用useEffect，但你先别急

useEffect是React提供给我们的一个“逃生舱”，是React 的纯函数式世界通往命令式世界的“逃生通道”，选择合适的时机使用useEffect会让我们的代码既优雅又高效，反之会造成不必要的负担。

升正

59

涯海

2024-05-15

132

链路追踪（Tracing）其实很简单——链路拓扑

最近一年，小玉所在的业务部门发起了轰轰烈烈的微服务化运动，大量业务中台应用被拆分成更细粒度的微服务应用。为了迎接即将到来的双十一大促重保活动，小玉的主管让她在一周内梳理出订单中心的全局关键上下游依赖，提前拉...

涯海

132

阿里云云原生

2024-07-29

164

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

164

阿里云大数据Al技术

2024-07-31

7063

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,063

阿里云实时计算Flink

2023-03-30

4499

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,499

阿里云实时计算Flink

2023-04-13

873

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

873

喻奎

2023-06-25

10115

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,115

云服务器ECS

2023-07-10

4172

一键配置版：搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手，通过远程调用部署在ECS上的服务端，实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

云服务器ECS

4,172

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

我知道你想用useEffect，但你先别急

链路追踪（Tracing）其实很简单——链路拓扑

从供应商深度绑定，到走向真正的云原生，他们是这样做的

OSS数据源一站式RAG最佳实践

Apache Paimon 在同程旅行的探索实践

海量数据实时分析引擎 Apache Flink

MaxCompute湖仓一体近实时增量处理技术架构揭秘

一键配置版：搭建高可用的微信/支付宝小程序服务