官方博客-第35页-阿里云开发者社区

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

逸扬

2024-05-15

431

提起CDN，大家想到的字眼可能是缓存、转发、调度，用来提升终端用户体验、保护源站IP、降低源站流量风险，同时可以将源站的应用功能卸载到边缘，进一步释放边缘算力满足业务需求。DCDN脱胎于CDN，面向动态元素，通过智能路由、协议优化、压缩传输等手段，将转发场景的性能提到极限，广泛应用于电商、游戏、政企等行业。在互联网蓬勃发展，传统企业寻求数字化转型机会的今天，DCDN作为流量的入口，搭配灵活易扩展的“高级条件”及“EdgeScript”，可以通过流量转发这一技术手段，实现客户上云的“安全灰度”。

逸扬

431

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

斜阳

2024-05-16

740

浅谈现代消息队列与云存储

讲述消息系统在现代化演进中软硬一体化，百万队列，分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离，FFM与协程，RDMA 传输，列式存储等技术，将消息向流的领域延伸。

斜阳

740

阿里云云原生

2024-05-21

57446

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,446

邢云阳

2024-08-20

19101

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

19,101

喻奎

2024-08-23

284

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

284

布谷

2024-09-03

576

React 的正确使用方法：ref 篇

你真的用对了 useRef 吗？在与 TypeScript 一起使用、以及撰写组件库的情况下，你的写法能够避开以下所有场景的坑吗？

布谷

576

资源编排ROS

2024-09-10

216

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

在虚拟游戏的世界里，数字化的乐趣谱写着无数玩家的回忆。本文将指导您使用阿里云ROS CDK轻松将2048小游戏部署到云端。ROS CDK是一种强大的工具，允许您使用熟悉的编程语言定义和部署云资源，简化开发流程。此外，ECS（弹性计算服务）为您提供灵活且可扩展的计算资源，确保应用稳定运行。通过简单的环境配置和依赖安装，您可以快速创建和管理云资源，实现从本地到云端的无缝迁移。跟随本文指引，您将学会如何使用ROS CDK和ECS部署2048小游戏，并享受云端游戏的乐趣。

资源编排ROS

216

官方博客-第35页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DCDN助力企业灰度上云产品实践

LISA微调技术解析：比LoRA更低的显存更快的速度

浅谈现代消息队列与云存储

函数计算助力领健信息为“看牙”注入 AI 活力

AI 网关零代码解决 AI 幻觉问题

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

React 的正确使用方法：ref 篇

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

官方博客-第35页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DCDN助力企业灰度上云产品实践

LISA微调技术解析：比LoRA更低的显存更快的速度

浅谈现代消息队列与云存储

函数计算助力领健信息为“看牙”注入 AI 活力

AI 网关零代码解决 AI 幻觉问题

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

React 的正确使用方法：ref 篇

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）