官方博客-第29页-阿里云开发者社区

ModelScope

2024-05-15

1128

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,128

李鹏

2024-05-15

574

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

574

阿里云实时数仓Hologres

2024-05-15

75041

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,041

资源编排ROS

2024-06-24

400

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

400

张昕东

2024-07-25

14023

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,023

浅奕

2024-09-05

378

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

378

阿里云云原生

2024-10-18

962

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

962

明巍临城水德

2024-11-14

511

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

511

龙蜥社区OpenAnolis

2024-11-22

462

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

Anolis OS 作为国内首个正式提供 OpenVINO 开发包和镜像的服务器端操作系统，推动国内 AI 推理生态和能力的升级。

龙蜥社区OpenAnolis

462

官方博客-第29页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Serverless Kubernetes 开发实践：异构资源，按需使用

大数据分析平台之 OLAP 架构的最佳实践

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

通过实验深入了解 TCP 连接的建立和关闭

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

官方博客-第29页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Serverless Kubernetes 开发实践：异构资源，按需使用

大数据分析平台之 OLAP 架构的最佳实践

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

通过实验深入了解 TCP 连接的建立和关闭

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

手把手教学攻略：在Anolis OS上部署OpenVINO深度学习模型

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理