2024-05-15
411

vLLM部署Yuan2.0:高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

2024-05-15
61149

云效 Pipeline as Code 来了,这些场景,用好它效率翻倍

可视化与YAML编排兼具,云效CI/CD流水线你愿意打几分?

2024-05-16
87961

通义千问 2.5 “客串” ChatGPT4,看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

87,961
2024-06-03
41509

iLogtail 2.0 重大升级,端上支持 SPL

日志数据格式可能是多样且复杂的,iLogtail 插件配置模式已经可以很好的支持复杂数据的处理。iLogtail2.0 又带来了 SPL 语法的重大支持,在日志处理场景下,可以通过多级管道对数据进行交互式、递进式的探索和处理,从配置交互和性能上,都有比较大的提升和优化。iLogtail2.0 已经在逐步灰度中,欢迎大家体验和使用。

41,509
2024-06-13
55557

基于云效 AppStack,5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具,本实验将带你体验云效应用交付平台 AppStack,从应用视角,完成一个 AI 聊天应用的高效交付。

2019-12-24
1904

资源编排ROS之自定制资源(基础篇)

本文介绍资源编排ROS的基础知识配置。

2023-07-10
4167

一键配置版:搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手,通过远程调用部署在ECS上的服务端,实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

2024-05-15
113639

函数计算部署AI艺术字应用,生成新春文字头像

基于 Stable Diffusion Serverless API 解决方案搭建 AI 文字生成应用,支持并发出图。

2024-06-13
64986

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

本文将演示结合云效 AppStack,来看下如何在阿里云 ACK 集群上进行应用的 Ingress 灰度发布。

64,986
1
...
8
9
10
...
19
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
9/19