2024-05-15
553

vLLM部署Yuan2.0:高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

2024-10-29
131

运用通义灵码有效管理遗留代码:提升代码质量与可维护性

本文首先介绍了遗留代码的概念,并对遗留代码进行了分类。针对不同类型的遗留代码,提供了相应的处理策略。此外,本文重点介绍了通义灵码在维护遗留代码过程中能提供哪些支持。

131
2024-11-04
80

国内首位聋人 Android 软件工程师体验通义灵码,“这真是太棒了”

@workspace 功能发布后,我们收到了非常多新老朋友的积极反馈,其中有一个特别的朋友给我留下了深刻的印象,来分享一下他的故事。

2024-05-15
61271

面向全栈可观测的分布式链路追踪

全栈可观测App提供了一套完整的分析工具,从数据统计分析能力到数据关联,再到具备智能化和自动化特性的相关工具,以解决人们在可观测性方面所遇到的问题。未来,我们将持续提供更加丰富和强大的分析工具来满足用户的需求。

61,271
2024-05-15
53057

面向全栈可观测的性能监控

SLS性能持续分析基于开放的接入生态与持续性能分析的理念所构建(开放接入部分已在iLogtail开源),基于SLS 性能持续分析,将为广大开发者提供开箱即用、一站式的的性能观测体验,助力开发者轻松面对多云、多Region、多版本、微服务等场景下的性能分析需求。

53,057
2024-05-15
375

ECS多场景迁移上云最佳实践

阿里云弹性计算团队十三位产品专家和技术专家共同分享云上运维深度实践,详细阐述如何利用CloudOps工具实现运维提效、弹性降本。

375
2024-05-15
191

AIGC下一步:用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站,阿里云视频云演讲分享

2024-05-15
472

Mistral 7B v0.2 基础模型开源,魔搭社区微调教程和评测来啦!

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型,有如下几个特点

2024-05-16
88084

通义千问 2.5 “客串” ChatGPT4,看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

88,084
1
...
9
10
11
...
15
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10/15