ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

364

探索云世界

2024-05-15

140

基于Docker搭建halo博客

实例安装Ubuntu20.04系统，通过MobaXterm远程连接ECS，同时通过安装宝塔面板和部署LNMP环境，基于Docker搭建了halo博客应用。

探索云世界

140

阿里云云原生

2024-05-15

66748

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

66,748

查斌

2023-04-14

349

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

349

元乙

2023-11-06

127732

从存储统一到数据融合，SLS在可观测场景的思考和行动

介绍SLS在可观测数据融合分析的一系列技术升级，融合Trace、全栈监控、Continuous Profiling、移动端监控等功能，帮助大家更快速地构筑全栈、自动化的观测能力。

元乙

127,732

ModelScope

2024-05-15

323

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

323

ModelScope

2024-05-15

140

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

140

离澈

2024-05-15

88

万字长文：一文详解单元测试干了什么

好的单元测试不仅可以验证代码结构设计的是否合理，而且可以提前发现代码中的漏洞，将线上风险扼杀在摇篮中。本文从常用的单元测试框架出发，对Mockito框架深入浅出的讲解，希望能帮到每一位同学。

离澈

88

阿里云云原生

2024-05-16

56180

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

56,180

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

基于Docker搭建halo博客

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

从存储统一到数据融合，SLS在可观测场景的思考和行动

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

万字长文：一文详解单元测试干了什么

容器内存可观测性新视角：WorkingSet 与 PageCache 监控