ModelScope

2024-05-15

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

218

仲阳

2024-06-13

14055

阿里云运维第一步（监控）：开箱即用的监控

监控运维是一个体系化的工作，完善这个体系非一日之功。但是我们的业务不可一日无监控“裸奔”，在阿里云怎么样快速低成本的建立第一道资源监控的护城河？开箱即用的云监控，将会是你进入阿里云的第一个可靠的小伙伴。

仲阳

14,055

望宸彦林

2024-06-24

50657

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,657

凡玺

2024-05-15

121547

Ganos实时热力聚合查询能力解析与最佳实践

本文主要介绍Ganos实时热力聚合查询并动态输出热力瓦片能力，依托阿里云PolarDB PostgreSQL产品、ADB PostgreSQL和RDS PostgreSQL 三款数据库建设输出。

凡玺

121,547

ModelScope

2024-05-15

326

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

326

ModelScope

2024-05-15

108863

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,863

ModelScope

2024-05-15

142

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

142

太业

2024-05-15

149

跟着iLogtail学习无锁化编程

锁是解决这些问题的传统方法，而无锁化编程是一种更高级但复杂的技术，它能够在某些情况下提供更优的性能和可扩展性。正确选择和实现适合应用场景的并发策略，是高效多线程编程的关键。本文由作者带着大家一起学习无锁化编程。

太业

149

一为

2024-05-15

180

基于ASK+TFJob快速完成分布式Tensorflow训练任务

本文介绍如何使用TFJob在ASK+ECI场景下，快速完成基于GPU的TensorFlow分布式训练任务。

一为

180

类目筛选

内容类型

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

阿里云运维第一步（监控）：开箱即用的监控

从云原生视角看 AI 原生应用架构的实践

Ganos实时热力聚合查询能力解析与最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

跟着iLogtail学习无锁化编程

基于ASK+TFJob快速完成分布式Tensorflow训练任务