官方博客-第15页-阿里云开发者社区

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

ModelScope

2024-05-15

480

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

480

资源编排ROS

2024-06-04

1159

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型，支持英中两种语言，训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案，用户只需在ROS控制台配置模板参数，如区域和实例类型，即可完成部署。部署后，从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用，提高了部署效率和稳定性。

资源编排ROS

1,159

阿里云大数据Al技术

2024-08-09

9091

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,091

赵世振

2024-08-22

1211

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,211

太业

2024-09-27

793

跟着iLogtail学习容器运行时与K8s下日志采集方案

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，本文跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

太业

793

阿里云云原生

2024-11-04

645

只要几句话，通义灵码帮你创建专属健康管理小程序

数字时代的大潮中，编程不再高深莫测，而是每个人都可以尝试并享受的乐趣。今天，就让我们一起探索如何利用通义灵码的自然语言生成代码功能，轻松打造你的专属健康管理小程序，说不定在这个过程中，不管是身材管理，还是编程学习，都能让你离目标更近一步。

阿里云云原生

645

青熙

2024-11-15

1177

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

青熙

1,177

新念

2025-02-14

1390

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,390

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

基于RAG搭建企业级知识库在线问答

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

跟着iLogtail学习容器运行时与K8s下日志采集方案

只要几句话，通义灵码帮你创建专属健康管理小程序

AI经营｜多Agent择优生成商品标题

DeepSeek-V3 高效训练关键技术分析

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

基于RAG搭建企业级知识库在线问答

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

跟着iLogtail学习容器运行时与K8s下日志采集方案

只要几句话，通义灵码帮你创建专属健康管理小程序

AI经营｜多Agent择优生成商品标题

DeepSeek-V3 高效训练关键技术分析