官方博客-第17页-阿里云开发者社区

子白

2024-05-15

102422

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,422

葳葳

2024-05-15

122604

每天一个摆脱if-else工程师的技巧，优雅的参数校验

在日常的开发工作中，为了程序的健壮性，大部分方法都需要进行入参数据校验。本文围绕作者如何优雅的进行参数校验展开讨论。

葳葳

122,604

ModelScope

2024-05-15

1367

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,367

涯海

2024-05-15

525

链路追踪（Tracing）其实很简单——链路拓扑

最近一年，小玉所在的业务部门发起了轰轰烈烈的微服务化运动，大量业务中台应用被拆分成更细粒度的微服务应用。为了迎接即将到来的双十一大促重保活动，小玉的主管让她在一周内梳理出订单中心的全局关键上下游依赖，提前拉...

涯海

525

龙蜥社区OpenAnolis

2024-11-06

726

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

726

阿里云云原生

2025-02-19

462

一键构建智能导购 AI 助手，轻松重塑购物体验

在数字化时代，线上购物已成为消费者生活中不可或缺的消费方式，而消费者的购物习惯和需求逐渐呈现多样化的趋势，为了帮助商家全天候、自动化地满足顾客的购物需求，本方案将详细介绍如何基于商品内容构建一个智能商品导购助手。

阿里云云原生

462

阿里云云原生

2025-04-25

659

本文介绍了为何需要WolframAlpha及其在解决大语言模型“幻觉”问题上的优势。大型语言模型如GPT-4虽在自然语言处理方面表现出色，但在科学与数学问题上常出错。WolframAlpha凭借其强大的计算能力和广泛的知识库，能准确处理复杂问题。Higress MCP市场已上线WolframAlpha LLM API，支持多种调用方式，并提供每月10次免费试用。配置流程包括获取API工具、安装Lobechat及配置Higress MCP插件。测试案例显示，WolframAlpha在数学推理、日常计算和图像绘制等方面表现优异，未来结合更多服务将推动AI技术发展。

阿里云云原生

659

阿里云云原生

2025-06-03

1032

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,032

ModelScope

2024-05-15

1927

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,927

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

每天一个摆脱if-else工程师的技巧，优雅的参数校验

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

链路追踪（Tracing）其实很简单——链路拓扑

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

一键构建智能导购 AI 助手，轻松重塑购物体验

理工科 MCP Server 神器，补足人工智能幻觉短板

实现企业级 MCP 服务统一管理和智能检索的实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

每天一个摆脱if-else工程师的技巧，优雅的参数校验

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

链路追踪（Tracing）其实很简单——链路拓扑

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

一键构建智能导购 AI 助手，轻松重塑购物体验

理工科 MCP Server 神器，补足人工智能幻觉短板

实现企业级 MCP 服务统一管理和智能检索的实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践