官方博客-第25页-阿里云开发者社区

闵子

2023-12-01

2960

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,960

王明橙鲤黄俊

2024-05-15

64206

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,206

非有

2024-05-15

1579

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,579

ModelScope

2024-05-15

1206

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,206

赵世振

2024-08-21

1546

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,546

寻剑

2024-09-11

417

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

417

阿里云云原生

2024-11-01

1060

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

1,060

勉成

2024-12-12

670

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

670

李德

2025-04-03

475

结合多模态RAG和异步调用实现大模型内容

文章探讨了如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括：通过多模态RAG技术实现图片查重，结合异步调用方法优化货损识别功能。

李德

475

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

从浏览器原理出发聊聊Chrome插件

通义千问开源模型在PAI灵骏的最佳实践

一文详解 Java 限流接口实现

LISA微调技术解析：比LoRA更低的显存更快的速度

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

表格存储低成本向量检索服务助力 AI 检索

Serverless GPU：助力 AI 推理加速

如何找出Java进程占用CPU高的元凶

结合多模态RAG和异步调用实现大模型内容

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

从浏览器原理出发聊聊Chrome插件

通义千问开源模型在PAI灵骏的最佳实践

一文详解 Java 限流接口实现

LISA微调技术解析：比LoRA更低的显存更快的速度

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

表格存储低成本向量检索服务助力 AI 检索

Serverless GPU：助力 AI 推理加速

如何找出Java进程占用CPU高的元凶

结合多模态RAG和异步调用实现大模型内容