官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1130

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,130

杨逍

2024-07-04

480

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

37,053

阿里云实时数仓Hologres

2024-07-23

25212

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

25,212

阿里云瑶池数据库

2024-08-13

755

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

755

右予故黎

2024-11-21

976

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

976

舟谨

2024-12-13

449

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

449

探索云世界

2024-12-20

481

本次实验主要体验RDS通用云盘的三项核心能力：IO加速、IO突发和数据归档。首先创建实验资源，包括RDS MySQL实例和ECS实例，耗时约5分钟。接着通过sysbench导入数据并配置安全设置。在体验阶段，我们对比了开启和关闭IO加速及IO突发功能对RDS性能的影响，观察到QPS有显著差异。最后，通过将数据从云盘迁移到OSS中，展示了冷存层的数据归档功能，并进行RDS硬盘缩容，验证了其成本优势。整个实验过程详细记录了每一步操作，确保用户能直观感受到RDS通用云盘带来的性能提升和成本优化。

探索云世界

481

赵世振

2024-12-25

2042

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,042

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

现已开源｜有这款神器，业务0改动即可实现数据加密

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

分析性能提升40%，阿里云Hologres流量场景最佳实践

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

“无”中生有：基于知识增强的RAG优化实践

如何提取手写票据信息

RDS通用云盘核心能力

通义视觉推理大模型QVQ-72B-preview重磅上线

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

现已开源｜有这款神器，业务0改动即可实现数据加密

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

分析性能提升40%，阿里云Hologres流量场景最佳实践

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

“无”中生有：基于知识增强的RAG优化实践

如何提取手写票据信息

RDS通用云盘核心能力

通义视觉推理大模型QVQ-72B-preview重磅上线