米基

2024-05-15

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

949

阿里云云原生

2024-07-30

779

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

779

翊云

2024-08-15

246

MySQL实现并发控制的过程

数据库系统到底是怎么进行并发访问控制的？本文以 MySQL 8.0.35 代码为例，尝试对 MySQL 中的并发访问控制进行整体介绍。

翊云

246

子丑

2024-07-22

15565

超越流水线，企业研发规范落地新思路

一文详解研发规范的目标、常见误区、选型方法与常见最佳实践。

子丑

15,565

阿里云云原生

2024-09-02

80

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

80

星舰正泽

2024-05-15

8509

通义千问API：找出两篇文章的不同

本章我们将介绍如何利用大模型开发一个文档比对小工具，我们将用这个工具来给互联网上两篇内容相近但版本不同的文档找找茬，并且我们提供了一种批处理文档比对的方案

星舰正泽

8,509

阿里云数据库

2024-05-15

82329

Ganos H3地理网格能力解析与最佳实践

本文介绍了Ganos H3的相关功能，帮助读者快速了解Ganos地理网格的重要特性与应用实践。H3是Uber研发的一种覆盖全球表面的二维地理网格，采用了一种全球统一的、多层次的六边形网格体系来表示地球表面，这种地理网格技术在诸多业务场景中得到广泛应用。Ganos不仅提供了H3网格的全套功能，还支持与其它Ganos时空数据类型进行跨模联合分析，极大程度提升了客户对于时空数据的挖掘分析能力。

阿里云数据库

82,329

ModelScope

2024-05-15

977

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

977

乐忱

2024-06-14

38065

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

38,065

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

5 大场景上手通义灵码企业知识库问答

MySQL实现并发控制的过程

超越流水线，企业研发规范落地新思路

西游再现，一键部署 Flux 文生图大模型生成西游人物

通义千问API：找出两篇文章的不同

Ganos H3地理网格能力解析与最佳实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

AI时代：云存储加速多模态数据存储与管理创新