官方博客-第6页-阿里云开发者社区

牧申景穆

2024-09-02

3558

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,558

刘军

2024-10-17

3306

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,306

探索云世界

2025-11-17

430

阿里云 AI 搜索 DeepSearch 技术实践

阿里云OpenSearch LLM版推出DeepSearch技术，实现从RAG 1.0到RAG 2.0的升级。基于多智能体协同架构，支持复杂推理、多源检索与深度搜索，显著提升问答准确率，助力企业智能化升级。

探索云世界

430

任庆盛

2023-02-22

23477

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,477

米基

2024-05-15

4044

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,044

荣阳

2025-02-28

1370

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,370

唐殊

2024-11-01

2279

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,279

山泽

2024-05-15

1685

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,685

ModelScope

2024-05-15

15415

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,415

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云 AI 搜索 DeepSearch 技术实践

Flink CDC+Kafka 加速业务实时化

大模型推理优化实践：KV cache复用与投机采样

使用A10单卡24G复现DeepSeek R1强化学习过程

探索LLM推理全阶段的JSON格式输出限制方法

从零构建现代深度学习框架(TinyDL-0.01)

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云 AI 搜索 DeepSearch 技术实践

Flink CDC+Kafka 加速业务实时化

大模型推理优化实践：KV cache复用与投机采样

使用A10单卡24G复现DeepSeek R1强化学习过程

探索LLM推理全阶段的JSON格式输出限制方法

从零构建现代深度学习框架(TinyDL-0.01)

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估