官方博客-第28页-阿里云开发者社区

ModelScope

2024-05-15

1231

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,231

ModelScope

2024-05-15

1143

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,143

阿里云瑶池数据库

2024-08-13

782

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

782

邢云阳

2024-08-20

19123

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

19,123

寻剑

2024-09-11

341

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

341

阿里云瑶池数据库

2024-11-08

1386

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

本文为数据库「拥抱Data+AI」系列连载第1篇，该系列是阿里云瑶池数据库面向各行业Data+AI应用场景，基于真实客户案例&最佳实践，展示Data+AI行业解决方案的连载文章。本篇内容针对电商行业痛点，将深入探讨如何利用数据与AI技术以及数据分析方法论，为电商行业注入新的活力与效能。

阿里云瑶池数据库

1,386

明巍临城水德

2024-11-14

542

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

542

张智超

2025-02-07

468

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

468

荣阳

2025-02-28

1049

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,049

官方博客-第28页-阿里云开发者社区

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

LISA微调技术解析：比LoRA更低的显存更快的速度

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AI 网关零代码解决 AI 幻觉问题

表格存储低成本向量检索服务助力 AI 检索

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

巧用通义灵码，提升前端研发效率

使用A10单卡24G复现DeepSeek R1强化学习过程

官方博客-第28页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

LISA微调技术解析：比LoRA更低的显存更快的速度

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AI 网关零代码解决 AI 幻觉问题

表格存储低成本向量检索服务助力 AI 检索

拥抱Data+AI｜破解电商7大挑战，DMS+AnalyticDB助力企业智能决策

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

巧用通义灵码，提升前端研发效率

使用A10单卡24G复现DeepSeek R1强化学习过程

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理