官方博客-第22页-阿里云开发者社区

ModelScope

2024-05-15

1226

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,226

离澈

2024-05-15

374

万字长文：一文详解单元测试干了什么

好的单元测试不仅可以验证代码结构设计的是否合理，而且可以提前发现代码中的漏洞，将线上风险扼杀在摇篮中。本文从常用的单元测试框架出发，对Mockito框架深入浅出的讲解，希望能帮到每一位同学。

离澈

374

刘军

2024-06-18

16994

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的，同时提供高性能通信、面向接口的易用性编码。

刘军

16,994

阿里云大数据Al技术

2024-07-31

7485

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,485

阿里云云原生

2024-09-06

302

MacTalk 测评通义灵码，实现“微信表情”小功能

墨问西东创始人池建强分享了团队使用通义灵码的经验。

阿里云云原生

302

阿里云云原生

2024-09-14

524

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

524

易定

2024-12-06

1040

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,040

阿里云云原生

2025-01-22

524

两步构建 AI 总结助手，实现智能文档摘要

本方案将运用函数计算 FC，构建一套高可用性的 Web 服务，以满足用户多样化的需求。当用户发起请求时，系统内部会自动将包含文本和提示词的信息传递给百炼模型服务，百炼平台将根据后台配置调用相应的大模型服务，对文本数据进行智能识别与解析，最终将总结结果返回给用户。

阿里云云原生

524

亦达

2025-02-20

716

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

716

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

万字长文：一文详解单元测试干了什么

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

OSS数据源一站式RAG最佳实践

MacTalk 测评通义灵码，实现“微信表情”小功能

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

【实战干货】AI大模型工程应用于车联网场景的实战总结

两步构建 AI 总结助手，实现智能文档摘要

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

万字长文：一文详解单元测试干了什么

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

OSS数据源一站式RAG最佳实践

MacTalk 测评通义灵码，实现“微信表情”小功能

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

【实战干货】AI大模型工程应用于车联网场景的实战总结

两步构建 AI 总结助手，实现智能文档摘要

破解 vLLM + DeepSeek 规模化部署的“不可能三角”