阿里云开发者_社区达人页

个人头像照片
阿里云开发者
已加入开发者社区1003

勋章 更多

个人头像照片
MVP_Star
MVP_Star
个人头像照片
阿里博主
阿里博主
个人头像照片
学习博主
学习博主
个人头像照片
门派掌门
门派掌门

成就

已发布781篇文章
1139条评论
已回答0个问题
0条评论
已发布5个视频
github地址

技术能力

兴趣领域
  • Java
  • 数据库
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍

暂无精选文章
暂无更多信息

2025年03月

  • 03.14 15:17:22
    发表了文章 2025-03-14 15:17:22

    2种方式1键部署,快速体验QWQ-32B 模型

    QwQ-32B 推理模型现已正式发布并开源,其卓越性能在多项基准测试中表现突出,与全球领先模型比肩。阿里云函数计算 FC 提供算力支持,Serverless+AI 云原生应用开发平台 CAP 提供两种部署方式:模型服务和应用模板,帮助用户快速部署 QwQ-32B 系列模型。用户可通过一键部署体验对话功能或以 API 形式接入 AI 应用。文档详细介绍了前置准备、部署步骤及验证方法,并提供删除项目指南以降低费用。来源:阿里云开发者公众号;作者:肯梦、折原。
  • 03.14 15:11:35
    发表了文章 2025-03-14 15:11:35

    从零开始的DeepSeek微调训练实战(SFT)

    本文重点介绍使用微调框架unsloth,围绕DeepSeek R1 Distill 7B模型进行高效微调,并介绍用于推理大模型高效微调的COT数据集的创建和使用方法,并在一个medical-o1-reasoning-SFT数据集上完成高效微调实战,并最终达到问答风格优化&知识灌注目的。
  • 03.14 14:47:29
    发表了文章 2025-03-14 14:47:29

    大模型无缝切换,QwQ-32B和DeepSeek-R1 全都要

    通义千问最新推出的QwQ-32B推理模型,拥有320亿参数,性能媲美DeepSeek-R1(6710亿参数)。QwQ-32B支持在小型移动设备上本地运行,并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换,涵盖环境准备、模型接入配置及客户端调用示例等内容。此外,还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能,帮助企业解决TPS与成本平衡、内容安全合规等问题,提升大模型应用的稳定性和效率。
  • 03.14 14:38:15
    发表了文章 2025-03-14 14:38:15

    Transformer到底解决什么问题?

    本文希望围绕“Transformer到底是解决什么问题的”这个角度,阐述NLP发展以来遇到的关键问题和解法,通过这些问题引出Transformer实现原理,帮助初学者理解。
  • 03.14 14:22:48
    发表了文章 2025-03-14 14:22:48

    从零开始教你打造一个MCP客户端

    Anthropic开源了一套MCP协议,它为连接AI系统与数据源提供了一个通用的、开放的标准,用单一协议取代了碎片化的集成方式。本文教你从零打造一个MCP客户端。
  • 03.14 14:13:21
    发表了文章 2025-03-14 14:13:21

    AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了

    大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下。 第一篇文章指路👉《AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了》
  • 03.11 10:15:42
    发表了文章 2025-03-11 10:15:42

    QwQ-32B一键部署,真正的0代码,0脚本,0门槛

    阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力,核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理(OOS)一键部署OpenWebUI+Ollama方案,轻松将QwQ-32B模型部署到ECS,或连接阿里云百炼的在线模型。整个过程无需编写代码,全部在控制台完成,适合新手操作。
  • 03.06 18:14:13
    发表了文章 2025-03-06 18:14:13

    AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了

    大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下。
  • 03.06 17:59:22
    发表了文章 2025-03-06 17:59:22

    schedule:原来还可以这样让进程让出 CPU?

    文章主要讲述通过模拟时钟中断和调度事件来优化和测试虚拟机监控器(VMM)的方法,包括流程设计、寄存器状态的保存与恢复、硬件中断处理规范等细节。
  • 03.06 17:52:24
    发表了文章 2025-03-06 17:52:24

    JDK21有没有什么稳定、简单又强势的特性?

    这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。
  • 03.06 17:30:45
    发表了文章 2025-03-06 17:30:45

    满血上阵,DeepSeek x 低代码创造专属知识空间

    本文介绍了如何结合阿里云百炼和魔笔平台,快速构建一个智能化的专属知识空间。通过利用DeepSeek R1等先进推理模型,实现高效的知识管理和智能问答系统。 5. **未来扩展**:探讨多租户隔离、终端用户接入等高级功能,以适应更大规模的应用场景。 通过这些步骤,用户可以轻松创建一个功能全面、性能卓越的知识管理系统,极大提升工作效率和创新能力。
  • 03.06 17:02:27
    发表了文章 2025-03-06 17:02:27

    校招阿里这三年,聊点非技术的

    作者总结了在阿里的三年时间中所收获的宝贵经验和成长感悟。
  • 03.06 16:57:47
    发表了文章 2025-03-06 16:57:47

    技术小白如何利用DeepSeek半小时开发微信小程序?

    通过通义灵码的“AI程序员”功能,即使没有编程基础也能轻松创建小程序或网页。借助DeepSeek V3和R1满血版模型,用户只需用自然语言描述需求,就能自动生成代码并优化程序。例如,一个文科生仅通过描述需求就成功开发了一款记录日常活动的微信小程序。此外,通义灵码还提供智能问答模式,帮助用户解决开发中的各种问题,极大简化了开发流程,让普通人的开发体验更加顺畅。
  • 03.06 16:18:27
    发表了文章 2025-03-06 16:18:27

    ComfyUI:搭积木一样构建专属于自己的AIGC工作流(保姆级教程)

    通过本篇文章,你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。
  • 03.06 15:58:37
    发表了文章 2025-03-06 15:58:37

    一篇关于DeepSeek模型先进性的阅读理解

    本文以DeepSeek模型为核心,探讨了其技术先进性、训练过程及行业影响。首先介绍DeepSeek的快速崛起及其对AI行业的颠覆作用。DeepSeek通过强化学习(RL)实现Time Scaling Law的新范式,突破了传统大模型依赖算力和数据的限制,展现了集成式创新的优势。文章还提到开源的重要性以及数据作为制胜法宝的关键地位,同时警示了业务发展中安全滞后的问题。
  • 03.06 15:52:45
    发表了文章 2025-03-06 15:52:45

    一招解决数据库中报表查询慢的痛点

    本文旨在解决传统数据库系统如PostgreSQL在处理复杂分析查询时面临的性能瓶颈问题。

2025年02月

  • 02.28 16:10:05
    发表了文章 2025-02-28 16:10:05

    使用A10单卡24G复现DeepSeek R1强化学习过程

    本文描述DeepSeek的三个模型的学习过程,其中DeepSeek-R1-Zero模型所涉及的强化学习算法,是DeepSeek最核心的部分之一会重点展示。
  • 02.28 15:53:32
    发表了文章 2025-02-28 15:53:32

    大模型推理主战场:通信协议的标配

    DeepSeek加速了模型平权,大模型推理需求激增,性能提升主战场从训练转向推理。SSE(Server-Sent Events)和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据,如一问一答场景;WebSocket支持双向实时通信,适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议,能更好地支持流式输出、长时任务处理和多轮交互,满足大模型应用的需求。随着用户体量扩大,网关层面临软件变更、带宽成本及恶意攻击等挑战,需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。
  • 02.28 15:30:22
    发表了文章 2025-02-28 15:30:22

    IDEA中使用DeepSeek满血版的手把手教程来了!

    本文主要介绍阿里云推出的AI编码助手——通义灵码在代码编写、智能问答、bug修复等方面的功能。
  • 02.28 15:27:30
    发表了文章 2025-02-28 15:27:30

    LLM 联网搜索,到底是咋回事?

    本文展示从零开始搭建一个本地聊天助手的过程,涵盖了模型部署、搜索逻辑设计、内容提取与整合等关键步骤,特别介绍了如何让模型具备联网搜索能力。
  • 02.28 15:23:52
    发表了文章 2025-02-28 15:23:52

    我是如何基于 DeepSeek-R1 构建出高效学习Agent的?

    本文介绍了名为“通俗讲解专家”的高效学习智能体,该智能体基于 DeepSeek-R1 模型构建,旨在通过生活化例子、概念讲解、简单记法和图示(SVG)四种方式帮助用户快速掌握复杂概念。文章详细描述了“通俗讲解专家”的提示词框架,包括角色定位、技能设定和输出规范,并提供了具体的使用方法。
  • 02.28 11:38:43
    发表了文章 2025-02-28 11:38:43

    进行GPU算力管理

    本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下,对GPU算力管理和分配带来的挑战。以及面对这些挑战,GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。
  • 02.28 11:16:55
    发表了文章 2025-02-28 11:16:55

    1分钟集成DeepSeek满血版!搭建智能运维助手

    阿里云 AI 搜索开放平台面向企业及开发者提供丰富的组件化AI搜索服务,本文将重点介绍基于AI搜索开放平台内置的 DeepSeek-R1 系列大模型,如何搭建 Elasticsearch AI Assistant。
  • 02.21 10:42:24
    发表了文章 2025-02-21 10:42:24

    基于LLM打造沉浸式3D世界

    阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索,为了解决LLMs与3D结合的问题,近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案,通过自然语言来与引擎内的3D世界进行交互。
  • 02.21 10:32:48
    发表了文章 2025-02-21 10:32:48

    重生之我在 Claude 上 “复刻”了 DeepSeek-R1 效果

    本文讲述 DeepSeek-R1 出来以后,作者尝试使用提示词工程在 Claude 上“复刻”DeepSeek-R1 使用效果的过程,包括背景介绍、复刻的尝试与优化,还阐述了复刻的意义、对提示词工程的影响。
  • 02.21 10:22:13
    发表了文章 2025-02-21 10:22:13

    K8S异常诊断之俺的内存呢

    本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。
  • 02.20 18:27:41
    发表了文章 2025-02-20 18:27:41

    在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

    如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型
  • 02.20 18:07:45
    发表了文章 2025-02-20 18:07:45

    系统稳定性建设三件事

    本文分享了作者学习稳定性工作、构建思路、落实方案,面对问题不断反思再推进的经验总结。
  • 02.20 18:01:54
    发表了文章 2025-02-20 18:01:54

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。
  • 02.20 17:44:26
    发表了文章 2025-02-20 17:44:26

    悲催,放到 Map 中的元素取不出来了

    本文通过一个程序员小明遇到的实际问题,深入探讨了在使用 HashMap 时由于键对象的可变性导致的数据访问异常。
  • 02.20 16:46:54
    发表了文章 2025-02-20 16:46:54

    大模型推理服务全景图

    推理性能的提升涉及底层硬件、模型层,以及其他各个软件中间件层的相互协同,因此了解大模型技术架构的全局视角,有助于我们对推理性能的优化方案进行评估和选型。
  • 02.20 16:40:55
    发表了文章 2025-02-20 16:40:55

    JDK11升级后竟让内存利用率飙升到90%以上?

    本文记录了作者升级到JDK11后,使用G1GC导致内存利用率飙升至90%以上的问题及其解决方案。
  • 02.14 16:33:05
    发表了文章 2025-02-14 16:33:05

    2025 年可观测 10 大趋势预测

    下述报告主要整理自各大网站发布的对 2025 年可观测趋势的预测,作者合并同类项汇总 10 个共性的趋势,欢迎大家一起讨论。
  • 02.14 16:23:23
    发表了文章 2025-02-14 16:23:23

    DeepSeek-V3 高效训练关键技术分析

    本文从模型架构、并行策略、通信优化和显存优化四个方面展开,深入分析了DeepSeek-V3高效训练的关键技术,探讨其如何以仅5%的算力实现对标GPT-4o的性能。
  • 02.14 16:12:43
    发表了文章 2025-02-14 16:12:43

    「缓存」会用很容易,用好才是技术活

    本文对比了几种常用缓存的特点,主要介绍了基于Guava的本地缓存和基于Tair的分布式缓存,包含快速入门和深入原理两部分,并在最后提供了使用缓存时需要注意的事项。
  • 02.14 15:40:23
    发表了文章 2025-02-14 15:40:23

    Spring容器的本质

    本文主要讨论Spring容器最核心的机制,用最少的代码讲清楚Spring容器的本质。
  • 02.14 14:45:18
    发表了文章 2025-02-14 14:45:18

    0代码!2种方式一键部署 DeepSeek 系列模型

    DeepSeek 凭借卓越性能和广泛应用场景,获得全球高度关注。DeepSeek-R1-Distill 是基于 DeepSeek-R1 生成的开源小模型,参数规模更小、推理成本更低,且基准测试表现出色。本文以 DeepSeek-R1-Distill-Qwen-7B-GGUF 模型为例,介绍如何通过阿里云 CAP 平台和函数计算 FC 部署 DeepSeek-R1 模型。用户可选择模型服务或应用模版两种方式快速部署,最快 10 分钟完成,最低 0 元起,支持 API 调用及第三方平台集成,具备免运维、弹性伸缩和高可用性,按量付费模式有效降低成本。欢迎点击阅读原文体验部署。
  • 02.14 14:37:28
    发表了文章 2025-02-14 14:37:28

    100万免费 Token!DeepSeek-R1满血版即刻拥有

    随着DeepSeek在线使用需求的迅猛增长,服务器资源紧张和响应延迟问题日益突出。本文推荐使用百炼大模型服务平台,提供DeepSeek满血版调用的平替方案,支持OpenAI SDK或HTTP方式快速体验。DeepSeek-R1与DeepSeek-V3分别有100万免费Token,另有多款开源Qwen及Llama蒸馏模型支持调用。通过百炼平台,无需自行搭建基础设施,具备负载均衡和自动扩缩容机制,确保API调用稳定。搭配Chatbox可视化界面客户端,简化调用流程,预估费用为0元,免费试用额度耗尽后预计成本不超过1元。
  • 02.14 14:30:27
    发表了文章 2025-02-14 14:30:27

    以史为鉴,未雨绸缪:身处“大模型掀起的AI浪潮中”的感悟和思考

    本文旨在帮助读者更深入地理解大模型和AI技术,重点介绍关键技术革新的背景与影响,特别是本次大模型时代和新一轮AI浪潮的推动因素与发展历程。
  • 02.14 10:27:54
    发表了文章 2025-02-14 10:27:54

    部署DeepSeek,你的GPU够用吗?

    本文介绍如何将 DeepSeek-R1 开源模型部署到 GPU 云服务器,在 GPU 云服务器上安装与配置 Ollama 和 Open WebUI。
  • 02.13 18:47:47
    发表了文章 2025-02-13 18:47:47

    大模型意图识别工程化实践

    本文重点介绍大模型意图识别能力在智能电视核心链路中的落地过程和思考,对比了基础模型、RAG 、以及7b模型微调三种方案的优缺点。
  • 02.13 18:29:22
    发表了文章 2025-02-13 18:29:22

    漫谈DeepSeek及其背后的核心技术

    本文深入探讨了DeepSeek大模型的核心技术,从公司背景、模型能力、训推成本到核心技术细节进行了全面分析。
  • 02.13 18:13:33
    发表了文章 2025-02-13 18:13:33

    高并发编程知识体系

    本文将从线程的基础理论谈起,逐步探究线程的内存模型,线程的交互,线程工具和并发模型的发展。扫除关于并发编程的诸多模糊概念,从新构建并发编程的层次结构。
  • 02.08 17:53:32
    发表了文章 2025-02-08 17:53:32

    提示词工程的十大认知误区

    本文将列举一些提示工程认知和创作方面的认知误区,并分享了作者的一些见解,希望能够为读者提供启发。
  • 02.07 17:53:01
    发表了文章 2025-02-07 17:53:01

    从铜线到云端:网络技术的跨越与未来趋势

    本文围绕物理网络和云网络基础知识科普进行展开,最后浅谈在AI大模型浪潮下云网络的演进方向。
  • 02.07 17:42:28
    发表了文章 2025-02-07 17:42:28

    3步,0代码!一键部署DeepSeek-V3、DeepSeek-R1

    阿里云PAI Model Gallery支持一键部署DeepSeek-V3、DeepSeek-R1模型,用户可在平台上零代码实现从训练到部署再到推理的全过程,简化开发流程。通过登录PAI控制台,选择Model Gallery,找到并部署所需模型,如“DeepSeek-R1-Distill-Qwen-7B”,享受高效便捷的AI应用体验。部署成功后可获取调用信息,快速集成到业务中。
  • 02.07 17:39:37
    发表了文章 2025-02-07 17:39:37

    大模型综述

    本文是一篇关于大模型的综述文章,旨在帮助读者快速了解并深入研究大模型的核心概念和技术细节。
  • 发表了文章 2025-10-13

    别让故障复盘流于形式:用AI挖掘每一次“跌倒”的价值

  • 发表了文章 2025-10-13

    云栖大会演讲实录:Qoder 产品背后的思考与未来发展

  • 发表了文章 2025-10-13

    【万字长文】大模型训练推理和性能优化算法总结和实践

  • 发表了文章 2025-10-13

    一场由AI拯救的数据重构之战

  • 发表了文章 2025-10-13

    构建企业级 AI 应用:为什么我们需要 AI 中间件?

  • 发表了文章 2025-10-13

    开源|Python 应用往微服务迈进的 1*3 种 Pythonic 步伐

  • 发表了文章 2025-10-13

    适用所有团队研发提效|带你1分钟上手基于Claude Code的AI代码评审实践

  • 发表了文章 2025-10-13

    「AI大模型时代的CIO」云栖专场: AI实战者与落地破局者的坦白局

  • 发表了文章 2025-10-13

    阿里云发布《AI 原生应用架构白皮书》!

  • 发表了文章 2025-09-26

    如何将 AI 代码采纳率从30%提升到80%?

  • 发表了文章 2025-09-26

    云栖重磅合集 | 吴泳铭:超级人工智能之路

  • 发表了文章 2025-09-26

    你们催更的模型,云栖大会一口气全发了!

  • 发表了文章 2025-09-26

    前端工程化演进之路:从手工作坊到AI驱动的智能化开发

  • 发表了文章 2025-09-26

    免费体验!高效实现自建 MySQL 数据库平滑迁移至 PolarDB-X

  • 发表了文章 2025-09-26

    CC&LG实践|基于 LangGraph 一步步实现 Claude-Code 核心设计

  • 发表了文章 2025-09-26

    配置驱动的动态Agent架构网络:实现高效编排、动态更新与智能治理

  • 发表了文章 2025-09-19

    从“代码补全”到“知识对齐”:Qoder Repo Wiki 迎来重磅升级

  • 发表了文章 2025-09-19

    大模型可观测1-5-10:发现、定位、恢复的三层能力建设

  • 发表了文章 2025-09-19

    30分钟轻松掌握Cursor,快速提升开发效率和体验

  • 发表了文章 2025-09-18

    Mem0 + Milvus:为人工智能构建持久化长时记忆

正在加载, 请稍后...
滑动查看更多
  • 提交了问题 2024-03-14

    程序员为什么不能一次性写好,需要一直改Bug?

  • 提交了问题 2024-03-08

    让 AI 写代码,能做出什么样的项目?

  • 提交了问题 2024-02-21

    开动脑洞,你最想用Sora生成什么样的视频?

  • 提交了问题 2024-02-05

    如果用你的专业送上新春祝福,会是什么样的?

  • 提交了问题 2024-01-18

    如何看黄铭钧院士点赞PolarDB,称「云数据库正进入2.0时代,AI与云数据库深度结合大有可为」?

  • 提交了问题 2024-01-17

    只允许用 AI 写代码,不允许程序员手写,你怎么看这种做法?

  • 提交了问题 2023-12-28

    你时常焦虑吗?浅聊技术人对抗焦虑的方法

  • 提交了问题 2023-12-22

    你曾经担任的角色是 CodeReviewer 还是 被 CodeReviewer ?

  • 提交了问题 2023-12-14

    偏向锁被废弃了?谈谈你背的那些“八股文”

  • 提交了问题 2023-12-07

    站在业务技术团队的开发视角,你认同“可读性”是代码的第一优先级要求吗?

  • 提交了问题 2023-12-01

    技术人上下班通勤时间会做些什么?

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
滑动查看更多