|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

929
来自: 人工智能平台PAI  版块
|
物联网 测试技术
|

为什么 loss 几乎没用:微调里最容易让人“自嗨”的指标

本文揭示了大模型微调中一个常见误区:过度依赖loss曲线判断训练效果。loss仅反映模型对训练数据的拟合程度,并不衡量实际表现。它可能平稳下降,但模型输出无改善甚至变差。尤其在SFT/LoRA微调中,loss易被“虚假优化”,掩盖行为偏移、泛化缺失等问题。真正关键的是人工对照输出变化,结合loss作为辅助参考,而非决策核心。

6 0
|
数据采集 并行计算 算法
|

从 0 到跑通一次微调:别急着追效果,先让它“真的动起来”

微调最难的不是算法,而是“跑通全流程”。首次微调应聚焦简单目标:让模型回答更规范、语气更一致。避免复杂数据与环境折腾。loss下降不等于成功,关键看输出是否按预期改变。跑通一次,复盘流程,才是真正入门。

8 0
|
算法 数据挖掘 API
|

淘宝店铺全量商品API接口技术实践指南

本文详解淘宝开放平台taobao.item_search_shop接口,涵盖核心功能、参数配置、签名生成、调用流程及实战要点,助力开发者高效获取店铺全量商品数据,实现电商运营与数据分析的自动化对接。(238字)

14 1
|
1小时前
|
存储 人工智能 运维
|

AI Agent 搭建师破局指南:从工具使用者到逻辑架构师的职业进化

AI Agent搭建师面临模型迭代快、低代码冲击与落地难等职业焦虑。本文从矛盾解构、能力升级到职业锚定,提出向业务逻辑架构师跃迁的体系化路径,助力开发者在AGI浪潮中构建不可替代性。(239字)

14 2
|
1小时前
|
存储 人工智能 架构师
|

智能体来了:AI Agent 职业路线的体系化进阶指南

在AGI浪潮下,阿里云开发者需重塑职业路径:从写代码转向设计AI Agent目标与推理链路。掌握“逻辑蒸馏”、多代理协同与意志对齐,构建可沉淀的数字资产,实现从线性产出到指数级价值跃迁,抢占智能时代新高地。(239字)

14 3
|
1小时前
|
存储 人工智能 资源调度
|

从代码维护到数字资产掌控:AI Agent 职业路线的体系化进阶指南

AGI落地推动软件工程向“代理工程”演进,AI Agent搭建师需构建“意志驱动+浮光执行”架构,实现从编码到数字资产掌控的跃迁。职业核心转向目标定义与逻辑蒸馏,通过感知、记忆、对齐三层架构,打造具备主动执行能力的智能体集群,以浮光行为为杠杆,重构生产力模式与商业价值。

10 1
|
1小时前
|
人工智能 自然语言处理 Serverless
|

破解 AI Agent 搭建师职业焦虑:从 “搬砖式搭建” 到 “资产化架构” 的升维路径

AI Agent搭建师正面临“沙城困境”:模型快速迭代使外挂逻辑失效,低代码工具普及压缩职业空间。破解焦虑需转型为“数字化资产构建者”,通过逻辑蒸馏、轻量行为编排与意志资产沉淀,将行业直觉转化为可复用、排他性的智能体核心竞争力,在AGI黎明期锚定不可替代价值。(238字)

11 4
|
1小时前
|
人工智能 自然语言处理 Cloud Native
|

从代码交付到智能资产构建:AI Agent 搭建师的职业转型路径与落地框架

本文系统阐述AI Agent搭建师的职业转型路径:从“逻辑编码者”跃升为“决策框架编排者”,聚焦私有决策资产构建;提出低侵入式自主运行机制与三维价值放大模型;分四阶段落地——工具提效、工作流设计、资产运营到主权收益,最终实现脱离体力劳动的可持续职业价值。(239字)

12 1
|
14小时前
|
运维 安全 算法
|

量子通信:真·不可破解的传输通道,还是被神话了?

量子通信:真·不可破解的传输通道,还是被神话了?

22 6
|
14小时前
|
存储 缓存 NoSQL
|

模型再牛也白搭?聊聊在线特征服务是怎么把系统拖慢的,又该怎么救

模型再牛也白搭?聊聊在线特征服务是怎么把系统拖慢的,又该怎么救

23 6
|
18小时前
|
人工智能 供应链 API
|

2026:深度拆解智能体(Agent)重构西南制造的三重核心能力

2026年,中国制造业重心西移,西南工厂面临供应链与人力双重挑战。智能体(Agent)正以感知、推理、行动三位一体能力,推动生产从“经验驱动”迈向“自主决策”。它不仅是技术升级,更是认知革命——重构调度、工艺与供应链,实现毫秒响应、知识沉淀与跨域协同,打造高“认知密度”的未来工厂。

20 1
|
18小时前
|
安全 算法 机器人
|

客服大模型 ≠ 问答机器人

客服大模型常因被误当作问答系统而失败。其核心并非“答对”,而是“判断”:识别风险、控制成本、把握边界。单纯依赖RAG与知识库无法解决策略问题,需通过微调与偏好对齐(如PPO/DPO)训练模型“何时不答”“如何回应”。成功关键在于理解客服是决策系统,而非技术堆砌。

16 1
|
19小时前
|
存储
|

RAG 为什么总是“看起来能用,实际不好用”?

RAG效果不佳?问题往往不在模型,而在于文档切分。错误的切分会导致语义断裂、关键信息丢失,使召回内容“看似相关却无用”。本文深入剖析切分误区:固定长度切割、过度依赖overlap、忽视文档结构等,并提出核心原则——保障语义完整性。不同文档需定制切分策略,FAQ按问答切,技术文档依章节分,流程类保完整上下文。切分是RAG的地基,而非细节,唯有夯实,才能让检索与生成真正生效。

24 3
|
19小时前
|
数据采集 人工智能 JSON
|

AI大模型微调完全指南:从原理到实践,轻松打造专属模型

大模型微调是让通用AI变身专业助手的核心技术。通过少量领域数据训练,可打造懂医疗、法律或企业专属业务的AI模型,成本低、效率高。无需编程基础,四步即可完成:准备数据、选基座模型、设参数、训练评估。未来,人人皆可定制AI。

32 2
|
20小时前
|
算法 C++
|

PPO vs DPO:不是谁淘汰谁,而是你用错了位置

PPO与DPO并非替代关系,而是解决不同问题的工具:PPO适合行为对齐与动态探索,DPO擅长偏好学习与精细优化。选择应基于业务阶段,而非盲目跟风。

17 1
|
20小时前
|
存储 人工智能 分布式计算
|

阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析

阿里云徐晟详解OpenLake:构建全模态、多引擎、一体化智能数据体系,融合大数据与AI,支持湖仓一体、Agentic Data及AI搜索,助力企业降本增效、加速AI落地。(239字)

24 1
|
20小时前
|
数据采集 Kubernetes Docker
|

采集架构的三次升级:脚本、Docker 与 Kubernetes

本文通过一个网站商品列表页采集任务,展示了爬虫架构从Python脚本到Docker化,再到Kubernetes Job化的三次演进。Kubernetes在处理大规模、高成本、高稳定性需求的爬虫任务时变得必要,帮助自动管理任务生命周期和资源,避免系统失控。

22 1
|
21小时前
|
人工智能 物联网 Shell
|

大模型微调完全攻略:不用写代码,让你的AI学会“说人话”

大模型虽强大,却缺乏个性。微调如同“二次教育”,让AI学会你的语言、风格与业务。通过LoRA/QLoRA技术,仅需少量数据和消费级显卡,即可快速打造专属智能助手。从环境搭建到训练测试,全流程低门槛操作,助力人人拥有“私人AI”。

44 5
|
21小时前
|
监控 算法 安全
|

你以为 PPO 很高级,其实它更像个“微调旋钮”

PPO在真实业务中日益重要,因其擅长行为对齐而非能力提升。本文从工程实践出发,解析PPO三大典型用法:风格对齐、降低幻觉、强化偏好决策,强调其作为“行为调节器”的定位,并提供可落地的训练流程与评估方法,助力模型输出更可靠、可控、符合业务需求。

22 2
|
21小时前
|
存储 JSON 自然语言处理
|

十一年实战沉淀:淘宝商品评论数据深度解析与落地技巧

深耕淘宝评论分析11年,亲历数据结构迭代与解析挑战。本文详解评论数据核心字段、解析难点及破局技巧,分享实战验证的标准化流程,涵盖字符处理、动态规则、高效存储等关键环节,助力精准情感分析与用户洞察。

26 1
|
22小时前
|
存储 人工智能 数据库
|

2026 AI Agent 搭建师职业全景指南:从技术基石到商业闭环

2026年,AI职业迎来范式变革,“AI Agent搭建师”取代提示词工程师,成为集架构设计、系统集成与智能协同于一体的“数字流程总设计师”。他们构建具备感知-思考-行动闭环的智能体,推动企业从“聊天机器人”迈向“行动中心”与“数字员工团队”。通过异构模型路由、多智能体编排、MCP工具协议与GraphRAG记忆系统等核心技术,实现业务流程自动化与决策智能化。该职业融合技术、业务与战略,人才缺口巨大,薪酬领先,被誉为AI时代的“黄金职业”,并持续向AI架构师与伦理治理等方向演进。

47 1
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

让大模型“读懂”你的文档:RAG核心技术——文档切分完全指南

文档切分是智能问答系统成败的关键。本文深入解析RAG技术中分块(Chunking)的核心原理,涵盖五大切分策略:从基础的按句子、固定长度切分,到更智能的递归与语义切分。通过LangChain实战代码,手把手教你处理文本、Markdown、代码等多格式文档,并优化块大小、重叠与分隔符参数。提供人工抽样、模拟检索和端到端测试三大评估方法,助你构建高效精准的知识检索体系。

15 0
|
1天前
|
并行计算 算法 量子技术
|

量子算法初探:从叠加态到加速计算,量子计算到底“快”在哪?

量子算法初探:从叠加态到加速计算,量子计算到底“快”在哪?

44 13
|
1天前
|
数据采集 机器学习/深度学习 人工智能
|

大模型“驯化”指南:从人类偏好到专属AI,PPO与DPO谁是你的菜?

本文深入解析让AI“懂你”的关键技术——偏好对齐,对比PPO与DPO两种核心方法。PPO通过奖励模型间接优化,适合复杂场景;DPO则以对比学习直接训练,高效稳定,更适合大多数NLP任务。文章涵盖原理、实战步骤、评估方法及选型建议,并推荐从DPO入手、结合低代码平台快速验证。强调数据质量与迭代实践,助力开发者高效驯化大模型,实现个性化输出。

85 8
|
1天前
|
机器学习/深度学习 SQL 分布式计算
|

特征工程不该再靠人肉:聊聊 Feature Store 为什么是数据团队的分水岭

特征工程不该再靠人肉:聊聊 Feature Store 为什么是数据团队的分水岭

39 6
|
1天前
|
存储 算法 数据处理
|

从零搭建向量数据库:实现文本语义检索实战

本文带你从零实现一个最小可用的文本语义检索系统,剖析向量数据库核心模块:文本嵌入、向量存储、近似最近邻搜索、元数据过滤等。不追求极致性能,重在理解工程设计权衡。通过亲手搭建,掌握系统瓶颈与优化方向,真正用好成熟方案。

46 6
|
1天前
|
存储 SQL 人工智能
|

数据语义层 vs 宽表模式:哪种架构更适合 AI 时代的数据分析?

用户零等待指标交付,逻辑变更分钟级生效,无需 ETL;100%一致口径,所有人与 AI 通过同一语义层访问数据;无缝对接 AI,语义层为 AI 提供标准化查询 API。

39 1
|
1天前
|
传感器 人工智能 监控
|

2026:智能体元年 —— 从“对话框”到“数字物种”的进化跃迁

如果说 2023 年是“大模型”的惊艳亮相,那么 2026 年将被定义为 Agent(智能体)元年。AI 的形态正在发生质变:它不再只是一个被动回答问题的 Chatbot,而是进化为具备感知、决策、行动能力的自主“数字物种”。本文将综合技术架构与科学范式,深度拆解这一场正在发生的生产力革命。

75 11
|
1天前
|
数据采集 人工智能 机器人
|

2026年 智能体来了!什么是 AI 智能体工程化?为什么金加德强调 Workflow + Code 才能真正落地?

AI智能体工程化是将AI从聊天工具升级为“数字员工”,通过流程编排(Workflow)、代码逻辑(Code)与知识增强(RAG),让其稳定执行重复性业务流程,实现可复用、可落地的自动化生产。

70 6
来自: 人工智能平台PAI  版块
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

智能体领航员:解码幕后大脑”的技术架构与运行逻辑

智能体领航员是融合多模态感知、大模型推理与工具调用的AI系统,具备感知、理解、规划与学习能力。它通过“感知-决策-执行”闭环,化身工作助手、家庭管家与健康顾问,实现主动服务。其核心技术涵盖NLP、CV、RAG、多智能体协作与强化学习,正迈向更自主、更智能的未来生活导航。

36 0
|
1天前
|
监控 安全 算法
|

从零开始:PPO 微调大模型实战(基于 PyTorch)

本文带你从零用PyTorch实现大模型PPO微调,不依赖黑盒框架。聚焦工程安全,详解每步原理与常见坑:从模型准备、响应生成、KL控制到优势估计,强调ref model重要性与KL监控。目标不是极致性能,而是让模型在合理边界内稳定优化,避免训坏。适合想深入理解PPO实战的开发者。

31 0
|
1天前
|
数据安全/隐私保护 流计算
|

pyflink在读取hdfs文件的时候如何使用通配符?

36 0
来自:实时计算 Flink 版块
|
1天前
|
人工智能 Rust 算法
|

趁智能体之势,融入智创未来,书写精彩人生

开发者如何抓住AI Agent红利?告别焦虑,从“码农”进阶“指挥官”。智能体不是替代你,而是放大你的创造力。未来属于善用Agent、构建数字员工团队的超级个体。融入浪潮,用智慧解决真问题,书写属于技术人的精彩人生。

25 0
|
1天前
|
传感器 人工智能 架构师
|

别错过!智能体已到,携手智创未来勇攀高峰

从“对话”到“行动”,AI正走出聊天框,迈向解决复杂问题的新纪元。智能体(Agent)让大模型具备感知、思考与执行能力,开发者也迎来角色重塑:从写代码转向设计智能流程、打造工具、指挥多Agent协作。掌握Flow Engineering、Tool Making与Orchestration,借助LangChain等开源力量,你将成为AI 2.0时代的“架构师”。山就在那里,攀登始于第一步——构建你的第一个Agent,共赴智能未来。🏔️(238字)

31 1
|
1天前
|
人工智能 自动驾驶 JavaScript
|

智能体来了,未来科技的奇妙冒险即将开启!

大模型不再只是“嘴强王者”,智能体(AI Agent)让它成为能感知、思考与行动的“全能冒险家”。装备工具、拆解任务,从游戏NPC到编程助手,每位开发者都能设计属于自己的数字生命。未来已来,你准备好起航了吗?🚀

29 1
|
1天前
|
人工智能 架构师 API
|

智能体来了,智创未来背后隐藏着哪些新趋势?

2024年迈入AI Agent时代:从单体大模型走向多智能体协作、端侧轻量化部署与Agent即操作系统。告别“单打独斗”,开发者需掌握Multi-Agent架构、SLM优化及Agent-OS范式,主动参与智能生产力重构。(239字)

34 1
|
1天前
|
人工智能 前端开发 API
|

哇塞!智能体来了,智创未来欢乐冒险起航啦

AI Agent正引领开发者迈入“实干”新纪元:它不止会聊,更能自主规划、调用工具、记忆偏好,化身全能助手。告别玄学提示词,拥抱工作流编排;一人即一队,代码、测试、评审全包办。玩转LangChain、Coze或MetaGPT,扬帆起航!🚀(239字)

35 1
|
1天前
|
SQL 人工智能 安全
|

破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构

以 NoETL 语义编织为核心的 AI 就绪架构,不仅是解决当前 AI 幻觉问题的方案,更是面向未来“数据智能时代”的基础设施。

36 0
|
1天前
|
数据采集 资源调度 安全
|

一次高并发采集系统的架构设计评审记录

本文讨论了高并发数据采集系统的架构设计问题。原系统因架构失配导致采集失败率高,解决方案是引入架构拆分与代理池,实现任务调度、代理管理、请求执行和失败处理的分离,以提高系统稳定性和资源利用率。评审结论强调,系统稳定性取决于架构设计而非代码质量。

26 1
|
1天前
|
混合部署
|

软件授时和 NTP 硬件时间服务器,项目里该怎么选

项目中多套系统、设备时间未统一,导致日志、视频等时间不一致,排查困难。经分析,采用专用授时设备NTS-886003作为内部唯一时间源,实现全系统统一对时,解决时间偏差问题。

39 0
|
1天前
|
存储 缓存 人工智能
|

向量数据库技术内核:从存储到检索,拆解其高效运作的秘密

本文深入剖析向量数据库从存储到检索的工程实现,揭秘其高效运作的核心机制。不同于传统数据库,它通过近似最近邻(ANN)、向量压缩与分层索引(如HNSW)等技术,在高维空间中以“算得少”实现“查得快”。文章结合真实场景,揭示其本质:不是追求绝对精确,而是工程权衡下的极致优化,是AI时代数据检索的实用化落地。

36 3
|
1天前
|
人工智能
|

当智能体开始长期运行,AI智能体运营工程师在系统中负责哪些关键决策?

在智能体逐步进入真实业务并开始长期运行的背景下,问题不再是是否需要智能体,而是如何保障其作为系统的稳定与可持续运行。随着运行周期拉长,目标调整、任务规划失效、成本与收益评估、异常处理以及能力复用等问题不断显现,这些问题往往无法通过一次性开发或模型训练解决。 在此过程中AI智能体运营工程师承担着关键的系统决策职责,其核心工作并非持续开发新功能,而是在智能体生命周期的多个关键节点上,对目标边界、执行路径、运行价值和风险进行判断与调整。通过这些系统层面的决策,运营工程师保障智能体从短期试验走向长期可用,避免因失控、低效或高成本而被淘汰。该角色的价值体现在对智能体整体运行质量的把控,是智能体实现规模化

21 4
|
2天前
|
人工智能 运维 自然语言处理
|

AI智能体运营工程师:智能体进入真实业务后,谁在负责系统的长期运行?

随着大模型能力逐步成熟,人工智能应用正从以单轮对话和内容生成为主的模式,向可承担复杂任务、支持长期运行的系统形态演进,智能体(AI Agent)成为连接大模型与真实业务的重要技术形态。 智能体是一种以目标为导向、具备任务规划、执行调度与结果反馈能力的系统结构,更强调多步骤任务处理、工具与系统调用以及基于结果的持续调整,因而适合嵌入真实业务流程并长期运行。 在此过程中,运行稳定性、目标边界、异常处理与效果评估等问题逐步显现,催生了AI智能体运营工程师这一角色。该角色关注智能体的长期可持续运行,并通过流程化、可编排方式(如“扣子”实践)推动人工智能能力向实际生产力转化。

27 2
|
2天前
|
机器学习/深度学习 监控 算法
|

PPO 为何成了大模型微调“最后的底牌”?一篇真正能跑通的工程实战指南

PPO为何成大模型微调“最后底牌”?本文直击工程痛点:揭秘reward飙升却胡说八道、拍马屁失常识等训崩现象;剖析PPO通过clip机制限幅更新、KL约束防退化的核心稳定性;给出SFT打底、Reward Model选型、参数调试等实战要诀——不讲理论,只教如何真正跑通。

32 0
|
2天前
|
数据采集 监控 API
|

1688商品列表API接口快速上手指南

本文介绍如何通过1688开放平台官方API,合规高效地获取店铺商品列表数据。以`item_search_shop`接口为例,详解请求参数、签名生成规则与调用限制,结合Python实战实现稳定采集。强调签名安全、频率控制与数据合规使用,助力B2B电商分析、选品监控等场景高效落地。(238字)

41 1
|
2天前
|
人工智能 运维 安全
|

风电不再“听天由命”:聊聊 AI 是怎么提前“预判”风机生病的

风电不再“听天由命”:聊聊 AI 是怎么提前“预判”风机生病的

51 12
|
2天前
|
数据采集 机器学习/深度学习 自然语言处理
|

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

45 10
|
2天前
|
人工智能 运维 供应链
|

智能体来了:生产企业如何用AI赚钱

在“智造”转型浪潮下,AI已成为制造企业发展的必选项。本文系统解析AI在研发、生产、供应链、管理等场景的应用路径,提出从数据筑基到智能体落地的四阶段实施框架,揭示避免技术陷阱、组织阻力的关键策略,助力企业以价值驱动、稳步推进智能化升级。

30 0
|
2天前
|
人工智能 供应链 程序员
|

# 2026智能体元年爆发:不仅是效率革命,更是六大核心行业的“基因重组”

当我们在2026年讨论Agent(智能体)时,我们不再讨论它“是什么”,而是关注它“改变了什么”。从软件开发的“端到端交付”到医疗健康的“全生命周期管理”,智能体正在从走向千行百业,将行业渗透率从15%推至全球60%。本文将深度解析智能体如何引发新的激动人心的产业革命。

78 10

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

8
今日
68792
内容
128
活动
439644
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务