|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

929
来自: 人工智能平台PAI  版块
|
3小时前
|
运维 安全 算法
|

量子通信:真·不可破解的传输通道,还是被神话了?

量子通信:真·不可破解的传输通道,还是被神话了?

12 0
|
3小时前
|
存储 缓存 NoSQL
|

模型再牛也白搭?聊聊在线特征服务是怎么把系统拖慢的,又该怎么救

模型再牛也白搭?聊聊在线特征服务是怎么把系统拖慢的,又该怎么救

15 0
|
8小时前
|
人工智能 供应链 API
|

2026:深度拆解智能体(Agent)重构西南制造的三重核心能力

2026年,中国制造业重心西移,西南工厂面临供应链与人力双重挑战。智能体(Agent)正以感知、推理、行动三位一体能力,推动生产从“经验驱动”迈向“自主决策”。它不仅是技术升级,更是认知革命——重构调度、工艺与供应链,实现毫秒响应、知识沉淀与跨域协同,打造高“认知密度”的未来工厂。

17 0
|
8小时前
|
安全 算法 机器人
|

客服大模型 ≠ 问答机器人

客服大模型常因被误当作问答系统而失败。其核心并非“答对”,而是“判断”:识别风险、控制成本、把握边界。单纯依赖RAG与知识库无法解决策略问题,需通过微调与偏好对齐(如PPO/DPO)训练模型“何时不答”“如何回应”。成功关键在于理解客服是决策系统,而非技术堆砌。

14 0
|
9小时前
|
存储
|

RAG 为什么总是“看起来能用,实际不好用”?

RAG效果不佳?问题往往不在模型,而在于文档切分。错误的切分会导致语义断裂、关键信息丢失,使召回内容“看似相关却无用”。本文深入剖析切分误区:固定长度切割、过度依赖overlap、忽视文档结构等,并提出核心原则——保障语义完整性。不同文档需定制切分策略,FAQ按问答切,技术文档依章节分,流程类保完整上下文。切分是RAG的地基,而非细节,唯有夯实,才能让检索与生成真正生效。

21 2
|
9小时前
|
数据采集 人工智能 JSON
|

AI大模型微调完全指南:从原理到实践,轻松打造专属模型

大模型微调是让通用AI变身专业助手的核心技术。通过少量领域数据训练,可打造懂医疗、法律或企业专属业务的AI模型,成本低、效率高。无需编程基础,四步即可完成:准备数据、选基座模型、设参数、训练评估。未来,人人皆可定制AI。

21 2
|
10小时前
|
算法 C++
|

PPO vs DPO:不是谁淘汰谁,而是你用错了位置

PPO与DPO并非替代关系,而是解决不同问题的工具:PPO适合行为对齐与动态探索,DPO擅长偏好学习与精细优化。选择应基于业务阶段,而非盲目跟风。

17 1
|
10小时前
|
存储 人工智能 分布式计算
|

阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析

阿里云徐晟详解OpenLake:构建全模态、多引擎、一体化智能数据体系,融合大数据与AI,支持湖仓一体、Agentic Data及AI搜索,助力企业降本增效、加速AI落地。(239字)

20 1
|
10小时前
|
数据采集 Kubernetes Docker
|

采集架构的三次升级:脚本、Docker 与 Kubernetes

本文通过一个网站商品列表页采集任务,展示了爬虫架构从Python脚本到Docker化,再到Kubernetes Job化的三次演进。Kubernetes在处理大规模、高成本、高稳定性需求的爬虫任务时变得必要,帮助自动管理任务生命周期和资源,避免系统失控。

20 1
|
10小时前
|
人工智能 物联网 Shell
|

大模型微调完全攻略:不用写代码,让你的AI学会“说人话”

大模型虽强大,却缺乏个性。微调如同“二次教育”,让AI学会你的语言、风格与业务。通过LoRA/QLoRA技术,仅需少量数据和消费级显卡,即可快速打造专属智能助手。从环境搭建到训练测试,全流程低门槛操作,助力人人拥有“私人AI”。

37 3
|
11小时前
|
监控 算法 安全
|

你以为 PPO 很高级,其实它更像个“微调旋钮”

PPO在真实业务中日益重要,因其擅长行为对齐而非能力提升。本文从工程实践出发,解析PPO三大典型用法:风格对齐、降低幻觉、强化偏好决策,强调其作为“行为调节器”的定位,并提供可落地的训练流程与评估方法,助力模型输出更可靠、可控、符合业务需求。

20 2
|
11小时前
|
存储 JSON 自然语言处理
|

十一年实战沉淀:淘宝商品评论数据深度解析与落地技巧

深耕淘宝评论分析11年,亲历数据结构迭代与解析挑战。本文详解评论数据核心字段、解析难点及破局技巧,分享实战验证的标准化流程,涵盖字符处理、动态规则、高效存储等关键环节,助力精准情感分析与用户洞察。

24 1
|
12小时前
|
存储 人工智能 数据库
|

2026 AI Agent 搭建师职业全景指南:从技术基石到商业闭环

2026年,AI职业迎来范式变革,“AI Agent搭建师”取代提示词工程师,成为集架构设计、系统集成与智能协同于一体的“数字流程总设计师”。他们构建具备感知-思考-行动闭环的智能体,推动企业从“聊天机器人”迈向“行动中心”与“数字员工团队”。通过异构模型路由、多智能体编排、MCP工具协议与GraphRAG记忆系统等核心技术,实现业务流程自动化与决策智能化。该职业融合技术、业务与战略,人才缺口巨大,薪酬领先,被誉为AI时代的“黄金职业”,并持续向AI架构师与伦理治理等方向演进。

32 1
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

让大模型“读懂”你的文档:RAG核心技术——文档切分完全指南

文档切分是智能问答系统成败的关键。本文深入解析RAG技术中分块(Chunking)的核心原理,涵盖五大切分策略:从基础的按句子、固定长度切分,到更智能的递归与语义切分。通过LangChain实战代码,手把手教你处理文本、Markdown、代码等多格式文档,并优化块大小、重叠与分隔符参数。提供人工抽样、模拟检索和端到端测试三大评估方法,助你构建高效精准的知识检索体系。

13 0
|
1天前
|
并行计算 算法 量子技术
|

量子算法初探:从叠加态到加速计算,量子计算到底“快”在哪?

量子算法初探:从叠加态到加速计算,量子计算到底“快”在哪?

44 13
|
1天前
|
数据采集 机器学习/深度学习 人工智能
|

大模型“驯化”指南:从人类偏好到专属AI,PPO与DPO谁是你的菜?

本文深入解析让AI“懂你”的关键技术——偏好对齐,对比PPO与DPO两种核心方法。PPO通过奖励模型间接优化,适合复杂场景;DPO则以对比学习直接训练,高效稳定,更适合大多数NLP任务。文章涵盖原理、实战步骤、评估方法及选型建议,并推荐从DPO入手、结合低代码平台快速验证。强调数据质量与迭代实践,助力开发者高效驯化大模型,实现个性化输出。

65 8
|
1天前
|
机器学习/深度学习 SQL 分布式计算
|

特征工程不该再靠人肉:聊聊 Feature Store 为什么是数据团队的分水岭

特征工程不该再靠人肉:聊聊 Feature Store 为什么是数据团队的分水岭

32 6
|
1天前
|
存储 算法 数据处理
|

从零搭建向量数据库:实现文本语义检索实战

本文带你从零实现一个最小可用的文本语义检索系统,剖析向量数据库核心模块:文本嵌入、向量存储、近似最近邻搜索、元数据过滤等。不追求极致性能,重在理解工程设计权衡。通过亲手搭建,掌握系统瓶颈与优化方向,真正用好成熟方案。

44 6
|
1天前
|
存储 SQL 人工智能
|

数据语义层 vs 宽表模式:哪种架构更适合 AI 时代的数据分析?

用户零等待指标交付,逻辑变更分钟级生效,无需 ETL;100%一致口径,所有人与 AI 通过同一语义层访问数据;无缝对接 AI,语义层为 AI 提供标准化查询 API。

35 1
|
1天前
|
传感器 人工智能 监控
|

2026:智能体元年 —— 从“对话框”到“数字物种”的进化跃迁

如果说 2023 年是“大模型”的惊艳亮相,那么 2026 年将被定义为 Agent(智能体)元年。AI 的形态正在发生质变:它不再只是一个被动回答问题的 Chatbot,而是进化为具备感知、决策、行动能力的自主“数字物种”。本文将综合技术架构与科学范式,深度拆解这一场正在发生的生产力革命。

71 11
|
1天前
|
数据采集 人工智能 机器人
|

2026年 智能体来了!什么是 AI 智能体工程化?为什么金加德强调 Workflow + Code 才能真正落地?

AI智能体工程化是将AI从聊天工具升级为“数字员工”,通过流程编排(Workflow)、代码逻辑(Code)与知识增强(RAG),让其稳定执行重复性业务流程,实现可复用、可落地的自动化生产。

67 6
来自: 人工智能平台PAI  版块
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

智能体领航员:解码幕后大脑”的技术架构与运行逻辑

智能体领航员是融合多模态感知、大模型推理与工具调用的AI系统,具备感知、理解、规划与学习能力。它通过“感知-决策-执行”闭环,化身工作助手、家庭管家与健康顾问,实现主动服务。其核心技术涵盖NLP、CV、RAG、多智能体协作与强化学习,正迈向更自主、更智能的未来生活导航。

34 0
|
1天前
|
监控 安全 算法
|

从零开始:PPO 微调大模型实战(基于 PyTorch)

本文带你从零用PyTorch实现大模型PPO微调,不依赖黑盒框架。聚焦工程安全,详解每步原理与常见坑:从模型准备、响应生成、KL控制到优势估计,强调ref model重要性与KL监控。目标不是极致性能,而是让模型在合理边界内稳定优化,避免训坏。适合想深入理解PPO实战的开发者。

28 0
|
1天前
|
数据安全/隐私保护 流计算
|

pyflink在读取hdfs文件的时候如何使用通配符?

36 0
来自:实时计算 Flink 版块
|
1天前
|
人工智能 Rust 算法
|

趁智能体之势,融入智创未来,书写精彩人生

开发者如何抓住AI Agent红利?告别焦虑,从“码农”进阶“指挥官”。智能体不是替代你,而是放大你的创造力。未来属于善用Agent、构建数字员工团队的超级个体。融入浪潮,用智慧解决真问题,书写属于技术人的精彩人生。

22 0
|
1天前
|
传感器 人工智能 架构师
|

别错过!智能体已到,携手智创未来勇攀高峰

从“对话”到“行动”,AI正走出聊天框,迈向解决复杂问题的新纪元。智能体(Agent)让大模型具备感知、思考与执行能力,开发者也迎来角色重塑:从写代码转向设计智能流程、打造工具、指挥多Agent协作。掌握Flow Engineering、Tool Making与Orchestration,借助LangChain等开源力量,你将成为AI 2.0时代的“架构师”。山就在那里,攀登始于第一步——构建你的第一个Agent,共赴智能未来。🏔️(238字)

31 1
|
1天前
|
人工智能 自动驾驶 JavaScript
|

智能体来了,未来科技的奇妙冒险即将开启!

大模型不再只是“嘴强王者”,智能体(AI Agent)让它成为能感知、思考与行动的“全能冒险家”。装备工具、拆解任务,从游戏NPC到编程助手,每位开发者都能设计属于自己的数字生命。未来已来,你准备好起航了吗?🚀

29 1
|
1天前
|
人工智能 架构师 API
|

智能体来了,智创未来背后隐藏着哪些新趋势?

2024年迈入AI Agent时代:从单体大模型走向多智能体协作、端侧轻量化部署与Agent即操作系统。告别“单打独斗”,开发者需掌握Multi-Agent架构、SLM优化及Agent-OS范式,主动参与智能生产力重构。(239字)

31 1
|
1天前
|
人工智能 前端开发 API
|

哇塞!智能体来了,智创未来欢乐冒险起航啦

AI Agent正引领开发者迈入“实干”新纪元:它不止会聊,更能自主规划、调用工具、记忆偏好,化身全能助手。告别玄学提示词,拥抱工作流编排;一人即一队,代码、测试、评审全包办。玩转LangChain、Coze或MetaGPT,扬帆起航!🚀(239字)

33 1
|
1天前
|
SQL 人工智能 安全
|

破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构

以 NoETL 语义编织为核心的 AI 就绪架构,不仅是解决当前 AI 幻觉问题的方案,更是面向未来“数据智能时代”的基础设施。

33 0
|
1天前
|
数据采集 资源调度 安全
|

一次高并发采集系统的架构设计评审记录

本文讨论了高并发数据采集系统的架构设计问题。原系统因架构失配导致采集失败率高,解决方案是引入架构拆分与代理池,实现任务调度、代理管理、请求执行和失败处理的分离,以提高系统稳定性和资源利用率。评审结论强调,系统稳定性取决于架构设计而非代码质量。

26 1
|
1天前
|
混合部署
|

软件授时和 NTP 硬件时间服务器,项目里该怎么选

项目中多套系统、设备时间未统一,导致日志、视频等时间不一致,排查困难。经分析,采用专用授时设备NTS-886003作为内部唯一时间源,实现全系统统一对时,解决时间偏差问题。

39 0
|
1天前
|
存储 缓存 人工智能
|

向量数据库技术内核:从存储到检索,拆解其高效运作的秘密

本文深入剖析向量数据库从存储到检索的工程实现,揭秘其高效运作的核心机制。不同于传统数据库,它通过近似最近邻(ANN)、向量压缩与分层索引(如HNSW)等技术,在高维空间中以“算得少”实现“查得快”。文章结合真实场景,揭示其本质:不是追求绝对精确,而是工程权衡下的极致优化,是AI时代数据检索的实用化落地。

34 3
|
1天前
|
人工智能
|

当智能体开始长期运行,AI智能体运营工程师在系统中负责哪些关键决策?

在智能体逐步进入真实业务并开始长期运行的背景下,问题不再是是否需要智能体,而是如何保障其作为系统的稳定与可持续运行。随着运行周期拉长,目标调整、任务规划失效、成本与收益评估、异常处理以及能力复用等问题不断显现,这些问题往往无法通过一次性开发或模型训练解决。 在此过程中AI智能体运营工程师承担着关键的系统决策职责,其核心工作并非持续开发新功能,而是在智能体生命周期的多个关键节点上,对目标边界、执行路径、运行价值和风险进行判断与调整。通过这些系统层面的决策,运营工程师保障智能体从短期试验走向长期可用,避免因失控、低效或高成本而被淘汰。该角色的价值体现在对智能体整体运行质量的把控,是智能体实现规模化

21 4
|
1天前
|
人工智能 运维 自然语言处理
|

AI智能体运营工程师:智能体进入真实业务后,谁在负责系统的长期运行?

随着大模型能力逐步成熟,人工智能应用正从以单轮对话和内容生成为主的模式,向可承担复杂任务、支持长期运行的系统形态演进,智能体(AI Agent)成为连接大模型与真实业务的重要技术形态。 智能体是一种以目标为导向、具备任务规划、执行调度与结果反馈能力的系统结构,更强调多步骤任务处理、工具与系统调用以及基于结果的持续调整,因而适合嵌入真实业务流程并长期运行。 在此过程中,运行稳定性、目标边界、异常处理与效果评估等问题逐步显现,催生了AI智能体运营工程师这一角色。该角色关注智能体的长期可持续运行,并通过流程化、可编排方式(如“扣子”实践)推动人工智能能力向实际生产力转化。

27 2
|
1天前
|
机器学习/深度学习 监控 算法
|

PPO 为何成了大模型微调“最后的底牌”?一篇真正能跑通的工程实战指南

PPO为何成大模型微调“最后底牌”?本文直击工程痛点:揭秘reward飙升却胡说八道、拍马屁失常识等训崩现象;剖析PPO通过clip机制限幅更新、KL约束防退化的核心稳定性;给出SFT打底、Reward Model选型、参数调试等实战要诀——不讲理论,只教如何真正跑通。

30 0
|
1天前
|
数据采集 监控 API
|

1688商品列表API接口快速上手指南

本文介绍如何通过1688开放平台官方API,合规高效地获取店铺商品列表数据。以`item_search_shop`接口为例,详解请求参数、签名生成规则与调用限制,结合Python实战实现稳定采集。强调签名安全、频率控制与数据合规使用,助力B2B电商分析、选品监控等场景高效落地。(238字)

38 1
|
2天前
|
人工智能 运维 安全
|

风电不再“听天由命”:聊聊 AI 是怎么提前“预判”风机生病的

风电不再“听天由命”:聊聊 AI 是怎么提前“预判”风机生病的

46 12
|
2天前
|
数据采集 机器学习/深度学习 自然语言处理
|

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

43 10
|
2天前
|
人工智能 运维 供应链
|

智能体来了:生产企业如何用AI赚钱

在“智造”转型浪潮下,AI已成为制造企业发展的必选项。本文系统解析AI在研发、生产、供应链、管理等场景的应用路径,提出从数据筑基到智能体落地的四阶段实施框架,揭示避免技术陷阱、组织阻力的关键策略,助力企业以价值驱动、稳步推进智能化升级。

28 0
|
2天前
|
人工智能 供应链 程序员
|

# 2026智能体元年爆发:不仅是效率革命,更是六大核心行业的“基因重组”

当我们在2026年讨论Agent(智能体)时,我们不再讨论它“是什么”,而是关注它“改变了什么”。从软件开发的“端到端交付”到医疗健康的“全生命周期管理”,智能体正在从走向千行百业,将行业渗透率从15%推至全球60%。本文将深度解析智能体如何引发新的激动人心的产业革命。

74 10
|
2天前
|
存储 人工智能 运维
|

向量数据库实战指南:从部署到RAG落地

本文以轻量开源向量数据库Chroma为例,手把手带你完成环境部署、数据导入、相似性检索到RAG集成的全流程实战,避开新手常见坑,适配码农与大数据爱好者快速落地AI应用,助力掌握向量数据库核心技能。

76 1
|
2天前
|
SQL 存储 分布式计算
|

Hologres Dynamic Table在淘天价格力的业务实践

淘天价格力团队依托Hologres Dynamic Table,实现亿级商品数据的高效治理。通过增量刷新与全量刷新机制,支持秒级圈选、分钟级报表更新,满足大促场景下高时效、多维度分析需求,显著提升数据灵活性与决策效率。

27 2
来自: 实时数仓 Hologres  版块
|
2天前
|
存储 搜索推荐
|

漫画说:为什么你的“增量计算”越跑越慢? ——90%的实时数仓团队都踩过的坑,藏在这几格漫画里

面对海量数据,传统全量计算导致实时更新效率低下。阿里云 Hologres 通过有状态增量计算,仅处理变更数据并持久化中间状态,实现秒级刷新、降本增效,真正让“增量”摆脱重复扫描历史的困局。

35 1
来自: 实时数仓 Hologres  版块
|
2天前
|
人工智能 搜索推荐 算法
|

不懂向量数据库?一文讲透其原理与应用场景

向量数据库通过将文本、图像等非结构化数据转化为“数学指纹”(向量),实现语义级相似性检索。它突破传统数据库的精确匹配局限,支撑智能客服、推荐系统与RAG应用。核心原理是Embedding编码+高效索引(如HNSW、IVF),支持亿级数据毫秒搜索。结合元数据过滤的混合查询,显著提升准确性。未来将迈向多模态融合与自适应智能检索,是AI时代不可或缺的基础设施。

74 0
|
2天前
|
XML 供应链 API
|

1688店铺公司档案信息API接口开发全指南

本文系统讲解1688店铺公司档案信息API开发,涵盖接口认知、接入准备、调用实战、数据解析与合规风控五方面,助力企业高效获取供应商资质、产能、信用等核心数据,提升供应链数字化水平。通过第三方合规接口,实现ERP系统对接、供应商分级与风险预警,推动采购智能化升级。(239字)

30 0
|
2天前
|
机器学习/深度学习 人工智能 算法
|

大模型微调新篇章:从“学会知识”到“理解偏好”,PPO算法全解析与实践指南

本文深入解析大模型对齐人类偏好的核心技术——近端策略优化(PPO)。从原理到实践,详解PPO如何通过Actor、Reference、Reward与Critic四模型协作,结合强化学习实现更自然、安全、有用的对话。涵盖训练流程、常见问题、评估方法及进阶技巧,并以LLaMA-Factory为例演示操作,助力开发者快速上手,打造更“懂你”的AI助手。

87 3
|
2天前
|
数据采集 文字识别 BI
|

RAG 只做文本已经不够了:多模态问答的工程化落地指南

本文深入探讨多模态RAG的工程落地挑战与实践方案,揭示为何仅处理文本已无法满足企业真实需求。从图像、表格等多模态数据的解析、语义对齐、检索融合到生成控制,系统梳理三层架构与四大关键步骤,助力构建真正可用的多模态问答系统。

68 2
|
2天前
|
运维 安全 测试技术
|

机房项目中的时间系统:从忽视到谨慎的十年体会

本文分享了作者在机房系统集成项目中,对时间同步从忽视到重视的十年实践经验。早期依赖公网NTP的简单做法,常导致日志混乱、故障难查等问题;后期引入本地北斗授时服务器,强调时间源的确定性与统一性,提升系统稳定性和可维护性。文章还探讨了设备选型关注点及可靠部署方案,突出时间系统在政企、金融等关键场景中的重要价值。

49 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
68784
内容
128
活动
439643
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务