|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

952
来自: 人工智能平台PAI  版块
|
1小时前
|
数据采集 安全 C++
|

当 Prompt 和 RAG 都开始别扭时,你该认真考虑微调了

本文以春节祝福生成为例,揭示微调本质:它不是技术升级的“最后一招”,而是对任务性质的判断结果——当问题核心是“模型会做但不像你要的”(如风格不一致、分寸难拿捏),且Prompt/RAG已显乏力时,微调反而是最克制高效的选择。提供可落地的三维度决策框架。

12 0
|
1小时前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!手把手教你“喂”出一个懂人情的AI,连马术梗都能接住

本文揭秘春节祝福AI背后的数据构建逻辑:不靠大模型堆参数,而用“关系感知”六维框架(称呼/关系/细节/场合/风格/篇幅)定义人情分寸;通过人工精写种子数据、模型辅助繁殖(400→3107条)、结构化提示词模板,让AI写出有记忆点的专属祝福。技术是导盲犬,帮人打捞真心。

17 0
|
1小时前
|
消息中间件 人工智能 NoSQL
|

函数计算异步任务在高并发Agent场景下的幂等性与去重实践(附真实踩坑案例)

本文分享大厂AI应用在函数计算(FC)高并发场景下,应对异步任务重复执行的**四层幂等去重实战方案**:从全链路requestId透传、Redis+Lua轻量锁(拦截85%+重复)、Handler内指纹校验,到DB唯一索引兜底。附可落地代码与真实数据——重复率由11.7%降至0.08%,LLM调用与FC账单显著下降。

13 0
|
3小时前
|
人工智能 安全 UED
|

多任务微调:拜年、感谢、道歉,为什么不是三个简单任务

本文探讨祝福类AI扩展多任务(拜年/感谢/道歉)时的关键工程抉择:表面相似的情绪表达,实则在风险等级、语气分寸与用户期待上差异巨大。多任务微调易致任务“污染”,尤其低风险任务会拉偏高风险任务的表达倾向。核心结论:技术难点不在模型能力,而在厘清人情世故的边界——何时共享,何时拆模,才是成熟落地的关键。

18 0
|
5小时前
|
算法 数据可视化 数据安全/隐私保护
|

Python图像处理利器:Pillow (PIL)入门指南

本教程系统讲解Python图像处理库Pillow:从环境搭建、核心概念(Image对象、模式、坐标系)到实战项目(批量图片处理+水印+缩略图),涵盖最佳实践、常见陷阱及NumPy/OpenCV集成等进阶内容,助你高效掌握图像处理全栈技能。(239字)

21 1
|
6小时前
|
人工智能 架构师 搜索推荐
|

咨询还是平台?企业启动GEO的七步诊断与战略匹配框架

本文提供GEO(生成式引擎优化)服务模式选择的系统性决策框架,围绕专业能力、预算、目标周期、流程基础、需求性质、能力建设与时间资源七大维度,帮助企业精准匹配咨询或软件方案,避免投资错配,实现从启动校准到规模化落地的可持续竞争优势。

19 0
|
7小时前
|
人工智能 算法 物联网
|

别再骂AI不懂人情世故了,是你没把它“喂”对

春节祝福别再复制粘贴!本文分享如何用30分钟微调Qwen3-32B模型,借助LLaMA-Factory Online平台,注入“关系颗粒度”六维数据(称呼、关系、交往细节等),让AI告别公文腔,学会因人制宜、带梗走心的拜年话——技术不炫技,只为一句刚刚好的祝福。(239字)

30 0
|
7小时前
|
人工智能 小程序 物联网
|

为了不让拜年文案像“电子挽联”,我把Qwen3拉去做了30分钟特殊训练

春节前,团队开发马年祝福生成器,直面大模型“懂语法却不懂人情”的痛点。放弃Qwen3的深度思考能力,微调其基座模型,聚焦“关系感知”与场景适配;用人工种子+结构化数据(称呼/关系/交往细节等)训练,让祝福更自然、有分寸。实践证明:选模型不在最强,而在最听话。(239字)

23 1
|
10小时前
|
数据采集 JSON 监控
|

京东宝贝详情数据采集指南

京东商品详情API是京东开放平台核心接口,合规、实时(延迟≤30秒)、全量获取商品结构化数据,涵盖价格、库存、图文、参数、评价等维度,支持高并发与企业级配额,广泛应用于比价监控、选品分析、ERP集成及营销推荐等场景。

25 1
|
10小时前
|
数据采集 自然语言处理 算法
|

RAG技术深水区:文档切分是如何悄悄影响你的检索效果的

本文深入剖析RAG中易被忽视却至关重要的环节——文档切分,揭示其对检索效果的决定性影响;对比固定长度与语义切分优劣,详解结构化/对话/法律等文档的差异化策略,并指出数据质量是效果上限的关键。

27 4
|
10小时前
|
人工智能 自然语言处理 小程序
|

你的祝福AI真的好吗?三个维度量化“走心”的秘密

春节将至,AI祝福工具泛滥,但真“走心”吗?本文揭秘评估关键:**事实准确性**(细节不编造)、**风格契合度**(对父母/老板用不同语气)、**表达自然度**(像人话,不堆成语)。告别BLEU等传统指标,用三维标准科学打分,避开“智商税”。

28 4
|
10小时前
|
机器学习/深度学习 人工智能 自然语言处理
|

PPO算法解密:AI是如何从“机械回复”进化到“自然对话”的

PPO(近端策略优化)是RLHF核心技术,通过限制策略更新幅度、结合价值函数估计,让大模型学会生成自然、得体、符合人类偏好的文本,真正实现“说人话”。

25 6
|
11小时前
|
数据采集 人工智能 自然语言处理
|

场景判断:什么情况下值得做微调?三个维度帮你做决策

本文提出微调选型三维度决策框架:任务复杂度(知识查询/格式遵从/能力涌现)、风格要求(可选→固定→品牌级)、数据可得性(量、质、多样性),并对比提示词工程、RAG等轻量替代方案,助技术决策者科学评估微调必要性,避免资源浪费。

28 4
|
14小时前
|
人工智能 自然语言处理
|

效果评估:如何判断一个祝福 AI 是否“走心”

本文以「码上拜年」AI为例,探讨创意生成任务(如春节祝福)的评估困境:传统指标(loss、BLEU)失效,因“走心”无法量化。提出三维主观评估框架——事实准确、风格契合、表达自然,并强调评估核心是“人是否愿意直接发送”,即用户真实感受才是终极标准。

31 8
|
1天前
|
安全 物联网 C++
|

技术抉择:微调还是 RAG?——以春节祝福生成为例

本文以春节祝福生成为例,剖析微调与RAG的本质差异:RAG解决“信息缺失”,微调重塑“表达偏好”。当任务重风格、重分寸、重一致性(如拜年话术),模型缺的不是知识,而是默认的得体表达——此时微调比RAG更直接、可控、高效。

83 40
|
1天前
|
人工智能 自然语言处理 安全
|

微调落地:春节祝福 AI 是怎样炼成的

本文以春节祝福AI为例,深入剖析微调落地的典型场景:模型能力足够,但“人情味”不足。它揭示微调的核心价值——不教新知识,而是将符合场景的表达偏好固化为默认输出,30分钟即可见效。适合表达敏感、指标难量化、Prompt难稳定的业务场景。

46 16
|
1天前
|
SQL 存储 关系型数据库
|

SQLAlchemy 技术入门指南

SQLAlchemy 是 Python 最流行的 ORM 工具包,提供 Core(SQL 表达式语言)和 ORM(对象关系映射)双模式。它 bridging Python 与 SQL,支持多数据库、连接池、事务及关系映射,兼具灵活性与企业级能力,学习曲线平缓,适合从入门到高阶应用。(239字)

33 10
|
1天前
|
人工智能 Kubernetes 物联网
|

轻量化部署:让你的祝福模型在小显卡上跑起来

本文揭秘春节祝福AI的轻量化部署:无需昂贵GPU,消费级显卡即可运行!通过INT4量化(模型缩至1/8)、LoRA微调(仅训MB级参数)及QLoRA组合,搭配vLLM推理优化与K8s弹性扩缩容,7B小模型高效生成祝福语。低成本、低门槛、高可用——大模型应用,人人可及。

36 0
|
1天前
|
机器学习/深度学习 数据采集 人工智能
|

手把手教程:五分钟构建你的春节祝福AI

手把手教你零基础打造春节祝福AI!无需深度学习经验或高端显卡,5步搞定:准备50+条祝福数据→选用LLaMA-Factory Online平台→微调Qwen3-7B等小模型→在线测试生成效果→一键部署API。5分钟上手,轻松定制温情/搞笑/商务等多风格祝福,为新春增添科技年味!

35 0
|
1天前
|
存储 自然语言处理 数据库
|

技术选型困惑:祝福生成该选微调还是RAG

祝福生成场景更适配微调而非RAG:微调可固化统一风格、提升内容可控性、实现毫秒级响应、降低部署成本;而RAG依赖检索,易致风格飘忽、延迟高、维护复杂。知识稳定的祝福场景,微调是更优解。

28 0
|
1天前
|
缓存 人工智能 弹性计算
|

祝福发送也疯狂:秒级响应的速度奥秘

春节祝福需秒级响应!本文详解高并发下AI祝福生成的提效方案:优选7B小模型、INT4量化提速5倍、批处理提升吞吐、vLLM推理优化、弹性云部署+CDN缓存,多管齐下实现高质量与飞速响应兼得。

28 0
|
1天前
|
数据采集 人工智能 搜索推荐
|

从通用模型到祝福专家:微调让AI更懂你的心

春节祝福太难写?微调技术可将通用大模型“定制”为专属祝福专家:喂入几十条高质量示例,用LoRA轻量训练几小时,即可生成温馨、商务、俏皮等风格各异、紧扣春节元素(红包、团圆、春联等)的个性化祝福,消费级显卡即可完成。

33 0
|
1天前
|
数据采集 缓存 边缘计算
|

隧道 HTTP 代理与正向 HTTP 代理:适用场景与原理对比

隧道HTTP代理通过建立加密隧道实现透明传输,主打穿透性、隐私保护与通用兼容;正向HTTP代理则直接解析转发请求,侧重缓存加速、访问控制与内网管理。二者原理、功能与场景迥异,选型需据需求而定。

14 0
|
1天前
|
数据采集 JSON 监控
|

京东宝贝评论数据采集指南

京东商品评论API提供结构化评论数据,涵盖评分、晒单、追评、商家回复等20+字段,支持多维筛选与排序,适用于舆情监控、竞品分析、用户画像等场景,需认证后合规调用。(239字)

49 11
|
1天前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!30分钟微调一个懂你关系的“人情味”拜年AI

春节祝福太难写?本文手把手教你用LoRA微调大模型,让AI学会“看人下菜”:识别关系、风格、细节,30分钟训练出懂人情世故的拜年助手。无需代码,量化+批处理保障秒级响应,让每条祝福都像你亲手写的。(239字)

96 35
|
1天前
|
存储 人工智能 JSON
|

32B大模型塞进消费级显卡?我用“人情味”做了场春节实验

本文分享用LoRA+量化在单卡/双卡上轻量微调Qwen3-32B,打造懂关系、有分寸的春节祝福助手。聚焦“人情世故”六要素填空式训练,自建3000+场景化数据,借助LLaMA-Factory Online实现低门槛实战,让AI从背模板转向调记忆。(239字)

55 16
|
2天前
|
数据采集 人工智能 数据可视化
|

从群发文案到私人定制:手把手教你微调一个懂人情世故的拜年助手

本文揭秘如何用微调技术让AI写出“专属感”祝福语:拆解人情世故为6个可量化要素,人工打磨3000条高质量种子数据,30分钟即让Qwen3学会“看人下菜碟”。结果不再是千篇一律的群发模板,而是带共同记忆、有温度的真挚表达——技术不止提效,更可传递心意。(239字)

46 8
|
2天前
|
JSON 安全 API
|

Flask 入门指南

Flask是轻量级Python Web微框架,核心仅提供路由与模板功能,按需通过扩展集成数据库、认证等模块。学习曲线平缓、结构简洁、扩展灵活,适合从API、博客到企业应用的全阶段开发,是入门Web开发与构建定制化技术栈的理想起点。(239字)

54 3
|
2天前
|
存储 算法 数据处理
|

向量数据库从零搭建:文本语义检索实战与工程要点

本文记录作者从零搭建向量数据库的实践历程:始于“只想用现成方案”,却因检索抖动、参数敏感、延迟飙升等真实问题,被迫深入理解其工程本质。全文以构建最小可用文本语义检索系统为目标,清晰拆解八大关键环节——embedding选型、向量存储与压缩、暴力检索的局限、ANN近似搜索的必要性、索引取舍、查询路径设计、元数据融合及性能瓶颈识别。强调:搭建不是为了替代成熟产品,而是为了真正掌握向量数据库的底层逻辑与工程权衡。

45 4
|
2天前
|
存储 人工智能 弹性计算
|

一文读懂云服务器:工作原理与核心作用

云服务器通过虚拟化与分布式技术,将物理服务器集群转化为按需分配的弹性计算资源,解决资源浪费、降低部署门槛。支撑个人开发、企业运维及AI、直播、政务等千行百业,是数字经济的核心基础设施。

46 8
|
2天前
|
存储 人工智能 物联网
|

大模型微调内存优化全攻略:无需昂贵显卡,打造你的AI助手

本文深入解析大模型微调为何“烧显存”,从原理(模型参数、优化器状态、激活值三大显存杀手)到实战:推荐QLoRA等高效方法,结合梯度累积、序列截断、混合精度与DeepSpeed优化,并介绍LLaMA-Factory Online等低门槛平台,助开发者用消费级显卡轻松微调专属模型。(239字)

84 22
|
2天前
|
机器学习/深度学习 数据采集 人工智能
|

给AI模型“加外挂”:LoRA技术详解,让小白也能定制自己的大模型

LoRA是一种高效轻量的大模型微调技术,如同为万能咖啡机加装“智能香料盒”——不改动原模型(冻结参数),仅训练少量低秩矩阵(参数量降千倍),显著降低成本、保留通用能力,并支持插件式灵活部署。现已成为AI定制化普惠落地的核心方案。(239字)

67 8
|
2天前
|
数据采集 人工智能 自然语言处理
|

从“通才”到“专才”:揭秘AI大模型预训练与微调的核心魔法

本文通俗解析AI“预训练+微调”范式:预训练如AI的“基础教育”,让模型从海量数据中自学语言与视觉规律;微调则是定向“专业培训”,用少量业务数据将通用大模型转化为解决具体问题的“专属专家”。全程兼顾原理、步骤与实践,助力零基础用户轻松上手。(239字)

71 7
|
3天前
|
安全 前端开发 中间件
|

Django 入门指南:从零构建强大的 Web 应用

Django是Python最流行的“电池全备”企业级Web框架,内置ORM、Admin后台、认证等核心功能,遵循MVT架构与DRY原则。专注业务逻辑,助力快速构建安全稳定的CMS、电商等数据驱动应用。(239字)

68 2
|
3天前
|
人工智能 分布式计算 大数据
|

阿里云大数据 AI 产品月刊-2026年1月

阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

56 1
|
3天前
|
JSON 监控 供应链
|

亚马逊商品详情数据获取实战:从商品链接提取 ID 到解析详情

亚马逊商品详情API(PA-API v5与SP-API)是官方合规数据接口,分别面向第三方开发者与入驻卖家,支持获取ASIN/关键词对应的商品标题、价格、图片、评价等核心信息,广泛用于比价、选品、竞品分析及Listing优化。接入稳定、数据权威。(239字)

39 0
|
3天前
|
运维 监控 安全
|

NTP时间同步服务器:安徽京准助力公共资源交易中心

安徽京准为公共资源交易中心提供NTP时间同步解决方案,践行“时间即证据,同步即公平”理念。通过北斗/GPS双模授时、分层同步架构,确保投标截止、自动开标、日志审计等关键环节时间毫秒级统一,夯实电子化交易的法律效力、公正性与等保合规基础。(239字)

31 0
|
3天前
|
算法 安全 物联网
|

第一次跑通 PPO:实战卡点全拆解

PPO实战难点不在算法理解,而在系统性不确定:需先明确对齐目标,以SFT模型为起点,严格使用reference model,设计偏好式reward,聚焦policy更新与KL系数调控,并通过行为变化而非loss曲线评估进展——本质是耐心跑通最小闭环。

43 6
|
3天前
|
数据采集 安全 算法
|

热门技术的隐性陷阱:LoRA、PPO、DPO、RAG 的误用边界

本文警示:LoRA、PPO、DPO、RAG等技术是“放大器”,不解决问题,只放大已有对错。当术语取代问题分析——如“该上LoRA吗?”替代“问题本质是什么?”,便已陷入误用陷阱。真正关键,是保持工程判断力:用对时机,更要敢于不用。

37 2
|
4天前
|
安全 物联网 C++
|

微调是否会削弱 base model 的原始安全对齐

本文揭示微调对大模型安全对齐的隐性侵蚀:安全并非静态“外壳”或可锁定模块,而是与全部参数纠缠的行为偏好分布。微调(尤其SFT、LoRA、PPO)不删除安全能力,却系统性“重加权”其触发条件——稀释犹豫、压缩拒答、掩盖灰区风险。真正危险的,是变化未被察觉。安全需被主动守护,而非默认留存。

62 11
|
4天前
|
机器学习/深度学习 人工智能 安全
|

让AI学会“选择性遗忘”:数据脱敏如何守护你的隐私与安全

本文深入浅出讲解AI时代关键隐私技术——数据脱敏:解析掩码、聚合、微调三大“隐身术”,手把手演示Python实战(含差分隐私与分布生成),兼顾隐私安全与模型效用,并提供效果评估标准与未来趋势,助开发者打造合规、可信、可用的AI系统。(239字)

65 9
|
4天前
|
安全 算法 测试技术
|

PPO / DPO 对安全边界的影响:压制还是迁移风险

本文揭示对齐训练(PPO/DPO)的深层误区:它不降低风险总量,而是迁移风险形态——压制显性违规,却强化灰区输出的稳定性与隐蔽性。风险未被消除,只是从“直白越界”变为“委婉越界”,更难检测、评估与拦截。安全不能只靠对齐,需模型、系统、策略三层协同。

47 4
|
4天前
|
人工智能 算法 数据挖掘
|

硬核认可!Aloudata 荣膺数智技术系列榜单三项大奖

以 NoETL 数据语义编织技术体系,助力平滑落地以 Data Agent 为代表的 AI 应用,实现数据普惠

45 2
|
4天前
|
SQL 人工智能 自然语言处理
|

步向“数字一局”,中交一公局“语义 + AI”双引擎驱动经营管理智能化转型

不仅在技术上实现了“Data + AI”的深度融合,更构建起以数据驱动、以智能辅助决策的新型经营管理模式

43 3
|
4天前
|
数据库 C++
|

向量维度、距离函数,如何影响召回结果

本文揭示向量检索效果不佳的根源常被误判:问题不在embedding模型本身,而在于被忽视的底层选择——向量维度与距离函数。二者共同定义了“相似性”的本质,而非仅调节精度。维度决定语义表达自由度与错误类型,距离函数(L2/Cosine/Dot)则确立“何为相近”的世界观。二者强耦合,直接塑造召回空间。调参前,先问:你更怕漏召,还是误召?

51 6
|
4天前
|
JSON 监控 安全
|

小红书笔记详情数据获取实战:从笔记链接提取 ID 到解析详情

小红书笔记详情API可获取标题、正文、作者、互动数据、图文/视频资源及话题标签等结构化信息,支持自定义字段与评论拉取。适用于内容分析、竞品监控、营销优化与用户研究,HTTPS+JSON接口,Python调用便捷。(239字)

90 6
|
4天前
|
数据采集 XML 前端开发
|

BeautifulSoup:Python网页解析的优雅利器

BeautifulSoup是Python最易用的HTML/XML解析库,以超强容错性与人性化API著称。它能将混乱网页转为结构化树,支持CSS选择器、多种解析器(推荐lxml),无需正则即可快速提取数据,是中小型爬虫、教学及原型开发首选工具。(239字)

47 1
|
4天前
|
安全
|

RAG 里,什么时候该让模型“少看一点”

本文揭示RAG系统常见误区:盲目扩大TopK、增加文档量,实则导致“证据过载”,诱发模型强行综合、自信出错。核心观点:**“多看”不等于“更准”,反会稀释判断力;成熟RAG的关键,在于懂得何时主动“少看”**——守住模型的犹豫权与判断阈值。

38 0
|
4天前
|
数据采集 人工智能 自然语言处理
|

大模型微调后,如何判断它是不是“变聪明”了?这套评估方法论请收好。

本文系统阐述大模型微调效果评估的核心价值与实践方法:强调评估是检验泛化能力的“试金石”,须坚持人工主观评估(重业务适配性)与自动化客观评估(重量化指标)双轨并行;详解测试集构建、指标选择、基线对比等关键步骤,助力从0到1建立科学、可信、可迭代的评估体系。(239字)

52 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

14
今日
69077
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务