|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

956
来自: 人工智能平台PAI  版块
|
12小时前
|
算法 数据挖掘 测试技术
|

大模型应用:向量数据库智能化索引优化:基于数据特征的最优算法自适应选择.32

本文介绍向量数据库的智能化索引优化方案:通过自动分析向量数据的维度、规模、分布与稀疏性四大特征,结合专家规则与轻量模型,动态匹配最优索引算法(如HNSW、IVF-PQ等),并经基准测试验证召回率、QPS与延迟,实现“分析—匹配—验证—部署”闭环,显著降低人工调参成本。

23 2
|
1天前
|
SQL 分布式计算 Spark
|

Spark SQL练习1-电商用户行为分析

`**商城`基于海量用户行为数据,开展五大核心分析:①用户购买力画像(订单数/金额/频次等);②连续购买识别(≥3天);③类目销售表现(订单量、金额、客单价);④用户品类偏好(首选类目及占比);⑤品类复购率(复购用户数/总购买用户数)。赋能精准营销与用户价值提升。

29 5
|
2天前
|
存储 人工智能 数据可视化
|

大模型应用:向量与元数据联动:解锁向量数据库复合查询的核心能力.30

本文深入解析向量数据库中“向量+元数据”复合查询技术:通过融合语义相似性与结构化过滤(如时间、标签、权限等),显著提升RAG等场景的检索精度、效率与业务适配性,并结合Chroma实战演示三种查询路径及多行业应用。

41 8
|
2天前
|
存储 算法 数据可视化
|

大模型应用:近似最近邻搜索(ANN)算法驱动向量数据库的高效检索.29

本文深入解析向量检索核心:精确最近邻(Brute-force)与近似最近邻(ANN)算法。详述BF原理、计算方式及性能瓶颈;系统对比KD-Tree、Ball-Tree、LSH、HNSW等ANN算法原理、特性与适用场景,并结合RAG与大模型长上下文应用,揭示其在AI时代的关键支撑作用。

31 3
|
3天前
|
存储 分布式计算 Java
|

PySpark入门教程(非常详细)从零基础入门到精通

本教程聚焦Spark Core核心原理,基于3.5.8版本,用Python详解RDD五大特性(分区、计算函数、依赖关系、分区器、首选位置)、容错机制、Shuffle、DAG调度及共享变量等,并通过WordCount实战演示。

52 5
|
7天前
|
人工智能 自然语言处理 小程序
|

给AI拜年差点翻车后,我悟了:RAG和微调,到底谁更懂“人情世故”?

大家好,我是AI伙伴狸猫算君!本文以“AI写春节祝福”为切入点,深入剖析RAG与微调的技术差异:RAG依赖检索拼凑,难捕获独特人情;微调则通过高质量关系感知数据,将“称呼、细节、风格”内化为模型本能。手把手演示30分钟用LLaMA-Factory完成Qwen3微调,让祝福真正有温度、有梗、有你。

97 13
|
8天前
|
机器学习/深度学习 SQL 人工智能
|

别再群发拜年消息了!三步微调AI,让它学会你的“独家语气”

每逢春节,通用AI祝福总显生硬空洞。本文探讨如何通过微调(LoRA),将“人情世故”转化为结构化数据(称呼/关系/细节/风格等),让AI真正学会你的语气与记忆,生成有温度、带梗、专属的个性化祝福——技术不是替代表达,而是帮你把来不及说的情意,说得恰到好处。(239字)

194 15
|
8天前
|
机器学习/深度学习 人工智能 物联网
|

春节祝福“AI味”太重?我用30分钟微调了一个能记住你我故事的专属模型

用30分钟微调Qwen3-32B,打造专属“马年祝福语创意伙伴”。借助LLaMA-Factory Online与PPO强化学习,让AI从“说正确的话”升级为“说走心的话”——懂关系、记细节、会调侃、有温度。技术不冰冷,祝福才动人。

119 9
|
8天前
|
人工智能 自然语言处理 安全
|

为什么祝福场景里,关系证据比祝福模板重要得多

祝福生成的关键不在“好模板”,而在“真关系”。模板让输出更安全却更空洞;关系证据(如共同经历、专属细节)才能激活真诚。RAG应检索“你们之间发生了什么”,而非“别人怎么祝福”。删掉模板若效果反升,说明它一直在拖后腿——因为祝福的灵魂,从来不是像祝福,而是像你。

91 9
|
8天前
|
安全 C++
|

关系记忆不是越完整越好:chunk size 的隐性代价

本文揭示关系型RAG(如祝福/道歉生成)中一个反直觉真相:关系信息并非越完整越好。大chunk会将“可引用的触发点”异化为“需总结的材料”,诱使模型转向安全、抽象、概括性表达,丧失走心感。核心原则是——切分重在“可被直接引用”,而非“逻辑完整”。

143 11
|
8天前
|
存储 运维 监控
|

Flink 实时计算 x SLS 存储下推:阿里云 OpenAPI 网关监控平台实践

本文由潘伟龙(阿里云可观测)、阮孝振(阿里云开放平台)撰写,介绍阿里云OpenAPI网关实时监控体系的构建实践。面对TB级日志、多维分析、秒级告警等挑战,采用Flink+SLS云原生方案,创新分层聚合+Source端谓词下推,实现60+地域、300+产品、200TB/日的高可用实时监控,故障发现从分钟级降至秒级。

167 8
来自: 实时计算 Flink  版块
|
8天前
|
机器学习/深度学习 算法 算法框架/工具
|

OpenCV Python技术文档

OpenCV Python技术文档是面向开发者的计算机视觉入门指南,涵盖环境搭建、图像/视频处理、人脸检测实战及常见陷阱规避等内容,以简洁代码示例和原理剖析,助你快速掌握这一高性能开源视觉库的核心用法。(239字)

101 4
|
8天前
|
机器学习/深度学习 人工智能 物联网
|

烧显卡不烧钱:学生党个人开发者GPU选购指南,看完不再被割韭菜

本文为学生与个人开发者量身打造大模型微调硬件选购指南:解析LoRA/QLoRA等高效微调技术如何大幅降低显存需求,对比RTX 3060/3090/4090等显卡的显存、带宽、算力与性价比,提供2000–8000元梯度配置方案,并分享混合精度、梯度累积等显存优化技巧及云资源省钱策略。

98 5
|
8天前
|
机器学习/深度学习 人工智能 物联网
|

从微调到 PPO:祝福 AI 的下一步进化

本文探讨祝福AI从“写得不错”到“越写越懂你”的演进路径:SFT微调已解决群体风格对齐,而PPO强化学习则让模型基于用户反馈(点赞、修改、发送等)动态适配个体偏好,学会为表达后果负责——不是教它“怎么说”,而是教它“何时这样说才对”。

73 1
|
8天前
|
存储 运维 分布式计算
|

诗悦游戏基于DLF与EMR StarRocks降本38%

诗悦网络(2014年成立)是千人规模的研运一体手游公司,代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》,其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维,总成本降38%,查询性能提升40%+,RPO=0,全面赋能实时/近实时/离线场景。

70 1
|
8天前
|
存储 安全
|

基于DLF构建实时数据湖

DLF

74 1
|
8天前
|
存储 分布式计算 OLAP
|

数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考

人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)

68 1
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
|

驯服AI的魔法:PPO是如何让机器学会说人话的

本文深入浅出解析PPO算法如何赋能RLHF,解决AI“说人话”的核心难题:通过策略限制与价值函数估计,使大模型学会语气适配、内容得体、表达自然的对话能力,推动从机械输出到人性交互的关键跃迁。

70 1
|
8天前
|
物联网 开发者 异构计算
|

微调实战全攻略:从数据准备到模型部署的完整流程指南

本文为学生与个人开发者量身定制大模型微调硬件指南:剖析LoRA/QLoRA等高效微调技术如何大幅降低显存需求,推荐RTX 3060(12GB)、3090(24GB)、4090(24GB)等高性价比方案,并提供混合精度、梯度累积等优化技巧及云资源省钱策略,助你以最小投入开启AI微调实践。

64 1
|
8天前
|
数据采集 人工智能 自然语言处理
|

微调不是万能药:三个信号告诉你根本不需要做微调

本文破除“微调万能”迷思,提出判断是否需微调的三大核心维度:任务复杂度(知识查询/格式遵从/能力涌现)、风格要求强度(可选→固定→品牌级)、数据可得性(量、质、多样性),并对比提示词工程、RAG等轻量替代方案,强调理性决策、避免无效投入。

52 0
|
8天前
|
人工智能 自然语言处理 小程序
|

你的祝福AI真的靠谱吗?三个科学指标帮你摆脱"玄学评估"

春节后祝福AI泛滥却难辨优劣?本文直击行业痛点,指出传统BLEU等指标在创意祝福场景完全失效,并首创“事实准确性、风格契合度、表达自然度”三维科学评估体系,助你告别玄学判断,理性挑选真正走心的AI祝福工具。(239字)

73 0
|
8天前
|
数据采集 存储 小程序
|

从踩坑到高效落地:微店商品详情API的实操心得

本文分享电商数据服务商对接微店商品详情API的实战经验:详解OAuth2.0授权、多类型商品字段兼容、滑动窗口限流三大典型坑及解决方案,助力私域电商实现商品/库存/价格实时同步,提升数据准确率至99.5%+。

87 0
|
9天前
|
数据采集 安全 C++
|

当 Prompt 和 RAG 都开始别扭时,你该认真考虑微调了

本文以春节祝福生成为例,揭示微调本质:它不是技术升级的“最后一招”,而是对任务性质的判断结果——当问题核心是“模型会做但不像你要的”(如风格不一致、分寸难拿捏),且Prompt/RAG已显乏力时,微调反而是最克制高效的选择。提供可落地的三维度决策框架。

273 148
|
9天前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!手把手教你“喂”出一个懂人情的AI,连马术梗都能接住

本文揭秘春节祝福AI背后的数据构建逻辑:不靠大模型堆参数,而用“关系感知”六维框架(称呼/关系/细节/场合/风格/篇幅)定义人情分寸;通过人工精写种子数据、模型辅助繁殖(400→3107条)、结构化提示词模板,让AI写出有记忆点的专属祝福。技术是导盲犬,帮人打捞真心。

119 3
|
9天前
|
消息中间件 人工智能 NoSQL
|

函数计算异步任务在高并发Agent场景下的幂等性与去重实践(附真实踩坑案例)

本文分享大厂AI应用在函数计算(FC)高并发场景下,应对异步任务重复执行的**四层幂等去重实战方案**:从全链路requestId透传、Redis+Lua轻量锁(拦截85%+重复)、Handler内指纹校验,到DB唯一索引兜底。附可落地代码与真实数据——重复率由11.7%降至0.08%,LLM调用与FC账单显著下降。

68 0
|
9天前
|
人工智能 安全 UED
|

多任务微调:拜年、感谢、道歉,为什么不是三个简单任务

本文探讨祝福类AI扩展多任务(拜年/感谢/道歉)时的关键工程抉择:表面相似的情绪表达,实则在风险等级、语气分寸与用户期待上差异巨大。多任务微调易致任务“污染”,尤其低风险任务会拉偏高风险任务的表达倾向。核心结论:技术难点不在模型能力,而在厘清人情世故的边界——何时共享,何时拆模,才是成熟落地的关键。

285 149
|
9天前
|
算法 数据可视化 数据安全/隐私保护
|

Python图像处理利器:Pillow (PIL)入门指南

本教程系统讲解Python图像处理库Pillow:从环境搭建、核心概念(Image对象、模式、坐标系)到实战项目(批量图片处理+水印+缩略图),涵盖最佳实践、常见陷阱及NumPy/OpenCV集成等进阶内容,助你高效掌握图像处理全栈技能。(239字)

286 2
|
9天前
|
人工智能 架构师 搜索推荐
|

咨询还是平台?企业启动GEO的七步诊断与战略匹配框架

本文提供GEO(生成式引擎优化)服务模式选择的系统性决策框架,围绕专业能力、预算、目标周期、流程基础、需求性质、能力建设与时间资源七大维度,帮助企业精准匹配咨询或软件方案,避免投资错配,实现从启动校准到规模化落地的可持续竞争优势。

49 0
|
9天前
|
人工智能 算法 物联网
|

别再骂AI不懂人情世故了,是你没把它“喂”对

春节祝福别再复制粘贴!本文分享如何用30分钟微调Qwen3-32B模型,借助LLaMA-Factory Online平台,注入“关系颗粒度”六维数据(称呼、关系、交往细节等),让AI告别公文腔,学会因人制宜、带梗走心的拜年话——技术不炫技,只为一句刚刚好的祝福。(239字)

81 0
|
9天前
|
人工智能 小程序 物联网
|

为了不让拜年文案像“电子挽联”,我把Qwen3拉去做了30分钟特殊训练

春节前,团队开发马年祝福生成器,直面大模型“懂语法却不懂人情”的痛点。放弃Qwen3的深度思考能力,微调其基座模型,聚焦“关系感知”与场景适配;用人工种子+结构化数据(称呼/关系/交往细节等)训练,让祝福更自然、有分寸。实践证明:选模型不在最强,而在最听话。(239字)

78 1
|
9天前
|
数据采集 JSON 监控
|

京东宝贝详情数据采集指南

京东商品详情API是京东开放平台核心接口,合规、实时(延迟≤30秒)、全量获取商品结构化数据,涵盖价格、库存、图文、参数、评价等维度,支持高并发与企业级配额,广泛应用于比价监控、选品分析、ERP集成及营销推荐等场景。

82 1
|
9天前
|
数据采集 自然语言处理 算法
|

RAG技术深水区:文档切分是如何悄悄影响你的检索效果的

本文深入剖析RAG中易被忽视却至关重要的环节——文档切分,揭示其对检索效果的决定性影响;对比固定长度与语义切分优劣,详解结构化/对话/法律等文档的差异化策略,并指出数据质量是效果上限的关键。

69 4
|
9天前
|
人工智能 自然语言处理 小程序
|

你的祝福AI真的好吗?三个维度量化“走心”的秘密

春节将至,AI祝福工具泛滥,但真“走心”吗?本文揭秘评估关键:**事实准确性**(细节不编造)、**风格契合度**(对父母/老板用不同语气)、**表达自然度**(像人话,不堆成语)。告别BLEU等传统指标,用三维标准科学打分,避开“智商税”。

76 4
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
|

PPO算法解密:AI是如何从“机械回复”进化到“自然对话”的

PPO(近端策略优化)是RLHF核心技术,通过限制策略更新幅度、结合价值函数估计,让大模型学会生成自然、得体、符合人类偏好的文本,真正实现“说人话”。

80 6
|
9天前
|
数据采集 人工智能 自然语言处理
|

场景判断:什么情况下值得做微调?三个维度帮你做决策

本文提出微调选型三维度决策框架:任务复杂度(知识查询/格式遵从/能力涌现)、风格要求(可选→固定→品牌级)、数据可得性(量、质、多样性),并对比提示词工程、RAG等轻量替代方案,助技术决策者科学评估微调必要性,避免资源浪费。

75 4
|
9天前
|
人工智能 自然语言处理
|

效果评估:如何判断一个祝福 AI 是否“走心”

本文以「码上拜年」AI为例,探讨创意生成任务(如春节祝福)的评估困境:传统指标(loss、BLEU)失效,因“走心”无法量化。提出三维主观评估框架——事实准确、风格契合、表达自然,并强调评估核心是“人是否愿意直接发送”,即用户真实感受才是终极标准。

87 8
|
10天前
|
安全 物联网 C++
|

技术抉择:微调还是 RAG?——以春节祝福生成为例

本文以春节祝福生成为例,剖析微调与RAG的本质差异:RAG解决“信息缺失”,微调重塑“表达偏好”。当任务重风格、重分寸、重一致性(如拜年话术),模型缺的不是知识,而是默认的得体表达——此时微调比RAG更直接、可控、高效。

329 165
|
10天前
|
人工智能 自然语言处理 安全
|

微调落地:春节祝福 AI 是怎样炼成的

本文以春节祝福AI为例,深入剖析微调落地的典型场景:模型能力足够,但“人情味”不足。它揭示微调的核心价值——不教新知识,而是将符合场景的表达偏好固化为默认输出,30分钟即可见效。适合表达敏感、指标难量化、Prompt难稳定的业务场景。

278 164
|
10天前
|
SQL 存储 关系型数据库
|

SQLAlchemy 技术入门指南

SQLAlchemy 是 Python 最流行的 ORM 工具包,提供 Core(SQL 表达式语言)和 ORM(对象关系映射)双模式。它 bridging Python 与 SQL,支持多数据库、连接池、事务及关系映射,兼具灵活性与企业级能力,学习曲线平缓,适合从入门到高阶应用。(239字)

65 10
|
10天前
|
人工智能 Kubernetes 物联网
|

轻量化部署:让你的祝福模型在小显卡上跑起来

本文揭秘春节祝福AI的轻量化部署:无需昂贵GPU,消费级显卡即可运行!通过INT4量化(模型缩至1/8)、LoRA微调(仅训MB级参数)及QLoRA组合,搭配vLLM推理优化与K8s弹性扩缩容,7B小模型高效生成祝福语。低成本、低门槛、高可用——大模型应用,人人可及。

126 0
|
10天前
|
机器学习/深度学习 数据采集 人工智能
|

手把手教程:五分钟构建你的春节祝福AI

手把手教你零基础打造春节祝福AI!无需深度学习经验或高端显卡,5步搞定:准备50+条祝福数据→选用LLaMA-Factory Online平台→微调Qwen3-7B等小模型→在线测试生成效果→一键部署API。5分钟上手,轻松定制温情/搞笑/商务等多风格祝福,为新春增添科技年味!

191 0
|
10天前
|
存储 自然语言处理 数据库
|

技术选型困惑:祝福生成该选微调还是RAG

祝福生成场景更适配微调而非RAG:微调可固化统一风格、提升内容可控性、实现毫秒级响应、降低部署成本;而RAG依赖检索,易致风格飘忽、延迟高、维护复杂。知识稳定的祝福场景,微调是更优解。

53 0
|
10天前
|
缓存 人工智能 弹性计算
|

祝福发送也疯狂:秒级响应的速度奥秘

春节祝福需秒级响应!本文详解高并发下AI祝福生成的提效方案:优选7B小模型、INT4量化提速5倍、批处理提升吞吐、vLLM推理优化、弹性云部署+CDN缓存,多管齐下实现高质量与飞速响应兼得。

68 0
|
10天前
|
数据采集 人工智能 搜索推荐
|

从通用模型到祝福专家:微调让AI更懂你的心

春节祝福太难写?微调技术可将通用大模型“定制”为专属祝福专家:喂入几十条高质量示例,用LoRA轻量训练几小时,即可生成温馨、商务、俏皮等风格各异、紧扣春节元素(红包、团圆、春联等)的个性化祝福,消费级显卡即可完成。

69 0
|
10天前
|
数据采集 缓存 边缘计算
|

隧道 HTTP 代理与正向 HTTP 代理:适用场景与原理对比

隧道HTTP代理通过建立加密隧道实现透明传输,主打穿透性、隐私保护与通用兼容;正向HTTP代理则直接解析转发请求,侧重缓存加速、访问控制与内网管理。二者原理、功能与场景迥异,选型需据需求而定。

81 0
|
10天前
|
数据采集 JSON 监控
|

京东宝贝评论数据采集指南

京东商品评论API提供结构化评论数据,涵盖评分、晒单、追评、商家回复等20+字段,支持多维筛选与排序,适用于舆情监控、竞品分析、用户画像等场景,需认证后合规调用。(239字)

99 11
|
11天前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!30分钟微调一个懂你关系的“人情味”拜年AI

春节祝福太难写?本文手把手教你用LoRA微调大模型,让AI学会“看人下菜”:识别关系、风格、细节,30分钟训练出懂人情世故的拜年助手。无需代码,量化+批处理保障秒级响应,让每条祝福都像你亲手写的。(239字)

232 35
|
11天前
|
存储 人工智能 JSON
|

32B大模型塞进消费级显卡?我用“人情味”做了场春节实验

本文分享用LoRA+量化在单卡/双卡上轻量微调Qwen3-32B,打造懂关系、有分寸的春节祝福助手。聚焦“人情世故”六要素填空式训练,自建3000+场景化数据,借助LLaMA-Factory Online实现低门槛实战,让AI从背模板转向调记忆。(239字)

173 16
|
11天前
|
数据采集 人工智能 数据可视化
|

从群发文案到私人定制:手把手教你微调一个懂人情世故的拜年助手

本文揭秘如何用微调技术让AI写出“专属感”祝福语:拆解人情世故为6个可量化要素,人工打磨3000条高质量种子数据,30分钟即让Qwen3学会“看人下菜碟”。结果不再是千篇一律的群发模板,而是带共同记忆、有温度的真挚表达——技术不止提效,更可传递心意。(239字)

104 8

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69096
内容
128
活动
439692
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务