|
25天前
|
SQL 存储 分布式计算
|

Hologres Dynamic Table在淘天价格力的业务实践

淘天价格力团队依托Hologres Dynamic Table,实现亿级商品数据的高效治理。通过增量刷新与全量刷新机制,支持秒级圈选、分钟级报表更新,满足大促场景下高时效、多维度分析需求,显著提升数据灵活性与决策效率。

158 2
来自: 实时数仓 Hologres  版块
|
25天前
|
存储 搜索推荐
|

漫画说:为什么你的“增量计算”越跑越慢? ——90%的实时数仓团队都踩过的坑,藏在这几格漫画里

面对海量数据,传统全量计算导致实时更新效率低下。阿里云 Hologres 通过有状态增量计算,仅处理变更数据并持久化中间状态,实现秒级刷新、降本增效,真正让“增量”摆脱重复扫描历史的困局。

96 1
来自: 实时数仓 Hologres  版块
|
25天前
|
人工智能 搜索推荐 算法
|

不懂向量数据库?一文讲透其原理与应用场景

向量数据库通过将文本、图像等非结构化数据转化为“数学指纹”(向量),实现语义级相似性检索。它突破传统数据库的精确匹配局限,支撑智能客服、推荐系统与RAG应用。核心原理是Embedding编码+高效索引(如HNSW、IVF),支持亿级数据毫秒搜索。结合元数据过滤的混合查询,显著提升准确性。未来将迈向多模态融合与自适应智能检索,是AI时代不可或缺的基础设施。

276 0
|
25天前
|
XML 供应链 API
|

1688店铺公司档案信息API接口开发全指南

本文系统讲解1688店铺公司档案信息API开发,涵盖接口认知、接入准备、调用实战、数据解析与合规风控五方面,助力企业高效获取供应商资质、产能、信用等核心数据,提升供应链数字化水平。通过第三方合规接口,实现ERP系统对接、供应商分级与风险预警,推动采购智能化升级。(239字)

112 0
|
25天前
|
机器学习/深度学习 人工智能 算法
|

大模型微调新篇章:从“学会知识”到“理解偏好”,PPO算法全解析与实践指南

本文深入解析大模型对齐人类偏好的核心技术——近端策略优化(PPO)。从原理到实践,详解PPO如何通过Actor、Reference、Reward与Critic四模型协作,结合强化学习实现更自然、安全、有用的对话。涵盖训练流程、常见问题、评估方法及进阶技巧,并以LLaMA-Factory为例演示操作,助力开发者快速上手,打造更“懂你”的AI助手。

401 3
|
25天前
|
数据采集 文字识别 BI
|

RAG 只做文本已经不够了:多模态问答的工程化落地指南

本文深入探讨多模态RAG的工程落地挑战与实践方案,揭示为何仅处理文本已无法满足企业真实需求。从图像、表格等多模态数据的解析、语义对齐、检索融合到生成控制,系统梳理三层架构与四大关键步骤,助力构建真正可用的多模态问答系统。

197 3
|
26天前
|
运维 安全 测试技术
|

机房项目中的时间系统:从忽视到谨慎的十年体会

本文分享了作者在机房系统集成项目中,对时间同步从忽视到重视的十年实践经验。早期依赖公网NTP的简单做法,常导致日志混乱、故障难查等问题;后期引入本地北斗授时服务器,强调时间源的确定性与统一性,提升系统稳定性和可维护性。文章还探讨了设备选型关注点及可靠部署方案,突出时间系统在政企、金融等关键场景中的重要价值。

93 0
|
26天前
|
存储 自然语言处理 监控
|

10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑

本文分享10万级文档RAG系统从Demo到生产的实战经验,剖析检索慢、召回率低、部署复杂三大痛点,涵盖文档切分、Embedding选型、向量库优化、重排序与生成约束等关键步骤,并提供可落地的工程方案与评估方法,助力构建高效、稳定的企业级RAG系统。

306 3
|
26天前
|
安全 网络安全 数据安全/隐私保护
|

用好代理 IP:加密付费拒绝免费陷阱

代理IP兼具隐私保护与安全风险,合规使用可防追踪、保障跨境业务,但非正规服务易致信息泄露、账号风控,甚至被用于违法活动。用户应选择加密付费代理,避开免费陷阱,遵守法规,强化安全防护,让技术真正服务于合法需求。

124 4
|
26天前
|
人工智能 搜索推荐 数据库
|

从零搭建RAG系统:原理剖析+代码实践,解锁大模型“记忆力”新姿势

RAG(检索增强生成)为大模型配备“外接大脑”,通过连接专属知识库,提升回答准确性。广泛应用于医疗、法律、客服等领域,兼具专业性与可解释性。本文详解其原理、实战步骤与优化技巧,助你快速构建个性化AI助手。

511 11
|
26天前
|
人工智能 运维 调度
|

数据中心节能:液冷 + AI 调度,到底是不是“真解法”?

数据中心节能:液冷 + AI 调度,到底是不是“真解法”?

106 4
|
26天前
|
机器学习/深度学习 数据采集 监控
|

别再只盯着模型了:从数据到模型,才是真正的端到端数据科学流水线

别再只盯着模型了:从数据到模型,才是真正的端到端数据科学流水线

75 8
|
26天前
|
前端开发 调度 决策智能
|

智能体应用场景拆解:它适合出现在系统的哪些位置?

智能体应用的关键不在“能否做”,而在“应放在系统何处”。本文从工程视角指出:智能体应作为被调度的执行模块,嵌入非结构化节点,避免成为中枢大脑。宜用于后台任务、辅助执行,而非前端交互或决策判断。合理位置需满足可降级、可替代、失败成本低等特征,确保系统稳定性。

104 2
|
26天前
|
存储 数据采集 数据处理
|

大模型RAG实战:从零搭建专属知识库问答助手

本文介绍如何用RAG技术从零搭建个人Python知识库问答助手,无需代码基础,低成本实现智能问答。涵盖数据准备、向量存储、检索生成全流程,附避坑技巧与优化方法,助力新手快速上手大模型应用。

388 0
|
26天前
|
存储 安全 API
|

隐私合规红线不能碰:大模型微调3大重灾区防护手册

本文聚焦大模型微调中训练数据、中间产物与部署链路三大隐私泄露重灾区,剖析90%开发者易踩的技术陷阱,从分层脱敏、差分隐私到权限管控,提供全链路可落地的防护方案,并结合性能与安全双重验证,助力企业实现合规与效能双赢。

142 0
|
26天前
|
数据采集 存储 监控
|

显存不够?16G显卡驾驭13B模型的计算与优化全指南

显存不够也能玩转大模型!本文详解如何用16G显卡成功微调13B参数模型,从显存精准计算、INT8量化、LoRA低秩适配到激活检查点优化,手把手教你规避OOM风险。结合实战代码与监控技巧,显存占用压至14.5GB内,效果显著优于7B模型。低成本实现高效大模型微调,个人开发者和小团队必备指南!

254 0
|
26天前
|
人工智能 运维 物联网
|

民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种?

本文深入解析大模型微调中民用卡、专业卡与云GPU的选型难题,从显存、算力、稳定性、成本四大维度对比三类GPU差异,结合个人、团队、企业不同场景,提供“三步选型法”与实测数据,帮你匹配最优方案,实现性能与成本的平衡。

137 2
|
26天前
|
数据采集 人工智能 搜索推荐
|

大模型入门指南:从看懂原理到动手微调,一步步打造你的专属AI

本文深入浅出地讲解大模型核心技术:从Token、Embedding到上下文窗口,揭秘AI如何理解语言;通过提示词工程、RAG与微调,教你打造专属智能助手。零基础也能学会,让AI真正为你所用,开启个性化智能时代。

186 0
|
27天前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

187 4
|
27天前
|
JSON 监控 API
|

1688商品查询榜单API技术对接指南(含趋势数据应用实操)

本文详解1688商品查询榜单API对接全流程,涵盖核心能力、前置准备、调用规范与实战避坑。通过热销榜、新品榜等多维数据,助力B2B选品分析、竞品监控与趋势预判,结合实操建议与进阶优化策略,赋能开发者高效构建数据驱动型业务。

129 2
|
27天前
|
机器学习/深度学习 人工智能 算法
|

新能源电池寿命预测模型

新能源电池寿命预测模型

132 11
|
27天前
|
存储 传感器 缓存
|

边缘到云:数据不是“搬家”,而是一场精打细算的流动博弈

边缘到云:数据不是“搬家”,而是一场精打细算的流动博弈

85 8
|
27天前
|
数据可视化 BI 定位技术
|

选择合适的工具

选择合适工具(如Excel、Tableau、Python等)进行数据可视化,确保数据清洁、结构合理。根据分析目标选用折线图、柱状图、散点图等图表类型,设计时优化颜色、字体、标签等视觉元素,提升可读性。通过代码示例实现图表并验证效果,确保信息准确传达。

78 8
|
27天前
|
数据采集 自然语言处理 搜索推荐
|

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

本文深入浅出解析大模型指令微调核心技术,从“能聊”到“会干”的关键跃迁。通过“教小孩做事”类比,拆解指令微调原理,详解数据格式、质量与策略三要素,提供16G显卡可跑的四步实操流程,并结合效果评估与未来趋势,助力新手快速掌握让大模型精准执行任务的核心方法。

149 3
|
27天前
|
数据采集 人工智能 监控
|

从原理到实操:大模型微调效果评估完全指南

微调大模型后如何判断效果?本文系统讲解评估核心方法:结合人工与自动化评估,覆盖通用能力与专项技能。通过明确目标、构建测试集、选用工具(如OpenCompass)、分析结果四步,打造完整评估体系。强调“对比”与“迭代”,助你避免灾难性遗忘,真实提升模型性能。

169 3
|
27天前
|
机器学习/深度学习 人工智能 分布式计算
|

大数据与机器学习的定义

大数据指海量、高速、多样的信息集合,传统工具难以处理;机器学习是AI分支,能从数据中自动学习规律并决策。二者相辅相成:大数据为机器学习提供训练基础,机器学习则挖掘数据价值,推动金融、医疗、零售、工业等领域的智能化升级。核心技术包括Hadoop、Spark、TensorFlow等,未来趋势聚焦边缘计算、可解释AI与实时分析。

83 5
|
27天前
|
人工智能 JSON 物联网
|

别光“调戏”ChatGPT了!亲手微调一个专属大模型,你需要知道这些

本文深入浅出地讲解大模型“训练-微调-推理”三步法,类比医生培养过程,帮助读者理解AI如何从通才变为专才。涵盖技术原理、实操步骤、效果评估与GPU选型,助力个人与企业打造专属AI模型,推动AI应用落地。

146 9
|
27天前
|
存储 人工智能 并行计算
|

别再搞混了!一文看懂“显存”与“内存”:从办公桌到实验室的硬核分工

本文以生动比喻与硬核解析,深入浅出地讲清内存(RAM)与显存(VRAM)的本质区别:内存是CPU的通用工作台,显存是GPU的专用高速实验室。二者分工明确,数据需通过PCIe传输,无法互相替代。尤其在AI训练中,显存容量与带宽直接决定模型能否运行。文章结合代码实例、性能对比表及排错指南,帮助开发者理解“CUDA out of memory”等常见问题,并提供优化策略与云平台建议,是迈向高效AI开发的必读指南。

972 0
|
28天前
|
存储 数据采集 人工智能
|

大模型微调显存计算:从原理到实践的精准把控

本文深入解析大模型微调中的显存占用问题,揭示8GB显存为何能跑7B模型的真相。从显存四大组成部分入手,结合量化、LoRA、AdamW8bit等优化策略,手把手教你精准计算与压缩显存,让低配显卡也能高效微调大模型,助力AI实践入门。

260 3
|
28天前
|
人工智能 自动驾驶 安全
|

V2X 车联网:不是“聪明的车”,而是“会聊天的车”

V2X 车联网:不是“聪明的车”,而是“会聊天的车”

125 6
|
28天前
|
消息中间件 分布式计算 监控
|

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

116 6
|
28天前
|
数据采集 人工智能 物联网
|

什么是微调?大模型定制化的核心技术与实操指南

微调让大模型从“通用助手”变为“专属专家”。通过少量数据训练,LoRA等轻量化方法可在单卡上实现高效优化,广泛应用于医疗、金融、电商等领域。数据驱动、成本低廉、效果显著,微调正推动AI定制化落地,人人皆可拥有专属AI。

274 3
|
29天前
|
XML JSON API
|

1688商品详情API接口使用指南

1688商品详情API(1688.item_get)是阿里1688开放平台核心接口,支持通过商品ID获取50+字段的全量信息,涵盖标题、价格、SKU、库存、图文、批发规则及商家资质等,适用于ERP同步、比价、跨境铺货等B2B场景。需实名认证并创建应用获取app_key与app_secret,接口仅返回JSON格式数据,是对接1688生态的关键技术通道。(239字)

147 4
|
29天前
|
数据采集 人工智能 自然语言处理
|

开源大模型微调对比:选对模型,让定制化更高效

本文对比Llama 3、Qwen2.5、Mistral三款开源大模型在中文场景下的微调表现,从算力门槛、数据效率、任务适配性等维度分析,结合实战案例与主观评估,为开发者提供选型建议,助力高效构建定制化AI模型。

282 10
|
29天前
|
传感器 自动驾驶 算法
|

自动驾驶不是“一行代码开上高速”:聊聊感知、预测与决策这三大算法核心

自动驾驶不是“一行代码开上高速”:聊聊感知、预测与决策这三大算法核心

128 13
|
29天前
|
消息中间件 存储 运维
|

别再只把 Pulsar 当 Kafka 平替了:主题分层、持久化和跨地域复制,才是它的杀手锏

别再只把 Pulsar 当 Kafka 平替了:主题分层、持久化和跨地域复制,才是它的杀手锏

114 8
|
29天前
|
数据采集 人工智能 自然语言处理
|

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

在AI迈向专业决策的关键节点,阿里云联合NVIDIA发起“寻找AI全能王”全球大奖赛,聚焦高质量数据构建与智能体开发两大挑战。赛事设高校与企业双赛道,覆盖万亿语料去重与DeepSearch智能体构建,提供工业级实战平台、专家指导与丰厚奖励,推动Data+AI融合创新,助力开发者实现“所想即所得”的技术突破。

463 2
来自: 大数据计算 MaxCompute  版块
|
30天前
|
机器学习/深度学习 传感器 算法
|

Python | Stacking回归和SHAP可解释性分析回归预测及可视化算法

本教程基于Python实现Stacking回归与SHAP可解释性分析,涵盖地球科学、医学、工程等多领域回归预测应用。结合CatBoost、LightGBM、XGBoost等模型,采用贝叶斯、随机与网格搜索优化参数,并通过SHAP值可视化特征贡献,提升模型性能与可解释性,适用于科研与实际项目。

204 2
|
30天前
|
消息中间件 自然语言处理 前端开发
|

Pandabuy模式淘宝 1688 代购系统搭建指南

聚焦留学生与海外华人需求,采用微服务架构集成淘宝/1688及国际物流API,提供代购集运一站式服务。盈利来自交易差价、增值服务与会员体系,结合网红营销与低价策略,支持多语言、多支付与合规认证,适配俄欧美等市场。

86 4
|
30天前
|
监控 API 开发者
|

关键词搜索京东商品列表 API 指南(2026 最新版)

本文详解京东商品搜索API(jd.item_search与jd.item_get)的技术接入,涵盖接口对比、参数配置、认证流程及Python实现,适用于电商选品、竞品分析与价格监控,助力开发者高效获取京东商品数据。

176 4
|
30天前
|
人工智能 监控 数据可视化
|

给大模型“开小灶”:零代码实战专属领域微调,手把手教你打造AI专家

本文介绍如何通过“模型微调”将通用大模型打造成特定领域的专家助手,聚焦Web安全场景,借助LLaMA Factory实现零代码、可视化微调。涵盖微调原理(如LoRA、量化)、全流程操作及效果评估,帮助用户低成本构建专属高性能AI模型。

193 0
|
30天前
|
传感器 数据采集 运维
|

智能电网的数字孪生方案——不是炫技,而是让电网“提前活一遍”

智能电网的数字孪生方案——不是炫技,而是让电网“提前活一遍”

101 4
|
30天前
|
消息中间件 运维 监控
|

Kafka 最佳实践:分区策略、重试、幂等生产者

Kafka 最佳实践:分区策略、重试、幂等生产者

129 3
|
30天前
|
存储 缓存 数据建模
|

StarRocks + Paimon: 构建 Lakehouse Native 数据引擎

12月10日,Streaming Lakehouse Meetup Online EP.2重磅回归,聚焦StarRocks与Apache Paimon深度集成,探讨Lakehouse Native数据引擎的构建。活动涵盖架构统一、多源联邦分析、性能优化及可观测性提升,助力企业打造高效实时湖仓一体平台。

347 39
来自: 实时计算 Flink  版块
|
1月前
|
SQL 人工智能 自然语言处理
|

企业落地 AI 数据分析,如何做好敏感数据安全防护?

在 AI 问数时代,数据安全与使用效率并非零和博弈。

132 8
|
1月前
|
运维 监控 安全
|

静态 IP + 防火墙,企业数据安全谁能破?

静态IP作为企业网络安全基石,凭借固定地址特性,实现精准访问控制、快速干扰溯源与核心设备稳定连接。结合防火墙、日志审计等措施,构建可管可控、可追溯的安全体系,有效防范入侵与数据泄露,保障企业数字化转型中的业务连续与数据安全。(238字)

82 5
|
1月前
|
搜索推荐 数据挖掘 API
|

京东商品评论API接口指南

京东商品评论API申请需通过京东开放平台,分个人与企业开发者权限。2025最新流程包括:注册账号、选择适用场景(如品牌合作需授权证明)、创建应用并申请接口权限(如item_review)。调用时需传入商品ID、页码、每页数量等参数。获取数据后可用于产品优化、运营提升与竞品分析,驱动业务决策。

106 4
|
1月前
|
人工智能
|

大模型产生幻觉的原因,如何解决?

大模型“幻觉”指AI生成看似合理但错误或虚构的信息,源于其概率预测机制、训练数据缺陷及缺乏事实核查能力。可通过RAG、微调、联网检索、自我核查等方法降低幻觉风险,提升输出准确性与可靠性。(238字)

347 3
|
1月前
|
消息中间件 监控 算法
|

数据不守规矩怎么办?——聊聊乱序事件的处理策略与实战要点

数据不守规矩怎么办?——聊聊乱序事件的处理策略与实战要点

96 11
|
1月前
|
机器学习/深度学习 人工智能 算法
|

光伏预测算法:AI 如何“看天吃饭”,把不确定性算明白

光伏预测算法:AI 如何“看天吃饭”,把不确定性算明白

110 10

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69094
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务