|
1月前
|
存储 Java
|

java工具:String转Long(日期格式字符串转为时间毫秒数)

java工具:String转Long(日期格式字符串转为时间毫秒数)

122 5
|
2月前
|
JSON API 数据安全/隐私保护
|

京东商品评论API接口封装的心路历程

本文分享了后端开发者封装京东商品评论API的实战历程:从踩坑(签名错误、权限不足、数据混乱、频控限制)到优化(统一配置、数据清洗、异常重试、分层设计),最终实现简洁、稳定、易用、可扩展的SDK。涵盖技术细节与工程思维,助力同行高效对接第三方API。(239字)

173 4
|
2月前
|
安全 C++
|

关系记忆不是越完整越好:chunk size 的隐性代价

本文揭示关系型RAG(如祝福/道歉生成)中一个反直觉真相:关系信息并非越完整越好。大chunk会将“可引用的触发点”异化为“需总结的材料”,诱使模型转向安全、抽象、概括性表达,丧失走心感。核心原则是——切分重在“可被直接引用”,而非“逻辑完整”。

422 11
|
2月前
|
存储 运维 分布式计算
|

诗悦游戏基于DLF与EMR StarRocks降本38%

诗悦网络(2014年成立)是千人规模的研运一体手游公司,代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》,其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维,总成本降38%,查询性能提升40%+,RPO=0,全面赋能实时/近实时/离线场景。

195 3
|
2月前
|
人工智能 小程序 物联网
|

为了不让拜年文案像“电子挽联”,我把Qwen3拉去做了30分钟特殊训练

春节前,团队开发马年祝福生成器,直面大模型“懂语法却不懂人情”的痛点。放弃Qwen3的深度思考能力,微调其基座模型,聚焦“关系感知”与场景适配;用人工种子+结构化数据(称呼/关系/交往细节等)训练,让祝福更自然、有分寸。实践证明:选模型不在最强,而在最听话。(239字)

143 1
|
2月前
|
安全 物联网 C++
|

技术抉择:微调还是 RAG?——以春节祝福生成为例

本文以春节祝福生成为例,剖析微调与RAG的本质差异:RAG解决“信息缺失”,微调重塑“表达偏好”。当任务重风格、重分寸、重一致性(如拜年话术),模型缺的不是知识,而是默认的得体表达——此时微调比RAG更直接、可控、高效。

415 165
|
2月前
|
安全
|

RAG 里,什么时候该让模型“少看一点”

本文揭示RAG系统常见误区:盲目扩大TopK、增加文档量,实则导致“证据过载”,诱发模型强行综合、自信出错。核心观点:**“多看”不等于“更准”,反会稀释判断力;成熟RAG的关键,在于懂得何时主动“少看”**——守住模型的犹豫权与判断阈值。

128 0
|
2月前
|
调度 C++ 异构计算
|

梯度累积真的省显存吗?它换走的是什么成本

梯度累积常被当作OOM“急救药”,但它并非免费:仅降低单步显存峰值,却牺牲训练速度、梯度信号密度、优化器响应灵敏度与调参手感。它适合快速验证,却不适配长期精调——真正的瓶颈,往往不是显存,而是系统设计。

155 6
|
2月前
|
数据格式
|

微调项目的终点,往往不是模型,而是框架

微调项目常陷“框架锁死”:初期依赖框架快速验证,却在数据、训练、评估等环节渐失自主权。当工程判断让渡给框架,迁移成本变成心理负担,项目便悄然被绑定。避免锁死,关键是以框架为加速器,而非方向盘——始终保有对问题本质的清醒认知与选择权。

151 6
|
2月前
|
JSON 监控 API
|

京东商品评论API(jd.item_review)开发指南

京东商品评论API(jd.item_review)是京东开放平台提供的合规REST接口,支持获取商品评论、评分、晒图、追评等多维数据,助力口碑监控、竞品分析与用户反馈收集,提升运营决策效率。(239字)

165 2
|
2月前
|
人工智能 C++
|

一个项目开始失控时,通常不是从代码开始的

本文揭示项目失控的深层规律:代码只是最晚显现的“结果层”,而非病因。真正失控始于早期——问题定义模糊、评估妥协、边界不清、复杂度累积、用解释替代约束、盲目依赖“再调一版”。六条路径环环相扣,每步看似合理,却悄然瓦解可控性。止损关键在决策层,而非代码层。

129 11
|
3月前
|
JSON 监控 API
|

关键词搜索淘宝商品列表API指南

本API提供合规、高效的淘宝商品关键词搜索服务,支持价格/销量/店铺类型等多维筛选,实时同步价格与销量(延迟<5分钟),返回含标题、主图、SKU等全字段JSON数据,适配选品、比价、运营等场景。(239字)

159 5
|
3月前
|
SQL 算法 搜索推荐
|

模型复现翻车的第一现场:不是代码,而是你没管好训练数据

模型复现翻车的第一现场:不是代码,而是你没管好训练数据

170 9
|
3月前
|
安全 数据库 C++
|

为什么你用了向量数据库,系统反而更复杂了

向量数据库并非万能解药:它擅长模糊检索与长尾问题,但仅解决“相似性”而非“正确性”。其优势依赖文档质量、切分合理与embedding适配;反之易致结果玄学、不可解释、调试困难。用前须问:这真是个相似性问题?

145 3
|
3月前
|
运维 安全 算法
|

RAG 不是万能解,这些场景你一开始就不该用

RAG并非万能,默认滥用反致系统复杂、效果难测。它仅解决“信息获取”,不提升模型能力。最适合四类场景:动态知识更新、需答案溯源、长尾问题密集、需求尚不明确。慎用于强推理、隐性经验、高实时性及高确定性要求场景。核心判断:问题是“找不到信息”,还是“不会处理信息”?

226 10
|
3月前
|
存储 人工智能 架构师
|

智能体来了:AI Agent 职业路线的体系化进阶指南

在AGI浪潮下,阿里云开发者需重塑职业路径:从写代码转向设计AI Agent目标与推理链路。掌握“逻辑蒸馏”、多代理协同与意志对齐,构建可沉淀的数字资产,实现从线性产出到指数级价值跃迁,抢占智能时代新高地。(239字)

233 3
|
3月前
|
安全 算法 机器人
|

客服大模型 ≠ 问答机器人

客服大模型常因被误当作问答系统而失败。其核心并非“答对”,而是“判断”:识别风险、控制成本、把握边界。单纯依赖RAG与知识库无法解决策略问题,需通过微调与偏好对齐(如PPO/DPO)训练模型“何时不答”“如何回应”。成功关键在于理解客服是决策系统,而非技术堆砌。

135 1
|
3月前
|
机器学习/深度学习 数据采集 监控
|

别再只盯着模型了:从数据到模型,才是真正的端到端数据科学流水线

别再只盯着模型了:从数据到模型,才是真正的端到端数据科学流水线

162 8
|
3月前
|
存储 人工智能 物联网
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】聚焦微调核心技术:详解指令微调、RLHF对齐、LoRA高效参数调整原理与实现,涵盖矩阵低秩分解、初始化策略、变体优化及Prompt Tuning等方法对比,助你攻克大模型面试核心考点,精准提升offer竞争力!

194 0
来自: 人工智能平台PAI  版块
|
3月前
|
机器学习/深度学习 人工智能
|

【AI大模型面试宝典四】- 基础架构篇

【AI大模型知识干货系列】深度解析Transformer位置编码:从绝对到相对,拆解Sinusoidal、RoPE、ALiBi等核心机制,对比优劣,直击面试高频问题。每篇聚焦一个知识点,助你系统掌握大模型关键技术,紧跟AI浪潮!欢迎关注、点赞、批评指正~

184 0
来自: 人工智能平台PAI  版块
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型面试宝典

【AI大模型面试宝典】聚焦Transformer核心架构,拆解自注意力、多头机制、位置编码等高频考点,配代码实现与面试真题解析,助你快速掌握大模型面试关键知识点,无痛拿下offer!

215 0
来自: 人工智能平台PAI  版块
|
3月前
|
安全 区块链 决策智能
|

Layer 2 的进化之路:Rollup 到底在“卷”什么?

Layer 2 的进化之路:Rollup 到底在“卷”什么?

175 10
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI数字人厂商的技术发展与行业生态分析

AI数字人融合语音识别、自然语言处理与3D建模等技术,正加速应用于金融、教育、医疗等领域。依托大模型与多模态交互,实现拟人化智能服务。世优科技推出“波塔AI数字人”,支持定制化形象与实时交互,助力政企数字化升级。行业快速发展的同时,也面临隐私、伦理与标准化挑战,需多方协同推进。

432 2
来自: 人工智能平台PAI  版块
|
3月前
|
消息中间件 运维 Kafka
|

Kafka Streams vs Flink:别再纠结了,选错不是技术问题,是场景没想清楚

Kafka Streams vs Flink:别再纠结了,选错不是技术问题,是场景没想清楚

211 2
|
4月前
|
持续交付
|

阿里巴巴-云效

本文介绍了如何开通云效服务并进行需求与代码管理。首先访问官网开通服务,随后在需求管理中创建项目、邀请成员并跟踪任务,支持看板模式以便直观管理。接着了解代码托管平台的使用,包括创建代码库、初始化工程、提交代码及构建自动化流水线,实现代码的自动部署与发布,重点在于流程体验。

171 1
|
4月前
|
消息中间件 Java 数据库
|

异步消息组件MQ高级

本文详解RabbitMQ消息可靠性保障机制,涵盖生产者重试、确认机制(Confirm/Return)、消息持久化及消费可靠性。通过配置重试、回调处理与失败消息表结合定时任务重发,确保消息不丢失,提升系统稳定性。

137 0
|
4月前
|
JavaScript 前端开发 小程序
|

Vue为何能稳居前端框架主流宝座

自2014年发布以来,Vue凭借“低门槛、渐进式、生态完善、持续进化”四大优势,迅速跻身前端主流框架。其简洁的模板语法降低学习成本,灵活架构适配各类项目,官方生态与活跃社区提升开发效率,Vue3性能升级与跨平台能力更支撑大厂核心业务,成为中小企业与头部企业共同选择,地位日益稳固。

221 0
|
4月前
|
存储 算法 BI
|

xxljob本地运行

本文介绍XXL-JOB分布式任务调度框架的快速入门指南,涵盖源码获取、服务端与客户端环境搭建、数据库初始化、执行器注册、调度任务配置及测试执行全过程,帮助开发者快速掌握其核心功能与使用方法。

145 0
|
4月前
|
消息中间件 负载均衡 Linux
|

RabbitMQ部署指南

本文介绍RabbitMQ在CentOS7下基于Docker的单机与集群部署方案。涵盖镜像拉取、容器启动、DelayExchange插件安装,并深入讲解普通模式与镜像模式集群搭建。通过配置Erlang Cookie、网络及策略,实现高可用消息队列服务,适用于生产环境部署参考。(239字)

150 0
|
4月前
|
消息中间件 人工智能 Linux
|

基于 RocketMQ 构建 高可靠 A2A 通信通道

A2A协议由Google于2025年发起,旨在构建跨厂商AI智能体的标准化通信机制。通过支持gRPC、JSON-RPC及RocketMQ异步通信,实现多智能体高效协同。基于RocketMQ的实现方案提供开箱即用的高可靠通信,支持任务分发、流式交互与状态查询,助力构建开放、可扩展的多智能体系统生态。(238字)

246 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于训练数据,导致性别、种族等歧视;公平性追求无差别对待,需技术与社会协同;可解释性提升模型透明度,增强信任;安全对齐防止有害输出;人类对齐确保价值观一致;隐私保护防范数据泄露。这些维度共同构成负责任AI的发展基石,需多学科协作持续优化,以实现安全、公正、可信的AI系统。

176 0
|
4月前
|
JSON 前端开发 API
|

京东商品详情 API 实战指南

京东商品详情API通过抓包分析前端异步请求,获取商品标题、价格、库存等核心信息,适用于电商数据分析与比价系统。本文详解接口逻辑、关键参数及Python实现,并强调反爬策略与合规性,助力开发者安全高效采集数据。(238字)

179 3
|
4月前
|
消息中间件 Java Kafka
|

在 OpenAI 打造流处理平台:超大规模实时计算的实践与思考

本文介绍OpenAI构建流处理平台的实践与挑战。面对Kafka高可用、Python生态兼容、云环境限制等问题,团队基于PyFlink打造跨区域流处理架构,集成Kafka HA组、自研代理与控制平面,支撑实时Embedding生成、特征计算等场景,并推动开源协作与平台自动化演进。

275 1
来自: 实时计算 Flink  版块
|
4月前
|
SQL 大数据 数据挖掘
|

十、HQL:排序、联合与 CTE 高级查询

Hive 查询不仅能查,还能查得漂亮、高效。我们这次聚焦 HQL 中的高级技巧——从 ORDER BY 到 SORT BY、DISTRIBUTE BY 与 CLUSTER BY,带你理解排序在分布式环境中的执行逻辑;再深入讲解 UNION 与 CTE 等查询组织方式,帮你将复杂 SQL 拆解得更清晰。我还特意写了丰富示例与实战练习,适合正在提升 Hive 查询能力的你阅读、收藏和练习。

228 6
|
4月前
|
SQL 存储 分布式计算
|

九、HQL DQL七大查询子句

Hive 查询写得清楚,数据分析就能更顺手。我们这次从入门角度出发,带你理清 Hive 中最常用的七个查询子句(FROM、WHERE、GROUP BY、HAVING、SELECT、ORDER BY、LIMIT),结合执行顺序梳理每一步的用法与注意事项。每个子句都有配套案例,还有实战练习题帮你快速上手。如果你刚开始学习 Hive 查询,或希望把基础打得更扎实,这篇内容值得收藏。

196 9
|
4月前
|
数据采集 存储 安全
|

DAMA数据管理导论-数据管理的本质及价值

数据管理是将数据转化为战略资产的系统方法,强调主动治理而非被动存储。通过提升数据质量、强化元数据管理、推动跨部门协作,企业可实现从直觉决策到数据驱动的跃迁,释放数据在营销、产品、人力等场景的深层价值。

167 1
|
4月前
|
缓存 安全 搜索推荐
|

网页模板源码-网站源码建设方式

本文聚焦免费开源企业网站源码模板,解析其低成本、高灵活等优势,推荐 PageAdmin CMS、Joomla、帝国 CMS 等主流模板并说明适配场景,阐述选择方法与二次开发优化要点,为企业低成本高效搭建网站提供实用指引。

295 3
来自: 人工智能平台PAI  版块
|
4月前
|
JSON 监控 API
|

1688查询榜单列表API开发指南

1688查询榜单列表API提供热门商品、类目销售排行等多类型榜单数据,支持实时更新,助力电商选品、市场分析与决策。返回商品ID、标题、价格、销量等关键信息,数据格式为JSON,编码UTF-8,适用于多种业务场景。

164 0
|
4月前
|
JSON 自然语言处理 API
|

1688商品详情API指南

1688商品详情API提供商品基础信息、规格参数及价格库存等核心数据,支持多语言、多维度SKU与实时价格查询,采用OAuth 2.0认证,返回标准JSON格式,助力B2B电商高效集成与应用。

143 2
|
4月前
|
人工智能 索引 SEO
|

AI搜索时代GEO与SEO双螺旋理论的三层核心逻辑(收藏版)

陈欢,毕业于西南政法大学,悟空空科技CEO,深耕品牌营销十余年,AI搜索双螺旋理论创立者。兼具技术实力与企业品牌运营能力,服务过地产,滋补,微商,农产品等行业品牌。目前专注于:AI营销IP,AI智能体,AI律师营销等领域。服务企业运用ai实现降本80%,得到了企业客户与广大学员的一致好评。以实战案例输出硬核知识,助力品牌方在ai时代从内容到转化的深度转型升级。

283 4
来自: 智能搜索推荐  版块
|
4月前
|
人工智能 运维 安全
|

SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道

SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道

351 15
|
5月前
|
人工智能 自然语言处理 人机交互
|

《智能语》:十进制驱动的多模态人工语言系统构建与协同机制研究

《智能语》是全球首个融合十进制逻辑、多模态表达与东方哲学的人工语言系统,实现文字、语音、词汇、语法全链条协同。通过笔画-音素-数字三重绑定,构建“形音义理”统一的创新架构,具备语义精准、无限扩展、跨文化普适等优势,为语言学习、人机交互与文化传播提供全新范式。(238字)

256 4
|
5月前
|
机器学习/深度学习 人工智能 API
|

从外贸数据孤岛到智能引擎:信风AI多Agent架构深度解析

传统外贸获客面临数据孤岛、决策固化、工具割裂三大困境。信风TradeWind AI通过多Agent协同架构,构建“数据-决策-执行”闭环,实现从单点工具到智能协同系统的跃迁,打造可扩展、可定制、可进化的AI获客引擎。

382 9
|
5月前
|
数据采集 数据可视化 大数据
|

2026版基于python大数据的电影分析可视化系统

本系统基于Python大数据技术,整合票房、评分、类型等多源电影数据,利用Pandas、MySQL、Django等实现数据处理与存储,结合Vue构建可视化平台,助力制片、投资与观影决策。

458 7
|
5月前
|
编解码 API 开发者
|

淘宝天猫商品视频API,轻松采集视频数据

淘宝天猫商品视频API可基于商品ID获取视频链接、时长、封面等信息,支持RESTful调用,适用于电商开发与内容分析。需注册开放平台账号并申请权限,提供高实时、精准的视频数据服务。

289 0
|
5月前
|
人工智能 分布式计算 数据处理
|

ODPS 十五周年实录 | Data + AI,MaxCompute 下一个15年的新增长引擎

本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 于得水(得水):阿里云智能集团计算平台事业部资深技术专家 活动:【数据进化·AI 启航】ODPS 年度升级发布

450 1
来自: 大数据计算 MaxCompute  版块
|
5月前
|
消息中间件 监控 Kafka
|

从“数据堆积如山”到“实时驱动业务”——聊聊Kafka到Flink的实时数据处理演进

从“数据堆积如山”到“实时驱动业务”——聊聊Kafka到Flink的实时数据处理演进

302 3
|
5月前
|
JSON 数据挖掘 API
|

微店商品详情API指南

微店商品详情API(micro.item_get)支持通过商品ID获取名称、价格、库存、图片等20+项实时数据,采用RESTful设计,返回JSON格式,适用于电商工具、跨平台展示与数据分析。需申请权限,构造含签名的请求调用。

194 3
|
5月前
|
人工智能 大数据 数据挖掘
|

当电竞遇上大数据:原来高手是“算”出来的

当电竞遇上大数据:原来高手是“算”出来的

295 9

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

4
今日
69331
内容
128
活动
439812
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务