|
Oracle 关系型数据库 Java
|

实时计算 Flink版操作报错之报错:Caused by: oracle.jdbc.OracleDatabaseException: ORA-01291如何解决

在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。

1076 1
来自: 实时计算 Flink  版块
|
机器学习/深度学习 数据可视化 PyTorch
|

时空图神经网络ST-GNN的概念以及Pytorch实现

本文介绍了图神经网络(GNN)在处理各种领域中相互关联的图数据时的作用,如分子结构和社交网络。GNN与序列模型(如RNN)结合形成的时空图神经网络(ST-GNN)能捕捉时间和空间依赖性。文章通过图示和代码示例解释了GNN和ST-GNN的基本原理,展示了如何将GNN应用于股票市场的数据,尽管不推荐将其用于实际的股市预测。提供的PyTorch实现展示了如何将时间序列数据转换为图结构并训练ST-GNN模型。

902 1
|
人工智能 自然语言处理 算法
|

【EMNLP 2023】面向垂直领域的知识预训练语言模型

近日,阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性,发现在垂直领域的图谱结构具有全局稀疏,局部稠密的特点。为了补足全局稀疏特点,将垂直领域中分层语义信息通过双曲空间注入到预训练模型中。为了利用局部图结构稠密特点,我们利用对比学习构造图结构不同难度的正负样本来进一步加强语义稀疏的问题。

978 6
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 异构计算
|

知识蒸馏的基本思路

知识蒸馏(Knowledge Distillation)是一种模型压缩方法,在人工智能领域有广泛应用。目前深度学习模型在训练过程中对硬件资源要求较高,例如采用GPU、TPU等硬件进行训练加速。但在模型部署阶段,对于复杂的深度学习模型,要想达到较快的推理速度,部署的硬件成本很高,在边缘终端上特别明显。而知识蒸馏利用较复杂的预训练教师模型,指导轻量级的学生模型训练,将教师模型的知识传递给学生网络,实现模型压缩,减少对部署平台的硬件要求,可提高模型的推理速度。

1166 0
来自: 人工智能平台PAI  版块
|
算法 索引
|

阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比

Elasticsearch 从8.8版本开始,新增 RRF,支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,可以提升排序的准确性。

3779 0
|
Linux 网络安全 文件存储
|

本地部署Jellyfin影音服务器 - 公网远程影音库

随着移动智能设备的普及,各种各样的使用需求也被开发出来,从最早的移动听音乐、看图片(MP3时代),到之后的移动视频需求(MP4时代)到现在的移动流媒体需求(智能手机看视频)。但当我们习惯这些需求后,忽然发现自己不知不觉间成了待割的韭菜(3台设备就要加钱)。作为一颗倔强的韭菜,自然不会甘愿被割,因此打算自建一个私人影音媒体平台。现在,笔者就向大家展示,使用cpolar内网穿透+ Jellyfin,自建私人影音平台的全过程。

1008 0
|
SQL 存储 消息中间件
|

Apache Flink X Apache Doris 构建极速易用的实时数仓架构

在本次分享中,将为大家介绍如何基于 Apache Doris 和 Apache Flink 构建极速易用的实时数仓架构。

5531 0
来自: 实时计算 Flink  版块
|
NoSQL 大数据 Apache
|

Apache Flink 入选 2022 年“科创中国”开源创新榜

Apache Flink 以及 Flink 开源社区重要推动者阿里巴巴,分别入选开源创新榜“开源产品”和“开源机构”。

1020 0
来自: 实时计算 Flink  版块
|
存储 人工智能 数据可视化
|

数字孪生核心技术揭秘(五):BIM究竟是解药还是毒药?

CIM模型的走红,也带热了BIM成为数字孪生城市应用的核心技术之一;基于BIM的数据挂载能力为数字孪生城市应用带来了极大想象空间,通过结合GIS/IOT数据可以连接人口、房屋、住户水电燃气信息、安防警务数据、等众多城市公共系统的信息资源,支撑数字孪生城市的决策分析。但是BIM数据的应用成本高也是一个不能回避的事实,无论是数据质量检查、数据格式转换、模型轻量化,到最终的渲染和应用,BIM模型在数字孪生场景下的应用链路都是非常冗长、复杂。因此BIM在数字孪生领域的应用,需要有目标与成本意识,以及合理的配套工具。

3850 0
来自: 数据可视化DataV  版块
|
分布式计算 DataWorks Java
|

DataWorks百问百答40:本地自定义函数UDF如何在DataWorks上使用?

本地自定义函数UDF如何在DataWorks上使用

7094 0
|
监控 NoSQL druid
|

Elasticsearch对垒8大竞品技术,孰优孰劣?

简要用Elasticsearch与其它8中数据产品做了个对比,基于很多业务场景对比,代表了笔者对于Elasticsearch优胜劣汰的看法

19185 0
|
SQL 分布式计算 监控
|

hive在E-MapReduce集群的实践(一)hive异常排查入门

hive是hadoop集群最常用的数据分析工具,只要运行sql就可以分析海量数据。初学者在使用hive时,经常会遇到各种问题,不知道该怎么解决。 本文是hive实践系列的第一篇,以E-MapReduce集群环境为例,介绍常见的hive执行异常,定位和解决方法,以及hive日志查看方法。

7730 0
|
11天前
|
Java
|

java工具:《List<Integer>转int[]》

java工具:《List<Integer>转int[]》

79 1
|
1月前
|
JSON 监控 API
|

京东商品评论内容获取指南

京东商品评论API(jd.item.review)提供结构化评论数据,支持按ID批量获取、好评/差评筛选、图文视频过滤、分页排序及追评、商家回复等维度,JSON格式返回,免申请一键调用,适用于口碑分析与舆情监控。(239字)

149 4
|
1月前
|
监控 数据可视化 数据处理
|

本地自动化新思路:不用脚本也能让电脑软件自己动起来?1949ai带你探究

本文分享了一线开发者在落地办公自动化时的真实困境与思考:面对CRM、Excel、邮件客户端等多系统混用场景,单纯写代码(如Selenium+PyAutoGUI)易受界面变化、弹窗、环境差异困扰;而可视化流程工具凭借“条件触发+跨应用感知”更稳定易维护。作者主张“代码管数据、工具管交互”的混搭策略,并附实用文件监听代码示例。核心观点:自动化不是炫技,而是把人从机械劳动中解放出来。(239字)

250 5
|
1月前
|
人工智能 运维 安全
|

基于云边协同的电线电缆押出机智能调机解决方案设计与落地

本方案基于云边协同架构,融合阿里云云原生技术,破解线缆行业押出机调机效率低、原料损耗高、数据孤岛等难题;边缘毫秒级实时控制+云端Al训练优化,实现调机提效80%、降耗60%,部署快、运维省、可扩展

280 9
|
1月前
|
SQL 人工智能 自然语言处理
|

周级交付变分钟级?NoETL 指标平台营销活动分析实战

选择 Aloudata CAN 不仅是选择了一个高效的指标开发平台,更是选择了一条通往智能化数据消费的可靠路径。

141 0
|
1月前
|
JSON 缓存 API
|

微店商品详情API概述

本文整理商品详情获取核心接口,涵盖权限申请、调用流程、参数说明及常见问题。支持反向海淘、ERP对接等场景,返回商品基础信息、价格、库存、素材、物流及销售数据,并提供标准签名调用与缓存建议。(239字)

142 1
|
1月前
|
Java
|

java工具:Long转String(时间毫秒数转日期格式字符串)

java工具:Long转String(时间毫秒数转日期格式字符串)

224 2
|
2月前
|
JSON API 数据安全/隐私保护
|

京东商品评论API接口封装的心路历程

本文分享了后端开发者封装京东商品评论API的实战历程:从踩坑(签名错误、权限不足、数据混乱、频控限制)到优化(统一配置、数据清洗、异常重试、分层设计),最终实现简洁、稳定、易用、可扩展的SDK。涵盖技术细节与工程思维,助力同行高效对接第三方API。(239字)

218 4
|
2月前
|
安全 物联网 C++
|

微调是否会削弱 base model 的原始安全对齐

本文揭示微调对大模型安全对齐的隐性侵蚀:安全并非静态“外壳”或可锁定模块,而是与全部参数纠缠的行为偏好分布。微调(尤其SFT、LoRA、PPO)不删除安全能力,却系统性“重加权”其触发条件——稀释犹豫、压缩拒答、掩盖灰区风险。真正危险的,是变化未被察觉。安全需被主动守护,而非默认留存。

220 11
|
2月前
|
人工智能 Java API
|

Apache Flink Agents 0.2.0 发布公告

Apache Flink Agents 0.2.0发布!该预览版统一流处理与AI智能体,支持Java/Python双API、Exactly-Once一致性、多级记忆(感官/短期/长期)、持久化执行及跨语言资源调用,兼容Flink 1.20–2.2,助力构建高可靠、低延迟的事件驱动AI应用。

675 9
来自: 实时计算 Flink  版块
|
3月前
|
运维 量子技术 芯片
|

一条走“低温暴力美学”,一条玩“光速优雅路线”:聊聊超导量子比特和光子量子比特

一条走“低温暴力美学”,一条玩“光速优雅路线”:聊聊超导量子比特和光子量子比特

168 6
|
3月前
|
缓存 搜索推荐 算法
|

RAG 的上限不在模型,而在你怎么切文档

RAG失效常因切分不当:碎片化chunk导致信息割裂、语义丢失。本文直击核心——切分不是预处理,而是知识工程:需结构感知、保留标题/表格/步骤完整性,以“可独立阅读、可直接引用”为黄金标准,避免“检索准、答案错”。

220 1
|
3月前
|
机器学习/深度学习 安全 算法
|

为什么很多团队从 PPO 转向 DPO,却又离不开 PPO

PPO与DPO并非新旧替代关系,而是分属对齐不同阶段的工具:PPO用于行为“塑形”(强干预、纠偏乱序),DPO用于偏好“定型”(稳定微调、精细排序)。选型关键看模型是否已基本可控——乱则用PPO,稳则用DPO。

186 1
|
3月前
|
算法 安全 物联网
|

PPO 实战:第一次跑通 PPO,到底难在哪

PPO实战难点不在算法理解,而在系统性不确定:动态数据、不稳reward、多目标冲突。关键在于明确对齐目标、用SFT模型起步、必备reference、设计偏好型reward、聚焦policy更新、善用KL系数调控风险,并以行为变化而非loss曲线评估进展——耐心跑通最小闭环,才是成功核心。

269 0
|
3月前
|
自然语言处理 监控
|

RAG 效果差,80% 的问题和模型无关

RAG效果差,往往错不在模型,而在检索环节:切分不当、检索不相关、TopK过载、缺乏Rerank等。本文揭示RAG本质是“自然语言检索系统”,80%问题源于数据组织与检索质量,而非模型能力。重拾工程思维,先夯实检索,再谈生成。

214 7
|
3月前
|
存储 人工智能 分布式计算
|

阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析

阿里云徐晟详解OpenLake:构建全模态、多引擎、一体化智能数据体系,融合大数据与AI,支持湖仓一体、Agentic Data及AI搜索,助力企业降本增效、加速AI落地。(239字)

664 2
|
3月前
|
数据采集 自然语言处理 搜索推荐
|

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

本文深入浅出解析大模型指令微调核心技术,从“能聊”到“会干”的关键跃迁。通过“教小孩做事”类比,拆解指令微调原理,详解数据格式、质量与策略三要素,提供16G显卡可跑的四步实操流程,并结合效果评估与未来趋势,助力新手快速掌握让大模型精准执行任务的核心方法。

370 3
|
3月前
|
存储 人工智能 物联网
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】聚焦微调核心技术:详解指令微调、RLHF对齐、LoRA高效参数调整原理与实现,涵盖矩阵低秩分解、初始化策略、变体优化及Prompt Tuning等方法对比,助你攻克大模型面试核心考点,精准提升offer竞争力!

236 0
来自: 人工智能平台PAI  版块
|
3月前
|
机器学习/深度学习 人工智能 算法
|

构建AI智能体:八十四、大模型涌现能力的解构分析:从量变到质变的神秘跃迁

大模型涌现能力的出现标志着人工智能发展的一个重要转折点。这些能力不是通过专门编程获得的,而是模型规模达到临界点时自然产生的质变。这种现象不仅证明了规模在人工智能发展中的关键作用,也为我们理解智能的本质提供了新的视角。涌现能力的出现预示着人工智能正从专门化工具向通用智能系统转变。随着模型规模的继续扩大和架构的不断优化,我们可能会看到更多令人惊讶的能力涌现。

416 7
|
3月前
|
机器学习/深度学习 算法 自动驾驶
|

基于YOLOv8模型的行人车辆多目标检测计数与跟踪系统

本研究基于YOLOv8模型,针对智能交通与公共安全需求,开展行人车辆多目标检测、计数与跟踪技术研究。通过融合YOLOv8高精度检测与DeepSORT稳定跟踪,实现复杂场景下目标的实时定位、统计与轨迹追踪,提升交通管理效率与公共安全保障能力,推动智慧城市发展。

395 13
|
4月前
|
数据采集 JSON 监控
|

京东店铺所有商品API接口使用指南

本文介绍如何对接京东开放平台“店铺所有商品API”,通过调用`JD.item_search_shop`接口,以编程方式获取POP或自营店铺的商品信息(如ID、标题、价格、库存等),适用于运营分析、库存监控等场景。需配置AppKey、时间戳等公共参数,并传入seller_id、page_no等业务参数实现分页查询,无需access_token授权。

332 1
|
4月前
|
Java 大数据
|

ArrayList扩容机制

本文深入解析ArrayList的add及扩容机制。通过源码分析,揭示其首次添加元素时默认扩容至10,后续每次扩容为原容量1.5倍的核心逻辑,并详解grow()方法如何通过位运算高效实现动态扩容,同时澄清length、length()、size()等易混淆概念。

227 0
|
4月前
|
前端开发 NoSQL Java
|

低代码IDEA启动项目

本教程介绍如何使用IDEA启动低代码项目Jeecg-Boot(Java+Vue3)。先启动后端SpringBoot项目,需初始化MySQL与Redis,配置application-dev.yml;再启动前端Vue3项目,安装pnpm依赖并配置代理,最后通过localhost访问系统,默认账号admin/123456。

142 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于数据,需通过去偏技术缓解;公平性要求无歧视输出;可解释性提升透明度与信任;安全对齐防止有害内容;人类对齐确保价值观一致;隐私保护防范数据泄露。六者共同构成负责任AI发展基石,需技术、伦理与法规协同推进。(238字)

164 0
|
4月前
|
消息中间件 人工智能 决策智能
|

AgentScope x RocketMQ:构建多智能体应用组合

AgentScope是阿里开源的多智能体开发框架,支持模块化、透明化、可定制的智能体构建。集成RocketMQ实现高效A2A通信,助力打造如“智能旅行助手”等复杂协作应用,推动开发者友好型AI生态发展。

263 0
|
4月前
|
关系型数据库 MySQL 数据库
|

用 Python 实现 MySQL 数据库定时自动备份

本文介绍如何用Python脚本实现MySQL数据库的自动化备份。通过调用`mysqldump`工具,结合时间戳命名、文件压缩与定时任务(如crontab),可轻松实现“无人值守”备份。涵盖配置修改、安全建议及日志管理,提升备份效率与可靠性,适用于日常开发与生产环境。

224 0
|
4月前
|
弹性计算 人工智能 对象存储
|

阿里云服务器最新优惠价格表:含 ECS、轻量、GPU 配置及收费标准

阿里云服务器多少钱?阿里云服务器优惠价格表:涵盖轻量应用服务器、ECS 云服务器、GPU 服务器等主流产品,低至 38 元1年、99元和199元收费,部分配置升级至 200M 带宽且不限流量,无论是个人开发者、中小企业还是大型企业,都能找到适配需求的高性价比方案。以下是整理的阿里云最新优惠价格及配置详情::轻量应用服务器200M峰值带宽68元1年(秒杀38元),ECS云服务器2核2G3M带宽99元一年、2核4G、5M带宽、80G系统盘优惠价格199元一年,4核16G服务器10M带宽89元1个月,8核32G服务器10M固定带宽160元一个月,阿里云香港轻量服务器200M带宽25元个月起。方便大

683 7
|
4月前
|
SQL 自然语言处理 数据挖掘
|

ChatBI 选型必看:为什么说“准确率”是评估智能问数工具的第一基石?

当 ChatBI 的准确率不断提升,其价值将从“效率工具”升级为“决策中枢”

309 2
|
4月前
|
JSON 安全 API
|

微店商品列表API,轻松采集商品列表数据

微店商品列表API是微店开放平台的核心接口,支持分页、筛选和排序,可获取指定店铺的商品信息。适用于电商管理、竞品分析等场景,返回JSON格式数据,集成便捷,助力多平台商品展示与高效数据处理。(238字)

123 1
|
5月前
|
存储 分布式计算 数据库
|

ETL vs ELT:到底谁更牛?别被名字骗了,这俩是两种世界观

ETL vs ELT:到底谁更牛?别被名字骗了,这俩是两种世界观

275 12
|
5月前
|
存储 Web App开发 前端开发
|

新手如何建站.新手建站的全流程

建站是通过整合域名、服务器等要素搭建可访问数字平台的过程,分自助建站、CMS系统和代码开发三类工具。核心流程包括需求规划、域名注册(实名认证)、服务器配置(国内需ICP备案),搭建后填充内容并测试优化,解析域名上线,做好后续维护。

633 10
来自: 人工智能平台PAI  版块
|
5月前
|
Shell 网络安全 开发工具
|

IDEA中Git使用http协议和ssh协议的区别

IDEA中Git使用http协议和ssh协议的区别

348 4
|
5月前
|
数据采集 运维 DataWorks
|

【赵渝强老师】阿里云大数据集成开发平台DataWorks

DataWorks是阿里云一站式大数据开发治理平台,支持数据集成、开发、建模、分析、质量监控、服务化及迁移等全链路功能,兼容多种计算引擎,助力企业高效构建数据中台,实现数据资产化与价值挖掘。

453 6
|
5月前
|
人工智能 算法 前端开发
|

实验报告:让AI自动生成采集代码,会踩哪些坑?

本文复盘AI自动生成采集代码的实战效果,梳理出“模拟行为”与“接口调用”两大技术路线。AI在浏览器自动化中表现良好,适合简单场景;但面对加密接口与强反爬时仍需人工介入。最终结论:AI是高效助手,但核心难题仍需工程师掌控。

474 1
|
5月前
|
数据采集 NoSQL Redis
|

百万级并发下的去重挑战:Bloom Filter 与 Redis 的组合方案

本文探讨了高并发数据采集中避免重复URL抓取的问题,提出了结合Bloom Filter、Redis HyperLogLog和持久化备份的解决方案,实现了快速查重、准确统计和数据恢复。

290 2
|
5月前
|
供应链 安全 开发者
|

微软代码签名证书申请

软件供应链成网络攻击重灾区,代码签名是保障安全的关键。通过数字签名验证软件来源与完整性,可有效防范恶意篡改。申请需选择OV或EV类型,单位用户可通过Gworg实名认证获取证书,EV版享更高信任。个人仅可申请OV,证书签发后邮寄硬件密钥,确保完全所有权与安全性。

214 1
|
6月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

943 9
|
6月前
|
JSON 供应链 监控
|

批量获取1688商品数据,精准筛选与分页查询

1688商品列表API(alibaba.product.list.get)支持按关键词、类目、价格等条件批量获取商品信息,适用于B2B场景下的商品管理与竞品分析。返回JSON格式数据,含商品ID、标题、价格、库存等核心字段,支持分页查询、动态筛选与排序,实时性强,字段可定制。

360 0