|
4月前
|
SQL 运维 分布式计算
|

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,提升日志分析效率与治理能力。

125 0
|
4月前
|
消息中间件 存储 Java
|

异步消息组件MQ高级

本文围绕消息中间件(如RabbitMQ)的可靠性机制展开,涵盖生产者重试与确认、消费者确认、消息持久化、失败处理、幂等性及延迟消息等核心内容。重点讲解如何通过重试机制、Confirm/Return确认模式保障消息发送可靠;通过手动或自动ACK确保消费可靠性;并结合定时任务实现失败消息重发,最终构建高可用的消息系统。

159 0
|
4月前
|
存储 供应链 API
|

1688店铺详情API使用指南

1688店铺详情API是阿里巴巴开放平台核心接口,支持通过店铺ID获取商家基本信息、资质、等级及主营类目等数据,适用于电商分析、供应链对接等场景。本文详解接口参数、Python调用示例及注意事项,助开发者高效集成与应用。

291 1
|
4月前
|
SQL 自然语言处理 数据可视化
|

大火的 ChatBI,是如何实现灵活的自然语言数据分析?

这对业务人员而言,不仅简化了数据分析流程,更无需依赖 IT 代码开发,实现了自主灵活的智能问数,高效敏捷展开分析。

412 1
|
4月前
|
数据采集 人工智能 监控
|

GEO优化核心:高权重新闻信源筛选与AI收录实战指南

在 GEO(搜索引擎地理优化)实操中,新闻信源的质量直接影响内容的 AI 收录率、关键词排名及转化效果。多数开发者面临两大核心问题:1. 低价值信源浪费成本:部分新闻平台价格低廉(30-50 元 / 篇),但发布后未被 AI 抓取,无法为 GEO 排名提供权重支撑;2. 广告属性触发审核拒绝:含联系方式(电话、微信号)的软文易被平台判定为广告,导致审核驳回,影响发布效率。

642 7
|
5月前
|
人工智能 监控 搜索推荐
|

数聚酷:如何让AI答案显示品牌名?

如何让品牌被AI推荐?2025年,生成式引擎优化(GEO)取代传统SEO。通过构建权威内容库、用户导向创作、数据交叉验证与结构化输出,让AI主动引用你的品牌,抢占搜索心智入口。

474 1
来自: 智能搜索推荐  版块
|
5月前
|
NoSQL Redis
|

Redis 搭建主从复用-读写分离和主备切换,及重要的关键词解释 部分3

Redis 搭建主从复用-读写分离和主备切换,及重要的关键词解释 部分3

170 4
|
7月前
|
存储 机器学习/深度学习 人工智能
|

RAG系统嵌入模型怎么选?选型策略和踩坑指南

嵌入是RAG系统的核心,直接影响检索质量。本文详解嵌入原理,解析稠密/稀疏、长上下文、多向量等类型,梳理选型关键:领域匹配、上下文长度、维度与成本,并结合MTEB基准给出实用建议,助你为业务挑选高效稳健的嵌入方案。

861 2
|
7月前
|
机器学习/深度学习 算法 PyTorch
|

深度学习调参新思路:Hyperband早停机制提升搜索效率

Hyperband是一种高效的超参数调优算法,通过逐次减半策略在探索与利用间取得平衡。它先为大量配置分配少量资源,快速淘汰表现差的模型,将剩余资源集中用于有潜力的配置,从而加快优化过程。相比贝叶斯优化、随机搜索和遗传算法,Hyperband在处理大规模搜索空间时效率更高,尤其适合资源有限的场景。文章通过LSTM模型预测股价的实验展示了其工作机制与实际效果。

390 6
|
8月前
|
存储 机器学习/深度学习 人工智能
|

MXFP4量化:如何在80GB GPU上运行1200亿参数的GPT-OSS模型

GPT-OSS通过MXFP4量化技术实现1200亿参数模型在单个80GB GPU上的高效运行,将权重压缩至每参数4.25位,大幅降低内存需求,同时保持高精度和竞争力的基准性能,为大规模模型部署提供了新思路。

715 13
|
9月前
|
机器学习/深度学习 自然语言处理 搜索推荐
|

搜索结果太乱?5种重排序模型让你的搜索系统准确率提升40%

本文将系统性地分析重排序模型的技术原理,深入探讨从传统学习排序方法到基于Transformer架构的前沿解决方案。

1008 0
|
9月前
|
JSON 人工智能 数据挖掘
|

LLM开发者必备:掌握21种分块策略让RAG应用性能翻倍

本文将系统介绍21种文本分块策略,从基础方法到高级技术,并详细分析每种策略的适用场景,以帮助开发者构建更加可靠的RAG系统。

516 0
|
9月前
|
Java 关系型数据库 MySQL
|

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

861 2
|
10月前
|
定位技术
|

安徽京准分享:北斗RDSS授时和北斗授时RNSS的区别

安徽京准分享:北斗RDSS授时和北斗授时RNSS的区别

1679 15
|
11月前
|
数据采集 SQL canal
|

Amoro + Flink CDC 数据融合入湖新体验

本文总结了货拉拉高级大数据开发工程师陈政羽在Flink Forward Asia 2024上的分享,聚焦Flink CDC在货拉拉的应用与优化。内容涵盖CDC应用现状、数据入湖新体验、入湖优化及未来规划。文中详细分析了CDC在多业务场景中的实践,包括数据采集平台化、稳定性建设,以及面临的文件碎片化、Schema演进等挑战。同时介绍了基于Apache Amoro的湖仓融合架构,通过自优化服务解决小文件问题,提升数据新鲜度与读写平衡。未来将深化Paimon与Amoro的结合,打造更高效的入湖生态与自动化优化方案。

595 1
来自: 实时计算 Flink  版块
|
11月前
|
SQL 关系型数据库 MySQL
|

Flink CDC 3.4 发布, 优化高频 DDL 处理,支持 Batch 模式,新增 Iceberg 支持

Apache Flink CDC 3.4.0 版本正式发布!经过4个月的开发,此版本强化了对高频表结构变更的支持,新增 batch 执行模式和 Apache Iceberg Sink 连接器,可将数据库数据全增量实时写入 Iceberg 数据湖。51位贡献者完成了259次代码提交,优化了 MySQL、MongoDB 等连接器,并修复多个缺陷。未来 3.5 版本将聚焦脏数据处理、数据限流等能力及 AI 生态对接。欢迎下载体验并提出反馈!

1715 1
来自: 实时计算 Flink  版块
|
12月前
|
存储 运维 Serverless
|

千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构,解决了海量数据处理中的资源利用率低、并发能力不足等问题,显著降低了硬件和运维成本。实时查询性能提升8倍,查询出错率减少30倍,集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验,还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

1080 69
|
12月前
|
人工智能 边缘计算 前端开发
|

人工智能平台 PAI DistilQwen2.5-DS3-0324发布:知识蒸馏+快思考=更高效解决推理难题

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建,显著提升推理速度,使得在资源受限的设备和边缘计算场景中,模型能够高效执行复杂任务。实验显示,DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出,其32B模型效果接近参数量接近其10倍的闭源大模型。

1251 56
来自: 人工智能平台PAI  版块
|
12月前
|
机器学习/深度学习 算法 PyTorch
|

10招立竿见影的PyTorch性能优化技巧,让模型训练速度翻倍

本文系统总结了PyTorch性能调优的关键技术,涵盖混合精度训练、PyTorch 2.0编译功能、推理模式优化、Channels-Last内存格式、图优化与变换、cuDNN基准测试、内存使用优化等多个方面。通过实证测试,文章详细分析了各技术的实现细节、优势及适用场景,如混合精度训练可显著提升计算效率和内存利用率,torch.compile()能自动优化代码生成以加速模型运行。此外,还探讨了推理模式的选择、卷积操作优化及模型构建的最佳实践。这些方法结合良好的编码习惯,有助于开发者构建高效、可扩展的深度学习应用。

878 3
|
12月前
|
传感器 机器学习/深度学习 人工智能
|

从“手环”到“健康顾问”:可穿戴设备背后的数据魔法

从“手环”到“健康顾问”:可穿戴设备背后的数据魔法

994 10
|
12天前
|
机器学习/深度学习 自然语言处理 监控
|

别再用“好评率”骗自己了:用 Python + Transformers 做一套真正能用的情感分析系统

别再用“好评率”骗自己了:用 Python + Transformers 做一套真正能用的情感分析系统

118 8
|
16天前
|
数据采集 负载均衡 NoSQL
|

抛弃自建代理池?深度评测隧道代理自动换IP背后的负载均衡架构

本文深度对比自建代理池与隧道代理:前者维护成本高、延迟大、并发易瓶颈;后者通过云端负载均衡实现“一次配置、自动换IP”,显著提升稳定性与扩展性。附Python实战评测,直观展现隧道代理优势。

155 1
|
16天前
|
安全 Python
|

本地自动化工具 零代码开箱即用 1949AI 适配个人办公单机轻量化运行

本文介绍零代码本地自动化工具的轻量化落地实践,专为个人办公单机场景设计:开箱即用、无需配置、资源占用低、离线运行、安全稳定。支持文件批量重命名、智能归类等高频任务,低配电脑亦流畅执行,零技术基础用户可快速上手。(239字)

134 7
|
18天前
|
存储 安全 编译器
|

嵌入式软件可靠性:从代码细节到系统化设计的工程实践

本文系统阐述高可靠嵌入式软件设计方法,涵盖编译器可信性、冗余容错、软硬协同、存储保护、人机安全交互、功能安全(ISO 26262/IEC 61508)、DFMEA分析及可维护性评价七大维度,强调可靠性源于全流程工程实践与习惯养成。(239字)

144 1
|
22天前
|
芯片
|

掌握OVP过压保护芯片:电路设计、引脚说明及PCB板应用

过压保护OVP:指当输入达到过压保护阀值时,表现为:切断断开输出;恢复条件:输入电压低于过压保护阀值。主要功能意义:保护后级电路或芯片不被高压损坏;应用:蓝牙耳机,充电宝,等等USB输入充电口和输出高电压隔离保护电路。

210 0
|
1月前
|
算法 搜索推荐 大数据
|

别再怪模型不聪明了:冷启动,本质是你“没喂饱”数据

别再怪模型不聪明了:冷启动,本质是你“没喂饱”数据

271 2
|
2月前
|
JSON 安全 API
|

Flask 入门指南

Flask是轻量级Python Web微框架,核心仅提供路由与模板功能,按需通过扩展集成数据库、认证等模块。学习曲线平缓、结构简洁、扩展灵活,适合从API、博客到企业应用的全阶段开发,是入门Web开发与构建定制化技术栈的理想起点。(239字)

413 3
|
2月前
|
数据采集 人工智能 自然语言处理
|

大模型微调后,如何判断它是不是“变聪明”了?这套评估方法论请收好。

本文系统阐述大模型微调效果评估的核心价值与实践方法:强调评估是检验泛化能力的“试金石”,须坚持人工主观评估(重业务适配性)与自动化客观评估(重量化指标)双轨并行;详解测试集构建、指标选择、基线对比等关键步骤,助力从0到1建立科学、可信、可迭代的评估体系。(239字)

182 3
|
2月前
|
物联网
|

LoRA、全参、QLoRA:显存占用结构对比

本文深入剖析大模型微调中显存占用的本质,指出LoRA、全参、QLoRA的差异不在参数量,而在“哪些组件必须常驻显存”。系统拆解显存四大构成:参数、梯度、优化器状态、中间激活,揭示三者各自保留/舍弃/压缩的部分,并强调:**激活(activations)才是OOM主因,而所有方案对此几乎无改善**。破除“换方案即省显存”误区,推动显存问题工程化诊断。

180 1
|
2月前
|
数据采集 人工智能 监控
|

让大模型“开小灶”:手把手教你打造能聊业务的专属AI

本文深入浅出解析AI微调(Fine-tuning)技术:揭示通用大模型“懂常识却不懂行”的根源,详解LoRA等高效微调原理,对比RAG适用场景,并提供数据准备、LoRA训练、效果评估到部署的四步实践指南。助力业务人员低成本打造专属行业AI助手。(239字)

262 0
|
3月前
|
Java Go 开发者
|

IDEA开发常用的快捷键

IntelliJ IDEA常用快捷键汇总:涵盖代码生成(如main、sout)、编辑(复制、删除、重命名)、导航(跳转、查找)、格式化、代码阅读及版本控制等高频操作,提升开发效率。熟练掌握可显著优化编码体验,是Java开发者必备技能。

345 1
|
3月前
|
存储
|

原码,反码,补码

原码是二进制的直观表示,符号位决定正负;反码用于解决负数计算问题,负数按位取反;补码在反码基础上加1,解决跨0误差。计算机中所有数据存储与运算均采用补码形式,可准确处理正负数运算,并能多表示一个特殊值-128。

473 5
|
3月前
|
存储 机器学习/深度学习 人工智能
|

构建AI智能体:七十九、从SVD的理论到LoRA的实践:大模型低秩微调的内在逻辑

本文系统介绍了奇异值分解(SVD)的核心原理及其在大模型微调中的应用。文章首先通过水果沙拉制作、员工评选等生活化案例,形象解释了SVD将复杂矩阵分解为三个简单矩阵乘积的过程。随后详细阐述了SVD公式A=UΣVᵀ的数学含义,包括奇异值矩阵Σ作为"重要性权重表"的关键作用。重点剖析了SVD的低秩近似特性,展示了如何通过保留主要奇异值实现数据压缩。最后深入探讨了SVD对LoRA技术的指导作用:通过分析权重更新矩阵的奇异值分布,科学确定低秩适配器的秩参数,实现大模型的高效微调。

307 3
|
4月前
|
JavaScript 前端开发 UED
|

Vue并发控制核心原理与实践技巧

Vue开发中常见并发问题,如重复请求、竞态冲突等,易导致数据混乱与性能下降。本文详解防抖、节流、AbortController、Promise控制及Pinia状态锁等策略,匹配不同场景,实现请求有序、数据稳定,提升用户体验。

184 0
|
4月前
|
存储 缓存 安全
|

One Trick Per Day

本文总结Java开发中六大关键规范:避免HashMap初始化容量设置不当,禁用Executors创建线程池以防OOM,Arrays.asList不可变操作,优先使用entrySet遍历Map,SimpleDateFormat非线程安全需避免static,以及并发修改记录时合理加锁。遵循这些实践可提升系统稳定性与性能。

137 0
|
4月前
|
Java 测试技术 Linux
|

生产环境发布管理

本文介绍大型团队如何通过自动化部署平台实现多环境(dev/test/pre/prod)高效发布。涵盖各环境职责、基于Jenkins+K8S的CI/CD流程、分支管理与一键部署,并结合Skywalking等工具实现日志链路追踪与快速排错,提升发布效率与系统稳定性。

146 0
|
4月前
|
存储 数据采集 分布式计算
|

一、数据仓库基石:核心理论、分层艺术与 ETL/ELT 之辨

数据仓库不是数据库的升级,而是面向决策的大脑。本篇带你快速厘清数据库 vs 数仓、分层架构逻辑、ETL/ELT区别,轻松建立数据思维骨架。

345 5
|
4月前
|
数据采集 分布式计算 监控
|

Airflow 做 ETL,真不是“排个 DAG 就完事儿”:那些年我踩过的坑与悟出的道

Airflow 做 ETL,真不是“排个 DAG 就完事儿”:那些年我踩过的坑与悟出的道

295 4
|
5月前
|
新能源 5G 芯片
|

Ansys Electronics 全流程电磁仿真降本增效,附安装包

Ansys Electronics Suite是Ansys推出的电磁仿真与电子系统设计平台,覆盖芯片、组件到系统级的电磁、热、电路及多物理场耦合仿真,广泛应用于5G、汽车、航天等领域,助力工程师优化设计、提升性能,缩短研发周期,降低开发成本。

376 2
|
5月前
|
机器学习/深度学习 人工智能 计算机视觉
|

AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

FBRT-YOLO提出专用于航拍图像的实时目标检测模型,通过轻量化设计、增强多尺度融合与小目标优化,在保证高精度的同时显著提升速度,实现复杂场景下更优的性能平衡。

496 0
|
5月前
|
边缘计算 自然语言处理 算法
|

实时交互数字人端到端延迟压至0.8秒:关键技术节点与商业价值解析

0.8秒是实时数字人体验的关键阈值,端到端延迟低于此值可实现自然流畅交互。本文解析其技术链路、核心支撑与商业价值,揭示为何这一指标成为数字人从“可用”到“好用”的分水岭。

530 4
来自: 人工智能平台PAI  版块
|
5月前
|
人工智能 机器人 数据处理
|

ICLR2026 !SAM3重磅来袭:能“听懂人话”的分割模型,性能狂飙2倍

Lab4AI.cn覆盖全周期科研支撑平台,提供论文速递、AI翻译和AI导读工具辅助论文阅读;支持投稿论文复现和Github项目复现,动手复现感兴趣的论文;论文复现完成后,您可基于您的思路和想法,开启论文创新与成果转化。

942 6
来自: 人工智能平台PAI  版块
|
5月前
|
人工智能 资源调度 搜索推荐
|

别光拼景点,拼“数据”才赚钱——用数据分析提升旅游业收入的那些事

别光拼景点,拼“数据”才赚钱——用数据分析提升旅游业收入的那些事

295 4
|
5月前
|
存储 人工智能 自然语言处理
|

阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元

本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。

807 22
|
6月前
|
人工智能 自然语言处理 Python
|

当AI开始写故事:AIGC重塑内容产业,创作的“边界”还剩什么?

当AI开始写故事:AIGC重塑内容产业,创作的“边界”还剩什么?

251 7
|
6月前
|
存储 前端开发
|

【实战案例】火语言 RPA 采集小说站已完结书名(自动翻页判断),保存到Excel 全流程(附完整脚本)

自动采集起点中文网完本小说书名,支持翻页检测与数据存储。脚本逐页抓取小说名并保存至Excel,最多采集50页,智能判断翻页逻辑,确保数据完整,适用于批量获取完结书籍信息。

395 5
|
6月前
|
存储 物联网 Serverless
|

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

理想汽车携手阿里云Hologres+Flink,打造万亿级车联网实时分析平台。面对百万余辆智能车、每秒百万级信号上报的挑战,通过存算分离、冷热分层、流批一体等创新,实现写入性能提升200%、查询QPS超万、成本降低40%,支撑数字孪生、智能诊断等高实时业务,构建高可用、弹性伸缩、低成本的下一代数据底座。

554 4
|
7月前
|
数据采集 数据可视化 安全
|

基于python大数据的天气可视化分析预测系统

本研究探讨基于Python的天气预报数据可视化系统,旨在提升天气数据获取、分析与展示的效率与准确性。通过网络爬虫技术快速抓取实时天气数据,并运用数据可视化技术直观呈现天气变化趋势,为公众出行、农业生产及灾害预警提供科学支持,具有重要的现实意义与应用价值。

439 8
|
7月前
|
人工智能 分布式计算 DataWorks
|

阿里云大数据AI产品月刊-2025年8月

阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

519 2
|
8月前
|
数据采集 存储 关系型数据库
|

全量抓取还是增量采集?二手房数据采集实战解析

本文以链家二手房数据采集为例,探讨全量抓取与增量采集的优劣与适用场景,并结合代理IP技术实现高效、稳定的爬虫方案。通过SQLite/PostgreSQL存储、内容哈希去重、定时任务调度等手段,构建可持续运行的数据更新与统计系统。适用于房产数据分析、市场监测等场景,兼顾资源效率与数据质量。

435 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

2
今日
69316
内容
128
活动
439805
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务