|
11月前
|
机器学习/深度学习 数据可视化 算法
|

数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律

本文深入探讨了数据科学中分布识别的重要性及其实践方法。作为数据分析的基础环节,分布识别影响后续模型性能与分析可靠性。文章从直方图的可视化入手,介绍如何通过Python代码实现分布特征的初步观察,并系统化地讲解参数估计、统计检验及distfit库的应用。同时,针对离散数据、非参数方法和Bootstrap验证等专题展开讨论,强调业务逻辑与统计结果结合的重要性。最后指出,正确识别分布有助于异常检测、数据生成及预测分析等领域,为决策提供可靠依据。作者倡导在实践中平衡模型复杂度与实用性,重视对数据本质的理解。

834 3
|
11月前
|
数据采集 存储 Web App开发
|

Python爬虫技巧:设置Cookie永不超时的详细指南

Python爬虫技巧:设置Cookie永不超时的详细指南

625 1
|
11月前
|
机器学习/深度学习 监控 Android开发
|

AppTrace技术全景:开发者视角下的工具链与实践经验

本文全面介绍了AppTrace技术,涵盖其核心价值、实现方案及实战经验。通过性能剖析、行为分析、异常诊断和优化验证等功能,开发者可深入了解应用行为并解决性能问题。文章详细解析了iOS与Android平台的原生工具(如Signpost API、Android Profiler)以及跨平台解决方案(如Firebase Performance Monitoring)。同时分享了列表滚动卡顿优化和内存泄漏排查等实战案例,并探讨商业级APM工具与开源工具的应用场景。最后展望了AI驱动异常检测、端侧机器学习分析等未来趋势,强调在追踪深度与用户隐私间寻求平衡的重要性。

249 2
|
11月前
|
监控 安全 测试技术
|

5步快速获取电商API接口

电商API接口是实现电商平台数据交互的重要工具。获取途径主要包括电商平台开放平台(如淘宝、京东等)和第三方API市场,涵盖商品管理、订单处理等功能。获取步骤包括:明确需求、选择服务、注册开发者账号、获取API密钥、阅读文档、开发测试、部署上线及监控优化。过程中需注意法律法规、使用限制和技术支持,确保接口安全稳定运行,满足业务需求。

767 1
|
12月前
|
机器学习/深度学习 人工智能 监控
|

业余AI与专业AI的区别,就在这些评估指标上

如何知道你训练的AI模型是天才还是学渣?本文用轻松幽默的方式带你了解机器学习的各类评估指标,让你不仅能说出模型的好坏,还能找到改进的方向,避免在实际应用中翻车。

689 8
|
12月前
|
人工智能 数据可视化 安全
|

增强现实如何让医疗影像“活起来”?——从辅助诊断到精准治疗

增强现实如何让医疗影像“活起来”?——从辅助诊断到精准治疗

304 1
|
12月前
|
人工智能 并行计算 开发者
|

CUDA重大更新:原生Python可直接编写高性能GPU程序

NVIDIA在2025年GTC大会上宣布CUDA并行计算平台正式支持原生Python编程,消除了Python开发者进入GPU加速领域的技术壁垒。这一突破通过重新设计CUDA开发模型,引入CUDA Core、cuPyNumeric、NVMath Python等核心组件,实现了Python与GPU加速的深度集成。开发者可直接用Python语法进行高性能并行计算,显著降低门槛,扩展CUDA生态,推动人工智能、科学计算等领域创新。此更新标志着CUDA向更包容的语言生态系统转型,未来还将支持Rust、Julia等语言。

828 3
|
12月前
|
机器学习/深度学习 数据采集 算法
|

大数据加持的预测性维护:让设备故障“未卜先知”

大数据加持的预测性维护:让设备故障“未卜先知”

684 2
|
1月前
|
数据采集 运维 网络协议
|

业务实战:基于 Ruby Mechanize 与隧道代理构建工业级数据采集器

本文探讨了在爬虫开发中如何平衡效率,并介绍了Ruby的Mechanize库的优势。它自动管理会话,处理复杂表单,适合社交平台。文章还讨论了IP封禁和代理策略,并提供了代码模板,包括代理配置和错误处理。最后总结了运维经验,帮助爬虫工程师专注于数据解析。

110 0
|
1月前
|
SQL 存储 关系型数据库
|

PL/SQL 存储过程血缘解析指南:攻克数据治理的「最后堡垒」

PL/SQL存储过程是传统血缘工具的盲区,解析准确率常低于80%,而算子级血缘能实现 >99% 的精准解析。

131 1
|
1月前
|
SQL 存储 架构师
|

指标平台能否真正替代 DWS/ADS?轻数仓转型的风险与对策

轻数仓转型的核心是用 NoETL 语义编织构建的统一语义层,替代烟囱式开发的物理宽表层,从根本上解决口径不一的问题。

107 0
|
1月前
|
SQL 人工智能 运维
|

Aloudata:从 A lot of data,到 AI on data

我们做的其实一直是同一件事: 先解决数据生产力的问题,让好数据更高效地被生产出来; 今天再进一步,让这些好数据不只是被人用,也能被 Agent 用。

156 1
|
1月前
|
Python
|

心脏病预测的F1 Score计算

本项目基于阿里云PAI Designer,对心脏病数据开展二分类预测评估。通过遍历0–1间1000个阈值,计算各阈值下的F1 Score等指标,最终确定最佳阈值0.955,对应F1得分为0.8132,准确率82.47%。

128 2
来自: 人工智能平台PAI  版块
|
1月前
|
数据采集 中间件 Go
|

Go Colly框架高阶技巧:如何在中间件中无缝切换代理IP

这是一份专为突发数据需求打造的Go Colly速查表:集成代理轮询、动态UA/Cookie伪装与智能限速,3步复制即用。无需架构设计,5分钟开跑,直面风控抓取竞品活动数据。

183 4
|
2月前
|
存储 Kubernetes Cloud Native
|

你以为是磁盘慢?其实是你不会调:云原生存储性能调优实战(IOPS / 吞吐 / 延迟)

你以为是磁盘慢?其实是你不会调:云原生存储性能调优实战(IOPS / 吞吐 / 延迟)

193 2
|
2月前
|
数据采集 传感器 数据可视化
|

从一次桌面整理说起,聊聊协同自动化工具1949里的那些看不见的代码逻辑

这是一篇关于轻量级协同自动化实践的随笔:作者用零代码拖拽搭建发票归档流程,遇瓶颈时通过内置Python节点灵活扩展逻辑,实现文件名智能重命名;再逐步串联浏览器、桌面与邮件操作,形成低资源、高适应的多应用自动化链。工具既省去重复劳动,又保留代码自定义空间——像一把“称手的刀”,静默高效,亦可刻下个性印记。(239字)

169 14
|
2月前
|
消息中间件 运维 Kafka
|

别再堆机器了:无服务器流处理,才是实时数据的“降维打击”

别再堆机器了:无服务器流处理,才是实时数据的“降维打击”

177 11
|
2月前
|
JSON 缓存 API
|

微店商品详情API概述

本文整理商品详情获取核心接口,涵盖权限申请、调用流程、参数说明及常见问题。支持反向海淘、ERP对接等场景,返回商品基础信息、价格、库存、素材、物流及销售数据,并提供标准签名调用与缓存建议。(239字)

188 1
|
2月前
|
机器学习/深度学习 SQL 自然语言处理
|

数据智能体技术路线深度对比:本体神经网络 vs 预制指标平台

本文剖析数据智能体四大技术路径:RAG(简单但精度低)、NL2SQL(单表准、多表差)、预制指标(高维护成本、扩展性差)、本体神经网络(UINO首创,95%+准确率,维护成本线性增长)。推荐企业优先选择本体论路线,实现高精准、低成本、强扩展的AI原生问数。

282 1
|
2月前
|
Java
|

java工具:《Java获取昨日零点时间工具方法》

java工具:《Java获取昨日零点时间工具方法》

186 9
|
2月前
|
数据采集 人工智能 数据处理
|

别只盯着模型参数了:聊聊多模态时代最容易被忽视的一件事——训练数据准备

别只盯着模型参数了:聊聊多模态时代最容易被忽视的一件事——训练数据准备

410 4
|
3月前
|
存储 分布式计算 Apache
|

数据湖上跑模型训练?别再“豪横烧钱”了,这样优化性能和成本才靠谱

数据湖上跑模型训练?别再“豪横烧钱”了,这样优化性能和成本才靠谱

190 2
|
3月前
|
传感器 人工智能 监控
|

过负荷监控系统:守护电力安全的全方位智能卫士,沃思智能

炎炎夏日变压器起火、精密仪器因过载损毁……这些风险能否提前预警?现代过负荷监控系统正是电力系统的“智能守护者”:融合高精度传感、AI动态分析与柔性应急决策,实现毫秒级响应、92%预测准确率,已应用于电网、医院、消防及光伏等领域,为城市用电安全保驾护航。(239字)

200 1
|
3月前
|
人工智能 SEO
|

GEO:从"排名优先"到"答案优先",这场营销革命正在重塑你的商业未来

本文揭示SEO向GEO(生成式引擎优化)的范式革命:从“人找信息”到“信息找人”,核心是让AI将你的内容视为权威答案。GEO非SEO升级,而是以“答案优先”取代“排名优先”,需系统构建“AI认知资产”。早布局者将抢占红利先机。(239字)

227 1
|
3月前
|
JSON API 数据安全/隐私保护
|

京东商品评论API接口封装的心路历程

本文分享了后端开发者封装京东商品评论API的实战历程:从踩坑(签名错误、权限不足、数据混乱、频控限制)到优化(统一配置、数据清洗、异常重试、分层设计),最终实现简洁、稳定、易用、可扩展的SDK。涵盖技术细节与工程思维,助力同行高效对接第三方API。(239字)

278 4
|
3月前
|
人工智能 自然语言处理
|

效果评估:如何判断一个祝福 AI 是否“走心”

本文以「码上拜年」AI为例,探讨创意生成任务(如春节祝福)的评估困境:传统指标(loss、BLEU)失效,因“走心”无法量化。提出三维主观评估框架——事实准确、风格契合、表达自然,并强调评估核心是“人是否愿意直接发送”,即用户真实感受才是终极标准。

271 8
|
3月前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!30分钟微调一个懂你关系的“人情味”拜年AI

春节祝福太难写?本文手把手教你用LoRA微调大模型,让AI学会“看人下菜”:识别关系、风格、细节,30分钟训练出懂人情世故的拜年助手。无需代码,量化+批处理保障秒级响应,让每条祝福都像你亲手写的。(239字)

490 35
|
3月前
|
人工智能 算法 数据挖掘
|

硬核认可!Aloudata 荣膺数智技术系列榜单三项大奖

以 NoETL 数据语义编织技术体系,助力平滑落地以 Data Agent 为代表的 AI 应用,实现数据普惠

172 2
|
3月前
|
JSON 监控 API
|

京东商品评论API(jd.item_review)开发指南

京东商品评论API(jd.item_review)是京东开放平台提供的合规REST接口,支持获取商品评论、评分、晒图、追评等多维数据,助力口碑监控、竞品分析与用户反馈收集,提升运营决策效率。(239字)

267 3
|
3月前
|
人工智能 C++
|

一个项目开始失控时,通常不是从代码开始的

本文揭示项目失控的深层规律:代码只是最晚显现的“结果层”,而非病因。真正失控始于早期——问题定义模糊、评估妥协、边界不清、复杂度累积、用解释替代约束、盲目依赖“再调一版”。六条路径环环相扣,每步看似合理,却悄然瓦解可控性。止损关键在决策层,而非代码层。

232 11
|
3月前
|
存储 SQL 运维
|

存量数仓宽表治理:基于 NoETL 语义编织实现指标统一管理

在企业已有的 DWD 明细数据层之上,构建一个统一的语义层,将业务逻辑的定义与物理存储和计算执行彻底解耦。

219 2
|
3月前
|
数据采集 安全 算法
|

LoRA、PPO、DPO、RAG:这些词什么时候会害你

本文警示:LoRA、PPO、DPO、RAG皆为“放大器”,不解决问题本身,只放大已有对错。当技术名词沦为条件反射式答案(如“要不要上RAG?”),便已背离工程本质——真正关键,是清醒拆解问题,而非用术语掩盖思考缺位。

158 2
|
4月前
|
SQL 人工智能 自然语言处理
|

数据工程视角:为什么公司会有几百个含义模糊的“DAU”指标?

除了提升开发效率、降低资源成本,更能保障决策一致性、赋能业务敏捷分析,并构成未来 AI 应用不可或缺的 AI-Ready 数据底座

256 1
|
4月前
|
SQL 存储 人工智能
|

数据工程新范式:NoETL 语义编织如何激活海量埋点数据价值?

数据工程师将从重复、低价值的 SQL 脚本编写和 ETL 运维中解放出来,转向更具战略性的工作。

221 2
|
4月前
|
数据采集 安全 机器人
|

慢一点,并不会让你更安全

本文讲述了作者在编写爬虫时,从依赖固定延时避免被封IP的错误做法,到意识到代理IP和随机延时的重要性。作者分享了使用代理IP和随机延时的最小可行方案,并强调了代理IP在爬虫项目中的基础性作用。

207 1
|
4月前
|
SQL 存储 人工智能
|

数据工程新范式:基于 NoETL 语义编织实现自助下钻分析

将分析需求响应时间从“周级”缩短至“分钟级”,实现真正的自助探索与归因分析。

193 0
|
4月前
|
安全 物联网
|

LoRA 不是“免费午餐”:你省下的算力,往往会在别的地方还回去

LoRA因轻量、易上手成为新手微调首选,但它并非“零代价”方案:虽节省显存与算力,却无法规避目标模糊、数据偏差、行为过拟合、表达能力受限等本质问题。它适合快速验证方向,而非替代系统性微调设计。

220 2
|
4月前
|
人工智能 搜索推荐 智能硬件
|

赶快体验!智能体来了,一起智创未来温馨生活

科技不止算力与参数,更该有温度。AI智能体正悄然融入生活:感知情绪、预判习惯、代管琐事,把人从重复决策中解放,腾出时间陪伴家人。它不是冰冷工具,而是懂你的“数字家人”。(239字)

154 2
|
4月前
|
存储 人工智能 资源调度
|

从代码维护到数字资产掌控:AI Agent 职业路线的体系化进阶指南

AGI落地推动软件工程向“代理工程”演进,AI Agent搭建师需构建“意志驱动+浮光执行”架构,实现从编码到数字资产掌控的跃迁。职业核心转向目标定义与逻辑蒸馏,通过感知、记忆、对齐三层架构,打造具备主动执行能力的智能体集群,以浮光行为为杠杆,重构生产力模式与商业价值。

188 3
|
4月前
|
人工智能 自然语言处理 Serverless
|

破解 AI Agent 搭建师职业焦虑:从 “搬砖式搭建” 到 “资产化架构” 的升维路径

AI Agent搭建师正面临“沙城困境”:模型快速迭代使外挂逻辑失效,低代码工具普及压缩职业空间。破解焦虑需转型为“数字化资产构建者”,通过逻辑蒸馏、轻量行为编排与意志资产沉淀,将行业直觉转化为可复用、排他性的智能体核心竞争力,在AGI黎明期锚定不可替代价值。(238字)

148 5
|
4月前
|
SQL 人工智能 安全
|

破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构

以 NoETL 语义编织为核心的 AI 就绪架构,不仅是解决当前 AI 幻觉问题的方案,更是面向未来“数据智能时代”的基础设施。

272 0
|
4月前
|
数据采集 机器学习/深度学习 自然语言处理
|

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

238 10
|
4月前
|
运维 安全 测试技术
|

机房项目中的时间系统:从忽视到谨慎的十年体会

本文分享了作者在机房系统集成项目中,对时间同步从忽视到重视的十年实践经验。早期依赖公网NTP的简单做法,常导致日志混乱、故障难查等问题;后期引入本地北斗授时服务器,强调时间源的确定性与统一性,提升系统稳定性和可维护性。文章还探讨了设备选型关注点及可靠部署方案,突出时间系统在政企、金融等关键场景中的重要价值。

215 0
|
4月前
|
传感器 自动驾驶 算法
|

自动驾驶不是“一行代码开上高速”:聊聊感知、预测与决策这三大算法核心

自动驾驶不是“一行代码开上高速”:聊聊感知、预测与决策这三大算法核心

309 13
|
4月前
|
人工智能 C++
|

【AI大模型面试宝典五】- 基础架构篇

【AI大模型面试宝典】深入解析归一化技术:LayerNorm、RMSNorm原理与应用,Pre-norm vs Post-norm对比,助力掌握大模型训练稳定与加速收敛核心要点。高频考点+实战解析,轻松拿下offer!点赞关注,持续更新~ #大模型面试 #归一化

205 0
来自: 人工智能平台PAI  版块
|
4月前
|
弹性计算 监控 Cloud Native
|

云原生时代,“信任”才是开发者的核心基础设施:4个技术维度筑牢增长底盘

在云原生时代,信任已成为技术发展的基础设施。本文深入剖析为何“信任”决定开源项目、API与云产品的成败,并从行为一致、承诺可验证、错误修复、输出稳定四大技术维度,揭示构建长期信任的实操路径,助力开发者实现可持续增长。

276 1
来自: 智能搜索推荐  版块
|
4月前
|
安全 算法 分布式数据库
|

链上太堵了怎么办?聊聊区块链可扩展性的三种主流解法

链上太堵了怎么办?聊聊区块链可扩展性的三种主流解法

282 5
|
5月前
|
机器学习/深度学习 人工智能 算法
|

基于深度学习的摔倒检测系统

针对人口老龄化背景下老年人摔倒问题突出,传统检测方法存在佩戴不便、隐私泄露等局限,本研究基于深度学习技术,利用YOLOv8模型与Python开发非接触式摔倒检测系统。通过高效算法与高质量数据集实现精准识别,具备实时性高、适应性强等优势,可广泛应用于家庭、社区及医疗机构,有效提升老年人安全监护水平,减轻照护负担,推动人工智能在智慧医疗领域的融合应用。

289 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439957
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务