|
25天前
|
存储 数据挖掘 OLAP
|

数仓入门篇-维度模型与第三范式

第三范式(3NF)是关系数据库规范化核心标准,要求消除传递依赖,确保数据无冗余、“一事一地”。维度模型则面向分析优化,采用星型结构与反规范化设计,以牺牲存储换查询性能与业务可读性。二者各适其用:3NF用于OLTP系统保一致性,维度模型用于OLAP场景提分析效率。(239字)

193 5
|
1月前
|
编译器 程序员 C语言
|

C语言深度解析:未定义行为(UB)—— 90%玄学bug的根源

C语言因极致性能与硬件控制力成为系统开发首选,但其“自由”伴生未定义行为(UB):语法合法却结果不可控,是“调试正常、上线崩溃”的元凶。UB包括数组越界、有符号溢出、空指针解引用、序列点违规、重复释放等,编译器可任意优化或崩溃。规避需严守边界、开启高警告、判空置空、拆分表达式、预检溢出。(239字)

242 8
|
1月前
|
Serverless
|

阿里云产品二月刊来啦

千问 Qwen3.5-Plus 重磅登场,百炼 Coding Plan 支持多款开闭源模型,桌面 Agent 工具 CoPaw 开源,函数计算 AgentRun 重磅上线知识库功能|产品二月刊

329 6
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

手把手教程:五分钟构建你的春节祝福AI

手把手教你零基础打造春节祝福AI!无需深度学习经验或高端显卡,5步搞定:准备50+条祝福数据→选用LLaMA-Factory Online平台→微调Qwen3-7B等小模型→在线测试生成效果→一键部署API。5分钟上手,轻松定制温情/搞笑/商务等多风格祝福,为新春增添科技年味!

296 0
|
2月前
|
存储 人工智能 JSON
|

从入门到实践:不懂代码也能微调大模型,普通人AI进阶指南

本文详解大模型微调:为何需要(让AI更懂你)、原理何在(参数微调如“专项特训”)、如何实操(四步完成数据准备→云端训练→参数配置→效果评估),并指出工具平民化正使个性化AI触手可及。(239字)

319 4
|
2月前
|
数据采集 人工智能 监控
|

让大模型“开小灶”:手把手教你打造能聊业务的专属AI

本文深入浅出解析AI微调(Fine-tuning)技术:揭示通用大模型“懂常识却不懂行”的根源,详解LoRA等高效微调原理,对比RAG适用场景,并提供数据准备、LoRA训练、效果评估到部署的四步实践指南。助力业务人员低成本打造专属行业AI助手。(239字)

269 0
|
2月前
|
算法
|

标注不规范,大模型全白练:聊聊训练大模型背后的规模化数据治理与标注流水线

标注不规范,大模型全白练:聊聊训练大模型背后的规模化数据治理与标注流水线

211 1
|
3月前
|
存储 人工智能 关系型数据库
|

传统数据库与向量数据库:一个管“是什么”,一个管“像什么”

向量数据库是AI时代的语义检索引擎,将文本、图片等非结构化数据转化为“语义向量”,支持基于相似性的毫秒级搜索。它不替代MySQL等传统数据库,而是作为大模型的“海马体”,赋能RAG、智能问答与多模态应用,实现从“关键词匹配”到“理解含义”的跃迁。(239字)

522 7
|
3月前
|
数据采集
|

静态IP购买常见问题及解决方案

静态IP因稳定、适用广,成企业刚需,但购买易踩坑。本文梳理IP纯度低、带宽虚标、地域偏差、售后差、计费不透明、合规风险6大问题,提供避坑指南,助你高效选购合规、稳定的独享静态IP,保障业务顺畅运行。(238字)

339 1
|
3月前
|
存储 机器学习/深度学习 人工智能
|

构建AI智能体:八十一、SVD模型压缩的艺术:如何科学选择K值实现最佳性能

本文探讨了SVD(奇异值分解)在深度学习模型压缩中的应用。随着模型规模不断扩大,面临的存储、计算和能耗问题日益突出。SVD通过将大型矩阵分解为三个特殊矩阵(U、Σ、Vᵀ),并根据奇异值大小进行截断,实现模型的高效压缩。文章详细分析了SVD的数学原理、压缩机制和参数选择策略,重点讨论了如何通过能量保留、目标压缩率和拐点检测等方法确定最佳截断秩k。以一个500×300的用户-物品矩阵为例,实证显示k=32时能实现82.93%的压缩率,99.97%的能量保留和5.86倍计算加速,达到了精度损失与压缩收益的最佳平衡

280 5
|
4月前
|
JSON 缓存 前端开发
|

什么是跨域

CORS(跨域资源共享)是W3C标准,允许浏览器向跨源服务器发起XMLHttpRequest请求,突破AJAX同源限制。浏览器自动处理CORS通信,开发者无需特殊编码。关键在于服务器需实现CORS接口。请求分为简单和非简单两类,后者会先发送OPTIONS预检。相比仅支持GET的JSONP,CORS更强大且安全,兼容现代浏览器。

127 0
|
4月前
|
NoSQL Shell Redis
|

Redis集群伸缩,转移插槽失败

Redis集群出现节点配置不一致,提示slot 0处于importing状态。需登录对应实例,执行`cluster setslot 0 stable`命令,恢复slot稳定状态,修复问题后再进行集群重平衡操作。注意根据实际slot ID调整命令参数。

124 0
|
4月前
|
XML Java 数据库连接
|

MyBatis映射关系(1-1 1-n n-n)

本文介绍了MyBatis中四种核心关联映射:一对一(属性与字段映射)、一对多(如用户关联多个角色,使用`<collection>`)、多对一(如博客关联作者,使用`<association>`)和多对多(通过中间类实现,如用户与部门)。适用于解决实体间复杂关系映射问题。

145 1
|
4月前
|
存储 数据采集 供应链
|

CNFans模式淘宝1688代购系统搭建指南

CNFans代购系统整合1688供应链与淘宝渠道,为跨境用户提供一站式代购服务。通过API对接实现商品、订单、支付数据自动化,支持多币种结算与全程物流追踪。面向小微电商、海外代购及价格敏感型消费者,提供代购、质检、仓储、物流等全流程服务,保障正品与性价比。盈利涵盖服务费、增值服务、广告与会员订阅,打造安全透明的跨境代购生态平台。(239字)

337 0
|
5月前
|
存储 Web App开发 前端开发
|

新手如何建站.新手建站的全流程

建站是通过整合域名、服务器等要素搭建可访问数字平台的过程,分自助建站、CMS系统和代码开发三类工具。核心流程包括需求规划、域名注册(实名认证)、服务器配置(国内需ICP备案),搭建后填充内容并测试优化,解析域名上线,做好后续维护。

578 10
来自: 人工智能平台PAI  版块
|
5月前
|
关系型数据库 MySQL PHP
|

0 基础建站?PageAdmin CMS 10 分钟搞定,源码免费拿!

PageAdmin CMS 为无编程基础用户提供高效建站方案。步骤包括:准备服务器、域名及源码;上传源码并配置数据库;通过安装向导完成基础设置;在后台创建栏目、填充内容;测试功能后上线。全程无需编程,简单操作即可搭建独立网站,支持后续维护与扩展。

573 1
|
5月前
|
人工智能 机器人 数据处理
|

ICLR2026 !SAM3重磅来袭:能“听懂人话”的分割模型,性能狂飙2倍

Lab4AI.cn覆盖全周期科研支撑平台,提供论文速递、AI翻译和AI导读工具辅助论文阅读;支持投稿论文复现和Github项目复现,动手复现感兴趣的论文;论文复现完成后,您可基于您的思路和想法,开启论文创新与成果转化。

949 6
来自: 人工智能平台PAI  版块
|
5月前
|
人工智能 测试技术 Python
|

AI也有“智商”吗?我们到底该用什么标准来评估它?

AI也有“智商”吗?我们到底该用什么标准来评估它?

836 8
|
5月前
|
人工智能 自然语言处理 供应链
|

低代码开发启蒙教程

低代码通过拖拽组件与可视化配置快速构建应用,支持数据编排、流程设计与多端发布,适用于OA系统、智能客服等场景,结合少量代码可扩展复杂功能,提升开发效率80%。

443 1
来自: 数据可视化DataV  版块
|
5月前
|
人工智能 分布式计算 大数据
|

阿里云大数据AI产品月刊-2025年10月

大数据& AI 产品技术月刊【2025年 10 月】,涵盖 10 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

454 1
|
8月前
|
JSON API 数据格式
|

抖音商品列表API秘籍!轻松获取商品列表页面数据

抖音商品列表API是抖音开放平台的核心电商接口,支持按分类、关键词、销量等条件筛选商品,具备分页、排序、数据过滤等功能,适用于电商整合、竞品分析等场景。接口返回JSON格式数据,包含商品列表、总数及分页信息,提供Python请求示例,便于开发者快速接入。

525 0
|
8月前
|
存储 机器学习/深度学习 人工智能
|

MXFP4量化:如何在80GB GPU上运行1200亿参数的GPT-OSS模型

GPT-OSS通过MXFP4量化技术实现1200亿参数模型在单个80GB GPU上的高效运行,将权重压缩至每参数4.25位,大幅降低内存需求,同时保持高精度和竞争力的基准性能,为大规模模型部署提供了新思路。

717 13
|
8月前
|
人工智能 自然语言处理 Java
|

面向 Java 开发者:2024 最新技术栈下 Java 与 AI/ML 融合的实操详尽指南

Java与AI/ML融合实践指南:2024技术栈实战 本文提供了Java与AI/ML融合的实操指南,基于2024年最新技术栈(Java 21、DJL 0.27.0、Spring Boot 3.2等)。主要内容包括: 环境配置:详细说明Java 21、Maven依赖和核心技术组件的安装步骤 图像分类服务:通过Spring Boot集成ResNet-50模型,实现REST接口图像分类功能 智能问答系统:展示基于RAG架构的文档处理与向量检索实现 性能优化:利用虚拟线程、GraalVM等新技术提升AI服务性能 文

787 0
|
9月前
|
SQL 安全 BI
|

Dataphin数据服务API行级权限管控解决方案 ——构建企业级数据安全的精细化管控体系

Dataphin数据服务推出行级权限管控功能,解决传统权限管理中用户权限分散、管控复杂等问题。支持直连与代理双模式访问,实现API与SQL权限统一管理,满足金融、零售、医疗等行业对数据访问的精细化控制需求。通过动态权限决策引擎和自动化继承体系,确保数据安全且提升应用开发效率。

848 0
|
10月前
|
存储 安全 Java
|

2025 年最新 40 个 Java 基础核心知识点全面梳理一文掌握 Java 基础关键概念

本文系统梳理了Java编程的40个核心知识点,涵盖基础语法、面向对象、集合框架、异常处理、多线程、IO流、反射机制等关键领域。重点包括:JVM运行原理、基本数据类型、封装/继承/多态三大特性、集合类对比(ArrayList vs LinkedList、HashMap vs TreeMap)、异常分类及处理方式、线程创建与同步机制、IO流体系结构以及反射的应用场景。这些基础知识是Java开发的根基,掌握后能为后续框架学习和项目开发奠定坚实基础。文中还提供了代码资源获取方式,方便读者进一步实践学习。

2479 2
|
10月前
|
Oracle Java 关系型数据库
|

java 入门学习视频_2025 最新 java 入门零基础学习视频教程

《Java 21 入门实操指南(2025年版)》提供了Java最新特性的开发指导。首先介绍了JDK 21和IntelliJ IDEA 2025.1的环境配置,包括环境变量设置和预览功能启用。重点讲解了Java 21三大核心特性:虚拟线程简化高并发编程,Record模式优化数据解构,字符串模板提升字符串拼接可读性。最后通过图书管理系统案例,展示如何运用Record定义实体类、使用Stream API进行数据操作,以及结合字符串模板实现控制台交互。该指南完整呈现了从环境搭建到实际项目开发的Java 21全流程实

576 1
|
10月前
|
数据采集 机器学习/深度学习 Web App开发
|

Python爬虫如何应对贝壳网的IP封禁与人机验证?

Python爬虫如何应对贝壳网的IP封禁与人机验证?

1091 5
|
11月前
|
SQL 分布式计算 大数据
|

大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南

本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容,并通过互联网广告和物流行业案例分析,展示其实际应用。具有专业性、可操作性和参考价值。

789 78
|
12月前
|
存储 人工智能 监控
|

通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索

阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。

1059 2
|
机器学习/深度学习 人工智能 算法
|

强化学习:Gym的库的实践——小车上山(包含强化学习基础概念,环境配置国内镜像加速)——手把手教你入门强化学习(一)

本文开启“手把手教你入门强化学习”专栏,介绍强化学习基础概念及实践。强化学习通过智能体与环境交互,学习最优策略以最大化累积奖励,适用于复杂动态决策问题。文章讲解智能体、环境等核心概念,并使用Gym库进行案例实操,如CartPole和MountainCar环境的代码实现。最后预告下期将深入马尔科夫决策过程(MDP)。适合初学者系统了解强化学习并动手实践。创作不易,欢迎关注、点赞与收藏!

1644 4
来自: 人工智能平台PAI  版块
|
数据采集 机器学习/深度学习 数据可视化
|

探索大数据分析的无限可能:R语言的应用与实践

探索大数据分析的无限可能:R语言的应用与实践

564 9
|
算法 数据安全/隐私保护
|

基于Adaboost的数据分类算法matlab仿真

本程序基于Adaboost算法进行数据分类的Matlab仿真,对比线性与非线性分类效果。使用MATLAB2022A版本运行,展示完整无水印结果。AdaBoost通过迭代训练弱分类器并赋予错分样本更高权重,最终组合成强分类器,显著提升预测准确率。随着弱分类器数量增加,训练误差逐渐减小。核心代码实现详细,适合研究和教学使用。

303 4
|
人工智能 运维 自然语言处理
|

Elasticsearch AI Assistant 集成 DeepSeek,1分钟搭建智能运维助手

Elasticsearch 新支持 DeepSeek 系列模型,使用 AI 助手,通过自然语言交互,为可观测性分析、安全运维管理及数据智能处理提供一站式解决方案。

1468 3
|
分布式计算 大数据 数据挖掘
|

大数据的第一步:初学者指南

大数据的第一步:初学者指南

420 70
|
人工智能 自然语言处理 搜索推荐
|

AI在教育中的潜力与挑战:开启智慧教育的新时代

AI在教育中的潜力与挑战:开启智慧教育的新时代

1388 19
|
JSON 数据库 数据格式
|

[开发技巧] 如何获取汉字笔画数?

在开发卜筮小脚本时遇到获取汉字笔画数的需求,起初尝试使用`pypinyin`库却未得理想结果。经过探索,发现Unicode联盟维护的Unihan数据库提供准确的汉字笔画数据。通过下载Unihan数据库文件,解析其中的`kTotalStrokes`字段,利用正则表达式提取所需信息,并将其保存为JSON格式以供快速查询。最终编写函数`get_character_stroke_count`实现任意汉字笔画数的高效获取,满足了项目需求并提供了准确的数据支持。此方法不仅解决了问题,还为类似需求提供了参考方案。

693 10
|
存储 SQL 缓存
|

Flink 2.0 存算分离状态存储 — ForSt DB 

本文整理自阿里云技术专家兰兆千在Flink Forward Asia 2024上的分享,主要介绍Flink 2.0的存算分离架构、全新状态存储内核ForSt DB及工作进展与未来展望。Flink 2.0通过存算分离解决了本地磁盘瓶颈、检查点资源尖峰和作业恢复速度慢等问题,提升了云原生部署能力。ForSt DB作为嵌入式Key-value存储内核,支持远端读写、批量并发优化和快速检查点等功能。性能测试表明,ForSt在异步访问和本地缓存支持下表现卓越。未来,Flink将继续完善SQL Operator的异步优化,并引入更多流特性支持。

1459 88
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 PyTorch
|

Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers

本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。

853 3
|
机器学习/深度学习 人工智能 PyTorch
|

使用Pytorch构建视觉语言模型(VLM)

视觉语言模型(Vision Language Model,VLM)正在改变计算机对视觉和文本信息的理解与交互方式。本文将介绍 VLM 的核心组件和实现细节,可以让你全面掌握这项前沿技术。我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。

525 2
|
数据采集 运维 DataWorks
|

DataWorks on EMR StarRocks,打造标准湖仓新范式

本文整理自阿里云计算平台产品专家周硕(簌篱)在阿里云DataWorks on EMR StarRocks解决方案介绍中的分享。介绍了阿里云DataWorks与EMR Serverless StarRocks的结合使用,详细阐述了在数据同步、数据消费、数据治理三大场景中的核心能力。DataWorks作为大数据开发治理平台,提供了从数据建模、数据集成、数据开发到数据治理的全链路解决方案,结合StarRocks的高性能分析能力,帮助企业实现OLAP分析、湖仓一体开发及数据综合治理,满足复杂业务场景下的需求,提升数据处理和分析效率。

601 4
|
运维 算法
|

基于Lipschitz李式指数的随机信号特征识别和故障检测matlab仿真

本程序基于Lipschitz李式指数进行随机信号特征识别和故障检测。使用MATLAB2013B版本运行,核心功能包括计算Lipschitz指数、绘制指数曲线、检测故障信号并标记异常区域。Lipschitz指数能够反映信号的局部动态行为,适用于机械振动分析等领域的故障诊断。

388 4
|
数据采集 机器学习/深度学习 数据可视化
|

过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比

本文介绍了处理不平衡数据集的过采样和欠采样技术,包括随机过采样、SMOTE、ADASYN、随机欠采样、Tomek Links、Near Miss 和 ENN 等方法。通过二维数据集的可视化示例,直观展示了各种方法的原理和效果差异。文章还讨论了混合采样方法(如SMOTETomek和SMOTEENN)以及应用这些方法的潜在风险,强调了在实际应用中审慎选择的重要性。

1101 3
|
iOS开发 MacOS Python
|

【10月更文挑战第1天】「Mac上学Python 1」入门篇1 - 安装Typora与Markdown编辑技巧

本篇将详细介绍如何在Mac系统上安装Typora这款简洁高效的Markdown编辑器,并学习Markdown常用语法。通过本篇,用户能够准备好记录学习笔记的工具,并掌握基本的文档编辑与排版技巧,为后续学习提供便利。

591 1
|
数据采集 安全 API
|

数据治理:实现原始数据不出域,确保数据可用不可见的创新策略

在数字化时代,数据成为企业宝贵资产,驱动业务决策与创新。然而,数据量激增和流通频繁带来了安全和管理挑战。“原始数据不出域,数据可用不可见”的治理理念应运而生,通过数据脱敏、沙箱技术和安全多方计算等手段,确保数据安全共享与高效利用。这一理念已广泛应用于金融、医疗等行业,提升了数据价值和企业竞争力。

2947 0
|
存储 Ubuntu 搜索推荐
|

构建多用户的 Jupyter 服务器 —— 利用 JupyterHub

【8月更文第29天】**摘要** JupyterHub 是一个易于使用的、可伸缩的、多用户的 Jupyter Notebook 服务器。它允许您在一个集中式服务器上托管多个独立的 Jupyter Notebook 会话,非常适合团队协作和教学环境。本文将详细介绍如何安装和配置 JupyterHub,以及如何利用它来构建一个多用户 Jupyter 服务器环境。

5516 0
|
XML 存储 API
|

RAG效果优化:高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

17162 15
来自: 智能搜索推荐  版块
|
机器学习/深度学习 算法 数据挖掘
|

深度学习中常用损失函数介绍

选择正确的损失函数对于训练机器学习模型非常重要。不同的损失函数适用于不同类型的问题。本文将总结一些常见的损失函数,并附有易于理解的解释、用法和示例

1550 0
|
DataWorks API 数据库
|

DataWorks操作报错合集之在使用 OceanBase (OB) 作为数据源进行数据集成时遇到报错,该如何排查

DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

454 1
|
机器学习/深度学习 数据可视化 测试技术
|

统计学入门:时间序列分析基础知识详解

本文探讨了时间序列分析的核心概念,包括自协方差、自相关和平稳性。通过Python实现和图形化展示了这些概念,以增进理解。时间序列涉及观察随时间变化的数据,如心率或温度。自协方差和自相关衡量数据点之间的关系,滞后表示时间间隔。弱平稳性意味着均值、方差和协方差不随时间变化。文章介绍了自回归(AR)、移动平均(MA)、ARMA和ARIMA模型,用于描述不同类型的序列行为。统计检验如ADF和Durbin-Watson用于检测平稳性和残差自相关。ARIMA模型特别适用于非平稳数据,通过差分实现平稳化。文章还提供了代码示例和可视化来辅助学习。

965 4
|
Cloud Native Java API
|

Java一分钟之-Micronaut:轻量级微服务框架

【6月更文挑战第16天】Micronaut是面向JVM的微服务框架,以其快速启动、低内存占用著称。文章探讨了配置管理、注解理解和AOT编译的挑战,提供了解决方案,并通过一个简单的HTTP服务示例展示了如何创建控制器和应用启动类。通过克服这些问题,开发者能更好地利用Micronaut构建高效微服务。

598 8

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

9
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务