|
2月前
|
人工智能 负载均衡 安全
|

云上AI推理平台全掌握 (3):服务接入与全球调度

阿里云人工智能平台 PAI 平台推出的全球化的服务接入矩阵,为 LLM 服务量身打造了专业且灵活的服务接入方案,正重新定义 AI 服务的高可用接入标准——从单地域 VPC 安全隔离到跨洲际毫秒级调度,让客户的推理服务在任何网络环境下都能实现「接入即最优」。

133 0
来自: 人工智能平台PAI  版块
|
2月前
|
人工智能 自然语言处理 并行计算
|

大模型面经:任务、clip、diffusion

本文简要介绍了文本生成的常见预训练任务(如MLM、CLM、NSP等),多模态模型中的SOTA模型及CLIP的优势,以及多模态大模型如Stable Diffusion的原理。重点解析了Stable Diffusion的扩散机制与图像生成流程,帮助理解其高效性和广泛应用的原因。

141 5
|
2月前
|
人工智能 数据可视化 API
|

科学界的“外挂”?AI正加速改变发现的方式!

科学界的“外挂”?AI正加速改变发现的方式!

124 3
|
2月前
|
SQL JSON 分布式计算
|

Spark SQL架构及高级用法

Spark SQL基于Catalyst优化器与Tungsten引擎,提供高效的数据处理能力。其架构涵盖SQL解析、逻辑计划优化、物理计划生成及分布式执行,支持复杂数据类型、窗口函数与多样化聚合操作,结合自适应查询与代码生成技术,实现高性能大数据分析。

208 2
|
2月前
|
人工智能 自然语言处理 搜索推荐
|

AI 搜索 MCP 最佳实践

本文介绍了如何通过 MCP 协议,快速调用阿里云 OpenSearch 、ElasticSearch 等工具,帮助企业快速集成工具链、降低开发复杂度、提升业务效率。

289 29
|
3月前
|
JavaScript 前端开发 Java
|

垃圾分类管理系统基于 Spring Boot Vue 3 微服务架构实操指南

本文介绍了基于Java技术的垃圾分类管理系统开发方案与实施案例。系统采用前后端分离架构,后端使用Spring Boot框架搭配MySQL数据库,前端可选择Vue.js或Java Swing实现。核心功能模块包括垃圾分类查询、科普教育、回收预约等。文中提供了两个典型应用案例:彭湖花园小区使用的Swing桌面系统和基于Spring Boot+Vue的城市管理系统,分别满足不同场景需求。最新技术方案升级为微服务架构,整合Spring Cloud、Redis、Elasticsearch等技术,并采用Docker容器

172 0
|
3月前
|
人工智能 大数据 Swift
|

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

136 5
|
3月前
|
数据采集 存储 数据可视化
|

Python爬取招标信息并生成可视化分析报告

Python爬取招标信息并生成可视化分析报告

225 0
|
3月前
|
人工智能 分布式计算 大数据
|

大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)

本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。

170 0
|
3月前
|
数据采集 搜索推荐 算法
|

Java 大视界 -- Java 大数据在智能教育学习社区用户互动分析与社区活跃度提升中的应用(274)

本文系统阐述 Java 大数据技术在智能教育学习社区中的深度应用,涵盖数据采集架构、核心分析算法、活跃度提升策略及前沿技术探索,为教育数字化转型提供完整技术解决方案。

116 10
|
3月前
|
机器学习/深度学习 数据可视化 算法
|

数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律

本文深入探讨了数据科学中分布识别的重要性及其实践方法。作为数据分析的基础环节,分布识别影响后续模型性能与分析可靠性。文章从直方图的可视化入手,介绍如何通过Python代码实现分布特征的初步观察,并系统化地讲解参数估计、统计检验及distfit库的应用。同时,针对离散数据、非参数方法和Bootstrap验证等专题展开讨论,强调业务逻辑与统计结果结合的重要性。最后指出,正确识别分布有助于异常检测、数据生成及预测分析等领域,为决策提供可靠依据。作者倡导在实践中平衡模型复杂度与实用性,重视对数据本质的理解。

232 3
|
3月前
|
机器学习/深度学习 自然语言处理 并行计算
|

提升长序列建模效率:Mamba+交叉注意力架构完整指南

本文探讨了Mamba架构中交叉注意力机制的集成方法,Mamba是一种基于选择性状态空间模型的新型序列建模架构,擅长处理长序列。通过引入交叉注意力,Mamba增强了多模态信息融合和条件生成能力。文章从理论基础、技术实现、性能分析及应用场景等方面,详细阐述了该混合架构的特点与前景,同时分析了其在计算效率、训练稳定性等方面的挑战,并展望了未来优化方向,如动态路由机制和多模态扩展,为高效序列建模提供了新思路。

266 1
|
4月前
|
数据采集 机器学习/深度学习 自然语言处理
|

NLP助力非结构化文本抽取:实体关系提取实战

本文介绍了一套基于微博热帖的中文非结构化文本分析系统,通过爬虫代理采集数据,结合NLP技术实现实体识别、关系抽取及情感分析。核心技术包括爬虫模块、请求配置、页面采集和中文NLP处理,最终将数据结构化并保存为CSV文件或生成图谱。代码示例从基础正则规则到高级深度学习模型(如BERT-BiLSTM-CRF)逐步演进,适合初学者与进阶用户调试与扩展,展现了中文NLP在实际场景中的应用价值。

234 3
|
4月前
|
人工智能 并行计算 开发者
|

CUDA重大更新:原生Python可直接编写高性能GPU程序

NVIDIA在2025年GTC大会上宣布CUDA并行计算平台正式支持原生Python编程,消除了Python开发者进入GPU加速领域的技术壁垒。这一突破通过重新设计CUDA开发模型,引入CUDA Core、cuPyNumeric、NVMath Python等核心组件,实现了Python与GPU加速的深度集成。开发者可直接用Python语法进行高性能并行计算,显著降低门槛,扩展CUDA生态,推动人工智能、科学计算等领域创新。此更新标志着CUDA向更包容的语言生态系统转型,未来还将支持Rust、Julia等语言。

319 3
|
4月前
|
PyTorch 调度 算法框架/工具
|

阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析

DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案

196 18
来自: 人工智能平台PAI  版块
|
5月前
|
人工智能 自然语言处理 搜索推荐
|

AI 搜索开放平台重磅发布:Qwen3 模型上线啦

阿里云AI搜索开放平台重磅发布最新Qwen3模型,为企业和开发者提供全栈智能搜索解决方案。Qwen3作为最新一代大模型,在推理、多语言支持和Agent能力上表现卓越。用户可通过三步快速体验Qwen3服务,助力业务在AI时代抢占先机。

571 13
来自: 智能搜索推荐  版块
|
5月前
|
SQL 数据可视化 关系型数据库
|

Quick BI 测评报告

Quick BI是阿里云推出的零代码可视化分析工具,适合个人开发者与小微团队使用。其核心优势在于轻量化启动(免费试用+按量付费)、多源接入(MySQL、MongoDB等)及敏捷分析能力(拖拽式仪表板)。实测显示,它支持智能CSV解析、语法高亮SQL编辑器和25+基础图表类型,具备图表联动交互功能。尽管缺少3D地图和自定义JS插件支持,但凭借低学习成本、OpenAPI扩展性以及移动端报表查看功能,Quick BI在个人项目展示、团队协作和轻量级数据分析中表现出色。不过,复杂计算需依赖SQL,移动端编辑和PDF导出存在局限性。

218 3
|
5月前
|
SQL 人工智能 数据挖掘
|

quickbi使用总结以及问题反馈

本文总结了使用QuickBI高级版及电子表格的功能体验与改进建议。内容涵盖具体报表使用(如趋势分析表、多维趋势表)、函数及其他模块(如LOD函数、自助取数)、AI智能问数模块以及数据集使用的优缺点。指出趋势分析表在复合指标处理上的不足,多维趋势表对比周期限制,以及1万条明细数据限制对年同比的影响等问题。同时提出未来期望,希望建立结合企业知识库的大模型,优化数据分析与建议能力。

498 46
来自: 数据可视化DataV  版块
|
5月前
|
机器学习/深度学习 人工智能 算法
|

AI鱼类识别技术原理及示例代码

本文详细解析了AI鱼类识别的代码示例,涵盖深度学习框架选择、数据集处理、模型构建与训练优化全流程。内容包括技术选型对比(如TensorFlow、PyTorch、YOLO系列)、数据准备流程(开源数据集与标注规范)、完整代码示例(以PyTorch版ResNet50改进模型为例)以及模型优化策略(如量化压缩、知识蒸馏)。此外,还提供了典型应用场景(如渔业资源监测系统)、模型评估指标及开源项目推荐,并针对常见问题(小样本、水下模糊、类别不平衡等)提出解决方案。

357 5
|
6月前
|
传感器 人工智能 定位技术
|

智能手表续航太短?聊聊可穿戴设备的能耗管理黑科技

智能手表续航太短?聊聊可穿戴设备的能耗管理黑科技

253 11
|
6月前
|
存储 人工智能 自然语言处理
|

方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索

阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。

486 2
|
6月前
|
传感器 人工智能 算法
|

智能眼镜,从科技幻想到现实生活的触手可及

智能眼镜,从科技幻想到现实生活的触手可及

216 22
|
6月前
|
人工智能 自然语言处理 搜索推荐
|

阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024

在新加坡 ElasticON 2025 的 Elastic 合作伙伴峰会上,阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024!

211 1
|
7月前
|
JSON API 开发者
|

淘宝淘口令转换API接口(淘宝API系列)

淘宝淘口令转换API是用于将淘宝商品或店铺链接与淘口令进行双向转换的接口,支持HTTP POST请求。开发者可通过此API生成或解析淘口令,方便在不同平台传播淘宝内容,吸引更多潜在客户。API返回JSON格式数据,包含转换结果和状态信息。使用前需注册并申请权限,确保调用稳定可靠。示例代码展示了如何通过Python实现淘口令的生成和解析功能。

215 5
|
7月前
|
机器学习/深度学习 人工智能 缓存
|

云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核,显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA,实现了约 16% 的性能提升。

569 10
来自: 人工智能平台PAI  版块
|
7月前
|
机器学习/深度学习 存储 缓存
|

LLM高效推理:KV缓存与分页注意力机制深度解析

随着大型语言模型(LLM)规模和复杂性的增长,高效推理变得至关重要。KV缓存和分页注意力是优化LLM推理的两项关键技术。KV缓存通过存储键值对减少重复计算,而分页注意力则通过将序列分割成小块来降低内存消耗,从而有效处理长序列。本文深入剖析这些技术的工作原理及其在仅解码器模型中的应用,探讨其优势与挑战,并展示其实现示例。

307 16
|
7月前
|
人工智能 自然语言处理 数据可视化
|

ElasticSearch AI Assistant 系列 2 —— Kibana 自带样例挑战

本视频介绍了如何在Elastic平台上配置AI助手以兼容并连接阿里巴巴的通义千问的第二部分——Kibana 自带样例挑战。 演示: 挑战1:ES集群和索引交互操作 1.1 请列出当前集群的索引,不要包含隐藏索引或者系统索引 1.2 比较kibana_sample_data_ecommerce和kibana_sample_data_flights两个索引到字段,有哪些重复的字段 1.3:复制kibana_sample_data_ecommerce的索引定义,并创建一个新的索引my_sample_data_ecommerce 1.4:将kibana_sample_data_ecommerce数据重新索引到my_sample_data_ecommerce索引 自行挑战示例 挑战2:智能数据分析和可视化 自然语言2ES|QL 2.1:可以分析kibana_sample_data_ecommerce的字段之间的关系,随便给我生成一张统计图表,并解释这个图表表达的含义吗, 使用ESQL查询语言 2.2:能帮我找出来卖的最多的品类最多是哪个吗 2.3:列出销售额前5的品类

154 0
|
7月前
|
传感器 物联网 大数据
|

物联网与大数据:揭秘万物互联的新纪元

物联网与大数据:揭秘万物互联的新纪元

257 7
|
7月前
|
存储 分布式计算 物联网
|

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台,实现了数据与 AI 技术的有效融合,解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台,最终实现不同场景下整体性能提升50%以上,同时综合成本下降30%。

552 58
|
7月前
|
存储 供应链 安全
|

区块链在物流管理中的应用:让货物管理变得更智能

区块链在物流管理中的应用:让货物管理变得更智能

770 14
|
7月前
|
机器学习/深度学习 PyTorch TensorFlow
|

DGL(0.8.x) 技术点分析

DGL是由Amazon发布的图神经网络开源库,支持TensorFlow、PyTorch和MXNet。DGL采用消息传递范式进行图计算,包括边上计算、消息函数、点上计算、聚合与更新函数等。其架构分为顶层业务抽象、Backend多后端适配、Platform高效计算适配以及C++性能敏感功能层,确保高效、灵活的图神经网络开发。

231 21
|
7月前
|
存储 机器学习/深度学习 PyTorch
|

PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率

本文探讨了机器学习项目中指标收集对训练性能的影响,特别是如何通过简单实现引入不必要的CPU-GPU同步事件,导致训练时间增加约10%。使用TorchMetrics库和PyTorch Profiler工具,文章详细分析了性能瓶颈的根源,并提出了多项优化措施

285 1
|
8月前
|
安全 前端开发 数据库
|

Python 语言结合 Flask 框架来实现一个基础的代购商品管理、用户下单等功能的简易系统

这是一个使用 Python 和 Flask 框架实现的简易代购系统示例,涵盖商品管理、用户注册登录、订单创建及查看等功能。通过 SQLAlchemy 进行数据库操作,支持添加商品、展示详情、库存管理等。用户可注册登录并下单,系统会检查库存并记录订单。此代码仅为参考,实际应用需进一步完善,如增强安全性、集成支付接口、优化界面等。

300 1
|
8月前
|
人工智能 搜索推荐 算法
|

解决方案评测|主动式智能导购AI助手构建

阿里云的主动式智能导购AI助手是电商商家提升用户体验和销量的利器。它能实时分析用户行为,提供个性化推荐,支持多渠道无缝对接,并具备语音和文本交互功能。通过注册阿里云账号、开通服务、配置项目、设置推荐策略、集成到平台并测试优化,商家可以轻松部署这一工具。关键代码示例帮助理解API对接和数据处理。建议增强个性化推荐算法、优化交互体验并增加自定义选项,以进一步提升效果。

546 11
|
9月前
|
运维 监控 DataWorks
|

DataWorks 稳定性保障全解析:深入监控与资源调配

DataWorks 的稳定性保障体系涵盖精细监控与资源调配,确保企业数据业务高效、稳定运行。监控模块包括资源、任务和质量监控,及时预警并处理异常;资源调配策略则针对集成、调度、数据服务及计算资源进行科学配置,保障数据同步、任务优先级和高并发需求。通过全方位的监控和合理的资源配置,DataWorks 为企业筑牢数据根基,助力数字化转型。

311 10
|
9月前
|
存储 人工智能 算法
|

深度解读面向大模型开发和应用的数据处理套件

本文深入解读了大数据与AI联合场景下的技术,重点探讨了大语言模型、多模态模型训练及应用数据处理。文章首先分析了算法、算力和数据在大模型训练中的重要性,强调数据采集、标注和质量控制的关键作用。接着介绍了PAI平台上的端到端数据处理套件,涵盖预训练、有监督微调和偏好对齐的数据处理流程,以及数据合成和蒸馏技术的应用。最后展望了未来在多模态处理、性能优化和行业解决方案方面的扩展方向。

489 3
来自: 人工智能平台PAI  版块
|
9月前
|
消息中间件 JSON 数据库
|

探索Flink动态CEP:杭州银行的实战案例

本文由杭州银行大数据工程师唐占峰、欧阳武林撰写,介绍Flink动态CEP的定义、应用场景、技术实现及使用方式。Flink动态CEP是基于Flink的复杂事件处理库,支持在不重启服务的情况下动态更新规则,适应快速变化的业务需求。文章详细阐述了其在反洗钱、反欺诈和实时营销等金融领域的应用,并展示了某金融机构的实际应用案例。通过动态CEP,用户可以实时调整规则,提高系统的灵活性和响应速度,降低维护成本。文中还提供了具体的代码示例和技术细节,帮助读者理解和使用Flink动态CEP。

1061 2
来自: 实时计算 Flink  版块
|
9月前
|
机器学习/深度学习 监控 算法
|

机器学习在图像识别中的应用:解锁视觉世界的钥匙

机器学习在图像识别中的应用:解锁视觉世界的钥匙

1036 95
|
9月前
|
IDE 测试技术 开发工具
|

10个必备Python调试技巧:从pdb到单元测试的开发效率提升指南

在Python开发中,调试是提升效率的关键技能。本文总结了10个实用的调试方法,涵盖内置调试器pdb、breakpoint()函数、断言机制、logging模块、列表推导式优化、IPython调试、警告机制、IDE调试工具、inspect模块和单元测试框架的应用。通过这些技巧,开发者可以更高效地定位和解决问题,提高代码质量。

943 8
|
9月前
|
人工智能 搜索推荐 安全
|

智能家居:AI如何让我们的生活更便捷

智能家居:AI如何让我们的生活更便捷

469 7
|
9月前
|
存储 算法 数据挖掘
|

重磅发布 | OpenSearch推出向量检索GPU图算法方案并支持GPU规格售卖

OpenSearch向量检索版推出了面向企业开发者的GPU图算法方案(CAGRA算法),支持客户直接购买GPU规格节点,是国内首家支持GPU规格的向量检索产品。

636 12
|
9月前
|
算法
|

基于GA遗传算法的PID控制器参数优化matlab建模与仿真

本项目基于遗传算法(GA)优化PID控制器参数,通过空间状态方程构建控制对象,自定义GA的选择、交叉、变异过程,以提高PID控制性能。与使用通用GA工具箱相比,此方法更灵活、针对性强。MATLAB2022A环境下测试,展示了GA优化前后PID控制效果的显著差异。核心代码实现了遗传算法的迭代优化过程,最终通过适应度函数评估并选择了最优PID参数,显著提升了系统响应速度和稳定性。

618 15
|
10月前
|
数据采集 存储 监控
|

Java爬虫:数据采集的强大工具

在数据驱动的时代,Java爬虫技术凭借其强大的功能和灵活性,成为企业获取市场信息、用户行为及竞争情报的关键工具。本文详细介绍了Java爬虫的工作原理、应用场景、构建方法及其重要性,强调了在合法合规的前提下,如何有效利用Java爬虫技术为企业决策提供支持。

715 2
|
10月前
|
机器学习/深度学习 数据采集 数据处理
|

Scikit-learn Pipeline完全指南:高效构建机器学习工作流

Scikit-learn管道是构建高效、鲁棒、可复用的机器学习工作流程的利器。通过掌握管道的使用,我们可以轻松地完成从数据预处理到模型训练、评估和部署的全流程,极大地提高工作效率。

191 2
|
10月前
|
存储 监控 数据处理
|

flink 向doris 数据库写入数据时出现背压如何排查?

本文介绍了如何确定和解决Flink任务向Doris数据库写入数据时遇到的背压问题。首先通过Flink Web UI和性能指标监控识别背压,然后从Doris数据库性能、网络连接稳定性、Flink任务数据处理逻辑及资源配置等方面排查原因,并通过分析相关日志进一步定位问题。

705 61
|
10月前
|
Java API 调度
|

如何避免 Java 中的 TimeoutException 异常

在Java中,`TimeoutException`通常发生在执行操作超过预设时间时。要避免此异常,可以优化代码逻辑,减少不必要的等待;合理设置超时时间,确保其足够完成正常操作;使用异步处理或线程池管理任务,提高程序响应性。

480 13
|
10月前
|
数据采集 前端开发 JavaScript
|

除了网页标题,还能用爬虫抓取哪些信息?

爬虫技术可以抓取网页上的各种信息,包括文本、图片、视频、链接、结构化数据、用户信息、价格和库存、导航菜单、CSS和JavaScript、元数据、社交媒体信息、地图和位置信息、广告信息、日历和事件信息、评论和评分、API数据等。通过Python和BeautifulSoup等工具,可以轻松实现数据抓取。但在使用爬虫时,需遵守相关法律法规,尊重网站的版权和隐私政策,合理控制请求频率,确保数据的合法性和有效性。

277 1
zdl
|
10月前
|
消息中间件 运维 大数据
|

大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群

本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。

408 56
来自: 实时计算 Flink  版块
|
10月前
|
机器学习/深度学习 数据采集 数据库
|

使用Python实现智能食品营养分析的深度学习模型

使用Python实现智能食品营养分析的深度学习模型

380 6