大数据与机器学习-最热-第36页-阿里云开发者社区

IvanCodes

|

11月前

|

SQL 关系型数据库 MySQL

|

博文

三、Sqoop 全量导入核心命令

在大数据处理过程中，数据库表怎么高效导入到 Hadoop？这一篇我带大家实战讲解 Sqoop 全量导入的用法，从基础命令到常用参数配置，再到导入到 HDFS、Hive 的各种格式案例，配合实操示例，帮你一步步掌握全量导入技巧。最后还有练习题，供大家动手巩固一下。

510 2 2

啦啦啦191

|

11月前

|

Java

|

博文

Java基础语法与面向对象

重载（Overload）指同一类中方法名相同、参数列表不同，与返回值无关；重写（Override）指子类重新实现父类方法，方法名和参数列表必须相同，返回类型兼容。重载发生在同类，重写发生在继承关系中。

268 1 1

Q一个好的名字容易让人记住你2483558220

|

11月前

|

JavaScript Java 关系型数据库

|

博文

基于springboot的电影购票管理系统

本系统基于Spring Boot框架，结合Vue、Java与MySQL技术，实现电影信息管理、在线选座、购票支付等核心功能，提升观众购票体验与影院管理效率，推动电影产业数字化发展。

604 9 9

Deephub

|

11月前

|

机器学习/深度学习自然语言处理 PyTorch

|

博文

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

掩码注意力是生成模型的核心，通过上三角掩码限制模型仅关注当前及之前token，确保自回归因果性。相比BERT的双向注意力，它实现单向生成，是GPT等模型逐词预测的关键机制，核心仅需一步`masked_fill_`操作。

771 0 0

Deephub

|

11月前

|

机器学习/深度学习算法数据可视化

|

博文

从另一个视角看Transformer：注意力机制就是可微分的k-NN算法

注意力机制可理解为一种“软k-NN”：查询向量通过缩放点积计算与各键的相似度，softmax归一化为权重，对值向量加权平均。1/√d缩放防止高维饱和，掩码控制信息流动（如因果、填充）。不同相似度函数（点积、余弦、RBF）对应不同归纳偏置，多头则在多个子空间并行该过程。

715 7 7

Q一个好的名字容易让人记住你2483558220

|

11月前

|

JavaScript Java 关系型数据库

|

博文

基于springboot的家政服务预约系统

随着社会节奏加快与老龄化加剧，家政服务需求激增，但传统模式存在信息不对称、服务不规范等问题。基于Spring Boot、Vue、MySQL等技术构建的家政预约系统，实现服务线上化、标准化与智能化，提升用户体验与行业效率，推动家政服务向信息化、规范化发展。

569 3 3

Deephub

|

11月前

|

数据采集机器学习/深度学习搜索推荐

|

博文

MIT新论文：数据即上限，扩散模型的关键能力来自图像统计规律，而非复杂架构

MIT与丰田研究院研究发现，扩散模型的“局部性”并非源于网络架构的精巧设计，而是自然图像统计规律的产物。通过线性模型仅学习像素相关性，即可复现U-Net般的局部敏感模式，揭示数据本身蕴含生成“魔法”。

405 3 3

Q一个好的名字容易让人记住你2483558220

|

11月前

|

搜索推荐算法 JavaScript

|

博文

基于springboot的健康饮食营养管理系统

本系统基于Spring Boot、Vue与MySQL技术，融合大数据与AI算法，构建个性化健康饮食管理平台。结合用户身体状况、目标需求，智能推荐营养方案，助力科学饮食与健康管理。

772 2 2

蒋星熠Jaxonic

|

11月前

|

人工智能自然语言处理算法

|

博文

现代AI工具深度解析：从GPT到多模态的技术革命与实战应用

蒋星熠Jaxonic，AI技术探索者，深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略，助力开发者提升效率，共赴智能编程新纪元。

489 4 4

Echo_Wish

|

11月前

|

存储人工智能监控

|

博文

看得清、判得准、动得快：智能摄像头如何优化安全监控系统

317 3 3

leobur

|

11月前

|

人工智能搜索推荐 SEO

|

博文

【1分钟解密】如何让 AI 大模型推荐你的品牌

随着AI逐渐取代传统搜索，企业如何让AI“看见”并“信任”你？GEO（生成式引擎优化）应运而生，它不仅是SEO的延伸，更是让AI主动推荐你的关键策略。通过优化内容结构、提升权威性与可读性，GEO助力企业在AI生成的答案中占据一席之地，赢得未来流量入口。

888 5 6

来自：智能搜索推荐版块

奔跑的数据

|

11月前

|

数据采集 JSON 自然语言处理

|

博文

超越传统XPath：用LLM理解复杂网页信息

本文深入探讨网页信息抽取技术的演进，从传统 XPath/CSS 结构匹配，到结合 LLM（大语言模型）的语义理解方法。分析了旧技术在动态渲染、结构变化和语义识别方面的局限，并通过架构图、实验数据和示例代码展示 LLM 在新闻、电商、社交等复杂场景中的高效应用。同时强调爬虫代理等基础设施的重要性，为信息抓取提供稳定网络环境。

476 1 1

Deephub

|

11月前

|

机器学习/深度学习数据采集算法

|

博文

量子机器学习入门：三种数据编码方法对比与应用

在量子机器学习中，数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法，分析其原理、实现及适用场景，帮助读者选择最适合的编码策略，提升量子模型性能。

833 8 8

winx_19970108018

|

11月前

|

算法 API 数据安全/隐私保护

|

博文

深度解析京东图片搜索API：从图像识别到商品匹配的算法实践

京东图片搜索API基于图像识别技术，支持通过上传图片或图片URL搜索相似商品，提供智能匹配、结果筛选、分页查询等功能。适用于比价、竞品分析、推荐系统等场景。支持Python等开发语言，提供详细请求示例与文档。

894 5 5

奔跑的数据

|

11月前

|

数据采集监控 C#

|

博文

构建一个“会思考”的房地产数据获取脚本

本文探讨如何借鉴认知科学中的“自适应”理念，设计具备环境反馈调整能力的智能爬虫系统，用于高效监测房地产市场信息。

173 0 0

Echo_Wish

|

11月前

|

搜索推荐数据挖掘大数据

|

博文

数据能不能养出“死忠粉”？聊聊用数据驱动品牌忠诚度的那些事

265 6 6

探索云世界

|

11月前

|

SQL 人工智能分布式计算

|

博文

ODPS十五周年实录|构建 AI 时代的大数据基础设施

本文根据 ODPS 十五周年·年度升级发布实录整理而成，演讲信息如下：张治国：阿里云智能集团技术研究员、阿里云智能计算平台事业部 ODPS-MaxCompute 负责人活动：【数据进化·AI 启航】ODPS 年度升级发布

492 9 9

Deephub

|

11月前

|

机器学习/深度学习人工智能 JSON

|

博文

微软rStar2-Agent：新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

Microsoft Research最新推出的rStar2-Agent在AIME24数学基准测试中以80.6%的准确率超越超大规模模型DeepSeek-R1，展现“思考更聪明”而非“更长”的AI推理新方向。

384 8 8

奔跑的数据

|

11月前

|

数据采集算法搜索推荐

|

博文

面向教育平台的分层内容采集思路

随着在线教育平台快速发展，其内容采集需应对层级化、动态更新及访问限制等挑战。本文提出分层采集方案，结合代理服务与异步爬虫技术，实现高效稳定的数据抓取，适用于教育平台及其他内容型平台的数据采集需求。

244 1 1

软件算法开发

|

12月前

|

算法机器人定位技术

|

博文

基于机器视觉和Dijkstra算法的平面建筑群地图路线规划matlab仿真

本程序基于机器视觉与Dijkstra算法，实现平面建筑群地图的路径规划。通过MATLAB 2022A读取地图图像，识别障碍物并进行路径搜索，支持鼠标选择起点与终点，最终显示最优路径及长度，适用于智能导航与机器人路径规划场景。

318 5 5

Echo_Wish

|

12月前

|

机器学习/深度学习自然语言处理监控

|

博文

保险行业的“算命术”？——数据驱动的风险评估真相

286 6 6

Echo_Wish

|

12月前

|

机器学习/深度学习数据采集搜索推荐

|

博文

277 0 0

来自：人工智能平台PAI 版块

网络AI

|

12月前

|

问答

本文探讨了Java大数据技术在智能医疗手术风险评估与术前方案制定中的创新应用。通过多源数据整合、智能分析模型构建及知识图谱技术，提升手术风险预测准确性与术前方案制定效率，助力医疗决策智能化，推动精准医疗发展。

324 0 0

灵杰开发者

|

1月前

|

技术作品

【FFA 2026】主论坛

158 1

来自：实时计算 Flink 版块

游客vv4u4wyick5ti

|

2月前

|

机器学习/深度学习 SQL 运维

|

博文

Aloudata Agent 分析技能详解：从一个业务问题到一份可用分析

一场完整的分析闭环：口径确认、名单融合、结果呈现、因子拆解、维度下钻、明细验证、What-if 测算、报告交付。

117 0 0

爱专研的技术土狗

|

2月前

|

监控搜索推荐算法

|

博文

Java 获取淘宝图搜接口（拍立淘）开发文档

本文系统介绍淘宝图片搜索API（拍立淘）在Java环境下的两种主流接入方案：淘宝开放平台TOP接口与阿里云图像搜索服务，涵盖接入准备、图片要求、签名算法、完整代码实现及常见问题解决方案，适用于电商比价、内容带货等场景。

362 0 0

奔跑的数据

|

2月前

|

数据采集监控 JavaScript

|

博文

全面复盘：BeautifulSoup在处理大规模脏数据时的崩溃问题与解法

本文深度剖析BeautifulSoup在大规模脏数据处理中的三大崩溃场景：内存溢出、中文乱码、畸形HTML卡死，并提供经生产验证的解决方案——流式解析+SoupStrainer、多级智能编码探测、解析器降级+超时熔断，以及进程隔离重启机制。（239字）

158 0 0

游客tg2jszfthwlu2

|

2月前

|

人工智能 JSON 自然语言处理

|

博文

从RAG工程到企业数字资产：艾索四标融合GEO方法论V2.0升级版的技术架构解读

本文介绍福建艾索“四标融合GEO方法论V2.0”，将GB/T 23011、45341、45988及ISO/IEC 42001四大国标深度嵌入RAG架构，聚焦语义匹配度、证据密度与信源权威性三大权重维度，实现品牌知识在大模型检索中的高权重工程化落地。（239字）

228 1 1

来自：智能搜索推荐版块

卿云阁

|

2月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

人工智能|大白话GPT

GPT-1是首个基于Transformer解码器的生成式预训练模型，采用自回归方式逐词生成文本：以起始，依上下文预测下一词，循环直至。其核心为12层Decoder-only架构，通过掩码自注意力实现单向语言建模，并支持分类、蕴含等下游任务微调。（239字）

258 1 1

aliyun9540770103

|

2月前

|

机器学习/深度学习编解码算法

|

博文

基于YOLO11的无人机影像海上油污分类与分割 (数据集+代码+模型+界面)

用无人机影像进行海上油污分类与分割 1. 引言在这里插入图片描述随着全球工业化进程的加速，海洋石油泄漏事件的发生频率逐年增加。这些事故不仅对环境造成巨大破坏，也给人类健康和社会经济带来了严重影响。为了有效应对和管理这类突发事件，及时准确地检测、分类并分割出海面上的油污区域变得至关重要。近年来，借助无人机（UAV, Unmanned Aerial Vehicle）获取高分辨率影像数据，并结合先进的图像处理和机器学习技术，为实现这一目标提供了新的解决方案。本篇文章将详细介绍如何利用无人机拍摄的视频片段来完成海上油污的分类与分割任务，涵盖从数据收集到模型训练再到结果分析的全流程。 2.

171 0 0

aliyun9540770103

|

2月前

|

机器学习/深度学习数据采集 TensorFlow

|

博文

基于ResNet50的鱼类识别系统设计图像分类识别

155 0 0

卿云阁

|

2月前

|

机器学习/深度学习数据可视化 PyTorch

|

博文

PyTorch深度学习实战 |手算变分自编码器（VAE）

本文详解变分自编码器（VAE）原理：指出传统自编码器因潜在空间无序而无法生成新图像；VAE通过引入概率建模，用高斯分布近似后验，并结合重构损失与KL散度优化，使潜在空间连续可采样，从而实现可控图像生成。含公式推导、重参数化技巧及完整代码实现。（239字）

292 1 1

aliyun9540770103

|

2月前

|

机器学习/深度学习数据采集自然语言处理

|

博文

基于LSTM的时间序列预测研究

133 0 0

卿云阁

|

2月前

|

机器学习/深度学习人工智能数据可视化

|

博文

手算神经网络

本文介绍了使用2×3×1神经网络实现房价预测的全过程。首先通过手动计算演示了单个样本的前向传播和反向传播，包括权重初始化和梯度更新。随后使用PyTorch实现了完整的神经网络模型，包含数据准备、网络结构定义、损失函数计算和优化器设置。在训练过程中记录了损失值变化，并可视化展示训练效果。最后提供了一个挖空版本的代码框架，帮助读者逐步完成神经网络的关键实现步骤，包括导入包、定义网络框架、数据准备、训练循环和结果可视化等模块。通过这个完整的项目实践，读者可以掌握神经网络从理论到实现的全流程。

125 0 0

aliyun9540770103

|

2月前

|

机器学习/深度学习数据可视化安全

|

博文

实在智能在实在Agent v7.3.4中推出TARS AI元素定位技术，通过视觉-语义联合建模，实现多模态编码、语义锚点生成与动态匹配优化，显著提升RPA在敏捷前端环境下的元素识别稳定性与自适应能力，配置即用，助力企业自动化迈向真正无人值守。（239字）

329 7 7

py世界

|

3月前

|

问答

我在文本分析，想要从Wikipedia上批量抓取特定主题下的所有条目摘要和链接，该怎么做？

128 1 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

三、Sqoop 全量导入核心命令

Java基础语法与面向对象

基于springboot的电影购票管理系统

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

从另一个视角看Transformer：注意力机制就是可微分的k-NN算法

基于springboot的家政服务预约系统

MIT新论文：数据即上限，扩散模型的关键能力来自图像统计规律，而非复杂架构

基于springboot的健康饮食营养管理系统

现代AI工具深度解析：从GPT到多模态的技术革命与实战应用

看得清、判得准、动得快：智能摄像头如何优化安全监控系统

【1分钟解密】如何让 AI 大模型推荐你的品牌

超越传统XPath：用LLM理解复杂网页信息

量子机器学习入门：三种数据编码方法对比与应用

深度解析京东图片搜索API：从图像识别到商品匹配的算法实践

构建一个“会思考”的房地产数据获取脚本

数据能不能养出“死忠粉”？聊聊用数据驱动品牌忠诚度的那些事

ODPS十五周年实录|构建 AI 时代的大数据基础设施

微软rStar2-Agent：新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

面向教育平台的分层内容采集思路

基于机器视觉和Dijkstra算法的平面建筑群地图路线规划matlab仿真

保险行业的“算命术”？——数据驱动的风险评估真相

手表只会报步数？别闹了，用神经网络优化健康监测才是王道

1688图片搜索API秘籍！轻松获取相似商品数据

Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用（229）

Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现（218）

京东商品评论API秘籍！轻松获取商品评论数据

京东商品详情API秘籍！轻松获取商品详情数据

在接入阿里云垃圾识别api的时候，使用官方文档中：“文件在本地 ”的代码，运行之后报错。

阿里云香港服务器延迟高怎么解决。。。。。

北京百思可瑞教育：模拟天气这件事，量子计算机轻松实现模拟天气气候

WebAssembly 与 Java 结合的跨语言协作方案及性能提升策略研究

Java 大视界 -- Java 大数据在智能医疗手术风险评估与术前方案制定中的应用探索（203）

【FFA 2026】主论坛

Aloudata Agent 分析技能详解：从一个业务问题到一份可用分析

Java 获取淘宝图搜接口（拍立淘）开发文档

全面复盘：BeautifulSoup在处理大规模脏数据时的崩溃问题与解法

从RAG工程到企业数字资产：艾索四标融合GEO方法论V2.0升级版的技术架构解读

人工智能|大白话GPT

基于YOLO11的无人机影像 海上油污分类与分割 (数据集+代码+模型+界面)

基于ResNet50的鱼类识别系统设计 图像分类识别

PyTorch深度学习实战 |手算​​变分自编码器（VAE）

基于LSTM的时间序列预测研究

手算神经网络

基于YOLOv11肺结节检测系统 医学图像诊断识别

一个基于 .NET 与 Avalonia 构建、面向 TrinityCore 的开源 WoW 数据库编辑器

AR 智能眼镜智正优化警务领域的日常巡逻和排查麻烦的难点

代购转运运费计算引擎：从硬编码到规则配置，taocarts给的设计思路

作为CTO，我发现：越来越多人把月度订阅预算，留给了AI

用AI重塑RPA稳定性：实在Agent TARS语义定位技术拆解与落地实践

我在文本分析，想要从Wikipedia上批量抓取特定主题下的所有条目摘要和链接，该怎么做？

大数据与机器学习

活跃用户

相关产品

基于YOLO11的无人机影像海上油污分类与分割 (数据集+代码+模型+界面)

基于ResNet50的鱼类识别系统设计图像分类识别

PyTorch深度学习实战 |手算变分自编码器（VAE）

基于YOLOv11肺结节检测系统医学图像诊断识别