大数据与机器学习-博文-第47页-阿里云开发者社区

Java开发者

|

IDE Java 应用服务中间件

|

博文

Java“NoSuchFieldError”解决

“NoSuchFieldError”是Java中常见的运行时错误，通常由于访问不存在的类字段引起。解决方法包括：检查字段拼写、确保类路径正确、更新依赖库版本等。

1826 4 4

奔跑的数据

|

数据采集人工智能文字识别

|

博文

如何绕过Captcha并使用OCR技术抓取数据

在现代网页数据抓取中，Captcha作为一种防止爬虫和恶意访问的措施，广泛应用于各种网站。本文介绍如何使用OCR技术绕过文字Captcha，并通过代理IP技术提高爬虫的隐蔽性。具体实现包括下载Captcha图片、使用Tesseract OCR识别文字、通过代理IP抓取目标数据。示例代码展示了如何抓取大众点评的商家信息。

591 0 0

Deephub

|

监控 PyTorch 数据处理

|

博文

通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

在 PyTorch 中，`pin_memory` 是一个重要的设置，可以显著提高 CPU 与 GPU 之间的数据传输速度。当 `pin_memory=True` 时，数据会被固定在 CPU 的 RAM 中，从而加快传输到 GPU 的速度。这对于处理大规模数据集、实时推理和多 GPU 训练等任务尤为重要。本文详细探讨了 `pin_memory` 的作用、工作原理及最佳实践，帮助你优化数据加载和传输，提升模型性能。

1355 4 4

suruili11

|

Java Apache Maven

|

博文

将word文档转换成pdf文件方法

在Java中，将Word文档转换为PDF文件可采用多种方法：1) 使用Apache POI和iText库，适合处理基本转换需求；2) Aspose.Words for Java，提供更高级的功能和性能；3) 利用LibreOffice命令行工具，适用于需要开源解决方案的场景。每种方法都有其适用范围，可根据具体需求选择。

1837 2 2

郑小健

|

机器学习/深度学习自然语言处理数据挖掘

|

博文

从理论到实践：详解GraphRAG框架下的多模态内容理解与生成

【10月更文挑战第10天】随着多媒体内容的爆炸性增长，如何有效地理解和生成跨模态的数据（如图像、文本和视频）变得越来越重要。近年来，图神经网络（GNNs）因其在处理非结构化数据方面的强大能力而受到广泛关注。在此背景下，Graph Retrieval-Augmented Generation (GraphRAG) 框架作为一种新的方法，通过结合图检索和生成模型来提升多模态内容的理解与生成效果。本文将深入探讨GraphRAG的基本原理、核心组件以及实际应用，并通过代码示例展示其在多媒体内容处理中的潜力。

2007 0 0

Deephub

|

机器学习/深度学习数据采集数据挖掘

|

博文

特征工程在营销组合建模中的应用：基于因果推断的机器学习方法优化渠道效应估计

因果推断方法为特征工程提供了一个更深层次的框架，使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要，如经济学、医学和市场营销。

593 1 2

郑小健

|

JavaScript 前端开发测试技术

|

博文

精通Selenium：从基础到高级的网页自动化测试策略

【10月更文挑战第6天】随着Web应用变得越来越复杂，手动进行功能和兼容性测试变得既耗时又容易出错。自动化测试因此成为了现代软件开发不可或缺的一部分。Selenium是一个强大的工具集，它支持多种编程语言（包括Python），允许开发者编写脚本来模拟用户与Web页面的交互。本文将带领读者从Selenium的基础知识出发，逐步深入到高级的应用场景，通过丰富的代码示例来展示如何高效地进行网页自动化测试。

2184 5 5

爱专研的技术土狗

|

API 定位技术

|

博文

api接口如何对接？（带你了解api接口的相关知识）

API接口是在产品和研发领域广泛应用的专业术语，主要用于公司内部系统衔接及公司间合作。本文将详细讲解API接口的概念、必要性及其核心要素。首先介绍API接口的基本原理与应用场景，随后阐述其重要性，最后解析API接口的核心组成部分，帮助读者深入理解API接口的工作机制。适合产品小白和求职者阅读，提升专业知识。

1493 0 0

码小匠

|

BI Linux API

|

博文

掌握 SkiaSharp 轻松实现 .NET 跨平台绘图

.NET 框架的发展，我们越来越多地寻求能够在多个平台上无缝运行的应用解决方案。

2295 2 2

蚂蚁数据智能技术

|

人工智能数据可视化前端开发

|

博文

DB-GPT v0.6.0 版本更新，发布六大核心新特性！

DB-GPT v0.6.0 版本已发布，这是一个开源的AI原生数据应用开发框架，带来了多项新特性，包括AWEL协议升级至2.0，支持复杂编排；改进的数据应用创建与生命周期管理，支持多模式构建；GraphRAG增强图社区摘要与混合检索，图索引成本降低50%；丰富的Agent Memory类型；支持Text2NLU与Text2GQL微调；GPT-Vis前端可视化升级。这些更新助力企业快速构建智能数据应用，推动数字化转型。

868 3 3

来自：开源大数据平台 E-MapReduce 版块

c的前世今生

|

安全 C语言

|

博文

C 标准库 - <stddef.h>详解

`<stddef.h>` 是 C 标准库的一个头文件，定义了常用类型和宏，包括 `size_t`（表示对象大小）、`ptrdiff_t`（指针间差值）、`NULL`（空指针）和 `offsetof`（计算结构体成员偏移量）。

389 1 1

果宝爱

|

存储传感器数据采集

|

博文

大数据

大数据是指数据量庞大（Volume）、增长迅速（Velocity）、类型多样（Variety）、价值密度低（Value）但潜力巨大的数据集。其来源包括互联网、物联网及企业内部数据。处理技术涵盖采集、预处理、存储、分析与可视化。应用领域涉及商业智能、金融、医疗、交通及公共服务等，助力决策优化与创新。

981 8 8

郑小健

|

消息中间件 Prometheus 监控

|

博文

RabbitMQ性能调优指南

【8月更文第28天】RabbitMQ 是一个非常流行的消息队列中间件，它支持多种消息协议，并且可以轻松集成到各种系统中。随着应用的扩展，确保 RabbitMQ 在高负载环境下能够高效稳定地运行变得至关重要。本文将深入探讨如何通过配置、监控以及最佳实践来优化 RabbitMQ 的性能。

2369 1 1

郑小健

|

机器学习/深度学习并行计算 PyTorch

|

博文

PyTorch与DistributedDataParallel：分布式训练入门指南

【8月更文第27天】随着深度学习模型变得越来越复杂，单一GPU已经无法满足训练大规模模型的需求。分布式训练成为了加速模型训练的关键技术之一。PyTorch 提供了多种工具来支持分布式训练，其中 DistributedDataParallel (DDP) 是一个非常受欢迎且易用的选择。本文将详细介绍如何使用 PyTorch 的 DDP 模块来进行分布式训练，并通过一个简单的示例来演示其使用方法。

2342 2 3

Deephub

|

机器学习/深度学习 Python

|

博文

时间序列特征提取：从理论到Python代码实践

时间序列是一种特殊的存在。这意味着你对表格数据或图像进行的许多转换/操作/处理技术对于时间序列来说可能根本不起作用。

542 1 2

Echo_Wish

|

机器学习/深度学习数据采集传感器

|

博文

使用Python实现深度学习模型：智能空气质量监测与预测

【8月更文挑战第21天】使用Python实现深度学习模型：智能空气质量监测与预测

1663 3 3

holiofox

|

机器学习/深度学习人工智能自然语言处理

|

博文

卷积神经网络（CNN）：视觉识别的革命先锋

卷积神经网络（CNN）作为人工智能领域的一颗璀璨明珠，在计算机视觉中发挥着核心作用。CNN的发展历程展现了从生物学灵感到技术创新的转变，历经LeNet-5至AlexNet、VGGNet、ResNet等里程碑式的进步。其独特结构包括卷积层、池化层及全连接层，能够层层递进地提取特征并作出决策。CNN不仅在图像分类、目标检测等领域表现卓越，还在人脸识别、医学影像分析等方面展现出巨大潜力。尽管存在局限性，如对序列数据处理能力有限及解释性问题，但通过引入注意力机制、自监督学习等方法，CNN将持续演进，引领人工智能技术走向更加精彩的未来。

1056 2 2

来自：人工智能平台PAI 版块

123proxy

|

数据采集监控大数据

|

博文

不限量住宅IP代理指南2024版

住宅IP代理是一种特别的代理形式，它通过互联网服务提供商（ISP）池获取真实住宅用户的IP地址。在此背景下，住宅IP通常与特定的物理位置绑定，从而在网络上看起来像是真实用户。该服务为企业及个人执行数据密集型活动时提供了可靠的支持

1185 1 1

扬流

|

SQL 人工智能分布式计算

|

博文

MaxCompute 产品新能力发布-2024年Q1

随着阿里云MaxCompute4.0的产品新版本发布，越来越多的MaxCompute产品新能力被客户广泛关注，包括近实时查询/湖仓一体&开放架构/容灾备份等。在此我们对外整体介绍一下MaxCompute FY25-Q1产品新功能，帮助更多用户借此了解MaxCompute4.0云原生数仓新版本的重点产品特性，核心竞争力与典型用户场景等信息。

626 1 1

来自：大数据计算 MaxCompute 版块

三分钟热度的鱼

|

机器学习/深度学习人工智能分布式计算

|

博文

人工智能平台PAI操作报错合集之引用github.com/alibaba/pairec包时报错，该如何解决

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台，旨在降低AI开发门槛，加速创新，助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务，共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述，涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

357 0 0

来自：人工智能平台PAI 版块

实时数仓Hologres团队

|

存储 SQL OLAP

|

博文

分析性能提升40%，阿里云Hologres流量场景最佳实践

25463 22 32

来自：实时数仓 Hologres 版块

aliyun0925406400-41188

|

机器学习/深度学习数据采集算法

|

博文

Python实现贝叶斯岭回归模型(BayesianRidge算法)并使用K折交叉验证进行模型评估项目实战

560 1 1

来自：人工智能平台PAI 版块

阿里云大数据Al技术

|

机器学习/深度学习算法开发工具

|

博文

大语言模型的直接偏好优化（DPO）对齐在PAI-QuickStart实践

阿里云的人工智能平台PAI，作为一站式的机器学习和深度学习平台，对DPO算法提供了全面的技术支持。无论是开发者还是企业客户，都可以通过PAI-QuickStart轻松实现大语言模型的DPO对齐微调。本文以阿里云最近推出的开源大型语言模型Qwen2（通义千问2）系列为例，介绍如何在PAI-QuickStart实现Qwen2的DPO算法对齐微调。

35778 2 6

来自：人工智能平台PAI 版块

aliyun0925406400-41188

|

数据采集机器学习/深度学习数据挖掘

|

博文

基于Python实现时间序列分析建模(ARIMA模型)项目实战

1110 0 0

来自：人工智能平台PAI 版块

AIGC小王子

|

分布式计算大数据数据处理

|

博文

「大数据」Kappa架构

**Kappa架构**聚焦于流处理，用单一处理层应对实时和批量数据，消除Lambda架构的双重系统。通过数据重放保证一致性，简化开发与维护，降低成本，提升灵活性。然而，资源消耗大，复杂查询处理不易。关键技术包括Apache Flink、Spark Streaming、Kafka、DynamoDB等，适合需实时批量数据处理的场景。随着流处理技术进步，其优势日益凸显。

898 0 0

AIGC小王子

|

自然语言处理算法 API

|

博文

「AIGC」Python实现tokens算法

使用Python的`transformers`库，通过`AutoTokenizer`初始化BERT tokenizer，对文本进行分词统计，减少API调用。示例展示从开始到结束的时间，包括文本转换为tokens的数量和过程耗时。

638 0 0

winx_19970108018

|

供应链 API UED

|

博文

Pandabuy VS Hagobuy 淘宝代购集运系统巨头，类似软件如何开发？

Pandabuy & Hoobuy是知名的淘宝代购集运平台，它们提供一站式购物物流服务。开发此类系统涉及市场定位、API接口集成、供应链管理、平台设计、支付物流整合及用户体验优化。例如，通过c0b.cc/R4rbK2可获取API测试，而成功的系统需确保用户友好性、多语言支持、国际支付与物流追踪，同时提供客服以保证高满意度。

633 0 0

实时数仓Hologres团队

|

SQL 存储 OLAP

|

博文

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

3270 8 10

来自：实时数仓 Hologres 版块

游客h2vchmlwqitbk

|

开发工具 git

|

博文

Jupyter Lab操作文档

**Jupyter Lab 概览：**集成编辑器、终端和自定义组件的环境。可定制主题、显示行号、切换语言。使用时，了解界面布局，通过`Ctrl+Enter`运行代码，`Shift+Enter`前进，`Alt+Enter`新建行。利用Markdown写作，通过Terminal执行命令，用快捷键提升效率，如`a/b`增删单元格，`m/y`切换模式。文件上传下载可使用OBS或终端工具。

842 0 0

奔跑的数据

|

数据采集 Web App开发数据处理

|

博文

一步步教你用Python Selenium抓取动态网页任意行数据

使用Python Selenium爬取动态网页，结合代理IP提升抓取效率。安装Selenium，配置代理（如亿牛云），设置User-Agent和Cookies以模拟用户行为。示例代码展示如何使用XPath提取表格数据，处理异常，并通过隐式等待确保页面加载完成。代理、模拟浏览器行为和正确配置增强爬虫性能和成功率。

2177 3 3

长梦

|

Java API 数据库

|

博文

Java一分钟之-JPA注解：@Entity, @Table, @Id等

【6月更文挑战第14天】Java Persistence API (JPA) 是Java开发中的ORM框架，通过注解简化数据访问层。本文介绍了三个核心注解：`@Entity`标识实体类，`@Table`自定义表名，`@Id`定义主键。易错点包括忘记添加`@Entity`、未正确设置主键。建议使用`@GeneratedValue`和`@Column`细化主键策略和字段映射。正确理解和应用这些注解能提高开发效率和代码质量。

1348 3 3

郑小健

|

监控网络协议 JavaScript

|

博文

WebSocket技术详解与应用指南

WebSocket是全双工TCP协议，解决HTTP的单向通信问题，允许服务器主动推送信息。本文档介绍了WebSocket的基本概念、工作原理（基于HTTP握手，通过帧进行数据通信）、应用场景（实时聊天、在线游戏、数据监控等）和实现方法（客户端使用JavaScript API，服务器端有多种编程语言库支持）。学习WebSocket能提升Web应用的实时性和交互性。

2862 1 1

kng32f3vbngrm

|

SQL 分布式计算 Java

|

博文

DataGrip 配置 HiveServer2 远程连接访问（含账号密码验证）

该文档介绍了如何为HiveServer2配置账号密码鉴权。提供了一个名为`CustomPasswdAuthenticator`的Java类实现`PasswdAuthenticationProvider`接口，用于验证HiveServer2的用户名和密码。此外，还给出了相关依赖的Maven配置，并说明了如何将编译后的Jar包放入Hive的库中。在Hive的`hive-site.xml`和Hadoop的`core-site.xml`中需配置相应的参数以启用自定义认证。文档还列举了可能遇到的问题及解决方法，包括权限问题、数据插入错误和JVM内存溢出。

1262 3 3

kng32f3vbngrm

|

SQL 分布式计算 Hadoop

|

博文

org.apache.hadoop.security.AccessControlException Permission denied: user=anonymous, access=WRITE...

在尝试通过 HiveServer2 远程执行 DDL 操作时遇到权限错误，错误信息显示匿名用户（`anonymous`）无权执行写操作。解决方案包括：1) 使用 `hdfs dfs -chmod -R +777 /warehouse` 给目录授权（不推荐，仅适用于测试环境）；2) 配置 Hive 和 Hadoop，创建具有权限的用户，如 `ad`，并将该用户添加到 Hive 的管理员角色和 Hadoop 的 proxyuser 配置中，然后重启相关服务。通过 `beeline` 测试连接和操作，确认权限问题已解决。

1225 0 0

kng32f3vbngrm

|

SQL HIVE UED

|

博文

【Hive SQL 每日一题】分析电商平台的用户行为和订单数据

作为一名数据分析师，你需要分析电商平台的用户行为和订单数据。你有三张表：`users`（用户信息），`orders`（订单信息）和`order_items`（订单商品信息）。任务包括计算用户总订单金额和数量，按月统计订单，找出最常购买的商品，找到平均每月最高订单金额和数量的用户，以及分析高消费用户群体的年龄和性别分布。通过SQL查询，你可以实现这些分析，例如使用`GROUP BY`、`JOIN`和窗口函数来排序和排名。

1325 2 2

kng32f3vbngrm

|

SQL 缓存分布式计算

|

博文

手把手教你解决 Hive 的数据倾斜

数据倾斜是 Hive 中影响任务执行效率的现象，表现为某些任务处理的数据量或耗时远超其他任务。根本原因是 Shuffle 后 Key 分布不均，导致部分 Reduce 负载过高。常见场景包括空值聚合、不可拆分大文件、数值膨胀、不同数据类型 Join、Count(distinct) 计算以及表 Join 操作。解决方法包括过滤空值、转换数据类型、调整聚合策略、使用 MapJoin 等。通过合理优化，如设置 `hive.groupby.skewindata` 和 `hive.map.aggr` 参数，可以有效缓解数据倾斜问题。

2512 2 3

蓝易云

|

PyTorch 算法框架/工具

|

博文

在conda中如何查看安装的pytorch版本 - 蓝易云

这个命令会列出所有与pytorch相关的包，包括它们的版本号。你可以在列表中找到pytorch的版本号。

1679 1 1

Byyyi

|

SQL 存储 Java

|

博文

Hive 拉链表详解及实例

拉链表是一种数据仓库技术，用于处理持续增长且存在时间范围内的重复数据，以节省空间。它在Hive中通过列式存储ORC实现，适用于大规模数据场景，尤其当数据在有限时间内有多种状态变化。配置涉及事务管理和表合并选项。示例中展示了如何从原始订单表创建拉链表，通过聚合操作和动态分区减少数据冗余。增量数据可通过追加到原始表然后更新拉链表来处理。提供的Java代码用于生成模拟的订单增量数据，以演示拉链表的工作流程。

916 3 4

Deephub

|

算法数据可视化数据挖掘

|

博文

Barnes-Hut t-SNE:大规模数据的高效降维算法

Barnes-Hut t-SNE是一种针对大规模数据集的高效降维算法，它是t-SNE的变体，用于高维数据可视化。t-SNE通过保持概率分布相似性将数据从高维降至2D或3D。Barnes-Hut算法采用天体物理中的方法，将时间复杂度从O(N²)降低到O(NlogN)，通过构建空间索引树和近似远距离交互来加速计算。在scikit-learn中可用，代码示例展示了如何使用该算法进行聚类可视化，成功分离出不同簇并获得高轮廓分数，证明其在大數據集上的有效性。

501 1 1

长梦

|

SQL 运维监控

|

博文

面经：Presto/Trino高性能SQL查询引擎解析

【4月更文挑战第10天】本文深入探讨了大数据查询引擎Trino（现称Trino）的核心特性与应用场景，适合面试准备。重点包括：Trino的分布式架构（Coordinator与Worker节点）、连接器与数据源交互、查询优化（CBO、动态过滤）及性能调优、容错与运维实践。通过实例代码展示如何解释查询计划、创建自定义连接器以及查看查询的I/O预期。理解这些知识点将有助于在面试中脱颖而出，并在实际工作中高效处理数据分析任务。

1145 12 12

阿里云大数据Al技术

|

人工智能编解码对象存储

|

博文

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

145826 185 203

来自：人工智能平台PAI 版块

游客svbiygeelfxu4

|

人工智能缓存机器人

|

博文

【2024】英伟达吞噬世界！新架构超级GPU问世，AI算力一步提升30倍

英伟达在加州圣荷西的GTC大会上发布了全新的Blackwell GPU，这款拥有2080亿个晶体管的芯片将AI性能推向新高度，是公司对通用计算时代的超越。Blackwell采用多芯片封装设计，通过两颗GPU集成，解决了内存局部性和缓存问题，提供20 petaflops的FP4算力，是上一代产品的5倍。此外，新平台降低了构建和运行大规模AI模型的成本和能耗，使得大型语言模型推理速度提升30倍。黄仁勋表示，Blackwell标志着AI算力在近八年内增长了一千倍，引领了技术边界拓宽的新趋势。

652 1 1

xijie.xu

|

搜索推荐大数据数据库

|

博文

【Havenask实践篇】搭建文本检索服务

Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎，深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文举例数据库检索加速的一个简单场景，使用Havenask对数据库的文本字段建立倒排索引，通过倒排检索列提高检索性能，缩短检索耗时。

114692 51 59

来自：智能搜索推荐版块

Byyyi

|

SQL 数据采集分布式计算

|

博文

Hive 数仓及数仓设计方案

数仓整合企业数据，提供统一出口，用于数据治理。其特点包括面向主题集成和主要支持查询操作。数仓设计涉及需求分析（如咨询老板、运营人员和行业专家）、确定主题指标（如电商的转化率）、数据标准设定、规模与成本计算、技术选型（如Hadoop生态组件）以及数据采集和操作。设计流程涵盖从理解需求到实施SQL函数和存储过程的全过程。

584 3 3

Byyyi

|

分布式计算资源调度 Java

|

博文

Spark安装教程

该教程详细介绍了在Linux环境下安装Spark 3.1.2的步骤。首先，检查JDK版本需为1.8。接着，下载Spark资源并设置环境变量`SPARK_HOME`。配置`spark-env.sh`和`yarn-site.xml`文件，禁用内存检查。然后，重启Hadoop集群，启动Spark集群，并通过`jps -ml`检查Spark Master和Worker。可以通过Web UI访问Spark状态，并使用`spark-shell`测试Scala交互环境及Spark on Yarn。最后，学习如何关闭Spark集群。

1105 2 2

Lwcah

|

算法计算机视觉

|

博文

【MATLAB 】 CEEMDAN 信号分解+希尔伯特黄变换+边际谱算法

519 0 0

Lwcah

|

算法

|

博文

MATLAB | 插值算法 | 二维griddata插值法 | 附数据和出图代码 | 直接上手

1550 0 0

机器智能社区

|

存储人工智能自然语言处理

|

博文

知识图谱与大模型双向驱动的关键问题和应用探索

图谱技术积极拥抱新一代AI技术体系，如大模型(Large Language Model, LLM)，实现二者的双驱动增强，定义融合互通的技术范式和关键问题，借助LLM强大的语言理解能力，为基于非/半结构化数据的图谱构建提效，同时在用户问答中，语言要素和语义结构的理解也会更加精准。

1027 0 0

孙玉洁-47170

|

SQL OLAP HIVE

|

博文

HQL的中级题目---炸裂函数、窗口函数

704 2 2

孙玉洁-47170

|

SQL Oracle 关系型数据库

|

博文

SQL 的 with as 临时中间表

522 1 1

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

Java“NoSuchFieldError”解决

如何绕过Captcha并使用OCR技术抓取数据

通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

将word文档转换成pdf文件方法

从理论到实践：详解GraphRAG框架下的多模态内容理解与生成

特征工程在营销组合建模中的应用：基于因果推断的机器学习方法优化渠道效应估计

精通Selenium：从基础到高级的网页自动化测试策略

api接口如何对接？（带你了解api接口的相关知识）

掌握 SkiaSharp 轻松实现 .NET 跨平台绘图

DB-GPT v0.6.0 版本更新，发布六大核心新特性！

C 标准库 - <stddef.h>详解

大数据

RabbitMQ性能调优指南

PyTorch与DistributedDataParallel：分布式训练入门指南

时间序列特征提取：从理论到Python代码实践

使用Python实现深度学习模型：智能空气质量监测与预测

卷积神经网络（CNN）：视觉识别的革命先锋

不限量住宅IP代理指南2024版

MaxCompute 产品新能力发布-2024年Q1

人工智能平台PAI操作报错合集之引用github.com/alibaba/pairec包时报错，该如何解决

分析性能提升40%，阿里云Hologres流量场景最佳实践

Python实现贝叶斯岭回归模型(BayesianRidge算法)并使用K折交叉验证进行模型评估项目实战

大语言模型的直接偏好优化（DPO）对齐在PAI-QuickStart实践

基于Python实现时间序列分析建模(ARIMA模型)项目实战

「大数据」Kappa架构

「AIGC」Python实现tokens算法

Pandabuy VS Hagobuy 淘宝代购集运系统巨头，类似软件如何开发？

实时数仓Hologres OLAP场景核心能力介绍

Jupyter Lab操作文档

一步步教你用Python Selenium抓取动态网页任意行数据

Java一分钟之-JPA注解：@Entity, @Table, @Id等

WebSocket技术详解与应用指南

DataGrip 配置 HiveServer2 远程连接访问（含账号密码验证）

org.apache.hadoop.security.AccessControlException Permission denied: user=anonymous, access=WRITE...

【Hive SQL 每日一题】分析电商平台的用户行为和订单数据

手把手教你解决 Hive 的数据倾斜

在conda中如何查看安装的pytorch版本 - 蓝易云

Hive 拉链表详解及实例

Barnes-Hut t-SNE:大规模数据的高效降维算法

面经：Presto/Trino高性能SQL查询引擎解析

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

【2024】英伟达吞噬世界！新架构超级GPU问世，AI算力一步提升30倍

【Havenask实践篇】搭建文本检索服务

Hive 数仓及数仓设计方案

Spark安装教程

【MATLAB 】 CEEMDAN 信号分解+希尔伯特黄变换+边际谱算法

MATLAB | 插值算法 | 二维griddata插值法 | 附数据和出图代码 | 直接上手

知识图谱与大模型双向驱动的关键问题和应用探索

HQL的中级题目---炸裂函数、窗口函数

SQL 的 with as 临时中间表

大数据与机器学习

活跃用户

相关产品