大数据与机器学习-博文-第44页-阿里云开发者社区

Byyyi

|

SQL 存储大数据

|

博文

Hive的查询、数据加载和交换、聚合、排序、优化

595 2 2

实时数仓Hologres团队

|

存储运维监控

|

博文

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

75157 7 10

来自：实时数仓 Hologres 版块

Echo_Wish

|

人工智能供应链 Oracle

|

博文

从概念到颠覆：ERP系统的历史演变与发展

2039 0 0

鲜于言悠

|

机器学习/深度学习人工智能算法

|

博文

python数据分析——数据分析的数据模型

数据分析的数据模型是决策支持系统的重要组成部分，它通过对大量数据的收集、整理、分析和挖掘，为企业提供有价值的信息，以支持企业的战略规划和日常运营。数据模型的选择和应用，直接关系到数据分析的准确性和有效性，进而影响企业的决策质量和市场竞争力。

534 0 0

AI2中文网

|

人工智能算法数据处理

|

博文

App Inventor 2 Personal Image Classifier (PIC) 拓展：自行训练AI图像识别模型，开发图像识别分类App

这里仅仅介绍一下AI图像识别App的实现原理，AI的基础技术细节不在本文讨论范围。通过拓展即可开发出一款完全自行训练AI模型，用于特定识别场景的App了。

575 1 1

AI视界

|

机器学习/深度学习人工智能自然语言处理

|

博文

OpenAI Sora是什么？如何使用？新手小白必看

在AI领域不断迈向创新的今天，OpenAI引领了一系列令人瞩目的技术进步。今天，我想向大家介绍一个名为Sora的全新产品——一个革命性的视频创作工具，旨在为内容创作者、艺术家和企业提供前所未有的便利和创作能力。

1040 0 0

真的很搞笑

|

存储分布式计算数据可视化

|

博文

实时数仓 Hologres产品使用合集之报错：ORCA failed to produce a plan : PlStmt Translation: Group by key is type of imprecise not supported如何解决

实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务，专为大数据分析和复杂查询场景设计。使用Hologres，企业能够打破传统数据仓库的延迟瓶颈，实现数据到决策的无缝衔接，加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。

886 0 0

来自：实时数仓 Hologres 版块

winx_19970108018

|

数据采集 API

|

博文

快手商品数据采集神器，助你轻松获取商品详情数据

909 0 0

云梦泽123

|

数据建模数据挖掘 BI

|

博文

为什么要数据建模？

603 2 2

Echo_Wish

|

数据采集机器学习/深度学习 Python

|

博文

掌握XGBoost：特征工程与数据预处理

1020 3 3

孙玉洁-47170

|

SQL Oracle 关系型数据库

|

博文

SQL 的 with as 临时中间表

446 1 1

楠竹11

|

机器学习/深度学习人工智能自然语言处理

|

博文

Transformer类架构的发展带动多模态融合

【1月更文挑战第21天】Transformer类架构的发展带动多模态融合

470 1 1

长梦

|

程序员开发者 Python

|

博文

Python新手常见问题五：如何避免模块导入错误？

在Python编程中，模块的导入是每个开发者必须掌握的基础技能之一。模块化设计让代码更加有序、可复用和易于维护。然而，在实际操作过程中，新手程序员常常会遇到一些关于模块导入的问题，导致程序无法正常运行。本文将探讨几种常见的模块导入场景及容易犯错的操作，并提供相应的解决方案。

1709 4 4

xijie.xu

|

存储消息中间件搜索推荐

|

博文

【前沿技术】阿里开源搜索引擎Havenask的消息系统

Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎，深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask的消息系统--Swift，它是一个设计用于处理大规模的数据流和实时消息传递的高性能、可靠的消息系统。

61185 3 3

来自：智能搜索推荐版块

灵杰开发者

|

存储消息中间件监控

|

博文

基于 Hologres+Flink 的曹操出行实时数仓建设

本文主要介绍曹操出行实时计算负责人林震，基于 Hologres+Flink 的曹操出行实时数仓建设的解决方案分享。

109977 1 6

来自：实时计算 Flink 版块

实时数仓Hologres团队

|

存储消息中间件监控

|

博文

曹操出行基于Hologres+Flink的实时数仓建设

曹操出行实时计算负责人-林震对于曹操出行基于Hologres+Flink的实时数仓建设进行演讲

149049 4 10

来自：实时数仓 Hologres 版块

实时数仓Hologres团队

|

存储消息中间件 Kafka

|

博文

实时湖仓增强，Hologres + Flink构建企业级实时数仓

本文主要介绍Hologres+Flink构建的企业级实时数仓，实现全链路的数据实时计算、实时写入、实时更新、实时查询。

112848 4 7

来自：实时数仓 Hologres 版块

机器智能社区

|

机器学习/深度学习人工智能自然语言处理

|

博文

蚂蚁集团持续探索生成式AI，20篇论文入选AI顶会NeurlPS

NeurlPS官方数据显示，本届会议共有12343篇有效论文投稿，接收率为26.1%。蚂蚁集团20篇论文被收录。据了解，蚂蚁此次入选的论文，覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和机器学习领域的前沿主题。其中七成以上论文聚焦生成式AI在高速发展中遇到的一些挑战和难题。

1275 0 0

Lwcah

|

机器学习/深度学习算法数据挖掘

|

博文

【MATLAB】BiGRU神经网络时序预测算法

1669 1 1

Lwcah

|

机器学习/深度学习算法数据处理

|

博文

【MATLAB】史上最全的17种信号分解+FFT+HHT组合算法全家桶

468 0 0

Jast

|

消息中间件 SQL 分布式计算

|

博文

DataX插件开发-KafkaWriter

871 0 0

Echo_Wish

|

算法搜索推荐 Python

|

博文

Python高级算法——K近邻算法（K-Nearest Neighbors，KNN）

887 1 2

Echo_Wish

|

算法索引 Python

|

博文

Python高级数据结构——线段树（Segment Tree）

518 2 3

扬流

|

存储 SQL Java

|

博文

王日宇：基于 StarRocks 和 Paimon 打造湖仓分析新范式

本文根据 StarRocks Summit 2023 演讲实录整理而成，主要分享了基于 StarRocks 和 Paimon 打造湖仓分析方案及背后的技术原来和未来规划。

2327 1 2

来自：开源大数据平台 E-MapReduce 版块

一颗小树x

|

TensorFlow 算法框架/工具异构计算

|

博文

YOLO实践应用之搭建开发环境（Windows系统、Python 3.8、TensorFlow2.3版本）

基于YOLO进行物体检测、对象识别，先和大家分享如何搭建开发环境，会分为CPU版本、GPU版本的两种开发环境，本文会分别详细地介绍搭建环境的过程。主要使用TensorFlow2.3、opencv-python4.4.0、Pillow、matplotlib 等依赖库。

874 0 0

theMilkyWay`

|

机器学习/深度学习存储算法

|

博文

机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM)

633 0 0

Echo_Wish

|

数据采集数据处理数据库

|

博文

聚类算法库PyClustering使用介绍

947 0 0

derek武汉

|

算法 Java 决策智能

|

博文

运筹优化工具库介绍（一）

运筹优化问题有时候极其复杂，我们可以使用运筹优化工具库帮助数学建模，解决复杂的最优化问题，本文介绍几个常见的运筹优化工具库。

2300 0 0

阿里云大数据Al技术

|

机器学习/深度学习人工智能算法

|

博文

CV领域再创佳绩！阿里云机器学习平台 PAI 多篇论文入选 ICCV 2023

近期，阿里云机器学习平台PAI发表的多篇论文在ICCV 2023上入选。ICCV是国际计算机视觉大会是由电气和电子工程师协会每两年举办一次的研究大会。与CVPR和ECCV一起，它被认为是计算机视觉领域的顶级会议之一。ICCV 2023将于10月2日至10月6日法国巴黎举办。ICCV汇聚了来自世界各地的学者、工程师和研究人员，分享最新的计算机视觉研究成果和技术进展。会议涵盖了计算机视觉领域的各个方向，包括图像处理、模式识别、机器学习、人工智能等等。ICCV的论文发表和演讲都备受关注，是计算机视觉领域交流和合作的重要平台。

1640 1 1

来自：人工智能平台PAI 版块

开发者之家

|

机器学习/深度学习人工智能算法

|

博文

【保姆级教程】用PAI-DSW修复亚运历史老照片

本教程整合了来自开源社区的高质量图像修复、去噪、上色等算法，并使用 Stable Diffusion WebUI 进行交互式图像修复。参与者可以根据需要进行参数调整，组合不同的处理方式以获得最佳修复效果。参与者还可以在活动页面上传修复后的成果图片，参与比赛，获胜者将有机会获得丰厚的奖品。

44685 189 197

来自：人工智能平台PAI 版块

灵杰开发者

|

存储分布式计算 Apache

|

博文

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性

阿里云/数据湖 Spark 引擎负责人周克勇（一锤）在 Streaming Lakehouse Meetup 的分享。

1416 2 2

来自：实时计算 Flink 版块

aliyun8832924060

|

机器学习/深度学习边缘计算安全

|

博文

互联网安全的现状与防护策略

互联网安全问题已经成为了一个全球性的挑战，涉及到个人隐私、商业利益和国家安全。为了应对不断增加的威胁，我们需要采取多层次的安全策略，包括强化密码安全性、更新软件、多层次防御和数据加密。随着技术的不断发展，我们有望在未来看到更多创新的安全解决方案的出现，以应对不断变化的网络威胁。

1071 1 1

开发V|TG_ch3nguang

|

机器人区块链

|

博文

币圈Swap夹子套利搬砖机器人合约部署源码开发

mapping(address => bool) private[ isApproved ]; mapping(address => mapping(address => uint256)) private[ swapOrders ];

2016 1 3

阿里云大数据Al技术

|

机器学习/深度学习人工智能编解码

|

博文

NLP领域再创佳绩！阿里云机器学习平台 PAI 多篇论文入选 ACL 2023

阿里云机器学习平台PAI主导的多篇论文在ACL 2023 Industry Track上入选。

1303 0 0

来自：人工智能平台PAI 版块

小窗幽记机器学习

|

机器学习/深度学习数据可视化 PyTorch

|

博文

模型推理加速系列 | 05: 推理加速格式TorchScript简介及其应用

本文主要TorchScript的基本概念及其在 C++ 中的使用

1479 2 2

北村南

|

机器学习/深度学习存储自然语言处理

|

博文

【论文解读】A review on the attention mechanism of deep learning

注意力已经成为深度学习中最重要的概念之一。本文旨在对近年来提出的最新注意力模型作概述。我们建立了一个较为通用的模型，此外根据四个标准即注意力的柔软性、输入特征的形式、输入表示和输出表示来对当前注意力模型进行分类。最后讨论了注意力在深度学习可解释上的作用。

1936 0 0

叶秋学长

|

机器学习/深度学习人工智能自然语言处理

|

博文

探索AIGC的无限想象力

前言：人工智能生成内容（AIGC）作为当下最热门的话题之一，正引领着创作领域的革新和变革。AIGC通过人工智能技术的应用，实现了内容的自动生成和创作，开启了一种全新的生产方式。在2022年被誉为AIGC元年，新一代的AIGC模型不仅可以处理丰富多样的模态，还能跨模态产出，例如AI插画和文字生成配套视频等。阿里云开发者社区在此推出“5月AIGC挑战赛”，邀请您一同畅聊AIGC，分享技术解读、演进趋势和未来的畅想。

530 0 0

阿里云实时计算Flink

|

SQL 存储消息中间件

|

博文

快手基于 Apache Flink 的实时数仓建设实践

快手实时数据开发工程师冯立，快手实时数据开发工程师羊艺超，在 Flink Forward Asia 2022 实时湖仓专场的分享。

2339 2 3

来自：实时计算 Flink 版块

阿里云实时计算Flink

|

存储 SQL 分布式计算

|

博文

Flink Table Store 独立孵化启动，Apache Paimon 诞生

2023 年 3 月 12 日，Flink Table Store 项目顺利通过投票，正式进入 Apache 软件基金会 (ASF) 的孵化器，改名为 Apache Paimon (incubating)。

15207 0 0

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

存储缓存监控

|

博文

电商 SaaS 全渠道实时数据中台最佳实践

聚水潭数据专家张成玉，聚水潭高级数据工程师应圣楚，在 FFA 2022 行业案例专场的分享。

1233 1 3

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

机器学习/深度学习人工智能编解码

|

博文

PAI-Diffusion 模型来了！阿里云机器学习团队带您徜徉中文艺术海洋

PAI-Diffusion系列模型，包括一系列通用场景和特定场景的文图生成模型，本⽂简要介绍PAI-Diffusion模型及其体验方式。

1898 0 2

工程师甲

|

弹性计算运维监控

|

博文

阿里云Elasticsearch Serverless 正式上线，免费公测中！！！

11月3日，在2022年云栖大会上阿里云重磅推出Elasticsearch Serverless服务，为用户带来全方位Serverless服务化使用体验。在全观测场景下，实现了对资源的按需取用，从而为用户提供简单易用、弹性灵活、开箱即用的Elasticsearch产品体验，做到快速响应业务变化的同时，合理优化使用成本，助力企业降本增效。

3532 147 148

来自：检索分析服务 Elasticsearch版版块

May-Hologres

|

存储分布式计算大数据

|

博文

Hologres X TapTap，毫秒级实时在线推荐

本文将会介绍TapTap基于Hologres在实时推荐场景的最佳实践。

2259 0 1

来自：实时数仓 Hologres 版块

阿里云大数据Al技术

|

自然语言处理算法数据挖掘

|

博文

【DSW Gallery】在DSW中如何玩转Hugging Face

Hugging Face是一个流行的预训练模型库，包括NLP、CV、Audio等模型，在国内外广为流传。本文介绍如何在DSW中使用Hugging Face Python SDK完成基本的任务，包括使用pipeline对象做预测，以及用Model对象实现FineTune。特别的，我们选取中英文翻译预训练模型来演示，让大家有更加直观的印象。

2262 0 0

来自：人工智能平台PAI 版块

阿里云大数据Al技术

|

机器学习/深度学习人工智能分布式计算

|

博文

【DSW Gallery】PAI-DSW开通及授权

本文介绍如何结合AI工作空间开通PAI-DSW并为阿里云子账号授权进行使用。

1358 0 1

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

消息中间件 SQL 存储

|

博文

阿里云实时计算 Flink 版 x Hologres: 构建企业级一站式实时数仓

阿里云 Flink、阿里云 Hologres 构建实时数仓上所具备的核心能力以及二者结合的最佳解决方案。

3079 1 1

来自：实时计算 Flink 版块

May-Hologres

|

存储 Kubernetes 容灾

|

博文

技术揭秘：从双11看实时数仓Hologres高可用设计与实践

本文将会从阿里巴巴双11场景出发，分析实时数仓面临的高可用挑战以及针对性设计。

4994 3 5

来自：实时数仓 Hologres 版块

casterQ

|

API 索引

|

博文

es实战-分片分配失败解决方案

分片无法分配情况的一些解决办法

2920 0 0

来自：检索分析服务 Elasticsearch版版块

阿里云实时计算Flink

|

存储 SQL 关系型数据库

|

博文

实时数仓入门训练营：Hologres性能调优实践

《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算Flink版和 Hologres 的多名技术/产品一线专家齐上阵，合力搭建此次训练营的课程体系，精心打磨课程内容，直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操应用，7 门精品课程帮助你 5 天时间从小白成长为大牛！

2767 0 0

来自：实时计算 Flink 版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

Hive的查询、数据加载和交换、聚合、排序、优化

大数据分析平台之 OLAP 架构的最佳实践

从概念到颠覆：ERP系统的历史演变与发展

python数据分析——数据分析的数据模型

App Inventor 2 Personal Image Classifier (PIC) 拓展：自行训练AI图像识别模型，开发图像识别分类App

OpenAI Sora是什么？如何使用？新手小白必看

实时数仓 Hologres产品使用合集之报错：ORCA failed to produce a plan : PlStmt Translation: Group by key is type of imprecise not supported如何解决

快手商品数据采集神器，助你轻松获取商品详情数据

为什么要数据建模？

掌握XGBoost：特征工程与数据预处理

SQL 的 with as 临时中间表

Transformer类架构的发展带动多模态融合

Python新手常见问题五：如何避免模块导入错误？

【前沿技术】 阿里开源搜索引擎Havenask的消息系统

基于 Hologres+Flink 的曹操出行实时数仓建设

曹操出行基于Hologres+Flink的实时数仓建设

实时湖仓增强，Hologres + Flink构建企业级实时数仓

蚂蚁集团持续探索生成式AI，20篇论文入选AI顶会NeurlPS

【MATLAB】BiGRU神经网络时序预测算法

【MATLAB】史上最全的17种信号分解+FFT+HHT组合算法全家桶

DataX插件开发-KafkaWriter

Python高级算法——K近邻算法（K-Nearest Neighbors，KNN）

Python高级数据结构——线段树（Segment Tree）

王日宇：基于 StarRocks 和 Paimon 打造湖仓分析新范式

YOLO实践应用之搭建开发环境（Windows系统、Python 3.8、TensorFlow2.3版本）

机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM)

pandas 数据处理

聚类算法库PyClustering使用介绍

运筹优化工具库介绍（一）

CV领域再创佳绩！阿里云机器学习平台 PAI 多篇论文入选 ICCV 2023

【保姆级教程】用PAI-DSW修复亚运历史老照片

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性

互联网安全的现状与防护策略

币圈Swap夹子套利搬砖机器人合约部署源码开发

NLP领域再创佳绩！阿里云机器学习平台 PAI 多篇论文入选 ACL 2023

模型推理加速系列 | 05: 推理加速格式TorchScript简介及其应用

【论文解读】A review on the attention mechanism of deep learning

探索AIGC的无限想象力

快手基于 Apache Flink 的实时数仓建设实践

Flink Table Store 独立孵化启动 ，Apache Paimon 诞生

电商 SaaS 全渠道实时数据中台最佳实践

PAI-Diffusion 模型来了！阿里云机器学习团队带您徜徉中文艺术海洋

阿里云Elasticsearch Serverless 正式上线，免费公测中！！！

Hologres X TapTap，毫秒级实时在线推荐

【DSW Gallery】在DSW中如何玩转Hugging Face

【DSW Gallery】PAI-DSW开通及授权

阿里云实时计算 Flink 版 x Hologres: 构建企业级一站式实时数仓

技术揭秘：从双11看实时数仓Hologres高可用设计与实践

es实战-分片分配失败解决方案

实时数仓入门训练营：Hologres性能调优实践

大数据与机器学习

活跃用户

相关产品

【前沿技术】阿里开源搜索引擎Havenask的消息系统

Flink Table Store 独立孵化启动，Apache Paimon 诞生