分布式计算的搜索结果_热门_第4页-阿里云开发者社区

曾安祥仁重

|

博文

|

来自：大数据与机器学习

凑单算法——基于Graph Embedding的bundle mining

本文描述如何在凑单场景突破找相似、发现惊喜的同时做到成交翻倍，实现体验和数据上的双赢。

# 机器学习/深度学习 # 分布式计算 # 算法 # MaxCompute

莫源

|

博文

|

来自：云原生

Spark in action on Kubernetes - Spark Operator的原理解析

在上篇文章中，向大家介绍了如何使用Spark Operator在kubernetes集群上面提交一个计算作业。今天我们会继续使用上篇文章中搭建的Playgroud进行调试与解析，帮助大家更深入的理解Spark Operator的工作原理。

# 容器服务Kubernetes版 # 容器计算服务 # 可观测监控 Prometheus 版 # 云解析DNS # 分布式计算 # Spark # 容器 # Perl # Kubernetes

隐林

|

博文

|

来自：大数据与机器学习

企业大数据平台下数仓建设思路

介然（李金波），阿里云高级技术专家，现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历，对系统架构、数据架构拥有丰富的实战经验，曾经数据魔方、淘宝指数的数据架构设计专家。与阿里云大数据数仓结缘介然之前在一家软件公司给企业客户做软件开发和数仓开发实施，数仓开发和实施都是基于传统的

# 云原生数据仓库AnalyticDB MySQL版 # 云原生大数据计算服务 MaxCompute # 数据采集 # 分布式计算 # 大数据 # 数据处理 # MaxCompute

隐林

|

博文

|

来自：大数据与机器学习

阿里云数加MaxCompute购买咨询钉钉群

为企业解答阿里云MaxCompute大数据计算产品购买问题。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # MaxCompute

余二五

|

博文

大数据测试之hadoop单机环境搭建(超级详细版)

# 云原生大数据计算服务 MaxCompute # 分布式计算 # Java # Linux # Hadoop # 资源调度 # 网络安全 # 数据安全/隐私保护 # Shell # 数据格式 # XML

隐林

|

博文

|

来自：大数据与机器学习

MaxCompute SQL原理解析及性能调优

分享内容介绍了ODPS SQL的基于mapreduce是如何实现的及一些使用小技巧，回顾了mapreduce各个阶段可能产生的问题及相应的处理方法，同时介绍了一些应对数据倾斜的处理方法，最后介绍了一些关于数据集构造、特征选择的技巧帮助减少资源利用。

# 云原生大数据计算服务 MaxCompute # 云解析DNS # SQL # 分布式计算 # 算法 # MaxCompute

祎休

|

博文

|

来自：大数据与机器学习

MaxCompute/DataWorks权限问题排查建议

MaxCompute/DataWorks权限问题排查建议 __前提：__MaxCompute与DataWorks为两个产品，在权限体系上既有交集又要一定的差别。在权限问题之前需了解两个产品独特的权限体系。

# 云原生大数据计算服务 MaxCompute # 大数据开发治理平台 DataWorks # 分布式计算 # DataWorks # 安全 # MaxCompute

木洛

|

博文

|

来自：云存储

数据中台之结构化大数据存储设计

对数据系统核心组件进行拆解，介绍每个组件下对应的开源组件以及云上产品。

开源大数据EMR

|

博文

|

来自：大数据与机器学习

基于Alluxio系统的Spark DataFrame高效存储管理技术

介绍越来越多的公司和组织开始将Alluxio和Spark一起部署从而简化数据管理，提升数据访问性能。Qunar最近将Alluxio部署在他们的生产环境中，从而将Spark streaming作业的平均性能提升了15倍，峰值甚至达到300倍左右。

# 开源大数据平台 E-MapReduce # 存储 # 缓存 # 分布式计算 # 固态存储 # Spark

watercat

|

博文

用MaxCompute Studio开发Python UDF（附采坑记录）

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 测试技术 # MaxCompute # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算