MaxCompute的搜索结果_热门_第5页-阿里云开发者社区

隐林

|

博文

Hadoop迁移MaxCompute神器之DataX-On-Hadoop使用指南

DataX-On-Hadoop即使用hadoop的任务调度器，将DataX task(Reader->Channel->Writer)调度到hadoop执行集群上执行。这样用户的hadoop数据可以通过MR任务批量上传到ODPS、RDS等，不需要用户提前安装和部署DataX软件包，也不需要另外为DataX准备执行集群。

# 云原生大数据计算服务 MaxCompute # 数据集成 Data Integration # 云解析DNS # SQL # 分布式计算 # Hadoop # DataX # MaxCompute

隐林

|

博文

|

来自：大数据与机器学习

MaxCompute SQL-列转行和行转列

1. 假设我们在MaxCompute中有两张表，其中一张表是存用户基本信息，另一张表是存用户的地址信息等，表数据假设如下： user_basic_info: id name 1 a 2 b 3 c

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # MaxCompute

隐林

|

博文

|

来自：大数据与机器学习

MaxCompute访问TableStore(OTS) 数据（20170601更新）

MaxCompute作为阿里云大数据平台的核心计算组件，承担了集团内外大部分的分布式计算需求。

# 表格存储 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # 分布式计算 # NoSQL # 大数据 # MaxCompute

继盛

|

博文

|

来自：大数据与机器学习

PyODPS开发中的最佳实践

PyODPS支持用 Python 来对 MaxCompute 对象进行操作，它提供了 DataFrame API 来用类似 pandas 的接口进行大规模数据分析以及预处理，并且可以用 ml 模块来执行机器学习算法。

# 云原生大数据计算服务 MaxCompute # JSON # 分布式计算 # MaxCompute # 数据格式 # Python

隐林

|

博文

|

来自：大数据与机器学习

Python实现MaxCompute UDF/UDAF/UDTF

参数与返回值类型参数与返回值通过如下方式指定： @odps.udf.annotate(signature) Python UDF目前支持ODPS SQL数据类型有：bigint, string, double, boolean和datetime。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # MaxCompute # Python

晋恒

|

博文

|

来自：大数据与机器学习

数据保护伞—为MaxCompute平台数据安全保驾护航

数据安全是大数据发展道路上的重要挑战之一，数据，作为企业的核心资产，80%以上的核心信息是以结构化数据存储，包含个人身份证号、银行账号、电话、客户数据、医疗、交易、薪资等极其重要又敏感的信息。一旦发生数据篡改、盗取、滥用等安全事件，将给企业带来经济和声誉上的双重打击，造成的后果将不堪设想。

# 数据安全中心 # 云原生大数据计算服务 MaxCompute # 分布式计算 # 安全 # 大数据 # 数据挖掘 # MaxCompute

隐林

|

博文

|

来自：大数据与机器学习

【大数据技巧】MaxCompute中实现IP地址归属地转换

大数据平台的成熟使得更多种类的非结构化、半结构化的数据分析成为可能其中应用非常广泛的一种场景就是日志分析。在日志类型数据的清洗转换过程中把IP地址转换为归属地又是极为常见的一种场景。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # MaxCompute # SQL # 数据挖掘 # Java # 数据库 # 监控

zongyuanwu

|

博文

|

来自：大数据与机器学习

DII—算法服务利器

随着集团内各种离线处理、实时反馈、在线学习和分析系统的发展壮大，为算法同学使用数据提供了更多的手段和玩法，能够从数据中挖掘出更多的宝藏。但是仅仅产出数据是不够的，他们需要将数据结合算法在线服务的方式应用到业务中去，才能真正产生价值。从搜索事业部的现状来看，算法的作用方式主要有两种，一种是嵌入引擎内.

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 运维 # 算法 # MaxCompute # 索引

黑风寨1号

|

博文

从分析性数据库ADS中导出数据

ADS是阿里云提供的分析性数据库，实现百亿数据毫秒级计算。将ADS中的数据导出，有2种思路，通过select或dump实现。这两种方法各有优缺点。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 数据库 # MaxCompute # 关系型数据库 # MySQL

晋恒

|

博文

|

来自：大数据与机器学习

专访20年技术老兵云郎：16年峰回路，每一步都是更好的沉淀

从技术研发到产品经理，3次峰回路转，这条路，他走了16年一个懂技术的产品，更有底气和研发“叫板” 一个具备产品思维的技术，更明白未来的方向

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 大数据 # MaxCompute # 云计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

MaxCompute