PyFlink 快速上手 | 学习笔记(一)

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 快速学习 PyFlink 快速上手

开发者学堂课程【开源 Flink 极客训练营PyFlink 快速上手】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/760/detail/13342


PyFlink 快速上手

 

内容介绍

一.PyFlink 简介

二. PyFlink 功能介绍

三. PyFlink 功能演示

四. PyFlink 下一步规划

 

一. PyFlink 简介

PyFlink 是 Flink 的一个子模块,也是整个 Flink 项目的一部分,主要目的提供 Flink 的 Python 语言支持。Flink 是用Java 语言开发的,对外提供了 Java,scala, SQL 等编程语言的支持。支持 Python 语言的主要考虑是在机器学习、数据分析等领域,Python 非常重要,甚至是最主要的开发语言,许多机器学习专家、数据分析科学家甚至完全不懂Java,为了满足用户需求、拓宽各个生态,启动了 PyFlink 项目。

1、PyFlink 项目的目标

1将 Flink 的计算能力输出给 Python 用户。

在 Flink 中提供一系列的 Python API,方便对于 Python 语言比较熟悉的用户开发 Flink 作业。这是目前正在做的事情。

2将 Python 生态基于 Flink 进行分布式化。

在 Flink 中提供一系列 Python API 方便Python 用户使用,但对于用户来说存在学习成本,因为用户要学习如何使Flink 的 Python API,了解没一个 API 的用途,而有一些常用的 Python 库比如 Pandas 或者 NumPy,许多用户很熟悉,那么我们能否在 API层使用这些 Python 用户比较熟悉的 Python 库的 API,但是底层的计算使用 PyFlink,这样对于 Python 库比较熟悉的用户就可以使用自己熟悉的 API 进行开发,从而降低学习成本。这是未来需要做的事情,目前处于启动阶段。

2、PyFlink 项目的发展历程

PyFlink 项目起源于2019年4月份,目前发布了三个版本1.9,1.10和1.11,功能趋于成熟。在1.9版本中提供了 Python Table API 功能,在1.10版本中支持了Python UDF 以及 Python 依赖管理,用户可以在 Python Table API 中使用 Python UDF,而在最新发布的1.11版本中 PyFlink 也带来更多的功能,比如向量化 Python UDF, Python UDTF,UDF metrics 支持, Python ML pipeline API 等等,在性能优化上,利用 Cython 极大的优化了 Python UDF 的执行性能,同时也支持了在 Java Table 的 API 作业以及在纯 SQL 作业中使用 Python UDF,极大的扩展了 Python UDF 的使用范围。

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
SQL 机器学习/深度学习 Java
用Python进行实时计算——PyFlink快速入门
Flink 1.9.0及更高版本支持Python,也就是PyFlink。 在最新版本的Flink 1.10中,PyFlink支持Python用户定义的函数,使您能够在Table API和SQL中注册和使用这些函数。但是,听完所有这些后,您可能仍然想知道PyFlink的架构到底是什么?作为PyFlink的快速指南,本文将回答这些问题。
2617 0
用Python进行实时计算——PyFlink快速入门
|
5月前
|
Linux Python Windows
超详细!新手友好Python+Django环境搭建
很高兴在这里陪您开始新的Python和Django学习之旅。下面是一个简单的指南,将引导您完成Python环境的安装、虚拟环境的创建、以及如何使用Django搭建一个基本的Web项目。
154 0
|
7月前
|
数据采集 数据可视化 数据挖掘
如何快速上手 Python,成为一名数据分析师
【6月更文挑战第10天】学习Python是成为数据分析师的关键。首先,掌握基本语法和数据结构,如变量、控制结构及列表、字典等。然后,学习NumPy、Pandas和Matplotlib库:NumPy用于数组计算,Pandas处理和分析数据,Matplotlib进行数据可视化。不断实践项目,从简单分析任务做起,并保持学习新技能的热情,关注技术动态。通过系统学习和实践,可迅速踏上数据分析师之路。
42 0
|
8月前
|
API 定位技术 开发工具
Mars3D小白专属:开发者快速上手实战指南
Mars3D小白专属:开发者快速上手实战指南
421 0
|
JSON IDE 安全
FastAPI 是什么?快速上手指南
FastAPI 是一个现代、快速(高性能)的 Web 框架,用于构建基于 Python 的 API。它是一个开源项目,基于 Starlette 和 Pydantic 库构建而成,提供了强大的功能和高效的性能。
FastAPI 是什么?快速上手指南
|
IDE 机器人 开发工具
Python语言快速上手
Python语言快速上手
72 0
|
SQL 存储 Java
|
Java API 流计算
|
数据采集 机器学习/深度学习 搜索推荐
通过实践快速上手python
如何快速通过实践上手python技术
|
SQL 机器学习/深度学习 Java
PyFlink 快速上手(一)|学习笔记
快速学习 PyFlink 快速上手
843 0
PyFlink 快速上手(一)|学习笔记

相关实验场景

更多