Alink 1.1.1 在易用性上有哪些优化?

简介: 本文将详解介绍 Alink 1.1.1 版本中的新增功能及修复内容,并分享 Alink 1.1.1 在易用性方面的小技巧。

2019年11月28日,在 Flink Forward Asia 大会上,机器学习算法平台 Alink 宣布开源,成为众多开发者关注的焦点。今年2月,Alink 1.10 发布,对 Flink 1.10 和 Flink 1.9 提供了支持。近期 Alink 团队持续发力,发布了最新的 Alink 1.1.1 版本,不仅开发了新功能,还对部分已有功能进行了增强和完善。

本文将详解介绍 Alink 1.1.1 版本中的新增功能及修复内容,并分享 Alink 1.1.1 在易用性方面的小技巧。

版本更新下载及 Github 送 Star
https://github.com/alibaba/Alink

Alink 1.1.1 Release Note 概览

Alink 1.1.1 增强功能和新功能:

  • 数据列参数的检验和提示
  • 枚举类型参数的检验和提示
  • 优化 Alink 批式组件与 Python Dataframe 之间数据转换的速度
  • 当 useRemoveEnv 时自动检测 localIp
  • 新增组件,将 CSV、JSON 和 KV 格式的字符串解析为多列
  • 新增组件 WindowGroupByStreamOp,简化流式数据的窗口分组操作
  • Tokenizer 支持多个空格的字符串拆分
  • 添加 FTRL 示例

Alink 1.1.1 修复和完善:

  • 修复 dill 版本冲突
  • 修复 HasVectorSize 别名错误
  • 修复使用 collect 方法时出现 mysqlsource 错误

了解更多 Alink 1.1.1 feature:
https://github.com/alibaba/Alink/releases

Alink 1.1.1 在易用性方面的小技巧

在使用 Alink 算法时,经常遇到一些枚举类型的参数,譬如:对于卡方特征选择器 ChiSqSelector,其参数 SelectorType 可以填写 NumTopFeatures、Percentil、FPR 等,是枚举类型,但是我们在写脚本的时候,可能会记错,譬如,我们输入了“aaa”,脚本代码如下:

1.jpg

在之前的 Alink 版本,会显示如下信息:

v2-dcbbf616e50f727340fd6c264da59cd9_r.jpg

SelectorType 输出错误的值 AAA,异常信息不明显,没有指出是哪个参数写错了。

在 1.1.1 版本优化之后, 异常信息中会有哪个参数填写错误,和值可能是什么。

v2-ddf2c2d35d0c4f19d919e7a1d6875837_r.jpg

如果使用 Java 编辑器,建议使用枚举类型作为参数的方法,编辑器的自动提示进行选择。

v2-b8b0a17c47d8a42edef8e219cb1e1587_r.jpg

我们在使用算法组件的时候还经常遇到这种情况,算法中会有些列名参数,我们也有输入错误的可能,如下图所示,将 text 列名写为 text1。

v2-54e477d77c3f62f7736aaea31f7549af_r.jpg

在 1.1.1 版本里,不仅抛出哪列不存在,也会提示最可能的列名,帮助用户做判断。

v2-148d0774a36a2ecac457ac10cfac1701_r.jpg

以上分享希望对你有所帮助,了解更多 Alink 上手实践文章,后续公众号将分享更多 Alink 技术干货,欢迎大家持续关注!

目录
相关文章
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
构建高效机器学习模型:从数据处理到性能优化
在数据驱动的时代,构建高效的机器学习模型已经成为解决复杂问题的关键手段。本文将详细讨论如何通过有效的数据处理、特征工程、模型选择以及性能优化策略来构建一个高效的机器学习模型。我们将重点关注数据处理的重要性,特征选择的影响,以及如何通过调整模型参数和采用集成学习方法来提高模型的性能。我们的目标是为读者提供一套实用的指南,帮助他们在构建自己的机器学习模型时能够更加高效和有效。
|
机器学习/深度学习 数据采集 人工智能
【技术揭秘】高性能粤语语音识别模型构建方案
随着人工智能技术的飞速发展,语音识别(Automatic SpeechRecognition)的应用越来越广泛,对于多语种多口音语音识别的需求也在日渐增加。虽然语音识别系统的基本原理和框架是不受限于语种的,在建立一个新语种的ASR模型时,还是需要结合到语言本身的特点,才能得到较好的效果。
【技术揭秘】高性能粤语语音识别模型构建方案
|
13天前
|
存储 缓存 前端开发
《构建高性能的前端应用:优化技巧与最佳实践》
本文探讨了构建高性能前端应用的关键技巧与最佳实践。从代码优化、资源压缩到网络请求管理,提供了一系列有效的解决方案,旨在帮助开发者提升前端应用的性能和用户体验。
|
4月前
|
存储 并行计算 数据挖掘
如何优化大规模数据处理的性能
在当今大数据时代,对于使用大规模数据处理技术进行数据分析和挖掘的企业和组织来说,优化数据处理性能已经成为一项关键任务。本文将介绍如何通过并行计算、数据分片、内存管理等技术手段,优化大规模数据处理的性能,以提高数据分析和挖掘的效率。
|
5月前
|
测试技术 API 开发工具
|
11月前
|
存储 消息中间件 SQL
快手 Flink 的稳定性和功能性扩展
快手技术专家刘建刚,在 Flink Forward Asia 2022 生产实践专场的分享。
7012 3
快手 Flink 的稳定性和功能性扩展
《分布式流处理框架——功能对比和性能评估》电子版地址
分布式流处理框架——功能对比和性能评估
62 0
《分布式流处理框架——功能对比和性能评估》电子版地址
EMQ
|
SQL 存储 运维
流批结合计算以及更多原生分析能力支持
十月,eKuiper发布了1.7.0版本:引入了查询表和可更新Sink的概念,支持数据流与外部存储的数据一起计算,进一步完善了流批结合的实时计算能力。
EMQ
653 0
流批结合计算以及更多原生分析能力支持
|
SQL 缓存 运维
更快更稳更易用: Flink 自适应批处理能力演进
朱翥、贺小令在 9.24 Apache Flink Meetup 的演讲内容整理。
更快更稳更易用: Flink 自适应批处理能力演进
|
存储 测试技术 文件存储
HLS开发学习-09- 描述高效的C测试平台
HLS开发学习-09- 描述高效的C测试平台
682 0
HLS开发学习-09- 描述高效的C测试平台