袋鼠云产品功能更新报告02期丨有亿点点走心!

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
日志服务 SLS,月写入数据量 50GB 1个月
简介: 袋鼠云产品功能更新报告第二期内容,更多探索,请继续阅读

不知不觉间,2022年的脚步已经走到了倒数第二个月。临近年末,我们对产品本身以及客户反馈的一些问题进行了持续的更新和优化,例如基线告警、数据服务平台新增TDengine 数据源支持、行级权限根据用户属性实现动态赋权。

以下为袋鼠云产品功能更新报告第二期内容,更多探索,请继续阅读。

数栈DTinsight

离线开发平台

1.支持对接Trino引擎

创建项目时支持对接Trino引擎,支持创建和运行Trino任务。

file

2.个人账号支持绑定Kerberos认证

数栈支持对用户或用户组绑定Kerberos证书,并支持以用户级/用户组级Kerberos账号进行任务提交。

file

3.基线告警

基线是一组任务的管理单位,被纳入同一组基线的任务一般需要相同的产出时间。一条基线被纳入监控后,该基线中的任务及其所有上游的任务都会被自动监控。

基线在基线管理中开启时,每天晚上24点会生成第二天的基线实例,以对第二天的基线上任务所产生的实例进行监控。

例子:如下图,设一条基线包含任务D、E,则D、E及其上游的A、B都会被纳入监控。

如果某任务的下游没有被纳入基线的任务(例如C),则即使该任务异常,智能监控也不会报警。
file
file

4.安全审计增加类目

file

5.NULL可以选择识别为NULL

数据同步任务中,FTP作为源数据源时,NULL可以选择识别为NULL或者空字符串

file

6.整库同步可以选择同步任务存放目录

file

7.其他优化项

· 在IDE中进行任务切换时,会记住上次代码浏览位置

· postgresql、db2、greenplum、kingbase、mysql、oceanbase、oracle、sqlserber、tidb等任务,存储函数使用select * from procedure() /select procedure()调用时,在调度不会执行的问题修复

· 表查询结果限制,所有SQL任务数据查询结果默认仅显示1000条

· 数据同步任务当HDFS分区不存在时,高级配置中可配置是否报错

具体说明:通过指定高级配置中failedIfPathNotExist的状态,来配置是否进行报错提示:

若failedIfPathNotExist=true,则报错;若failedIfPathNotExist=false,则不报错

8.技术改造

· 统计数据流量统计优化

· SQL加密解密防止某些关键字被拦

· 支持spark UDF

· inceptor同步支持直接读写文件的方式去进行数据同步

实时开发平台

1.产品首页改造

在原来只有项目入口和帮助手册入口的基础上,新增了更多运维信息。帮助用户进入产品后,不需要一个个进入项目,可以直观的看到目前项目运行情况、当前需要处理什么问题,提高产品可用性。

file

2.任务运行日志推送

在【任务开发-任务设置】页面,支持将任务运行日志推送至外部Kafka,运维人员可基于日志信息做更丰富的日志分析、任务监控等工作。

file

3.优化项目

· PyFlink任务在创建时可以引用第三方python包

· Flink1.12兼容TiDB Connector

· Flink1.10/1.12兼容开启SASL认证的Kafka Connector

· 优化日志打印格式,避免出现/n/t等字符

· Source Connector新增支持了RocketMQ

数据服务平台

1.【生成API】新增TDengine 数据源支持

TDengine 是一款高性能、分布式、支持 SQL 的时序数据库,广泛运用于物联网、工业互联网、车联网、IT 运维、金融等领域。除核心的时序数据库功能外,TDengine 还提供缓存、数据订阅、流式计算等大数据平台所需要的系列功能。

目前EasyAPI支持TDengine基本SQL语句的查询功能,可以在「生成API」-「自定义SQL模式」DQL模式下创建TDengine API服务。

file

2.【API市场】增加批量导出功能

支持API市场API的批量导出,用户可先在测试环境中进行API调试,无误后在API市场批量导出API,再在正式环境中导入API,提高效率。
file

3.【API调用情况】新增下载日志功能

「API管理」API调用情况 调用明细/错误明细模块增加「下载日志」功能,可以通过设置调用条件下载7天内的日志数据,方便用户进行明细查看,调用统计。

file

4.【生成API】in、not in 操作符增加分隔符配置

之前的版本当进行in、not in 操作符查询数据时,默认入参参数为逗号分隔。存在特殊业务场景入参参数中包含逗号的情况,导致入参分隔错误。

当前版本中,针对in、not in操作符,可以自定义选择英文“,”、“|”、“/”、“:”、“;”五种分隔符,以满足不同客户业务场景需求。

file

数雁EasyDigit

客户数据洞察平台(原智能标签平台)

1.【授权】-标签/实体/群组/目录细粒度权限控制

用户痛点:标签、实体、群组等属于企业数据资源的一部分,随着资源持续维护、资产沉淀,对资源的权限控制提出了更高的要求,本次新增的授权功能能够实现灵活的权限控制。

新增功能说明:给用户/用户组/部门/角色授予当前资源的权限,可授权的资源包括标签、实体、群组、目录,可授予的权限包括可查看、可编辑权限,也可以将资源设置为全员公开可查看/可编辑,实现细粒度的权限控制。

file
file

2.【行级权限】-根据用户属性实现动态赋权

用户痛点:行级权限 用来控制用户对标签数据的访问权限,当某个用户被设置了行级权限后,只能查看在权限规则内设置的标签数据。

新增功能说明:

· 支持针对用户属性动态设置权限规则,如1000条结果数据,用户A查看200条,用户B查看500条

· 单个权限标识可设多条权限规则,且最大支持5个层级,条件之间支持配置“且”、“或”关系

· 权限的适用成员可指定用户、用户组、部门、角色,且支持针对用户属性动态设置适用成员

file

3.【多值标签】-标签值分隔去重

多值标签 的值由一个或多个值组合构成,多个值之间由分隔符进行分隔(系统固定为英文逗号),可在实体/关系创建时指定标签是否多值。

多值型标签的操作符包括【包含部分、包含所有、不包含、精确匹配、模糊匹配、不匹配、有值、无值】,可选的是分隔并去重后的标签值。其中:

· 包含所有:若选择多个标签值,筛选结果将同时符合所有标签值,即多个标签值的筛选结果之间使用交集运算;

· 包含部分:若选择多个标签值,筛选结果将至少符合其中一个标签值,即多个标签值的筛选结果之间使用并集运算。
file

4.【组织架构】-引入多层级部门

组织架构 是一个组织整体的结构,是企业内部开展业务、落实管理的基本要素。标签系统支持根据多层级的组织架构添加用户,并根据部门进行标签授权、行级权限的控制。

file

5.【批量操作】-发布/更新交互升级

· 批量发布:分类展示可发布、无法发布的标签,并说明标签无法发布的原因,降低操作门槛

file

· 批量更新:分类展示可更新、无法更新的标签,并说明标签无法更新的原因,降低操作门槛

file

6.【通用模板】-查询模板设置

设置查询维度通用模板,并直接应用于标签圈群、上传本地群组、群组交并差选查询维度的地方,用户可以在模板的基础上增删查询维度,减少操作成本。

file

7.【导出描述】-导出数据时可填描述

用户在导出数据时可填写描述信息,系统将描述信息记录在审计日志中。

file

8.其他优化项

· 标签圈群支持重置条件

file

· 字典数据最大支持2000条

file

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szalykfz

添加【小袋鼠:dtstack001】入qun,免费获取大数据&开源干货

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术 qun」,交流最新开源技术信息,qun 号码:30537511,项目地址:https://github.com/DTStack

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
运维 监控 Java
内存溢出+CPU占用过高:问题排查+解决方案+复盘(超详细分析教程)
全网最全的内存溢出CPU占用过高排查文章,包含:问题出现现象+临时解决方案+复现问题+定位问题发生原因+优化代码+优化后进行压测,上线+复盘
2557 5
|
4月前
|
编解码 人工智能 运维
南加大提出全新通用时间序列基础模型TimeDiT!基于扩散模型创新物理约束机制
 【10月更文挑战第10天】南加大提出TimeDiT模型,创新融合扩散模型与Transformer架构,针对真实世界时间序列数据的复杂性,如多分辨率、缺失值等问题,提供高效解决方案。该模型通过新颖的掩码机制和无微调编辑策略,实现多任务处理及物理知识集成,显著提升预测和异常检测的准确性和鲁棒性。
123 3
|
机器学习/深度学习 存储 数据采集
工业场景全流程!机器学习开发并部署服务到云端 ⛵
本文以保险金额预估为例,讲解机器学习从开发到云端服务部署的全流程:基于PyCaret开发机器学习全流程、基于Flask搭建简易前端Web应用程序、在Heroku云上部署机器学习应用。
948 2
工业场景全流程!机器学习开发并部署服务到云端 ⛵
|
SQL 存储 运维
袋鼠云产品功能更新报告06期|数栈产品功能升级,做产品我们是认真的!
第06期袋鼠云产品功能更新报告来啦!包括对 EasyMR 监控告警功能的更新,以及对离线开发平台表生命周期逻辑的优化等,力求满足不同行业用户的更多需求,为用户带来极致的产品使用体验。
349 0
|
9月前
|
存储 缓存 Linux
【Linux】进程概念(冯诺依曼体系结构、操作系统、进程)-- 详解
【Linux】进程概念(冯诺依曼体系结构、操作系统、进程)-- 详解
|
1月前
|
消息中间件 人工智能 Serverless
主动式智能导购AI助手构建解决方案评测
主动式智能导购AI助手构建解决方案评测
153 3
|
3月前
|
机器学习/深度学习 传感器 算法
智能机器人在工业自动化中的应用与前景###
本文探讨了智能机器人在工业自动化领域的最新应用,包括其在制造业中的集成、操作灵活性和成本效益等方面的优势。通过分析当前技术趋势和案例研究,预测了智能机器人未来的发展方向及其对工业生产模式的潜在影响。 ###
269 9
|
机器学习/深度学习 存储 算法
机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost
机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost
607 0
|
9月前
|
安全 算法 网络安全
IPsec VPN简介
IPsec VPN简介
269 6
|
9月前
|
安全 测试技术 PHP
如何搭建 sqli-labs 靶场保姆级教程(附链接)
如何搭建 sqli-labs 靶场保姆级教程(附链接)

热门文章

最新文章