SSIS 延迟验证

简介:

验证是一个事件,该事件在Package执行时,第一个被触发,验证能够避免SSIS引擎执行一个有异常的Package或Task。延迟验证(DelayValidation)是把验证操作延迟到Package真正运行(run-time)时开始执行,当禁用延迟验证时,一旦验证操作返回错误(Error)或警告(Warning),Package就不会继续执行下去。在更新海量的数据时,通常需要用到暂存表把远端数据加载到本地,这就需要在Package执行之后,创建暂存表(staging table);在Package执行之后,删除暂存表,当禁用延迟验证时。当禁用延迟验证时,验证操作在Package执行之前,会检测暂存表是否存在,由于暂存表需要在Package执行之后创建,因此,验证事件发出错误消息,Package停止运行,这对这种情况,必须使用延迟验证,在真正引用到暂存表时,延迟暂存表是否存在。

一,延迟验证属性

延迟验证属性作用于Package,Task,容器(Container)和链接管理器(Connection Manager),默认情况下,禁用延迟验证,这就意味着,在Package执行时,首先验证Package,Task,容器和链接管理器引用的对象是否有效,如果有任何对象不存在,那么验证失败,Package停止运行。

在Package开始执行之前,验证Package,能够尽早发现错误,避免浪费系统资源去执行一个必定会失败的Package,合理配置,会带来性能的优化。

二,验证方式

按照验证的执行顺序来看,Package包含两种类型的验证方式:

  • Package Validation:在Package执行时,首先验证Package及其包含的所有组件,是Package级别的验证;
  • 组件验证:组件级别的验证,包含Task , Connection Manager和Container,在组件开始执行之前,验证组件中引用对象的有效性。

验证分为两个阶段(Phrase),首先进行Package级别的验证,而后进行组件级别的验证:

Package级别的验证包含组件级别的验证,如果禁用延迟验证,那么组件级别的验证会执行两次,这在设计Package时,不是一个好的选择,这会增加Package的验证时间,还会增加每一次打开Package进行编辑的时间。而启用延迟验证,这会禁用了Package 级别的验证,以至于在Package的设计时(design-time),只执行组件级别的验证,注意,任何情况下,无法禁用组件级别的验证。

通常情况下,对一个完成开发的Package启用延迟验证,是一个好的选择,这会减少Package整体的执行时间,因为跳过了Package级别的验证。

1,禁用延迟验证

禁用Package的延迟验证,需要设置Package的DelayValidation属性值为False,默认情况下,Packag会禁用延迟验证,如下图所示:

那么在Package开始运行之后,第一件事就是开始执行Package Validation,当Package级别的验证操作完成之后,开始验证Package包含的各个Task等,如果验证发现错误,Package不会被执行,直接报错。

 2,启用延迟验证

启用Package的延迟验证,需要设置Package的DelayValidation属性值为True,如下图所示:

当启用延迟验证时,Package会执行下去,知道运行到特定的组件时,才会执行组件验证,如果组件验证失败,那么抛出错误消息,停止Package的运行。

组件验证发生真正执行组件,如果上流组件新建一个暂存表(staging table),下游组件引用该暂存表,并不会出现异常,这是因为在该组件进行验证时,该暂存表已经存在。

三,延迟验证属性的层次结构

在Package级别上设置DelayValidation属性并不能阻止打开Package时的最初的验证过程,它只是在运行包时延迟Package级别的验证,这就意味着Package将继续运行,但是当打开Package时警报仍然出现。如果想阻止打开Package时的验证,那么必须把Task级别上的DelayValidation属性设置为True。

避免验证链接管理器,有时,是一个非常节省开发时间的选择。有时打开Package的过程会花费很长的时间,这可能是因为它引用了一个远程数据源,而数据源的响应很缓慢,或者链接不上。如果我们正在开发一个包,并且需要经常打开这个包,那么我们可能需要花费很长的时间来等待SSIS验证一个数据源。在这样的情况下,在任务级设置DelayValidation属性为True可以为我们节省大量的时间。

示例1,验证操作只会验证属性的完整性

设置Package Level的属性DelayValidation=False,Task Level的属性DelayValidation=False

Package的处理流程如下图所示,Package级别的Validation在Create Staging Table的Validation之前开始,在Insert Data的Validation之后结束,从图中能看到Insert Data的验证完成,实际上,验证操作并没有检查出一个非常简单的语法错误,直到Task真正执行时,才发现错误,这说明,验证操作只会验证Task属性的完整性,效果是有限的。

示例2,验证操作会验证引用的对象是否存在

设置Package Level的属性DelayValidation=False,Task Level的属性DelayValidation=False,在Data Flow Task中,OLE DB Source组件从一个当前不存在的表dbo.delay_test中selelct数据:

在执行Package时,SSIS弹出“Package Validation Error”窗体,这就是Package级别上的验证发现的错误:

设置Package Level的属性DelayValidation=False,Task Data Flow Task的属性DelayValidation=True,重新执行,Package成功执行。

示例3,打开package的验证

设置Package Level的属性DelayValidation=True,Task Level的属性DelayValidation=False,在打开Package时,Task Data Flow Task上面是有红色X号的,当设置Task Level的属性DelayValidation=True时,在打开package时,Task Data Flow Task上面的红色X符号消失,这说明,在打开Package时,验证操作已经开始,并且Task 级别的验证属性会覆盖上层的验证。

 

以上三个示例说明,在打开Package,设计Package和运行Package时,SSIS引擎都会对Package进行验证,并且Package的验证操作是优层次结构的,底层的延迟验证会覆盖上层的延迟验性。

 

作者悦光阴
本文版权归作者和博客园所有,欢迎转载,但未经作者同意,必须保留此段声明,且在文章页面醒目位置显示原文连接,否则保留追究法律责任的权利。
分类: SSIS

本文转自悦光阴博客园博客,原文链接:http://www.cnblogs.com/ljhdo/p/4803531.html,如需转载请自行联系原作者
目录
相关文章
|
7月前
|
存储 运维 Kubernetes
批处理及有状态等应用类型在 K8S 上应该如何配置?
批处理及有状态等应用类型在 K8S 上应该如何配置?
|
12天前
|
存储 缓存 网络协议
数据库执行查询请求的过程?
客户端发起TCP连接请求,服务端通过连接器验证主机信息、用户名及密码,验证通过后创建专用进程处理交互。服务端进程缓存以减少创建和销毁线程的开销。后续步骤包括缓存查询(8.0版后移除)、语法解析、查询优化及存储引擎调用,最终返回查询结果。
23 6
|
7月前
|
存储 SQL SpringCloudAlibaba
记一次生产环境存储过程优化的过程(42秒-->0.06秒)
记一次生产环境存储过程优化的过程(42秒-->0.06秒)
74 0
|
7月前
|
SQL 关系型数据库 MySQL
⑩⑥ 【MySQL】详解 触发器TRIGGER,协助 确保数据的完整性,日志记录,数据校验等操作。
⑩⑥ 【MySQL】详解 触发器TRIGGER,协助 确保数据的完整性,日志记录,数据校验等操作。
136 0
|
消息中间件 存储 算法
Flink---13、容错机制(检查点(保存、恢复、算法、配置)、状态一致性、端到端精确一次)
Flink---13、容错机制(检查点(保存、恢复、算法、配置)、状态一致性、端到端精确一次)
|
自然语言处理 算法 数据库
简述数据库执行查询请求的过程
当数据库接收到查询请求后,首先需要对查询语句进行解析。这个过程包括词法分析和语法分析,将查询语句转化为内部数据结构,以便后续处理。
169 0
|
SQL 关系型数据库 MySQL
Loadrunner脚本优化-参数化之关联MySQL数据库获取数据
Loadrunner脚本优化-参数化之关联MySQL数据库获取数据
112 0
|
缓存 Go 数据库
SSIS技巧--优化数据流缓存
原文:SSIS技巧--优化数据流缓存 问题     我们经常遇到一种情况,在SSMS中运行很慢的一个查询,当把查询转化成从源到目的数据库的SSIS数据流以后,需要花费几倍的时间!源和数据源都没有任何软硬件瓶颈,并且没有大量的格式转换。
1724 0
|
存储 监控 数据库
SqlServer 监控发布中未分发的命令数
原文:SqlServer 监控发布中未分发的命令数 对于查看未分发的命令数,我们通常这样查看。 然而当服务器有很多发布时,一个个打开查看就很麻烦 当然,如果想用脚本查看就更方便了,运行下面的语句 --查看各发布订阅未分发的命令数和估计时间 SELECT 'EXEC distribution.
1116 0
|
存储 SQL Go
SqlServer 禁止架构更改的复制中手动修复使发布和订阅中分别增加的字段同步
原文:SqlServer 禁止架构更改的复制中手动修复使发布和订阅中分别增加的字段同步 由于之前的需要,禁止了复制架构更改,以至在发布中添加一个字段,并不会同步到订阅中,而现在又在订阅中添加了一个同名字段,怎么使这发布和订阅的两个字段建立同步关系呢? 下面就测试更改:此次发布类型为事务复制的可更新订阅,其他类型的发布没有测试。
1124 0