DataWorks公共资源组可以访问公网数据,但是需要注意以下几点:
网络带宽:如果您的任务需要处理大量的数据,或者需要从公网下载大量的数据,那么网络带宽可能会成为限制因素。您需要根据实际情况调整网络带宽设置,以确保任务能够顺利完成。
网络延迟:网络延迟也可能成为限制因素。如果您的任务需要处理的数据量较大,或者需要从公网下载的数据量较大,那么网络延迟可能会对任务的执行时间产生影响。您需要根据实际情况调整网络延迟设置,以确保任务能够顺利完成。
网络安全:如果您的任务需要访问敏感的数据或者需要与公网进行通信,那么网络安全也可能成为限制因素。您需要确保网络安全设置正确,以确保数据的安全性和通信的可靠性。
DataWorks公共资源组可以访问公网数据,但是需要注意网络带宽、网络延迟和网络安全等限制因素,以确保任务能够顺利完成。
开通DataWorks时,DataWorks自动为您提供公共资源组(包括公共调度资源组、公共数据集成(调试)资源组、公共数据服务资源组),可用于数据开发、运行测试等操作。公共资源组被多个租户共享,高峰期租户间可能会存在抢占资源的情况。
数据源所处的网络环境与资源组的连通性支持情况如下。
所以DataWorks公共资源组不仅可以拉取公网数据,也可以拉取经典网络里的数据。
DataWorks公共资源组不是只能拉取公网数据,并非绝对。
一般情况下,公共资源组默认只能访问互联网中的公网数据源。
但是在特定的场景下,公共资源组也可以访问内部私网的数据源。具体有以下几种方法:
数据源进行内网穿透
即通过技术手段,将内网的数据源暴露到公网,然后公共资源组就可以连接访问了。
数据源配置IP白名单
内网数据源允许公共资源组所在服务器的IP地址访问。
这样公共资源组就可以访问这个内网数据源。
通过专用通道访问
内网数据源和公共资源组通过专用通道进行互联,实现私网互联。
配置内网路由
使公共资源组可以访问内网地址,即内网数据源可以在公共资源组内直接查询到。
上述几种方式,都可以让公共资源组被 autorize 去访问内网私有的数据源。
但一般来说,公共资源组主要还是用于连接公网数据为主。而独享资源组用于访问内网数据源的效率更高,安全性更高。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。