备案控制台

开发者社区大数据与机器学习正文

大佬们问下,flink datastream api支不支持,把B数据源放到slot2,C数据源放？

大佬们问下,flink datastream api支不支持,把B数据源放到slot2,C数据源放到slot3中？

展开

收起

真的很搞笑 2023-06-04 18:48:04 377 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

行十三

云端行者觅知音，技术前沿我独行。前言探索无边界，阿里风光引我情。
网上找了下答案，看能不能帮助到你。Flink DataStream API提供了一些方法来控制数据源的并行度和分区，以便更好地利用资源。您可以使用DataStream的rebalance()、rescale()、shuffle()等来重新分配数据源的分区，以便更好地平衡负载。

如果您想将数据源放到slot2，C数据源放到3，可以使用Flink的Slot Sharing机制。Slot Sharing机制允许多个任务共享同一个slot，以便更好地利用资源。您可以使用DataStream的slotSharingGroup()方法来指定任务的slot sharing group，以便将它们分配到同一个中。

例如，您可以使用以下代码将B数据源放到slot2，C数据源放到slot3：
```
DataStream<B> bStream = ...;
DataStream<C> cStream = ...;

bStream = bStream.slotSharingGroup("group2").setParallelism(1).slotSharingGroup("group2");
cStream = cStream.slotSharingGroup("group3").setParallelism(1).slotSharingGroup("group3");

DataStream<Tuple2<B, C>> joinedStream = bStream.join(cStream)
    .where(<b-key-selector>)
    .equalTo(<c-key-selector>)
    .window(<window-assigner>)
    .apply(<join-function>);
```
在这个例子中，我们将B数据源放到slot2，C数据源放到slot3，并使用setParallelism()方法将它们的并行度设置为1。然后，我们将它们分配到相应的slot sharing group中。最后，我们使用join()方法将它们连接起来。

请注意，这只是一个示例，具体的实现可能因您的应用程序而异。您需要根据您的应用程序需求和资源配置来选择合适的并行度和分区策略。
2023-06-14 19:05:54

赞同展开评论

问答分类：

API 流计算实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83837

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3792

1

0

重启Docker后报错：Error response from daemon

2352

0

0

this xml file does not appear to have any style in

51943

10

0

sql server的用户名和密码怎么查啊？

37556

21

0

LoRa的网络覆盖能力范围是怎么样的？

3231

1

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60971

32

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3701

1

0

OSS的endpoint如何查看

37530

6

0

阿里云服务器如何重置系统？

24757

4

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

相关文章

全球IP归属地查询免费API详细指南

免费天气预报API接口详解

Python装饰器进阶：用闭包打造智能缓存函数

Python异步编程入门：告别阻塞，拥抱高效IO

蓝易云：整理Selenium应用中的核心JavaScript操作技巧

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

flink cdc同步的源表，一定要有主键么？

flink cdc source端能降低消费速度嘛？

Dataworks中MaxCompute表怎么创建唯一索引啊?

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

展开全部

阿里封神谈hadoop生态学习之路

你刚吃的兰州牛肉面，背后就藏着大数据

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

【转载】时隔一年多，我又用起了 Superset

品《阿里巴巴大数据实践-大数据之路》一书（上）

干货：解码OneData，阿里的数仓之路。

现代流式计算的基石：Google DataFlow

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

展开全部

还有其他疑问?