备案控制台

开发者社区问答正文

BigQuery -更新已更改/删除记录的表

目前，我们将整个文件发送到云中(谷歌云存储)，导入到BigQuery中，并进行简单的删除/替换。然而，随着文件大小的增长，我们的网络团队并不特别喜欢在其他etl也在尝试运行时我们所占用的带宽。因此，我们只希望发送更改/删除的行。试图找到路径/帮助文档如何做到这一点。Scope——我将从一个简单的例子开始。我们有一个包含3亿条记录的大表。与其每天晚上发送3亿条记录，不如发送超过X万条已更改/删除的记录。然后，我需要将更改/删除的记录合并到BigQuery表中。我们目前使用Node JS从存储迁移到BigQuery，使用Python通过编写器在BigQuery中调度本地表更新。希望能找到正确的方向，知道如何开始这条路。问题来源StackOverflow 地址：/questions/59381483/bigquery-update-tables-with-changed-deleted-records

展开

收起

kun坤 2019-12-28 13:46:59 813 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

在每次更新到BigQuery时都将完整的行数据流化。让表容纳同一主实体的多行。写一个视图，如table_last，选择最近的行。通过这种方式，您可以对真实数据进行几乎实时的查询。您可以通过运行一个只使用最新行重写self表的查询来重复数据。另一种方法是，如果您有一个final表，以及一个您流进的表，并且有一个每X分钟运行一次的MERGE语句，以将更新从流进的表写到final表。

2019-12-28 13:47:05

赞同展开评论

问答分类：

SQL 存储 JavaScript 调度 Python

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

2874

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82221

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

131164

28

0

this xml file does not appear to have any style in

50645

10

0

sql server的用户名和密码怎么查啊？

36676

21

0

OSS的endpoint如何查看

37008

6

0

计算机网络的频带传输是什么意思？

2011

1

0

手机弹出支付风险问题

6827

2

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60263

30

0

配置了安全组规则，端口还是无法访问

32897

25

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云双十一优惠活动开始了？2025年的是这个吗？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

阿里云PAI是什么？怎么用？

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

阿里云2核2G3M适合搭建个人博客或小型项目吗？

相关文章

单位电脑监控软件的 Node.js 哈希表日志去重算法

ASP.NET Core Blazor 核心功能一：Blazor依赖注入与状态管理指南

构建AI智能体：十五、超越关键词搜索：向量数据库如何解锁语义理解新纪元

AI时代数字营销的底层重构：于磊老师深度解析Geo未来发展趋势展望

基于java语言自主版权的一套医院随访管理系统源码

还有其他疑问?