开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

项目爬虫,每次只能爬取一个表中的2-3个字段,然后我需要把这几次爬取的合并成一张表。有什么解决方案

项目爬虫,每次只能爬取一个表中的2-3个字段,然后我需要把这几次爬取的合并成一张表。有什么解决方案么

展开
收起
游客3oewgrzrf6o5c 2022-07-19 14:13:34 343 0
1 条回答
写回答
取消 提交回答
  • dataworks这边没有相关解决方案 如果需要数据传输 要看爬虫出来的数据存储在哪个服务 再通过数据集成传输到MaxCompute等(此答案整理自DataWorks交流群(答疑@机器人))

    2022-07-19 14:44:21
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关电子书

更多
Python第五讲——关于爬虫如何做js逆向的思路 立即下载
4个迭代,从批量交...1573957773.pdf 立即下载
RowKey与索引设计:技巧与案例分析 立即下载