开发者社区 > PolarDB开源 > PolarDB 分布式版 > 正文

做数据分析的时候,获取了数据之后需要做哪些工作?

已解决

做数据分析的时候,获取了数据之后需要做哪些工作?

展开
收起
云上静思 2022-10-18 15:21:41 1469 1
3 条回答
写回答
取消 提交回答
  • 推荐回答

    把数据加载到数据分析工具里,即先获得要分析的数据,再将数据导入到工具中。这些待分析的数据可能是 散落在互联网上,也可能是在某个文件里面,总而言之我们得先获得想要分析的数据。但是,刚拿到手的数据,格式通常 是五花八门的,比如下载的网页格式通常是HTML,有些数据是XML格式,也有些是JSON格式,甚至还有一些数据格式 是自定义的,不是通用的格式。为了能分析这些数据,得先把这些数据做格式转换,转换成方便处理的结构化格式(例如 CSV、JSON等),然后导入到分析工具中。

    以上内容摘自《PolarDB for PostgreSQL 源码与应用实战》电子书,点击https://developer.aliyun.com/ebook/download/7773可下载完整版

    2022-10-18 16:26:11
    赞同 2 展开评论 打赏
  • 喜欢旅游,运动,健身

    新人做任务

    2023-06-21 21:42:45
    赞同 展开评论 打赏
  • 先做ETL吧;然后视情况看需不需要导入到数仓/数据库之类的里面;然后用Hive这种SQL类的工具或者python这种高级程序设计语言做一些数据综合处理和分析;最后用一些BI工具做可视化分析?

    2023-06-20 14:23:52
    赞同 2 展开评论 打赏

PolarDB 分布式版 (PolarDB for Xscale,简称“PolarDB-X”) 采用 Shared-nothing 与存储计算分离架构,支持水平扩展、分布式事务、混合负载等能力,100%兼容MySQL。 2021年开源,开源历程及更多信息访问:OpenPolarDB.com/about

相关电子书

更多
Python第四讲——使用IPython/Jupyter Notebook与日志服务玩转超大规模数据分析与可视化 立即下载
互联网下半场的角逐,玩转轻资产的大数据服务—图(关系网络)数据分析与阿里应用 立即下载
如何使用大数据计算服务 MaxCompute进行数据分析 立即下载