开发者社区> 问答> 正文

MaxCompute半结构化数据是什么?

MaxCompute半结构化数据是什么?

展开
收起
xin在这 2021-12-12 12:00:15 577 0
1 条回答
写回答
取消 提交回答
  • 结构化数据,即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据

    非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等

    半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,经常变化的,数据的结构和内容混在一起,一般由一个三元组表示,包括标记、类型和对象的值。

    通过数据模型比较:

    结构化数据:关系型(二维表) 半结构化数据:由一个由节点集合和弧段集合组成的具根有向图结构。(树、图) 非结构化数据:无

    最后从wiki带的定义看,半结构化的特点是复杂类型结构,易变,需要从自描述结构中提取数据进行计算。

    2021-12-12 12:00:41
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载
大数据&AI实战派 第2期 立即下载