开发者社区 问答 正文

元数据库数据字典是什么?(2)

  • 储了所有的表中索引的详细信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(128)NOPRINULL所属SCHEMA
TABLE_GROUPvarchar(128)YESNULL所属表组
TABLE_NAMEvarchar(128)NOPRINULL所属表名
COLUMNSvarchar(255)YESNULL列名
INDEX_NAMEvarchar(128)NOPRINULL索引名称
INDEX_TYPEint(11)YESNULL索引类型:3(HASH)、5(FULLTEXT)
TYPE_NAMEvarchar(128)YESNULL类型名称:HASH、FULLTEXT
IS_PREFETCHtinyint(1)YESNULL是否是PREFETCH
COMMENTvarchar(255)YESNULL说明
CREATE_TIMEtimestampNOCURRENT_TIMESTAMP创建时间
UPDATE_TIMEtimestampNO0000-00-0000:00:00更新时间
  • 如果希望了解某一个表的索引信息可以根据 TABLE_SCHEMA 、 TABLE_GROUP 、 TABLE_NAME查询该表下所涉及的索引信息情况。


STATISTICS

  • 表存储了所有的表中索引使用情况的统计信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_CATALOGvarchar(64)YESNULLCATALOG名称
TABLE_SCHEMAvarchar(64)NOPRINULL表的SCHEMA
TABLE_NAMEvarchar(64)NOPRINULL表名
NON_UNIQUEtinyint(1)YESNULL是否是非唯一
INDEX_SCHEMAvarchar(64)YESNULL索引的SCHEMA
INDEX_NAMEvarchar(64)NOPRINULL索引名称
SEQ_IN_INDEXint(11)YESNULL索引中的位置
COLUMN_NAMEvarchar(64)NOPRINULL列名
COLLATIONvarchar(64)YESNULL排序规则
CARDINALITYbigint(20)YESNULL散列程度
  • 如果希望了解某一个表中的索引使用信息,例如某一个表中包含了多少个索引,索引类型,某一个列在索引总的位置,索引的散列程度等,可以根据TABLE_SCHEMA 、 TABLE_GROUP 、 TABLE_NAME 查询该表的响应的信息。


JOB_INSTANCES

  • 该表存储了所有任务的详细信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
JOB_IDvarchar(255)NOPRINULL任务ID
JOB_NAMEvarchar(255)YESNULL任务名称
JOB_TYPEvarchar(64)YESNULL任务类型
DEADLINEtimestampNOCURRENT_TIMESTAMP截止日期
STARTING_LINEtimestampNO0000-00-0000:00:00
STATEvarchar(64)YESNULL状态
PROGRESSint(11)YESNULL进度
START_TIMEtimestampNO0000-00-0000:00:00开始时间
END_TIMEtimestampNO0000-00-0000:00:00结束时间
PREDICTED_START_TIMEtimestampNO0000-00-0000:00:00预计开始时间
PREDICTED_END_TIMEtimestampNO0000-00-0000:00:00预计结束时间
  • 如果希望了解任务的运行情况,查看任务运行的状态和进度,可以根据JOB_ID查询这张表的信息。


TABLE_DATA_LOADS

  • 该表存储了表数据加载情况的相关信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(64)NOPRINULL表的SCHEMA
TABLE_NAMEvarchar(64)NOPRINULL表名
TABLE_PARTITIONvarchar(255)NOPRINULL表的分区名
DATA_VERSIONbigint(20)NOPRINULL数据版本
DATA_SOURCE_TYPEvarchar(255)YESNULL数据源类型:odps、pangu
DATA_SOURCE_PATHvarchar(255)YESNULL数据源路径在odps和pangu上的路径
COMMAND_SQLtextYESNULLSQL
JOB_INSTANCE_IDvarchar(255)NOPRINULL任务实例ID,关联到job_instances的JOB_ID
DATA_SOURCE_SIZEbigint(20)YESNULL数据源大小
USERvarchar(64)YESNULL用户
USER_HOSTvarchar(64)YESNULL用户主机
CREATE_TIMEtimestampNOCURRENT_TIMESTAMP创建时间
  • 如果希望了解表中数据的装载信息可以根据 TABLE_SCHEMA 和 TABLE_NAME 查询相应信息。
  • 通过 JOB_INSTANCE_ID 联合 job_instances 中的 JOB_ID 查询任务运行情况。


SERVERS

FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
SCHEMA_NAMEvarchar(128)NOPRINULLSCHEMA名称
CREATE_TIMEtimestampNOCURRENT_TIMESTAMP创建时间
UPDATE_TIMEtimestampNO0000-00-0000:00:00更新时间
ONLINE_SERVER_IDvarchar(255)YESNULL
SLB_PLAN_ENTRY_IDvarchar(255)YESNULL
SLB_INSTANCE_IDvarchar(255)YESNULL
SLB_RS_LISTvarchar(255)YESNULL
read_slb_instance_idvarchar(255)YESNULL
write_slb_instance_idvarchar(255)YESNULL


MINUTE_DB_PROFILE

  • 该表存储了按照分钟级别统计DB访问量的信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(64)NOPRINULLSCHEMA名称
UPDATE_TIMEvarchar(64)NOPRINULL更新时间
SERVER_IDvarchar(64)NOPRINULLSERVERID
QPSint(11)YESNULL按照分钟级别统计的每秒查询数
PVbigint(20)YESNULL按照分级级别统计的访问量
AVG_RTint(11)YESNULL按照分支级别统计的平均响应时间
DATA_SIZEbigint(20)YESNULL数据大小
  • 如果希望了解某一个数据库分钟级别的统计信息包括QPS、PV、RT和数据大小信息可以根据 TABLE_SCHEMA 查询相应信息。
  • 通过查询这些信息,可以了解数据库的当前使用情况,尤其是在数据库性能底下的时候可以通过这些信息发现性能瓶颈。


HOUR_DB_PROFILE

  • 该表存储了按照小时级别统计DB访问量的信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(64)NOPRINULLSCHEMA名称
THEDATEint(11)NOPRINULL
HOURint(11)NOPRINULL小时数
TOTAL_PVbigint(20)YESNULL总访问量
AVG_RTint(11)YESNULL平均响应时间
MAX_RTint(11)YESNULL最大响应时间
ZERO_RESULTbigint(20)YESNULL零结果查询个数
TIME_OUTbigint(20)YESNULL超时查询个数
CACHE_HIT_RATEfloatYESNULL缓存访问率
RT_DISTvarchar(255)YESNULL
  • 如果希望了解某一个数据库小时级别的统计信息包括QPS、PV、RT、零结果查询、超时查询等信息可以根据 TABLE_SCHEMA 查询相应信息。
  • 通过查询这些信息,可以了解数据库的当前使用情况,尤其是在数据库性能底下的时候可以通过这些信息发现性能瓶颈。


HOUR_DB_PROFILE

  • 该表统计了小时级别的所有慢查询,以及相关的统计信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(64)NOPRINULLSCHEMA名称
THEDATEint(11)NOPRINULL
HOURint(11)NOPRINULL小时数
ORDER_IDXint(11)NOPRINULL
SQLtextYESNULL具体的SQL
RTint(11)YESNULL响应时间
PVbigint(20)YESNULL访问量
LAST_QUERY_TIMEtimestampNOCURRENT_TIMESTAMP最后查询时间


CURRENT_JOB

  • 数据批量导入任务或实时表的optimize table的任务信息,通常只保留最近24小时的任务
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(128)NOPRINULLSCHEMA名称
TABLE_GROUPvarchar(128)YESNULL表组名称
TABLE_NAMEvarchar(128)NOPRINULL表名称
DATA_VERSIONbigint(20)NOPRINULL数据版本
JOB_IDvarchar(255)NOPRINULL任务ID,可以关联job_instances的JOB_ID
STATEvarchar(128)YESNULL任务状态
USERvarchar(128)YESNULL提交者
ONLINE_GROUPvarchar(255)YESNULL在线组
START_TIMEtimestampNOCURRENT_TIMESTAMP开始时间
FINISH_TIMEtimestampNO0000-00-0000:00:00结束时间
SOURCE_PATHtextYESNULL源在odps或者pangu上面的路径
PARTITION_PATHvarchar(255)YESNULL分区路径
PARAMETERStextYESNULL运行时参数
DEADLINEtimestampNO0000-00-0000:00:00截止日期
ERROR_CODEvarchar(128)YESNULL错误编码
ERROR_MSGvarchar(255)YESNULL错误信息
PRIORITYint(11)YESNULL优先级
  • 如果希望了解某一个数据库某一个表的数据上线任务信息,可以根据 TABLE_SCHEMA , TABLE_GROUP 和 TABLE_NAME查询相应信息。


CURRENT_TASK

  • 如果希望了解某一个数据库某一个表的数据上线任务信息,可以根据 TABLE_SCHEMA , TABLE_GROUP 和 TABLE_NAME查询相应信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(64)NOPRINULL表的SCHEMA
TABLE_NAMEvarchar(64)NOPRINULL表名
DATA_VERSIONbigint(20)NOPRINULL数据版本
JOB_IDvarchar(255)NOPRINULLJOB_ID
TASK_IDvarchar(255)NOPRINULLTASK_ID
TABLE_GROUPvarchar(128)YESNULL表组名称
TASK_TYPEvarchar(64)YESNULLTASK类型
USERvarchar(64)YESNULL创建者
TASK_STATEvarchar(64)YESNULLTASK状态
START_TIMEtimestampNOCURRENT_TIMESTAMP开始时间
END_TIMEtimestampNO0000-00-0000:00:00结束时间
PREDICTED_START_TIMEtimestampNO0000-00-0000:00:00预计开始时间
PREDICTED_END_TIMEtimestampNO0000-00-0000:00:00预计结束时间
DEADLINEtimestampNO0000-00-0000:00:00截止日期
PRIORITYint(11)YESNULL优先级
INIT_TIME_COSTbigint(20)YESNULL初始化时间
RESOURCE_COSTint(11)YESNULL资源耗费
BUILD_IDvarchar(255)YESNULLBUILD_ID
PARTITION_PATHvarchar(255)YESNULL分区路径
ONLINE_GROUPvarchar(255)YESNULL在线分组
EXIGENTvarchar(255)YESNULL是否紧急
INPUTtextYESNULL输入参数
OUTPUTtextYESNULL输出参数
  • 如果希望了解Build排队时间,取决于当前集群Build并发度、DB内Build并发度。例如:
  1. SELECT timestampdiff(second, a.end_time,b.start_time) FROM
  2. (select start_time,end_time from information_schema.current_task where job_id='LDDT-xxx' and task_type='CALLBACK') a
  3. JOIN
  4. (select start_time,end_time from information_schema.current_task where job_id='LDDT-xxx' and task_type='BUILID') b;
  • 如果希望了解Build执行时间,取决于数据量大小、MR配置(如map/reduce个数及内存大小)、ODPS资源。例如:在ODPS资源充足、无排队情况下,Build构建索引的性能是单核5GB/h左右。MR的默认配置是100个reduce,每个reduce的默认cpucore数为1。
  1. SELECT timestampdiff(second, start_time,end_time)
  2. FROM information_schema.current_task
  3. WHERE job_id='LDDT-xxx' and task_type='BUILD';
  • 查询任务状态。例如:
  1. SELECT state,error_code,error_msg
  2. FROM information_schema.current_job
  3. WHERE job_id='LDDT-xxx';
  • 查询阶段任务状态。例如:
  1. SELECT task_type,task_state,start_time,end_time
  2. FROM information_schema.current_task
  3. WHERE job_id='LDDT-xxx';


BUILD_CURRENT_TASK

  • 如果希望了解某一个数据库某一个表的数据上线任务信息,可以根据 TABLE_SCHEMA, TABLE_GROUP 和 TABLE_NAME查询相应信息。
FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL集群名称
TABLE_SCHEMAvarchar(128)NOPRINULLSCHEMA名称
TABLE_GROUPvarchar(128)YESNULL表组名称
TABLE_NAMEvarchar(128)NOPRINULL表名称
DATA_VERSIONbigint(20)NOPRINULL数据版本
JOB_START_TIMEtimestampNOCURRENT_TIMESTAMPJOB开始时间
JOB_IDvarchar(255)YESNULLJOB_ID可以关联job_instances的JOB_ID
SOURCE_PATHvarchar(255)YESNULL数据源路径
TASK_TYPEvarchar(128)YESNULLTASK类型pangu、odps
TASK_IDvarchar(255)NOPRINULLTASK_ID关联current_task中的TASK_ID
TASK_STATEvarchar(128)YESNULLTASK状态
INNER_STATEvarchar(128)YESNULLBUILD内部状态
INCREMENTALvarchar(128)YESNULLtrue实时表,FALSE批量表
PROPERTIESvarchar(255)YESNULL
PARTITIONSvarchar(255)YESNULL
TASK_PREFIXvarchar(255)YESNULL
USERvarchar(128)YESNULL
RETRY_TIMES_REMAINvarchar(255)YESNULL剩余重试次数
VIEW_PHYSICAL_TABLEvarchar(255)YESNULL
SPLIT_INSTANCE_IDvarchar(255)YESNULLOPPS返回的SPLIT阶段的MapReduceID
SPLIT_LOG_VIEWtextYESNULLOPDS返回MapReduce的LOGVIEW连接
MERGE_INSTANCE_IDvarchar(255)YESNULLOPPS返回的MERGE阶段的MapReduceID
MERGE_LOG_VIEWtextYESNULLOPDS返回MapReduce的LOGVIEW连接
SPLIT_START_TIMEtimestampNO0000-00-0000:00:00BUILD中2个MR任务中的SPLIT阶段的开始时间
SPLIT_FINISH_TIMEtimestampNO0000-00-0000:00:00BUILD中2个MR任务中的SPLIT阶段的结束时间
MERGE_START_TIMEtimestampNO0000-00-0000:00:00BUILD中2个MR任务中的MERGE阶段的开始时间
MERGE_FINISH_TIMEtimestampNO0000-00-0000:00:00BUILD中2个MR任务中的MERGE阶段的结束时间
CREATE_TIMEtimestampNO0000-00-0000:00:00
UPDATE_TIMEtimestampNO0000-00-0000:00:00
ERROR_CODEvarchar(128)YESNULL
ERROR_MSGtextYESNULL


TABLE_DATA_REQUEST

FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(128)NOPRINULL
TABLE_SCHEMAvarchar(128)NOPRINULL
REQUEST_IDvarchar(128)NOPRINULL
REQUEST_TYPEvarchar(128)YESNULL
SCHEMA_IDbigint(20)YESNULL
TABLE_IDbigint(20)YESNULL
TABLE_NAMEvarchar(128)YESNULL
DATA_VERSIONbigint(20)YESNULL
REQUEST_NAMEvarchar(128)YESNULL
STATEvarchar(128)YESNULL
CREATE_TIMEtimestampNOCURRENT_TIMESTAMP
UPDATE_TIMEtimestampNO0000-00-0000:00:00
ERROR_CODEvarchar(128)YESNULL
ERROR_MSGvarchar(255)YESNULL
INTERNAL_ERROR_CODEvarchar(128)YESNULL
INTERNAL_ERROR_MSGvarchar(255)YESNULL
user_namevarchar(128)YESNULL
user_idvarchar(128)YESNULL


SERVICE_REQUEST

FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(128)NOPRINULL
TABLE_SCHEMAvarchar(128)NOPRINULL
RESOURCE_GROUP_NAMEvarchar(128)NOPRINULL
REQUEST_IDvarchar(128)NOPRINULL
SCHEMA_IDbigint(20)YESNULL
REQUEST_TYPEvarchar(128)YESNULL
WORKER_TYPEvarchar(128)YESNULL
PACKAGE_VERSIONvarchar(128)YESNULL
CONF_VERSIONvarchar(128)YESNULL
CREATE_TIMEtimestampNOCURRENT_TIMESTAMP
UPDATE_TIMEtimestampNO0000-00-0000:00:00
STATEvarchar(128)YESNULL
ERROR_CODEvarchar(128)YESNULL
ERROR_MSGvarchar(255)YESNULL
INTERNAL_ERROR_CODEvarchar(128)YESNULL
INTERNAL_ERROR_MSGvarchar(255)YESNULL


HISTORY_JOB

FIELDTYPEALLOW_NULLPKDEFAULT_VALUECOMMENT
CLUSTER_NAMEvarchar(16)NOPRINULL
JOB_DATEdateNOPRINULL
TABLE_SCHEMAvarchar(128)NOPRINULL
TABLE_GROUPvarchar(128)NOPRINULL
TABLE_NAMEvarchar(128)NOPRINULL
DATA_VERSIONbigint(20)NOPRINULL
JOB_IDvarchar(255)NOPRINULL
STATEvarchar(128)YESNULL
USERvarchar(128)YESNULL
LOAD_STARTtimestampNOCURRENT_TIMESTAMP
LOAD_FINISHtimestampNO0000-00-0000:00:00
LOAD_STATEvarchar(128)YESNULL
BUILD_STARTtimestampNO0000-00-0000:00:00
BUILD_FINISHtimestampNO0000-00-0000:00:00
BUILD_STATEvarchar(128)YESNULL
ONLINE_STARTtimestampNO0000-00-0000:00:00
ONLINE_FINISHtimestampNO0000-00-0000:00:00
ONLINE_STATEvarchar(128)YESNULL
START_TIMEtimestampNO0000-00-0000:00:00
FINISH_TIMEtimestampNO0000-00-0000:00:00
SOURCE_PATHtextYESNULL
ERROR_CODEvarchar(128)YESNULL
ERROR_MSGvarchar(255)YESNULL
PARAMETERStextYESNULL
ONLINE_GROUPvarchar(255)YESNULL
DEADLINEvarchar(255)YESNULL
PARTITION_PATHvarchar(255)YESNULL
PRIORITYint(11)YESNULL

展开
收起
nicenelly 2017-10-31 13:59:59 2775 分享 版权
0 条回答
写回答
取消 提交回答