开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope/ChineseText2SQL中提供的训练json数据的数据格式是什么?

modelscope/ChineseText2SQL中提供了如下的训练json数据,但没有给出其中字段的中文含义,能否提供一下其中各个字段的中文含义。

{
    "table_id": "excel_通用_google_1092607",
    "question": "男生彭胤的生源省市是哪里?",
    "action": [
        10
    ],
    "sql": {
        "agg": [
            0
        ],
        "sel": [
            3
        ],
        "cond_conn_op": 1,
        "conds": [
            [
                1,
                2,
                "彭方胤",
                "彭胤"
            ],
            [
                2,
                2,
                "男",
                "男生"
            ]
        ],
        "use_add_value": 0
    },
    "history_sql": null,
    "wvi_corenlp": [
        [
            2,
            3
        ],
        [
            0,
            1
        ]
    ],
    "question_tok": [
        "男",
        "生",
        "彭",
        "胤",
        "的",
        "生",
        "源",
        "省",
        "市",
        "是",
        "哪",
        "里",
        "?"
    ],
    "header_tok": [
        [
            "报",
            "名",
            "号"
        ],
        [
            "考",
            "生",
            "姓",
            "名"
        ],
        [
            "性",
            "别"
        ],
        [
            "生",
            "源",
            "省",
            "市"
        ],
        [
            "所",
            "在",
            "中",
            "学"
        ],
        [
            "考",
            "核",
            "资",
            "格",
            "大",
            "类"
        ],
        [
            "符",
            "合",
            "报",
            "名",
            "条",
            "件"
        ],
        [
            "空",
            "列"
        ]
    ],
    "bertindex_knowledge": [
        1,
        3,
        1,
        3,
        0,
        4,
        4,
        4,
        4,
        0,
        0,
        0,
        0
    ],
    "header_knowledge": [
        0,
        2,
        2,
        1,
        0,
        0,
        0
    ],
    "types": [
        "number",
        "text",
        "text",
        "text",
        "text",
        "text",
        "text",
        "null"
    ],
    "units": [
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ],
        [
            "null"
        ]
    ],
    "schema_link": [
        {
            "question_index": [
                0,
                1
            ],
            "column_index": 2,
            "label": "val"
        },
        {
            "question_index": [
                2,
                3
            ],
            "column_index": 1,
            "label": "val"
        },
        {
            "question_index": [
                5,
                8
            ],
            "column_index": 3,
            "label": "col"
        }
    ]
}

展开
收起
砖头大师 2023-03-15 16:19:49 678 0
1 条回答
写回答
取消 提交回答
  • 可以参考这个链接~

    https://developer.aliyun.com/ask/488580?spm=a2c6h.13066369.question.7.3a766fc1DQZoXC

    2023-03-23 20:36:50
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

相关电子书

更多
MaxCompute SQL 2.0 全新的计算引擎 立即下载
SQL Server云化思考与实践 立即下载
RDS SQL Server CPU高使用率性能优化 立即下载