看起来你正在尝试加载一个名为 'GeoGLUE' 的数据集并对其进行预处理。然而,在 get_label_list 函数调用后发生了 KeyError 错误,提示 "Column train not in the dataset." 这意味着你的数据集中没有名为“train”的列。
解决这个问题的方法取决于你的数据集结构。你需要确认数据集中是否有预期的列名,如果没有则需要修改相应的名称;如果有但位置不同的话,你可以考虑重新组织数据以便于访问所需的数据。
在ModelScope中,数据集通常以表格形式出现,可以按照模态划分为文本、图像、音频、视频、多模态等。数据集可以通过git实现版本管理,用户可以下载单个文件或数据相关所有文件。通过一个数据集名称和namespace,即可通过本地SDK从DatasetHub下载数据,以及加载使用。同时此ModelScope的SDK对于本地下载的数据文件会自动进行缓存管理。下次您需要相同文件时,它将从您的缓存中加载,无需重新下载。