开发者社区> 问答> 正文

请问palm是否支持本地自定义数据集呢?

请问palm是否支持本地自定义数据集呢?(文本生成的),官网只看到了从DataHub 加载公开数据的方式,不知道私有数据该如何适配MsDataset呢? from modelscope.msdatasets import MsDataset ds_dict = MsDataset.load('squad', namespace='damotest') print(ds_dict['train'][0])

展开
收起
fuxixi 2022-10-31 15:18:41 459 0
1 条回答
写回答
取消 提交回答
  • 本地dataset如果是文本数据可以使用这种方式: 方式1: from modelscope.msdatasets import MsDataset

    (需保证 ../data/ 文件夹下平铺所有csv文件,并且文件名字为 train.csv, test.csv)

    local_data = MsDataset.load('/Users/xxx/your-local-path/data') train_set = local_data['train'] test_set = local_data['test'] print(next(iter(train_set))) print(next(iter(test_set))) 方式2:

    支持自定义文件名

    local_data = MsDataset.load('csv', data_files={'train': ['/Users/xxx/your-local-path/my_train.csv'], 'test': ['/Users/xxx/your-local-path/data/my_test.csv']}) train_set = local_data['train'] test_set = local_data['test'] print(next(iter(train_set))) print(next(iter(test_set))) 此答案整理自钉钉群“ModelScope开发者联盟群 ①”

    2022-10-31 15:38:16
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
技术图谱:由专家组参与技术图谱的绘制与编写,知识与实践的结合让开发者们掌握学习路线与逻辑,快速提升技能 电子书:电子书由阿里内外专家打造,供开发者们下载学习,更与课程相结合,使用户更易理解掌握课程内容 训练营:学习训练营 深入浅出,专家授课,带领开发者们快速上云 精品课程:汇集知识碎片,解决技术难题,体系化学习场景,深入浅出,易于理解 技能自测:提供免费测试,摸底自查 体验实验室:学完即练,云资源免费使用
问答排行榜
最热
最新

相关电子书

更多
PAI-Megatron-Patch:灵骏集群训练 LLMs 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载