AI系统工程
2023年06月
2022年11月
ds = MsDataset.load('modelscope/Youku-AliceMind', subset_name='caption', split='train', use_streaming=True)
for line in ds: print(line)
结果示例: {'video_id:FILE': '/xxxx/Youku-AliceMind/master/data_files/e9310xxxx', 'golden_caption': '白色的小羊站在一旁讲话。旁边还有两只灰色猫咪和一只拉着灰狼的猫咪。'} 1
可以尝试先删除一下缓存,即该文件夹下的内容: ~/.cache/modelscope/hub/datasets/modelscope/Youku-AliceMind/master/meta
然后再执行如下代码: from modelscope.msdatasets import MsDataset
ds = MsDataset.load('modelscope/Youku-AliceMind', subset_name='classification', split='train', use_streaming=True)
for line in ds: print(line)
结果示例如下:
开发者可以通过以下方式使用sdk: 1. 自建环境中使用SDK:您可以在自己构建的开发环境中使用SDK,仅需要pip install安装sdk,并在代码中引入相关api即可 2. 使用modelscope官方提供的DSW或EAIS的notebook环境开发应用,该环境已经集成了sdk和相关依赖镜像,并提供CPU/GPU相关算力资源支持。
详细内容请参考官方文档:https://modelscope.cn/docs/ModelScope%20Library%E6%A6%82%E8%A7%88%E4%BB%8B%E7%BB%8D
sdk快速上手指南,请参考官方文档:https://modelscope.cn/docs/ModelScope%20Library%E6%A6%82%E8%A7%88%E4%BB%8B%E7%BB%8D
Modelscope python sdk向开发者提供了一整套API的集合,支持用户使用SDK连接modelscope的data-hub和model-hub,完成数据集的处理和算法模型的开发。
目前modelscope社区集成了NLP、CV、Speech、Multi-modal、Ai-for-science等方向的算法模型,用户可以在python sdk基础上做二次开发,如数据集的加载和预处理、模型训练、推理,以及基于达摩院的开源预训练模型做finetune。同时,开发者亦可以通过SDK实现对数据集和模型的管理。
另外,SDK的使用也很简单,开发者可以在本地通过pip install的方式安装,或者使用modelscope提供的notebook(已预装SDK)来开发自己的应用。