qwen-7b后续如果商用用缴纳费用吗 这个千问14B 应该也通用吧 那train.en和train.zh除了要文本一一对应以外还有什么其它要求吗?
通义千问-7B(Qwen-7B)是由阿里云研发的通义千问大模型系列的70亿参数规模的模型,其在Hugging Face和ModelScope平台上是免费商用的。这意味着你可以自由地在你的项目中使用这个模型,无需支付任何费用。
关于train.en
和train.zh
的使用要求,这两个文件分别代表了英文和中文的训练数据,且每行数据一一对应。在使用前,你需要先对自有数据进行预处理,然后再配置到模型中。预处理过程主要包括tokenization和BPE处理。此外,你还需要一个fairseq-preprocess命令来生成词表和训练用的二进制文件。在配置过程中,需要注意的是,你可能需要根据你的实际需求来调整batch_size等参数。
阿里云已宣布开源两款重要的大型模型QWen-7B和Qwen-7b-Chat,这两款模型的参数规模令人瞩目地达到了70亿。它们已经在Hugging Face和ModelScope平台上开放,并且可以免费商用。这意味着你可以自由使用这些模型进行商业活动,无需缴纳额外费用。
至于你提到的train.en和train.zh,这可能涉及到具体的使用场景和需求。一般来说,这可能与训练模型时的数据集有关。例如,如果你正在进行英文到中文的机器翻译任务,你可能需要有对应的英文(train.en)和中文(train.zh)数据集来进行训练。此外,确保你的数据集质量高、覆盖面广,可以帮助提高模型的准确性和性能。
https://www.modelscope.cn/models/qwen/Qwen-14B-Chat/file/view/master/LICENSE.md
月活过一亿的产品需要特别申请一下,其他的可以直接商用。应该是可以的,您尝试一下,7b用的多。我这边是可以的,没找到合适的数据集,用的模型文件夹中的train.en和train.zh
模型卡片预处理那部分您看一下会不会是和您遇到的问题有关。。此回答整理自钉钉群:魔搭ModelScope开发者联盟群 ①