ModelScope请问最大输入长度4k指的是4kb大小吗? 怎么理解呢?比如codegeex2最大支持4k的输入是不是指的最大输入内容大小不能超过4kb?
"应该是token ,可以理解成大致是4k个汉字,但由于常用词合并等情况,转成汉字的字数后与4k有偏差。方便的话,您可以在这打断点看一下。
https://github.com/modelscope/swift/blob/main/swift/llm/sft.py#L168
参考swift下这个脚本调整一下 https://github.com/modelscope/swift/blob/main/examples/pytorch/llm/scripts/baichuan2_7b_chat/lora_ddp_ds/sft.sh 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"