ModelScope中,CUDA_VISIBLE_DEVICES=0 swift deploy \
--ckpt_dir /mnt/workspace/output/qwen1half-0_5b-chat/v1-20240507-092936/checkpoint-92-merged-awq-int4 \
--infer_backend vllm --max_model_len 4096
这个命令行中 如何设置torch.float16?
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352