热门
1、是否支持双A100 -40g 显卡推理?2、如果需要支持最高100并发问答,显卡配置至少是多少?3、根据qwen-7b在a100-80g的测试,1s生成8000token/s,那理论上A100-40约为4000token/s?
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352