热门
设备 16GB M4 Mac推理速度 8-12 tokens/s稳定性 极快
【演示视频】 https://www.bilibili.com/video/BV1cVfRBuE68/?share_source=copy_web&vd_source=2a2ab1e2b11ae068dfc450d40f4e37e1
本人优化了模型 cpu 内存的访问机制,达到的效果